誰能將爬蟲關進鐵籠?

作者: 呂倩

[ 隨着數據彙集、規模變大、透明度變高,數據越權逐漸成爲安全的核心問題,近期不斷髮生的爆雷事件核心便是來自於數據泄露、數據私下交易,以及隱私權泄露。 ]

[ 2019年11月以來,公安部開展APP違法違規採集個人信息集中整治,下架整改100款違法違規APP。 ]

大數據技術趨勢下的“爬蟲危機”日益得到有關部門的重視。

7月18日,立木徵信法人及大部分員工被警方帶走;9月6日,魔蠍科技高管被警方帶走,新顏科技CEO黃向前被帶走,聚信立被曝有警方進駐調查;9月11日,公信寶被杭州警方查封;9月12日,集奧聚合深圳分公司有10多人被帶走,後北京辦公室也被深圳警方帶走多人;9月27日,同盾科技子公司信川科技高管被帶走調查。

所謂網絡爬蟲又名“網絡蜘蛛”,是通過網頁的鏈接地址來尋找網頁,從網站某一個頁面開始,讀取網頁的內容,找到在網頁中的其他鏈接地址,然後通過這些鏈接地址尋找下一個網頁,這樣一直循環下去,直到按照某種策略把互聯網上所有的網頁都抓取完爲止的技術。

近日,浪潮集團高級副總裁、浪潮雲董事長兼CEO肖雪在接受第一財經記者採訪時表示,隨着數據彙集、規模變大、透明度變高,數據越權逐漸成爲安全的核心問題,近期不斷髮生的爆雷事件核心便是來自於數據泄露、數據私下交易,以及隱私權泄露。

通過爬蟲技術獲取數據並可能用於不法用途的審查調查早已開始。中國互聯網金融協會向會員單位下發《關於增強個人信息保護意識依法開展業務的通知》。要求不與違規收集和使用個人信息的第三方開展數據合作,不濫用、非法買賣和泄露消費者個人信息。

金融業務之外,更貼近普通受衆的APP數據安全與隱私保護也被納入監管範圍。國家網絡與信息安全通報中心發佈《公安機關開展APP違法採集個人信息集中整治》的通報指出,2019年11月以來,公安部開展APP違法違規採集個人信息集中整治,下架整改100款違法違規APP。微店、天津銀行、考拉海購、晉江小說閱讀等APP名列其中,具體問題包括超範圍收集、隱私協議不規範等。

雲測數據總經理賈宇航對第一財經記者表示,在電子信息化時代中,個人信息的隱私問題逐漸受到重視。消費者在使用個人信息享受便利的同時,個人信息也是一個人重要資產的一部分。

賈宇航表示,一方面要做到完全透明,讓消費者有數據授權後知情數據的最終流向;其次,尊重版權,對於無版權數據,不應進行商業變現。

但在大數據時代,用戶數據一度被認爲是互聯網企業的下一步希望所在。

2019中國企業領袖年會上,華興資本董事長兼首席執行官包凡強調稱,隨着網民數量紅利與市場紅利漸趨瓶頸,互聯網行業下一步發展方向與破局之點主要在於數據的應用。“過去二三十年裏互聯網把幾乎所有的消費者帶到了網上,其中產生、沉澱了大量的數據,同時大量企業業務也基本上了雲。如果我們把數據看作資源的話,其實地下的(待開採的)石油已經很多了,如何進一步地挖掘、應用好,一定是下一步創新企業需要解決的問題,也是我們未來的希望所在。”

然而,持續發生的大數據公司因隨意“爬取”用戶數據信息而被查封的消息頻頻訴諸報端,技術時代到來前,如何確定安全紅線?

賈宇航對第一財經記者表示,企業方應確保數據安全性,保證自己的數據資產不被商業盜取。合理構建擁有數據的核心壁壘,在金融風控全流程中,做到認證作用,而並非數據買賣。

另外,針對近來火熱的AI數據服務行業,賈宇航表示AI數據也屬於數據行業,本質是提升讓AI理解事物和世界的能力。作爲AI數據服務商應同樣重視用戶個人隱私、版權、數據安全三點。隱私方面,如進行人體動作採集,注重被採集人員是否知情,並且簽署對應的肖像授權協議,確保潛在法律風險;版權方面,在進行數據採集後,數據公司要確保版權歸屬問題,若版權歸屬甲方AI人工智能企業,則不應再通過其他方式進行變現,在完成交付後應做到不留底;作爲重要的數據資產,AI數據也同樣珍貴,做好安全防護,確保數據不被盜用。在企業內部工作中,通過工具實現工作人員只有處理數據權限,而不能獲取數據。

相關文章