原標題:隱私計算興起,或成破解數據孤島困境的最優解

在數字時代,數據的重要性不言而喻。隨着各行各業的數字化深入,數據的融合應用也成爲一個重要趨勢。在這個過程中,如何打破數據孤島的壁壘,實現數據共享,也是整個行業亟待解決的難題。

在這種背景下,隱私計算應運而生。隱私計算(Privacy Computing)是一種由兩個或多個參與方聯合計算的技術和系統,參與方在不泄露各自數據的前提下通過協作對他們的數據進行聯合機器學習和聯合分析。

目前,隱私計算是當前數據保護領域各界關注的熱點。在學術界,近年來有關隱私計算的學術會議和論文呈現爆發式增長,產業界則也愈發關注隱私計算技術和產品,各企業都爭相投入到隱私計算的研發和產品化工作。

4月18日下午,騰訊便基於隱私計算技術,推出了自研的第四代數智融合計算平臺——騰訊大數據-天宮。據騰訊數據平臺部總經理蔣傑介紹,“騰訊大數據-天工”將以安全的方式打通數據孤島,橋接多方數據,並以統一的數據處理引擎更高效地挖掘數據價值,以及以智能化的方式驅動整個數據處理閉環。

隱私計算興起

自2009年開始,騰訊就開始深耕海量大數據處理領域,並在過去十餘年裏完成了四代更迭。

第一代是2009年-2011年,騰訊大數據主要依託Hadoop生態,圍繞離線計算模式化構建出能夠穩定支撐小時/天級別的計算任務數據處理平臺;第二段是2012-2014年,騰訊大數據通過引入Spark、Storm等實時計算處理框架,讓大數據平臺處理性能邁入毫秒級別;第三代是2015年-2019年,騰訊大數據開始朝着機器學習發展,其自研機器學習框架Angel成爲國內第一個從Linux基金會畢業的頂級AI項目,並推動國內大數據處理正式進入機器學習時代。

而2020年開始進入的第四代,騰訊大數據更注重強調安全、統一和智能。據悉,“騰訊大數據-天工”通過解決大數據和人工智能計算框架的統一,從而更好地適配了CPU、GPU、NPU、FPGA等硬件。與此同時,“天工”通過構建大數據、AI基礎算子,統一元數據用於執行優化,以及統一批、流、圖計算形態來統一計算引擎。

蔣傑表示,從離線計算、實時計算再到機器學習,大數據智能化是第四代數智融合計算平臺規劃的必由之路,騰訊正在構建平臺大腦,推動萬億級大數據分析逐步實現“自動駕駛”。據其介紹,從快速發現大數據運行問題到主動發現問題,再到主動解決問題,平臺大腦預計可讓數據中心研發效率提升60%,運營效率提升50%,平臺服務質量提升80%。

在蔣傑看來,騰訊大數據平臺的一個主要優勢,是騰訊自身即擁有海量的數據規模,這使得騰訊大數據平臺在推出的時候,就已經經過海量數據的驗證。數據顯示,目前,騰訊大數據平臺日接入消息量超過55萬億,日實時計算量超過65萬億,平臺整體算力超過500萬核,日分析任務達到1500萬。

此外,爲打破數據孤島實現數據協同,數據安全是重中之重。“騰訊大數據-天工”採用自研隱私計算技術,從機器學習到大數據分析爲各個場景提供全方位保護,而且去中心化的架構則能避免單點隱私泄露風險。在安全性上,騰訊”天工”可提供3072bit業界最高強度加密和TEE硬件雙保險。

仍存在合規痛點

4月18日,騰訊也對外發布了《騰訊隱私計算白皮書2021》。在白皮書的序言中,騰訊高級執行副總裁盧山表示,隱私計算的興起,爲人們提供了在數據安全合規、融合應用過程中尋求發展和安全平衡點的技術路徑和解決思路,其正成爲未來數字治理的有效路徑之一。

但是,盧山也提出,數字治理的探索是一項系統性工程,僅僅依靠單一技術無法滿足當前和未來複雜的治理需求,需要技術、法律、制度等都不斷的演進和配合,才能找到適應數字社會發展的治理路徑。

從技術層面而言,隱私計算實現的數據保護功能與國內外數據保護相關立法精神高度契合,具有廣闊的發展前景。但在全球數據合規監管日趨嚴格的大背景下,隱私計算仍具有較大提升空間。

白皮書便寫道,由於隱私計算技術正處於快速迭代和發展的階段,目前仍在實現用戶授權同意、數據存儲安全、信息主體權利保障等關鍵合規要求的有效性上存在爭議,這些爭議在一定程度上限制了隱私計算的推廣應用。

比如在用戶授權同意方面,根據我國《網絡安全法》及《民法典》的規定,數據處理者在處理數據時應公開收集、使用規則,並經用戶同意。從理論上而言,數據合作方通過隱私計算技術實現數據分析與建模,不需實際流轉數據,且處理過程中的數據都進行了匿名化處理,或不需要獲得用戶授權同意。

但實踐中,在原始數據採集階段,數據合作各方仍需獲得用戶授權同意。此外,由於個人信息的匿名化標準尚存爭議,因此做好告知同意的授權管理,對強化企業數據合規仍具有重要意義。

(作者:白楊)

相關文章