原標題:360數科革新隱私計算技術

自2016年穀歌首次提出聯邦學習概念,這個初衷爲保證數據交換時信息安全的人工智能基礎技術隨即在中國掀起風潮。在隱私數據保護上,360數科(原360金融)於2018年引入隱私計算研究,並在2019年宣佈成立隱私保護與安全計算研究院,運用聯邦學習技術發力大數據隱私保護。

2020年,360數科進一步推動隱私數據保護領域研究,在業內第一次提出分割式神經網絡技術框架(Spilt Neural Network),並通過自主研發的一套系統實現算法落地。

隱私數據項目主要牽頭人、360數科隱私保護研究院院長沈贇博士表示,“我們一直以來都在做一些技術上的創新。在隱私數據保護領域,使用神經網絡算法更加靈活,可以把不同類型數據提取出來,在統一架構下去學習,效率上能夠大幅提升。”

與傳統聯邦學習不同的是,分割式神經網絡技術框架輸出層數據的維度遠小於原始輸入層的維度,即使輸出層的數據沒有加密也無法反推原始輸入層的數據,從而在框架設計上杜絕了數據泄露的問題。由於輸出層數據的維度較小,也可以大幅降低服務器端的計算量與內存使用量,減少網絡傳輸量,降低對帶寬的要求。

目前國內行業內較爲推崇的聯邦學習,其原理在於參與學習的各方機器上部署的客戶端從服務器端下載現有模型以及參數,而後根據各自所有的數據對模型的參數進行更新,並把結果傳回客戶端並更新模型。使用該方法不會與服務器交互原始數據,因此保證了原始數據不會出庫。另外,原始數據或者梯度在使用前都可以使用某種方式進行加密或加噪,來增強安全性。

與聯邦學習類似,分割式神經網絡技術框架不需要上傳任何原始數據。在使用原始數據或者上傳輸出層結果前,可以使用各種加密方式進行加密,從而切實保障了隱私數據安全。

而其與聯邦學習的不同之處在於,該框架下每個參與學習的客戶端各自部署自身的子神經網絡,學習後的參數並不需要共享給服務器。每個客戶端只需要把最頂層輸出層的數據回傳給服務器,之後服務器綜合各個客戶端的結果再由各客戶端各自進行更新迭代。

由於網絡是分裂部署在各客戶端上,它們自身的結構並不與其他各方共享,且自身的權重也不需要與服務器交互,因此可以解決聯邦學習中龐大的深度網絡帶來的服務器與客戶端之間大量數據交互帶來的網絡傳輸壓力。另外,分割式神經網絡技術輸出層數據的維度會遠小於原始輸入層的維度,可以解決聯邦學習中由於網絡結構需要與服務器共享所帶來的潛在原始數據泄露的風險。

360數科針對分割式神經網絡技術框架的項目實施技術方案能夠搭建出更安全、對硬件要求更低且更加靈活的框架。目前,該框架主要滿足360數科在與合作方進行數據交互時的需求。

未來,在360數科對外輸出風控能力的過程中,隱私計算也將作爲技術輸出的一部分,作爲綜合解決方案從底層解決數據安全問題。360數科將繼續加大對於新技術的研發力量,營造健康與安全的數據生態。

---------------------------

(市場有風險,投資交易需謹慎。據此投資交易,風險自擔。)

相關文章