原創:譚婧

當騰訊推出產品,正式宣佈進入隱私計算技術領域,隱私計算創企都證明自己的路走對了,甚至有機會被巨頭收購。華控清交、數牘科技、矩陣元、翼方健數、瑞萊科技都是這個領域知名初創企業。

大多數技術初創企業都是從默默無聞開始,很少看到哪個技術領域的創業企業光環亮,且密度高。

就在過去的2020年,隱私技術作爲前沿技術領域,其發展特色是,大牛大佬雲集,豪華技術團隊帶路。

比如瑞萊科技有清華大學張鈸院士與朱軍博士兩位首席科學家。華控清交創始人兼首席科學家是MPC 理論的提出者和重要奠基人姚期智院士。翼方健數(BaseBit.ai)有李凱、密碼學女神王小云、宋曉東組成公司技術戰略委員會。

臥虎藏龍與人才濟濟,證明了隱私計算技術的關鍵性。

2021年4月18日,北京國貿。

在 “騰訊大數據高峯論壇”上,騰訊正式發佈自研第四代數智融合計算平臺“騰訊大數據-天工”,可以支持千億級規模的海量數據訓練,性能參數領先業界5倍,在此基礎上,提供3072bit業界最高強度加密和TEE(Trusted Execution Environment),軟硬件雙保險。

現場得到的消息是:這一金融級安全強度的騰訊隱私計算技術已廣泛應用在醫療、金融風控、數字政務等衆多領域。

“騰訊大數據-天工”自研隱私計算技術,從大數據分析到機器學習,爲多個場景提供全方位保護,去中心化的架構避免單點隱私泄露風險。

筆者理解,隱私計算是數智融合計算平臺重要特色,長遠目標是毫無感知進入數據生命週期,融入大數據技術和計算平臺系統。

這也符合隱私計算基礎性極強的特色。

沒有好數據,就沒有好智能。在安全有保障的前提下,數據的流動性是合理和必要的。

儘管核心技術不可能統一標準比較,但是創業技術公司也各有特色。

創業技術公司的產品路徑與騰訊也不可能相同,有的發力隱私計算編譯,有的發力模型聯邦化,有的側重同態加密技術,有的使用祕密共享(Secret share)。產品路徑方面,有的輸出機器學習平臺,有的隱私計算可以是所有機器學習平臺當中的一個模塊。

但是,殊途同歸,保障安全。

隱私計算領域的學術研究也較爲熱門。

中國計算機學會多次組織隱私計算技術研討會,在國際頂級學術會議上(如NeurIPS, ICML, AAAI, IJCAI等)也多次召開有關隱私計算技術的專題研討會,與隱私計算相關的學術論文平均每年都超過1000篇。

但是,有時候,學術論文這麼說行,但是你落到商業的場景,大家都有顧慮,尤其是金融、醫療、自動駕駛等領域。

前沿技術日拱一卒,隱私計算還是解決特定領域的特定問題,不是包羅萬象,能解決所有的問題,有些人爲的問題,用技術解決不了。

一個數據從生成,開始它的生命週期,可能會在多箇中間點行走,就像許多企業內部存在數據流動的pipeline,在更宏觀的層面也存在類似流式計算的flow。

騰訊數據平臺部總經理蔣傑表示:“騰訊自身即擁有海量的數據規模,目前騰訊大數據平臺日接入消息量超過55萬億,日實時計算量超過65萬億,平臺整體算力超過500萬核,日分析任務達到1500萬,騰訊是日實時計算量最大的公司。第四代數智融合計算平臺是騰訊最近兩三年的積累。”


騰訊數據平臺部副總經理劉煜宏談道:“騰訊業務量比較大,平臺能力就會比較早的去探索,相比有些同行我們可能稍微走得早一點,包括隱私計算這塊也是我們2019年就開始,現在落地了電力、電信、銀行等行業,但這個確實還在初步的起步的一個階段。”

公開信息可查,從2019年開始,騰訊大數據在規劃第四代計算平臺,包括批流融合、數據湖、聯邦學習等新型技術,圍繞安全、智能、統一等提出了下一代騰訊天工數智融合計算平臺。

騰訊大數據平臺將會在數據安全、智能化、統一平臺三大方向重點發力。據劉煜宏透露,騰訊目前正在研發聯合計算平臺,實現在保護數據隱私的同時,提供聯合數據分析、聯合數據建模等能力。

蔣傑還在會上表示:“此次發佈的第四代數智融合計算平臺,將以安全的方式打通數據孤島,橋接多方數據,以統一的數據處理引擎更高效地挖掘數據價值。”

騰訊數據平臺部AI平臺總監陶陽宇在回答《親愛的數據》採訪問題“關於算法模型聯邦化的加速方法”中談道:

“騰訊Angel PowerFL安全聯合計算平臺擁有全棧的聯邦機器學習和深度學習功能,支持多方聯邦邏輯迴歸、XGBoost、PCA、用戶自定義神經網絡模型,支持多方聯邦模型在線serving和模型管理,支持聯合數據分析。算法模型聯邦化的解決。我們會深入基礎算子,在算法磨練之後,慢慢地攢經驗,發現共性可以抽象成一些基礎算子。有了這一步,思考未來更多的算法是不是可以通過搭積木的方式就可以組合出來。”

值得一提的是,騰訊研究院與騰訊六大部門共同撰寫的《騰訊隱私計算白皮書》,從隱私計算發展背景、技術體系、重點應用行業和場景、數據安全合規、未來發展前景等多角度全方位探索隱私計算。

最後,非常明確的一點是,在數智化發展和安全中必須找到平衡點,但是平衡從來都沒有容易的事情。(完)

《親愛的數據》出品

相關文章