“Debug the world” 隱私計算風起正當時

兩個百萬富翁在街上相遇,如何在不泄露各自財產的前提下,讓對方知道誰更有富有?這是華人科學家姚期智1982年提出的“百萬富翁”設想,並在其中給出了“多方安全計算” 解決方案。

這一看似像童話故事的命題,實際上用到的理論,後來成爲了現代密碼學的重要理論框架。在世紀之交的2000年,姚期智也憑藉在計算機領域的重要貢獻,獲得了計算機領域的諾貝爾獎——圖靈獎。

2004年起,姚期智院士到清華大學任全職教授

四十年後,大概令姚院士本人也沒想到,隨着數字化時代的到來,數據逐漸成爲了一項重要的生產要素,而對數據的使用及其帶來的數據安全成爲全球議題,由他發軔的MPC理論(多方安全計算),經過演變以及和其他技術結合,逐漸形成了一條獨特的被統稱爲“隱私計算”的技術賽道。

隱私計算指的是在保證數據提供方不泄露原始數據的前提下,對數據進行分析計算的一系列信息技術,保障數據在流通與融合過程中的“可用不可見”、“可算不可識”。隱私計算融合了密碼學、計算機硬件、AI等多學科,逐漸形成了以多方安全計算、聯邦學習、可信執行環境爲代表,混淆電路、祕密分享、不經意傳輸等作爲底層密碼學技術,同態加密、零知識證明、差分隱私等作爲輔助技術的相對成熟的技術體系。

2021年,隱私計算進入應用商業化元年。一年過去了,隱私計算的市場成果如何,未來何去何從?

2022年4月22日,權威國際諮詢機構IDC中國發布《IDC Perspective: 隱私計算全景研究》報告,透露2021年中國隱私計算市場規模突破8.6億元人民幣,未來有望實現110%以上的市場增速。

據公開信息及相關研究,以螞蟻集團爲代表的“大廠”科技公司和以“星雲Clustar”爲代表的創業公司較早入局,已經成爲國內隱私計算市場的兩股主流力量。

隱私計算技術走過四十年,爲什麼在近年迎來爆發?

一個不可否認的事實是,互聯網浪潮帶來的人口紅利已經逐漸走向飽和,數據資產再開發,正在成爲新一輪增長點。

根據IDC數據,2020年全球數據量達到了59ZB。人們已經熟練地掌握了數據挖掘、數據分析的技術,在信息化、數字化的當下,不管是單一主體的數據分析,還是跨領域、跨多個主體的數據融合,其價值已經得到顯現。對於數據的流通和開發,如果能夠從更多維度,更多行業、更大體量等持續打通,那麼數據作爲生產要素的價值將得到最大程度地釋放。

但不可忽略的是,數據流通領域頭頂天然地懸着一把“達摩克利斯之劍”,避免它“野蠻生長”——越來越嚴的數據保護政策。

2016年,歐盟出臺被稱爲當時最嚴的《通用數據保護條例》,一些科技巨頭因爲忽略數據安全喫過不少苦頭。去年7月,美國電商巨頭亞馬遜因違反歐盟數據保護條例,被負責監管亞馬遜數據保護的盧森堡當局罰款7. 46 億歐元(約合57. 29 億元人民幣),成爲歐盟有史以來最大的數據隱私泄露罰款。

2021年9月,歷經三次審議,我國《數據安全法》正式實施,11月《個人信息保護法》生效,12月國務院辦公廳印發《要素市場化配置綜合改革試點總體方案》第二十條建立健全數據流通交易規則中強調了“原始數據不出域”。多部有關數據安全的法律法規、政策文件出臺,凸顯出數據合規發展的強烈需求。

讓數據在法律法規範圍內安全地用起來,隱私計算被認爲是極爲有效的技術措施,發展隱私計算技術成爲了數據流通和數據保護不可或缺的一部分。短期來看,越來越嚴的數據安全政策促使了隱私計算市場的快速發展,而數據作爲生產要素流通並形成的價值體系,纔是隱私計算市場長遠持續發展的根本動力。

市場的反應也印證了這一判斷。2019年前後,我國以隱私計算爲解決方案的初創技術公司,瞄準了數據安全市場,如雨後春筍般出現,而提前佈局隱私計算多年的頭部互聯網科技公司,也逐漸走向了成熟化,湧現出一批成功的應用案例。

隱私計算市場格局雛形初現

隱私計算產業發端於國外,在中國市場得到風起。

2016年歐盟《通用數據保護條例》一經面世,便激起了數據安全保護產業的千層浪。國際傳統科技巨頭,迅速在理論和應用層面做出了回應,如谷歌2016年在一篇論文中率先提出分佈式機器學習系統聯邦學習,如今成爲了隱私計算三大技術路線之一,還有一些公司通過開源算法庫迅速搶佔賽道;一些初創公司也開始通過切入單個技術路線,拼搶隱私計算市場。 

從2017年開始,國內零星出現了一些隱私計算領域的技術廠商,到2019年集中湧現了一批不同技術路徑的產品解決方案;經歷2-3年的蟄伏,2021年隱私計算整體行業競爭態勢開始加速,進入商業化元年,市場格局也露出水面。

目前隱私計算市場大概分爲3類公司:科技公司的隱私計算部門、專注於隱私計算的初創公司、現有業務結合隱私計算技術的公司。 

科技公司一般由於自身業務需要,對數據安全有着天然的高需求,在數據體量、算法、硬件開發、技術研發(包括專利和論文研究)、應用場景方面擁有優勢,人才的佈局也相對完整,能夠平滑地將新技術與原有業務融合落地。從公開信息及市場應用情況來看,典型的如螞蟻集團、騰訊雲、阿里雲、百度安全等,早期便入局了隱私計算技術賽道。

以螞蟻集團爲例,2016年開始佈局隱私計算,技術能力涵蓋了多方安全計算、隱私保護、聯邦學習、機密計算、區塊鏈技術等,推出了摩斯多方安全計算平臺,可信隱私計算框架隱語、螞蟻鏈數據隱私協作平臺FAIR、螞蟻隱私計算一體機等產品,在聯合風控、政務數據、聯合營銷等業務場景中得到了成熟的應用。是典型的基於原有業務需求形成隱私計算技術能力,並逐漸向外開放的公司。

螞蟻集團首個商用隱私計算一體機

IDC報告顯示,螞蟻集團隱私計算已經形成了性能優良,豐富多樣的產品線,性能保持領先,通過了多項權威認證,安全合規。經過4年多打磨和大規模商業化應用,已初具規模。

初創隱私計算公司一般專注於某一項技術,核心研發團隊大多在隱私計算領域具有多年研究經驗,在多方安全計算效率、聯邦學習模型豐富度、互聯互通等技術探索中具有較強先進性,且具有差異化優勢。如有把算力作爲核心優勢的隱私計算技術提供商,也有以軟硬件結合解決方案推進數據開放流通的公司;還有專注於某一特定領域的隱私計算應用產品。有意思的是,這類創業型的隱私計算企業與互聯網科技公司也嘗試了合作互補、互聯互通,經過強強結合推出性能更優、適用性更廣的隱私計算產品或服務。隱私計算廠商諾崴科技就將國產化CPU及硬件架構、鍩崴信隱私保護計算內核與螞蟻集團可信原生一體化解決方案,隱私保護計算加速卡、自主可控可信執行環境、國密加速卡、安全可信技術棧等技術結合,打造了隱私保護一體機。

這類公司近年來也贏得了資本市場的青睞,僅2021年,星雲Clustar獲得1100萬美金A+輪戰略融資,翼方健數完成超過3億元規模的B+輪融資,鍩崴科技拿下億元級B輪融資,而華控清交完成了5億元人民幣B輪融資,創下隱私計算行業截至目前最高融資記錄。

此外,還有一類公司則是結合自身業務和技術優勢,以短平快的方式迅速入局,用技術互補的形式完成隱私計算能力搭建。如把區塊鏈與隱私計算結合打造隱私計算全生命週期數據流通;本身在安全領域擅長,打造數據沙箱這類隱私保護軟件的公司等。

由於市場化起步時間較短,相對高昂的成本和體系化運營帶來的門檻,當前隱私計算市場玩家收入規模不大,但憑藉各自的技術特色、產品化能力等優勢,在未來增長方面頗具潛力。

總體來看,未來頭部廠商的優勢將進一步凸顯,特別是在大規模產業化應用、互聯互通、行業生態建設層面;在行業競爭環境中下,細分領域各廠商將通過發揮專項技術優勢,汰換出一批頭號玩家。

隱私計算技術未來何去何從?

風口之下,實際上隱私計算目前仍然處於行業初期,技術發展、政策法規、互聯互通、商業模式等還需要進一步完善。

首先,在隱私計算技術本身的安全性上需要實現突破。儘管隱私計算單一技術理論基礎完善,但應對龐大的數據體量,隱私計算的性能和算力上也相應受到掣肘,且在安全性上,隱私計算單一技術並不是萬無一失。以聯邦學習爲例,IDC通過調查發現,聯邦學習是隱私計算重要發展方向。但是聯邦學習技術仍然較爲新興,在安全性、去中心化架構、模型可解析性等各方面,仍然任重道遠。

針對隱私計算產品的安全性,中國信通院2021年首次推出了多方安全計算和聯邦計算兩項隱私計算安全測評,從結果來看,安全測評共有9款隱私計算產品通過,螞蟻集團和洞見科技成爲了兩項測評都通過的企業。

其次,在互聯互通能力上,當前隱私計算存在產品及其技術架構的同質化現象,但細分來看卻存在着不同的理論模型、技術路徑和業務邏輯。新興技術路線早期呈現的百花齊放的狀態,釋放了各自技術魅力,但經過一段時間的驗證和應用之後,必定存在着一些技術的擱置甚至是淘汰。

要做到互聯互通,技術上涵蓋了從節點、管理系統到數據層面、算法協議等不同層面的互聯互通。另一方面,行業標準的建設也至關重要,通過明確技術使用場景和框架,推動隱私計算技術的認知並加速落地應。目前中國信通院及相關部門已經牽頭了多項行業標準及團體標準,國內主流廠商都有積極參與其中。在國際標準制定方面中國企業也積極參與。

如,中國聯通、螞蟻集團、之江實驗室牽頭了國際電信聯盟(ITU)發佈的“隱私保護機器學習技術框架”標準,螞蟻集團主導的全球首個隱私計算一體機國際標準也通過了IEEE-SA立項。

在市場化關鍵的商業模式層面,儘管數據合規需求從根本上鞭策了相關企業進行數據安全的改造和升級,但當前隱私計算的商業模式還處於早期探索期。從收入形態來看,通過搭建隱私計算技術基礎設施,產品售賣和平臺搭建是主要來源;另一類是通過提供SaaS服務,主要面向中小客戶羣體,比如多中心的隱私計算保護需求或者跨域分析、諮詢服務等商業模式已初具雛形。更多的模式還在探索期,在市場逐步成熟的條件下,營業模式也將與時俱進。

隱私計算技術當前主要成熟應用在金融、政務、聯合營銷、醫療等對隱私計算有剛性需求的行業。 

2018年成立的隱私計算公司華控清交,衆多技術骨幹來自清華“姚班”,承建了光大銀行的多方安全計算平臺,幫助光大銀行部署了業內第一個進入銀行生產系統的多方安全計算平臺。在此基礎上,光大銀行得以聯合母公司光大集團旗下保險、信託、旅遊等成員單位,開展客戶金融資產、消費偏好、風險偏好等數據的聯合統計與建模,加強集團內部數據互聯互通。光大銀行正在與多個集團外部企業探討數據合作,未來可能共同開發聯合風控等更多應用場景。

在醫療領域,數據價值也因隱私計算得到釋放。以螞蟻隱私計算的應用爲例,螞蟻可信隱私計算框架“隱語”和阿里雲數字醫療團隊合作,爲浙江某三級醫院搭建了面向醫院運營管理的數據融合平臺,病理質控和醫保DRG(Diagnosis Related Group,疾病診斷相關分組)管理效能得到顯著提升,2021年三個月時間內,醫院累計優化數十萬醫保結算,並通過編碼入組,將醫保反饋分析工作量顯著降低,甲級病案例病理質控也提升了10~20%。在這個案例中,基於螞蟻隱私計算技術,多家醫院數據安全共享聯合建模,幫助解決了單一三甲醫院的數據量和數據的豐富程度不充足的問題;同時在跨醫院合作中,保證聯合建模的模型達到調優,在保證數據安全可控、可用不可見的前提下,更好地發揮自身價值。

IDC判斷,隨着合規標準的逐步細化與推出,製造業、能源等行業對隱私計算的需求也將穩步上升。同時隨着醫療領域將模型方面完善、信息化建設跟進,這一市場將迎來高速增長生物醫療,是下一個競爭市場與爆發點。

結語

回答隱私計算爲什麼理論誕生40年,真正起風卻是在近兩年,其實也是回答技術發展路徑的普遍的現象。一項技術被廣泛接受,需要經過理論發展、實踐認證,大規模應用三個階段。隱私計算技術,便是一個很好的驗證,沒有政策法規完善、技術成熟,便沒有隱私計算從理論走向大規模應用的可能。有從業者多年前就發出過感慨,隱私計算是科技世界的一個“補丁”,需要有人“Debug the world”。而現在,或許正是隱私計算這項技術Debug the world的最好時機。

相關文章