原標題:【等深線】隱私計算崛起還有多遠?

來源:等深線

中國經營報《等深線》記者 裴昱 北京報道

如何在不暴露和泄露各自財產的情況下,準確地比較兩個百萬富翁誰更加富有,即“百萬富翁命題”。這一看似無厘頭的命題實際上用到了現代密碼學的重要內容。

世紀之交的2000年,華裔科學家姚期智憑藉這一命題研究獲得了“計算機領域的諾貝爾獎”——圖靈獎,爲日後隱私計算的應用打下了理論基礎。

所謂隱私計算,即在保護數據本身不對外泄露的前提下實現數據分析計算的技術集合,達到對數據“可用、不可見”的目的,從而實現數據價值的轉化和釋放。隱私計算是一類既能保護用戶隱私,又能實現數據計算效果的技術的統稱。

時值壯年的姚期智那時恐怕不會想到,在他完成“百萬富翁命題”近40年後,他的祖國已經成爲全球第二大經濟體和數字經濟最爲發達的國度。而他的模型和思想,如今在金融、政務、醫療等場景中得以商業化應用,並形成獨特的賽道。

當下,恰逢中國開始進入對數據安全和個人信息安全嚴格監管的時代。當海量的、已經“升級”爲生產要素的數據資源,面對嚴格的個人信息監管時,發軔於姚期智的隱私計算技術終於有了用武之地。

同時,隱私計算不僅是商業和產業層面的問題,在個人信息保護、數據安全與數據應用之間尋求平衡,以數據優勢持續構建中國的國家競爭力,同樣是事關國運的重大命題。在這條賽道上,既有互聯網巨頭公司競爭,也有長期從事大數據業務的企業參與,還有初創企業的加速入局,資本正在識別“隱私計算”賽道的長短與容量,投資人躍躍欲試。

一位天使投資機構的投資人對《等深線》記者表示,中國龐大的市場和數據使用場景,總是能夠提供更多的可能性,現在一切仍未有明確的答案,投資人正在探索隱私計算是否能夠成爲一個獨立的賽道。“不試一試,怎麼知道呢?”他說。

何爲隱私計算

近日,招商銀行“慧點隱私計算平臺互聯互通項目”中標結果公佈,這個名字看起來有點拗口的項目,實際上是國內首個由大型股份制商業銀行牽頭,與多家隱私計算服務商共同合作的跨平臺互聯互通項目。項目中標方之一的同盾科技公司相關人士告訴記者,該項目將協助招商銀行完成企業級隱私計算互聯互通標準的制定。

隱私計算,這個對大衆來說有些陌生的概念,正在變得越來越重要,金融業對其更是頗爲熱衷。在招商銀行的項目之前,浦發銀行聯合騰訊雲計算公司等機構,啓動了“多方數據學習‘政融通’在線融資項目”,交通銀行則聯合中國銀聯、華控清交啓動了監管沙盒項目,中國工商銀行中國農業銀行也不同程度地在相關業務中嘗試性地應用隱私計算工具。

在知名諮詢公司Gartner對重要戰略科技趨勢的預測中,“隱私計算”技術連續兩年入圍。Gartner還預測,到2025年,將有一半的大型企業機構使用隱私計算在不受信任的環境和多方數據分析用例中處理數據。那麼,隱私計算究竟爲何物?

簡單來說,隱私計算是一類既能保護用戶隱私,又能實現數據計算效果的技術的統稱。

百萬富翁命題中,富翁擁有的財富就是數據所有權,富翁公佈財富數據就是數據使用權,是否有一種技術,能讓他們向這個技術平臺透露財富數據,經過一系列加密數據的計算,最終得出(誰更富有的)結果,而他們的財富數據本身不會泄露。對於需要數據的企業來說,他們獲得的不是原始數據,而是經過加密的數據,以此來計算結果提供服務。理解了這一假說,就能理解隱私計算的大概思路。

姚期智早在上世紀80年代提出的這一命題,被視爲隱私計算的雛形。但是,在他提出這套算法的時代,由於計算機的算力有限,實際應用耗時頗長,在當時並未廣泛應用。

目前,隱私計算包括多個“流派”。據《等深線》記者瞭解,姚期智論文中提出的方法,在隱私計算領域中被稱爲“多方安全計算”,更多依託於密碼學,是將一組相互不信任或者不信任任何第三方的獨立數據所有者,通過一個函數得出準確的運算結果,同時各方輸入的數據信息不會暴露且不可還原。

“用更通俗的話說就是,多方安全計算,是指每個人算一點,然後合在一起能夠完成一個任務,它可以做一些相對簡單的數據查詢、統計等計算。”同盾科技合夥人兼人工智能研究院院長李曉林說。

除了多方安全計算,隱私計算還有“聯邦學習”和“可信執行環境”兩大流派。

“聯邦學習”由國際互聯網巨頭谷歌提出,是一種分佈式的“機器學習”,即多個參與方事先商定好分析模型,在數據不出各方“本地”的情況下,用各方數據對模型進行訓練,而後得出結論供各方使用。“這一流派是從機器學習的角度出發,比多方安全計算又走近了一步,更適合目前人工智能的需求,模型訓練和學習需要利用更豐富的多方數據,因此需要數據隱私的保護。”李曉林說。

無論是多方安全計算,還是聯邦學習,都是軟件層面的路徑,而“可信執行環境”這個流派,則加進了硬件的因素。這個流派的核心思路,是通過構建一個獨立於各方,且受各方認可的安全硬件環境,在安全、機密的空間內進行計算,得出結論。

“通過硬件打造出來的一個安全屋,在這個安全屋裏的所有操作是受保護的。多方的數據放入這個可執行環境中,然後在執行環節裏面得出結果。”李曉林說。

目前,這三種技術流派在隱私計算的商業層面都有應用。“具體應用並非涇渭分明,而是從適用的角度出發,相互融合。這不是華山論劍,一定要比出哪個門派是高是低,單純的、脫離市場與爭論哪條路線的技術水平的高低,也沒有太大意義。”藍象智聯CEO徐敏向《等深線》記者表示,藍象智聯是一家隱私計算服務商,主要爲金融機構提供服務。

應用場景何在?

一項技術的偉大之處,在於其解決了什麼樣的實際問題,沒有產業場景的應用,技術也只是“英雄無用武之地”,隱私計算也不例外。用技術創新尋求突破並非難事,但如何找到產業場景的沉澱是擺在隱私計算企業面前的重要問題。

隱私計算如何推動數字經濟的發展?藍象智聯創始人兼董事長童玲對《等深線》記者表示,隱私計算本質上並不算一個行業,而是一個基礎技術,可能和各行各業發生關聯。(在不同的應用場景下)利用隱私計算解決數據安全流動的問題,並進一步挖掘數據價值。“在我們的團隊中,除技術團隊外,還有一個數據運營團隊,這個團隊的人既要懂技術,還要懂行業。”童玲說。

當海量用戶數據誕生後,已經開始指導各種產品的設計生產,在藥物研發、風險評估等領域需要大量的交叉數據作爲參考依據。數據價值也從消費側向生產側轉變,在這一背景下,隱私計算爲安全合規地使用交叉數據提供了一種可能。如今,在防範化解金融風險和金融支持實體經濟的過程中,隱私計算也在發揮部分作用。

彭凱是金誠同達律師事務所高級合夥人,幫多家跨國企業和大型集團公司處理數據合規業務,他告訴《等深線》記者,目前,即使是在一些大型企業和集團公司中,他們的信息系統基礎設施(在安全防控方面)並沒有我們想象的好。這就帶來一個問題,在數據使用、傳輸過程中,被外界攻擊怎麼辦?數據泄露怎麼辦?甚至還有一些更爲原始的數據傳輸方式,比如拿一個U盤拷貝了數據,U盤丟了怎麼辦?

“從這個角度看,隱私計算爲數據商業化應用提供了一個技術層面的解決方案。”彭凱說,“因爲數據‘不可見’,能在一定程度上規避數據傳輸過程中的攻擊和泄露風險。”

目前,監管部門在反洗錢和反詐騙方面對銀行和金融機構有較高的要求,隱私計算在金融機構的一部分應用市場即來自於此。除此之外,貸款發放的風險審覈也是當下隱私計算在金融機構的另一個應用場景。

對於金融機構而言,運用隱私計算服務的優勢,在於可以使用多方數據對貸款申請者的資信、還款能力等風險因素進行評估,從而實現“精準風控”的目的。徐敏告訴記者,目前較爲主流的方式,是銀行自身數據與運營商數據、政府公共部門數據綜合運用,通過隱私計算,就能夠得出較爲精準的貸款申請者風險評估,並進行分類。

不過,法律和監管要求電信運營商不得對外提供涉及敏感個人信息的數據,這就爲隱私計算提供了重要的應用場景。在得到授權的情況下,通過建立模型,可以保證各方數據不出本地亦不可見的情況下,通過模型運算得出金融機構所需的評級,作爲風控參考。“銀行對獲得敏感個人信息並不感興趣,其所需要的,只是能夠精準評估風險的結果。”一位大型股份制銀行風控部門人士說。

徐敏表示,總在深夜打電話,或者是頻繁接聽國際長途,這些情況發生在一個人身上,可能只是特殊的個例,但當數據量足夠大之後,就會發現這種情況和電信詐騙、洗錢等非法金融交易,有一定的正相關性,通過這個邏輯,就可以進行風險評估。“不拿出、不顯示具體的數據,但模型最後會根據計算結果,給出一個風險較高的評級,這對金融機構是很有用的。”他說。

隱私計算之所以能夠實現保護信息安全的目的,是因爲其中存在一項“同態加密”技術。李曉林告訴《等深線》記者,不同的數據所有方,按照一個相同的方式將數據加密,然後再由模型程序進行計算,計算結果解密後和明文(未加密的數據)計算結果一致。利用這項技術,可以實現讓解密方只能獲知最後結果,而無法獲得每一個數據,對保護信息安全有重要意義。

隱私計算的另一個應用場景,在大型金控集團。這類企業可能擁有多張金融牌照、開展多項業務、(不同板塊、公司)各自累積了海量數據,但在監管要求和內部競爭格局的合規約束和制約下,數據在集團內部也不能隨意流動。

彭凱舉例稱,一家大型集團公司,旗下擁有地產、金融、電商等多板塊業務,如果集團公司想整合不同板塊的數據資源,或者把地產板塊的客戶信息用於電商業務的精準營銷,根據《個人信息保護法》需要取得客戶單獨同意的、履行個人信息保護影響評估等法定義務。“這樣的法定要求在實踐中是很難實現的,同時也對大型企業、金融機構的業務流程、合規要求、系統建設提出了更高要求。”彭凱說。

“未來拼的是數據資產能力,數據融合是繞不開的問題。利用隱私計算的方式,可以在合法合規的情況下,得出指標性的評估結果,對於各自(條線)的業務開展,都是很有用的。”一位全牌照金融機構的人士表示,隱私計算可以解決數據跨機構互聯互通的難題。

數據從何而來?

在隱私計算業內有一句“諺語”, “心有餘而數不足”,用來形容缺乏數據的業務運營就像“空中樓閣”,數據從何而來?特別是在《數據安全法》《個人信息保護法》等法規出臺後,企業如何安全合規地利用數據來支撐業務運營,隱私計算爲其提供了一種技術手段。

徐敏告訴記者,從應用層面而言,目前隱私計算重點在對接的數據來源包括三個:銀行數據、運營商數據、電網數據。形成這一結構的原因在於,這類數據規範性較強,標準化程度較高,合規運用的效率較高。

“運營商數據很豐富,用戶通話信息、上網行爲信息和位置信息等,運營商都有,這些數據對於評估分配一個人的資信情況很有價值,這些數據不能對外提供,但是通過隱私計算的方式,可以綜合這些因素,再和銀行的數據一起形成評級,來標定一個主體的風險等級。”徐敏說。

此外,電網機構也是重要的數據來源。一位隱私計算公司的技術人員告訴記者,企業用電負荷、繳納電費等電網數據,可以反映企業的經營狀況,但只有這一數據的價值非常有限。如果結合工商登記信息、司法履約信息、對外投資信息等外部數據,構建科學的算法模型,就可以形成企業的評級或徵信信息,等於挖掘出了更多的數據價值。

這個思路已經用於實踐,同盾科技的隱私計算服務中所使用的數據源,便包括部分電網數據。李曉林告訴記者,他們採用的數據處理方式叫作知識聯邦模式,這種模式不同於使用本地的海量數據進行機器學習、模型訓練,而是利用多方的部分數據來提煉知識達到訓練機器學習的作用,從而撬動更大的數據資源來共創和共享知識。

據李曉林介紹,知識聯邦模式是一個多層級的模型系統。可以先在內網層面操作,比如在一定範圍內交換不同的電網數據,把這部分數據加密處理,進行模型訓練,用於訓練的數據不出本地,在模型的科學性和應用性達標後,用於訓練的數據將被清除,而這個模型將用於電網數據和其他外部數據融合。“這種模式更安全,且不能反推出原始數據,已經被用於金融反欺詐、企業融資、營銷、疫情預報等場景。”他說。

而擁有數據資源或數據使用權的一方,也有開發數據價值的訴求,換言之,就是他們也需要和外部數據互聯互通,推動多數據資源整合。一位運營商人士表示,他們有專門的部門和團隊開展合規數據經營業務。現在,隱私計算的服務商,也是他們的客戶。在與客戶的合作中,運營商遵循兩個原則:其一,不外泄個人信息,具體包括電話號碼、APP裝機種類、開機時長等;其二,相關信息不能對應個人姓名、電話,且信息不能“出本地”。

但是,他拒絕向記者透露這種合作具體的費用標準。

記者瞭解到,國家電網也成立了商用大數據、徵信公司,拓展電力大數據的應用場景,打破各行業間的數據孤島,推動數字經濟融合發展,隱私計算將發揮更大作用。

“隱私計算有助於將數據的所有權和使用權分離,並創造商業價值,這在數據成爲生產要素後,有着非常重大的現實意義和作用。”徐敏說。

賽道有多大?

牽涉到算法、模型、數據這些頗具“技術含量”的語彙,隱私計算給人“高深莫測”的感覺,技術是隱私計算立命根本,但這個賽道前景如何?商業化道路能走多遠?應用空間也是不可忽視的問題。

就商業模式,徐敏告訴記者,隱私計算一般有兩種模式:一種是收取隱私計算系統搭建的費用,這種模式下,收入是以“單”計算的,根據客戶需求的不同,有不同的報價組合;另一種是收取運營的費用,即搭建系統完成後,按照客戶使用查詢的次數收費。這部分費用先由隱私計算服務供應商向客戶收取,而後隱私計算服務的供應商,再向數據方支付使用數據的費用。

至於處理海量數據和查詢服務的系統運算速度如何,是否會影響“客戶體驗”,徐敏表示,這其實不是太大的問題,他以銀聯數據和新網銀行牽頭的、藍象智聯參與的多家金融機構間數據共享平臺爲例,目前每天大約有60多萬筆跨機構隱私查詢,每筆大概只需要100~200毫秒。

“這個速度相當於在百度上搜索詞條,按回車鍵就立刻出現搜索結果,也就是‘實時’速度。”一位隱私計算業內的技術人士解釋道,如果慢於這個速度,是無法商業落地的。

除此之外,在與客戶建立了較爲緊密的合作關係後,隱私計算服務供應商還可以根據客戶的需求,針對不同的應用場景,提供建模等方面的諮詢服務,這也是根據客戶的需求組合報價。“這種打包提供綜合性的服務,也是我們盈利的商業模式之一。”同盾科技的相關人士說。

目前,隱私計算尚屬起步階段,業內則將2021年視作“元年”。

童玲認爲,新技術的崛起通常有三個階段:第一個階段是尋找樣本客戶,也就是第一批喫螃蟹的人;第二個階段是經過第一批客戶的應用,讓大家看到一些真正有價值的場景,這些場景未來可能會成爲現象級場景;第三個階段則是相關政策、監管等外部環境的支持。“經過這幾個階段,這項技術就能夠加快推廣和應用。”她說。

正在爲這項新技術崛起躍躍欲試的企業主要有兩類:一類是大型互聯網平臺企業體系中從事隱私計算業務的公司,比如螞蟻金服的螞蟻摩斯鏈、騰訊雲隱私計算等;另一類是初創類公司,它們要麼具有高校院所的背景,要麼主要的骨幹人員來自大型互聯網公司。業內人士告訴記者,這其中較爲典型的,一個是華控清交,另一個是藍象智聯。

隱私計算作爲數字經濟底層基礎設施被看好,但目前落地的場景有限,有觀點認爲其商業化應用的前景尚待驗證。一位爲金融機構提供諮詢服務的人士告訴《等深線》記者,隱私計算概念很火,在內外部數據交換融合時發揮較大作用,但在中小銀行領域的市場一直一般,這是爲什麼?就是因爲沒有應用層的場景。

該人士稱,數據不足是行業面臨的問題,但在實際應用中,相較於外部數據,通過線下渠道獲得的非標準化數據可能能構建更有價值的用戶畫像。他舉例說:“中小銀行的一部分客戶本身是無法數字化的,比如一些小微企業是通過個人賬戶收款的,社保、稅務等系統的數據並不能準確反映這類企業的情況,還是需要客戶經理線下去做盡調,瞭解情況。”

不僅如此,金融數據對外開放也是個複雜的問題。彭凱告訴記者,很多信息一旦進入金融業務領域,就會涉及到徵信問題,如果變爲徵信信息,就不能輕易拿出去合作了,因爲在現有的監管體系下,需要具有個人徵信業務牌照的機構才能開展此類業務。

前述天使投資機構的投資人告訴記者,隱私計算已經不是藍海。他做了一個推算,未來5年,大數據市場交易額約在500億~600億元,通過與數據持有方分潤,隱私計算服務商可以獲得百億元左右的市場規模,同時,通過自身經營,也可以獲得百億元左右的收入。因此,他保守估計,隱私計算未來一段的市場規模應在200億~300億左右。

“從市場容量來看,隱私計算很難是一個獨立的賽道。”前述同盾科技的相關人士說。

“應用場景要繼續擴大,否則總能看到天花板,這會影響到市場對隱私計算的持續投資。”前述天使投資機構的投資人說。

當下,在隱私計算賽道中投資的資本,其規模和量級各異。其中既包括金沙江、聯想這樣的大型知名投資機構,也包括一些規模不大的投資機構。“甚至就是私人金主投錢。”一位業內人士說。

“隱私計算本質上是促進數據安全流通的底層技術,是數據經濟領域的一個基礎設施,既和數據有關也和安全有關,所以我們目前選擇的投資方里更傾向於有國資背景的人民幣基金。”童玲說。

隱私計算的鼻祖姚期智2004年返回中國,並於2016年放棄美國國籍,轉爲中科院院士。2021年6月18日,姚期智獲得第36屆日本京都獎。姚期智在頒獎演講中說:“科學帶來了創新,可以改善人類的現狀,爲未來所面臨的挑戰做好準備。”

隱私計算帶來的創新,會給人類帶來怎樣的未來?

(編輯:孟慶偉 校對:顏京寧)

相關文章