聯邦學習開創了一種面向數據隱私保護的機器學習新算法。

如今數據已是新產業、新業態的核心生產要素,數據運用面臨的隱私性、可用性也隨之備受關注。

較其他領域,金融領域對數據的管控更爲嚴格。目前,一種面向數據隱私保護的機器學習新算法——聯邦學習,爲金融行業人工智能技術的應用提供了一種新的機制和平臺,有效打破隱私保護與數據使用的困局。

目前大型銀行已經開始佈局,部分金融科技公司也已紛紛入局聯邦學習應用。那麼聯邦學習在金融行業大規模落地還面臨着哪些問題?如何解決?

銀行“扎堆”聯邦學習

“目前部分頭部銀行已經開始做聯邦學習的商業化落地,比如對供應商的招募已經開始,今後在頭部銀行的帶動作用下,隱私計算技術在金融行業大規模落地的趨勢十分明顯。” 4月18日,在中國計算機學會(CCF)主辦、CCF YOCSEF上海學術委員會和普華永道協辦的聯邦學習技術論壇上,致星科技商務副總裁許振提到。

據許振透露,聯邦學習在產業落地的應用場景範圍很大,相當於一個數據淘寶,預計今年內會有更多聯邦學習相關基礎設施落地。

交通銀行金融科技創新研究院研究員謝謹在會上介紹,隱私計算是面向隱私信息全生命週期保護的計算理論和方法,具體是指在處理視頻、音頻、圖像、圖形、文字、數值、泛在網絡行爲信息流等信息時,對所涉及的隱私信息進行描述、度量、評價和融合應用等操作,形成一套符號化、公式化且具有量化評價標準的隱私計算理論、算法及應用技術,支持多系統融合的隱私信息保護。聯邦學習是隱私計算技術的一種,是機器學習和人工智能面對更加嚴格的數據管理規定的解決方案。

根據此前微衆銀行發佈的《聯邦學習白皮書V 2.0》(下稱“白皮書”),通過合規的多維度聯邦數據建模,風控模型效果通常約可提升12%,消費金融類企業機構有效節約了信貸審覈成本,整體成本預計下降5%-10%,並因數據樣本量的提升和豐富,風控能力進一步增強。

白皮書提到,聯邦學習的核心特徵在於,參與各方在不轉移自身數據的前提下,進行數據聯合訓練,從而實現聯合建模的目標。

目前,聯邦學習已經在一些關鍵的金融領域取得了進展,例如智慧風控場景、隱私保護場景等。

謝謹具體介紹稱,基於多方安全知識圖譜可以計算中小微企業融資服務項目,通過融合圖計算與安全計算技術,在保護各自數據的條件下,實現跨機構間(如銀行與運營商)數據安全融合,構建聯合關係圖譜,打破圖計算的數據邊界,識別更復雜、更全面的關係鏈條以及欺詐風險。

隱私保護方面,則運用多方安全計算、圖像識別技術,有效覈實商戶責任人和收銀員身份,解決傳統收單管理中設備、人工驗證帶來的管理漏洞,在保護商戶責任人和收銀員隱私安全的基礎上有效提升收單機構反欺詐、反洗錢等風控能力,降低收單機構運營成本。

大規模落地難在哪?

相較於其他領域,金融領域對數據的管控更爲嚴格,因此在實際的落地過程中,總是面臨着各種問題。

“在不同的隱私計算平臺之間實現跨接成爲新形勢下的必然趨勢。不同的機構在不同的業務場景中應用不同的隱私計算技術形態;會逐漸形成了事實上難以對接的新數據壁壘。因此,在不同的技術平臺之間尋求可能的跨接協議甚至是橋接平臺將成爲未來的需求。”謝謹介紹道:“常見的橫向聯邦學習模型是最常見也容易實現互聯互通考慮的聯合建模方向,但縱向聯邦學習的互聯互通是主要突破點。聯邦遷移學習本身可以爲未來的應用場景拓展無限可能。”

對於今後隱私計算技術能否在金融行業大規模落地。平安科技聯邦智能產品部李澤遠在會上分析稱,目前金融領域每條業務線及相關係統都在做數字化轉型,跨部門甚至跨機構間的數據流通成爲剛需。處於對隱私安全保護意識的提升,數據流通必然是需要隱私計算技術的支撐。

談及落地方面的難點,李澤稱,目前我國中小型銀行數量較多,但這類銀行的科技能力有限,對金融科技方面的前期建設投入較大,相關項目週期較長。此外對於隱私計算產品的市場監督度,還需要進一步提升。對於隱私計算,金融機構應從被動接受要求轉化爲主動落地金融相關的產品。

針對落地應用的瓶頸,上海交通大學教授鬱昱會上指出,首先是效率問題,當前不能做大規模的通用計算,只有一些簡單的計算;其次是安全性方面,由於隱私很難量化,對於安全性如何證明,如何評估都需要進一步解決。此外,除了技術還有更多方面的因素需要考慮。如合規性的問題,產品屬性如何界定,如何被相關機構認可和監管這些都是需要考慮的問題。

相關文章