微衆銀行楊強：針對中小微企業信貸評審數據稀缺等問題，聯邦學習機制可提升模型的有效性

21世紀經濟報道記者胡天姣深圳報道　近年來，聯邦學習（Federated Learning）與安全多方計算、區塊鏈、可信執行環境（TEE）成爲隱私計算的技術路徑。

金融是聯邦學習主要探索應用領域。聯邦學習提供金融風控、金融營銷、評分卡等業務場景的多方數據源聯合建模服務。隨着行業應用的深化，可用性、效率等多維度被納入整體技術框架，“可信聯邦學習”新範式應運而生。

“需要在‘安全與效率’權衡中推演出一個恆定定律。”微衆銀行首席人工智能官楊強在近日採訪中對記者表示，根據論文《聯邦學習中隱私與模型性能沒有免費午餐定理》，通過隱私與模型性能的“No-free-lunch”安全-收益恆定定律，可實現可信聯邦學習中安全、效用、效率三者的協調。

楊強認爲，“法律法規與技術有機且無縫的結合”是未來金融行業需要注意的關鍵。此外，如何設計巧妙的算法，使聯邦學習能夠應付可能的安全隱患是未來大規模運用至金融場景的重要挑戰。

數據“安全-效用-效率”權衡間的保護機制

中國與美國正在引領全球聯邦學習發展。據統計，在聯邦學習領域，全球高被引論文領先的機構依次是谷歌、卡內基·梅隆大學、北京郵電大學及微衆銀行。

聯邦學習是一種分佈式機器學習技術，以實現“數據可用不可見”、“數據不動模型動”的應用新範式。

楊強表示，根據設定的四個維度（威脅的源頭、威脅性質、隱私窺探的有意/無意及保護措施的嚴格程度），微衆銀行現正與各機構合作，推動基於“No-free-lunch”定律的新標準建設。

作爲一種新範式，“可信聯邦學習”增強了傳統的聯邦學習，使得在保證原始數據的隱私安全和模型的可證安全外，還保證學習過程的高效率和模型的可用性，模型決策機制的可解釋性，模型的可溯源和審計監管。

“需要設計一種保護機制，在‘安全與效率’權衡中推演出一個恆定定律。”楊強指出，根據《聯邦學習中隱私與模型性能沒有免費午餐定理》，通過隱私與模型性能的“No-free-lunch”安全-收益恆定定律，可實現可信聯邦學習的安全、效用、效率三者的協調，在保證數據隱私保護的同時，也最大化模型效用和學習效率。

“在中小微企業信貸場景中，針對中小微企業信貸評審數據稀缺、不全面、歷史信息沉澱不足等問題。”楊強說，通過聯邦學習機制，可在確保數據提供方數據安全以及隱私保護的情況下，爲銀行融匯企業經營數據、稅務數據等多源信息，豐富建模特徵體系，共同提升模型的有效性。

此外，通過將風險前置，從風險源頭切入，隱私計算還可幫助金融機構過濾信貸黑名單客戶。

楊強表示，所有金融場景的應用均有其共性（如風控、銷售、服務），也有其特殊性（如偏重線上或線下，營銷還是反欺詐），對此，可以設計不同的聯邦學習引擎，最大化安全與效率的平衡。

巧妙打造“數據安全鎖”

央行《金融科技發展規劃（2022-2025年）》明確提出，加強金融科技倫理建設，深化數字技術金融應用，健全安全與效率並重的科技成果應用體制機制。

《金融領域科技倫理指引》也要求，金融機構充分獲取用戶授權，以最小必要原則採集數據，使用數據秉持“專事專用”原則，嚴格採取防護措施，依法合規共享數據。

楊強稱，越來越多的金融行業在邁向數字化與智能化，二者聯合起來可被稱爲“數智化”。數智化的一個重要驅動因素爲數據要素流通是，即數據由一個地點流至另一個地點，這由此構成了金融業另一個發展特徵：數據的可交易化。

在“流動”中才能更好地發掘應用數據的價值。楊強表示，在數據交易所內，所有數據均會被定價，且受到知識產權等認證。

“上述特點構成了未來金融生態的重要特徵。他強調，通過提升數據的安全與可交易性，聯邦學習將持續對金融業態的發展發揮關鍵作用。

針對目前聯邦學習中同態加密、差分隱私等隱私保護方法可能帶來計算和通信開銷大、模型性能大幅下降的弊端，論文《FedCG：聯邦條件對抗生成網絡》提出在橫向聯邦學習中將生成對抗網絡與分割學習相結合，有效保護了參與方的數據隱私，同時保障了各參與方模型性能的競爭力。該論文提出了名爲FedIPR的首個聯邦學習模型版權驗證框架。

“如何使技術與法律法規有機未來”是未來金融行業需要注意的關鍵。楊強指出，現有的數據安全法與相關規制一部分得以經由技術實現，另一部分卻需要來自法律、法規的保障。“二者的有機、無縫結合是微衆銀行目前正在進行的嘗試。”他補充，以增強整體決策過程的可解釋性與透明度，同時更具可監管、可問詢及可追蹤性。

聯邦學習也可被視爲促使AI更有效落地的一項技術。“它是AI發展的下一站，也同樣是大數據發展的下一站。”楊強說，其安全可信的數據保護措施下連接數據孤島的模式，將不斷推動全球AI技術的創新與飛躍。隨着聯邦學習在更大範圍和更多行業場景中的滲透及應用，促進企業級數據合作。

他稱，No-Free-lunch是一個亟待突破的瓶頸。數年前，計算機行業有過如多方安全計算等類似探索，但此類探索所產生的數據“安全鎖”很難被打開，難以激發大規模的數據運用。“設計出巧妙算法，使聯邦學習能應對可能的安全隱患是其未來大規模運用至金融場景的關鍵。”

（作者：胡天姣）