金融大模型爭鋒能否“重塑”行業？

本報記者李暉北京報道

大模型正在成爲推進金融業數字化的第二波浪潮。

在對新技術最敏感也最謹慎的金融業，雖然大模型的滲透仍處於初期，但沒有一家機構對其“不關注”，一些大廠（大型互聯網公司）甚至一度“門庭若市”。近半年來，銀行、券商、保險等傳統金融機構，以及金融科技公司、隱私計算類公司紛紛下場。

“今年4月我們銀行領導計劃拜訪主要科技公司，一接觸發現竟然‘需要排隊’，很多大型銀行、頭部股份制銀行是董事長、行長級別帶隊去調研。”一位國有大型銀行技術高管向《中國經營報》記者透露。

值得注意的是，大模型除了進一步提升金融行業數字化水平之外，是否能帶來質變層面的利好尚需時間檢驗。中國工程院院士、復旦大學金融科技研究院院長柴洪峯在今年7月的一場公開演講中指出，從技術面看，金融數據和知識的私密性限制了共享和構建大規模數據集的能力，金融數據的多模態特性增加了模型處理和建模的複雜性。

記者採訪的多位從業者認爲，大模型是金融行業“必爭之地”，但仍要面對技術挑戰和行業特點限制。想進一步滲透到風控等金融核心業務，還需要在垂直領域精調，並經過相對完整信貸週期證明。

“塔尖技術”浪卷金融業

大模型是“大規模預訓練模型”的簡稱，主要依據參數規模（即函數的參數數量）來定義，相對於基礎深度學習的“小模型”，通常參數規模多於10億的模型被稱作“大模型”。

科技部下屬相關單位發佈的《中國人工智能大模型地圖研究報告》顯示，截至2023年5月末，全國參數在10億規模以上的大模型已發佈79個，數量僅次於美國排名全球第二。

騰訊研究院今年7月末的一項調研數據顯示，國內參數在10億規模以上的大模型數量已由5月末的79個增加至116個，其中金融行業大模型約18個。

從公開信息看，5月，大數據基礎軟件供應商星環科技推出面向金融量化領域的生成式大語言模型“無涯Infinity”；5月下旬，度小滿推出國內首個千億級中文金融大模型“軒轅”；6月底，恒生電子推出金融行業大模型“LightGPT”；同期，拓爾思發佈包括金融行業大模型在內的產品；8月底，馬上消費金融發佈了首個零售金融大模型“天鏡”。

而更多的銀行機構則由於謹慎和保密的考慮選擇“默默發力”。目前，正式披露相關消息的包括工商銀行和農業銀行。其中，工商銀行基於昇騰AI的金融行業通用模型，實現企業級金融通用模型的研製投產；農業銀行則通過自主研發推出“ChatABC”，並在行內科技問答場景進行了內部試點。

據記者瞭解，自然語言處理（NLP）、機器學習（ML）、計算機視覺（CV）、智能機器人（IR）等是人工智能應用最廣的幾個子領域。

在北京大學光華管理學院商務統計與經濟計量系教授王漢生看來，算力、算法、數據構成了新範式的“三駕馬車”，好的人工智能算法、模型最終要解決的是業務問題，數據模型落地最重要的是尋找應用場景。

而圍繞NLP的大模型則決定了其在金融業務中的主要應用範圍。從第一批披露“大模型”相關動作的金融機構來看，應用探索多集中在智能投顧、智能客服、營銷渠道、保險理賠、研報撰寫等業務場景。

前述國有大型銀行技術高管提供的場景列表顯示，該行自研的大模型目前已經應用在在線客服輔助、智能知識輔助、法律事務問答、運維知識問答、輔助分析財報、網絡安全輔助分析、智能輔助公文生成等場景。從效果來看，智能客服可以持續提升問答結果準確率。

“從行業應用路徑來看，科技巨頭提供通用大模型，或者技術能力強的金融科技公司提供金融行業大模型，具體的金融機構基於這個行業底層模型，用自己的業務數據去做私域訓練，然後做私有化的部署和應用。”度小滿CTO許冬亮表示。

根據度小滿官方信息，其中文金融大模型“軒轅”開源以來已經有上百家金融機構申請試用。度小滿數據智能部總經理楊青透露，“軒轅”大模型2.0版本將在今年10月發佈，將會進一步提高對話和金融理解等場景下的能力，實現處理更長的金融報告、研究和分析。

除度小滿之外，奇富科技在2023年二季度財報中披露：通過對預訓練的深度學習模型和大語言模型進行調優，使得在用戶身份識別和行業識別場景下，模型理解能力提高。騰訊雲在今年7月披露，其已經推出金融風控大模型。數據顯示，應用後客戶風控策略部署效率提升10倍。而馬上消費金融也在近期發佈“天鏡大模型”時透露，該模型將應用於營銷獲客、風險審批、客戶運營、客戶服務、安全合規、資產管理六個零售金融最典型的場景。

核心業務有待滲透

從制約因素來看，任何AI 大模型都面臨着算力需求大、訓練和推理成本高、數據質量不佳、隱私和安全問題等挑戰。而由於金融行業面對的監管門檻更高，對大模型在數據合規性、可追溯性、私有化部署、風險控制等方面就提出了更多要求。

據記者瞭解，大模型主要有兩個方面需要改造，一是高達上千億的模型參數，需要算力支持和高可擴展的調度框架；二是巨量的高質量語料訓練。而僅在第一個方面，就需要數以億元級別的投入。

“算力的成本也決定了小機構很難負擔，2023年3月我們發現AI服務器市場出現幾倍增長。比較幸運的是我們今年年初囤了不少卡（CPU），這也是我們在大模型風起時能夠快速跟進的基礎。”一家金融科技公司內部人士向記者表示。

而在數據安全方面，前述國有大型銀行技術高管透露，銀行的大模型業務主要基於開源數據，以及行內已有的數據進行清洗。這要求AI首先要懂本行知識，要支持多輪對話，還要能實現知識更新並對齊人類思維。而如果是引入外部合作方，必須都部署在銀行本地。

在金融這種專業門檻極高的領域，所需的“巨量語料”顯然不是互聯網免費公開的數據，要訓練出精度極高的模型，需要的是極其準確專業的知識，甚至是核心付費數據。大模型的幻覺問題（AI“一本正經地胡說八道”）在金融領域更是無法容忍的弱點。

業界傾向認同：通用的大模型往往只能解決80%的問題，而在面向行業細分領域時，還需要結合信貸傳統模型在深度學習領域的積累。

馬上消費首席信息官蔣寧認爲，通用大模型和金融大模型存在本質區別。目前，大模型還面臨關鍵性任務和動態適應性、個性化要求和隱私保護、羣體智能與安全可信，以及基礎設施的能力四大難題。“生成式模型不能做解釋，但是金融大模型最主要的模型叫作判別性，它需要做決策，包括交易決策。”

事實上，當前銀行廣泛使用的“大數據”風控模型也是伴隨互聯網貸款業務的發展，歷經五年時間，逐步由形式風控走到實質風控，由聯合風控走到獨立風控，由內部質疑走到廣泛接受。從這一邏輯來看，“大模型”顯然也需要經過數據的積累週期、完整的信貸週期、市場的接受週期等過程，纔可能真正放心地投入到銀行信貸的核心環節。

“大模型在金融行業的落地路徑需要通過大數據的整合、大算力的合作，在垂直領域精調模型，以小規模算力打造輕量級推理模型。”在光大信託數據公司總經理祝世虎看來，目前大模型在金融領域的應用主要集中在智能客服、智能運營、智能辦公等領域，後續應該更多地應用於風險管理、資本管理和監管科技等方向，且對於傳統風控難以捕捉的、由小尺度風險傳導至大尺度風險的風險刻畫，也可能是大模型的優勢之一。

“但需要注意，大模型是社會整體生產力級別的提升，會產生‘雙刃劍’的效果，即機構在風控、反詐領域性能提升，而黑產、詐騙團伙等也可能會使用這些能力，攻防雙方未來可能會在更高科技維度上去對峙。”祝世虎向記者進一步表示。