遏制貸款欺詐：銀行試水圖數據庫技術構築知識圖譜“防火牆”

　　原標題：遏制貸款欺詐：銀行試水圖數據庫技術，構築知識圖譜“防火牆”

來源：21世紀經濟報道

作者：陳植

“與黑產團伙的鬥爭，永遠是道高一尺，魔高一丈的博弈。”一位股份制銀行風控部門人士趙強（化名）感慨說。

近日，他發現貸款欺詐行爲正變得更加“隱蔽”——比如一家企業因資金週轉困難，竟慫恿員工向銀行申請個人消費貸款“紓困”。隨着這些員工未能按時償還貸款，銀行方纔發現這家企業早已因經營不善而倒閉，員工拿不到企業還款，也就無力償還貸款。

“這讓我們意識到，原先的大數據反欺詐風控模型或許已過時。”趙強表示。一直以來，銀行通過跟蹤信貸資金流向以防範欺詐風險的各項數據，主要通過表格方式存儲呈現。但隨着銀行每日交易流水量達到百萬級，傳統的表格查詢方式不但跟不上業務發展速度，極其“抽象”的呈現方式也令銀行風控部門難以在海量數據裏，精準捕捉貸款欺詐行爲的蛛絲馬跡。

記者多方瞭解到，隨着貸款欺詐方式日益多元化與隱蔽化，越來越多銀行機構也意識到傳統大數據反欺詐技術的侷限性，紛紛探索基於知識圖譜（關係網絡）的新型反欺詐技術。

“所以越來越多金融機構選擇圖數據庫技術作爲反欺詐模型的底層技術。”TigerGraph（維加星信息科技（上海）有限公司）解決方案顧問李憓松向記者透露。某種程度而言，圖數據庫技術好不好用，呈現的用戶賬戶關係網絡全不全，數據處理分析速度能否起到實時預警欺詐風險的效果，對銀行持續升級反欺詐風控模型有着至關重要的作用。

所謂圖數據庫技術，主要是通過點和邊的形式呈現人、地點、事物等數據是如何相互關聯的，進而協助銀行風控部門通過圖分析技術，藉助用戶社會關係、交易模式關聯、互聯網行爲、移動設備等數據特徵，對客戶行爲模式進行匹配分析，精準判斷客戶是否存在貸款欺詐（或遭遇欺詐而申請貸款）的可能性。

“目前，不少銀行基於圖數據庫技術，一面構建基於知識圖譜（關係網絡）的反欺詐風控模型，一方面則挖掘出新的反欺詐風控規則，在大幅提升欺詐行爲預判精準性同時，有效抵禦黑產團伙的頻繁大規模攻擊。”一位城商行風控部門主管向記者直言。比如在信用卡套現欺詐行爲的偵測過程，他所在的銀行採取多部圖及高密子圖偵測等方法，將代碼運行時間從2-3周縮短爲1小時，輸出結果覆蓋的黑樣本（與黑產團伙相關的賬戶號碼等）從總量的58%提高到77%，既提升了對欺詐行爲的實時監測預警效率，也令更多欺詐行爲變得無所遁形。

李憓松透露，當前圖數據庫技術還能有效搜索資金交易鏈路、迴路等結構，在發現洗錢鏈路、套現團伙、反貸款欺詐等業務應用場景具有天然的優勢。

銀行與黑產團隊的“鬥智鬥勇”再升級

記者多方瞭解到，隨着科技發展，貸款欺詐方式也變得多元化——尤其是越來越多黑產團伙從原先的盜號，演變成使用大規模攻擊、通過IP池等技術繞過風控規則實施貸款欺詐，導致金融機構遭遇的欺詐狀況日益複雜，傳統的大數據反欺詐模型變得“力不從心”。

“目前，黑產團伙還呈現專業化、產業化、隱蔽化、突發化的新特徵。”趙強向記者指出。

所謂專業化，即黑產團隊招募大量風控人員，專業黑客、AI專家等，通過大規模攻擊等方式“反覆測試”金融機構的反欺詐風控規則，一旦他們掌握這些風控規則且找出相應的漏洞，就會迅速制定針對性欺詐手段騙取鉅額貸款資金。

產業化，則是貸款欺詐行爲已從單個作案發展成團伙作案，即黑產團隊通過獲取大量賬號進行大規模攻擊，以實現欺詐收益最大化。

隱蔽化，即黑產團隊跨境作案日益普遍，往往會利用IP池對身份進行洗牌，將交易鏈路變得更加複雜，從而令金融機構難以開展深層次數據挖掘以識別其中的欺詐風險。

突發化，是黑產團隊賬戶號碼一旦進入徵信系統就迅速“作廢”，迫使黑產團伙採取兩種方式對這些賬戶號碼進行最大化利用，一是用一個號碼向多家銀行等金融機構進行騙貸，二是使用很多賬戶在同一時間內，對銀行等金融機構反欺詐規則漏洞進行大規模突擊性攻擊，若銀行等金融機構不具備高實時性的反欺詐監測能力，就容易被“攻破”。

“這無形間對銀行持續升級反欺詐風控模型提出更大的考驗。”趙強強調說。目前他所說的銀行反欺詐風控模型已出現某些技術性短板，一是對欺詐行爲的數據監測分析存在“滯後性”——當銀行發現欺詐行爲蹤跡時，有些欺詐行爲已發生；二是反欺詐風控規則迭代更新速度偏慢，容易被黑產團隊利用大規模攻擊方式“洞察”其中祕密。

記者獲悉，這驅動越來越多銀行等金融機構開始嘗試使用圖數據庫技術工具，構建反欺詐風控新模型。

李憓松告訴記者，已有多家銀行使用TigerGraph圖分析技術構建基於知識圖譜的反欺詐模型。究其原因，一是TigerGraph實時圖數據庫能將不同數據源的萬億級數據進行集中處理，並提供實時查詢能力，從而在貸款發放前識別欺詐行爲；二是TigerGraph可以爲機器學習提供圖特徵，對某些隱蔽性高的欺詐行爲進行快速識別，比如通過對借款人的各類關係特徵進行建模，對潛在的欺詐行爲進行毫秒級實時甄別；三是圖特徵結合邏輯迴歸、決策樹等機器學習算法所得到的預測分析結果比較容易理解，有助於銀行風控人員加快反欺詐風控模型迭代升級進程。

“目前，圖數據庫技術已在某些金融反欺詐領域得到廣泛應用。”他指出。比如根據業務人員以往經驗，不少銀行認爲公司在獲得貸款後的短時間內（比如3天內）將大部分貸款資金（貸款金額80%以上）轉出，可能存在違規使用企業信貸資金購買房產的行爲。於是這些銀行採取圖數據庫技術，在全圖上設置查詢條件——（1）發放貸款與轉出交易的時間差在3天內、（2）轉出的總金額不小於貸款發放金額的80%，就能迅速得到符合上述條件的所有資金交易賬戶關聯網絡圖，再快速識別資金是否流向存在買房行爲的關聯賬戶，及時阻止信貸資金違規流入樓市的行爲。

“相比基於關係型數據庫的查詢，TigerGraph圖查詢的條件設置直觀且簡便，無論從分析結果呈現還是業務邏輯關聯，都具有較強的可解釋性。” 李憓松表示。

圖數據庫技術的“新挑戰”

儘管越來越多銀行開始將圖數據庫技術作爲構建知識圖譜反欺詐模型的重要抓手，但在實際操作環節，他們仍遇到不少操作痛點——比如某些金融科技公司提供的圖數據庫+大數據平臺技術，難以擴展到多臺機器、難以深度鏈接分析、不支持實時反欺詐預警等問題。

“因此，我們一直致力於創建操作簡單且技術成熟的解決方案，徹底解決上述三大痛點。”李憓松向記者直言。在可擴展性和高性能方面，TigerGraph已能夠支持萬億級別的關係網絡處理和亞秒級查詢；在易用性方面，TigerGraph則採用類SQL高級SDK，擁有圖靈計算完備的表達力，支持以天計算的PoC（項目驗證）能力；此外，TigerGraph還開發了基於瀏覽器的GraphStudio可視化開發工具，令銀行等金融機構更容易使用圖數據庫技術清晰全面地呈現各類賬戶的關聯網絡，洞察其中的欺詐行爲蛛絲馬跡。

在業內人士看來，圖數據庫技術能否最大限度提升基於知識圖譜的反欺詐模型運營效果，還取決於用戶數據全面性。

“畢竟，用戶數據是圖分析的基礎。若銀行在遵循相關法律法規和監管要求的情況下，通過用戶授權收集到更全面的個人數據，風控人員就能構建更完整的用戶社會關係、交易模式關聯、互聯網行爲、移動設備等圖數據庫，從而對用戶行爲模式開展更精準的匹配分析，對用戶是否存在貸款欺詐（或遭遇欺詐而申請貸款）的判斷會變得更準確。”上述城商行風控部門主管指出。然而，數據安全保護相關法規日益嚴格導致個人數據獲取難度日益增加，對銀行完善知識圖譜反欺詐模型的數據積累構成相當大的挑戰。

記者獲悉，部分銀行決定另闢蹊徑——在數據量不足的情況下，利用圖數據庫技術將業務人員以往的反欺詐經驗總結成衆多風控規則，編寫相應圖數據庫查詢代碼，令圖數據庫查詢結果具有更大的覆蓋度，從而協助風控部門提升資金流向追蹤監控能力，在更大範疇與維度洞察各類潛在的貸款欺詐行爲。

“目前，我們迫切需要構建大量全新的反欺詐風控規則，以確保我們的反欺詐風控模型始終領先黑產團伙，纔能有效抵禦他們大規模攻擊行爲。”趙強指出。