8月31日,澎湃新聞記者在世界人工智能大會主會場探營時發現,繼去年的甲骨文識別之後,參展元宇宙核心展的合合信息又將智能文字識別技術應用到了難度更高的鐘鼎文(金文)識別上。

在一隻內部刻有綠色鐘鼎文的青銅鼎器上,架起了兩根小型滑軌,迷你的智能識別設備可左右移動。

記者在展臺上看到,在一隻內部刻有綠色鐘鼎文的青銅鼎器上,架起了兩根小型滑軌,隨着迷你的智能識別設備的左右移動,在沒有人工干預的狀態下,原本處於內凹狀態的鐘鼎文被拉平,並被轉譯成簡體字顯示在上方的屏幕裏,“克曰穆朕文且師華父悤譲氒心寧靜於猷淑哲氒”等原本連在一起的複雜語句,也經過“AI斷句”功能自動處理後,被區分開來,方便大衆理解。

合合信息參展人員告訴澎湃新聞記者,在鐘鼎文的處理過程中,重點展示了智能文字識別技術的應用,通過以“彎曲矯正”爲代表的智能圖像處理、基於深度學習的複雜場景文字識別、自然語言處理(NLP)等三大核心技術層,來精準實現複雜場景中的多語言識別。

與常規文本相比,鐘鼎文字形小而細密,其載體青銅鼎面存在彎曲、反光、凹凸不平的狀況,識別難度極大。這次展示的圖像處理技術可有效解決多種彎曲文檔圖像的矯正問題,還可精準處理拍攝電子屏時出現的摩爾紋以及陰影、圖片模糊等現代文本圖像處理中常見的干擾狀況,讓圖像看起來更清晰,也爲接下來的文字信息提取、識別創造了良好的條件,爲我們研究遠古時期人類的生產生活、歷史演變提供了重要的參考。

參展人員告訴記者,基於不同場景中的文檔識別需求,他們推出了智能文字識別訓練平臺,可識別上百種卡證、票據、行業單據內容。在C端應用中,智能文字識別技術已落地在掃描全能王APP的掃描證件、拍圖識字、試卷作業、掃描書籍等多項功能上,常規的印刷體文檔字符平均識別率達到99.77%, 手寫體文檔字符平均識別率爲 97.00%。

AI的智能識別技術,還有一大神奇功能,就是對“PS篡改”具有火眼金睛般的檢測能力,一切修改TA都知道。

很多人都知道,詐騙團伙在行騙過程中,經常會使用PS過的材料來進行僞裝,從個人證件、票據到各類商業材料,受害者不計其數。合合信息此次帶到世界人工智能大會的智能圖像處理技術,主要採用神經網絡捕捉圖像在篡改過程中留下的細微痕跡,基於百萬級的數據,學習圖像被篡改後統計特徵的變化,不僅可以判斷圖片是否被篡改,還能定位修改區域,以熱力圖形式展示圖片的PS區域篡改置信度,檢測準確率遠超傳統技術方法和人眼判斷。該項技術可對身份證、護照、行駛證、駕駛證、港澳通行證等證照類別,以及增值稅發票、普通發票、醫療發票、小票、合同等多種文檔類別進行檢測,可廣泛應用於保險、銀行、證券、政務等多種場景。

相關文章