萬衆矚目,9月17日至19日,由國家發展和改革委員會、科技部、工業和信息化部、國家網信辦、中國科學院、中國工程院和上海市人民政府共同主辦2018 世界人工智能大會在上海舉辦。

本屆大會以“人工智能賦能新時代”爲主題,谷歌、亞馬遜、微軟、騰訊、百度等互聯網巨頭紛紛現身,共同承辦了總計30餘個圍繞人工智能領域開展的分論壇,全球超過200餘家人工智能領域領軍企業參加了論壇和展示活動。

9月18日下午,在由小i機器人承辦的“聽見聽懂 AI知你心”智能語音語義分論壇上,合合信息聯合創始人、副總裁龍騰博士,以“文本智能處理技術在實踐中的應用”爲題發表主題演講。從文本智能處理技術發展現狀入手,分析了目前可行的實踐應用模式以及未來對於如何讓機器“閱讀”人類文字的美好展望。

要想讓讓機器學會閱讀,首先要解決入口問題——進行文本識別。OCR技術作爲文本識別技術的核心,同時也是較爲成熟的一種技術在近幾年得到了人工智能領域的重視。百度、阿里、騰訊等巨頭的紛紛加入也讓沉寂多時的文本處理技術一時間炙手可熱。在實踐中,當OCR技術面對複雜的現實情況,譬如抖動模糊、歪斜、反光、形變、遠距離低像素等,文本識別率往往不如人意。

文檔智能處理技術基於人工智能技術的發展,將深度學習和文本識別進行結合,推出的STR(Scenetext Recognition場景文本識別)技術則很好地解決了傳統OCR技術無法解決的問題。通過在具體垂直案例中的測試,STR技術相較OCR技術的文本識別率得到了質的飛躍。以銀行卡識別爲例,目前合合信息的銀行卡識別廣泛應用於全球的支付行業,合作伙伴包括三星、eBay、支付寶,翼支付等國內外的知名支付公司。在與三星的合作過程中,合合信息銀行卡識別準確度高達99.9%,並且可以支持全球範圍內的銀行卡識別。在國內,超過80%的券商在證件識別領域都選擇了合合信息作爲其供應商。

在To C領域,合合信息早在2009年就推出了第一款運用文本智能處理技術的移動應用——名片全能王,這也是全球第一個將模式識別技術運用到手機上的APP,目前在全球名片全能王擁有3.2億用戶,另一款文本掃描識別APP掃描全能王,則擁有3.7億用戶,其中80%都是海外用戶。To B領域,經過多年的深耕,目前合合信息的STR技術已經成熟運用於金融、銀行、保險等領域。而要讓機器讀“懂”人類的語言,除了做好入口的文本識別,語言語義分析技術的實現也是必不可少的一環。合合信息擁有名片、財報、企業三證、合同、外賣小票等一百多個識別模塊,攻克了語言判斷、文字識別、版面理解、語義理解等多道難題,讓機器像人類一樣,動態實時學習更新。

正是出於對文本智能處理技術的極致追求,方成就了今天合合信息在該領域全球領先的地位。從名片識別、文檔識別,到如今的一百多個模塊識別,七百多億條企業數據,合合一步一個腳印,通過STR+Data+AI的行業解決方案,賦能保險、證券、酒店、物流、o2o等行業,

助力企業縮減人員成本、提高行業效率。

分享最後,龍騰博士將多年深耕在人工智能領域的經驗總結爲一句話:

“垂直領域,扎深扎透。

日積月累,必成江河。”

查看原文 >>
相關文章