摘要:王海峯在演講中介紹,百度創新地融合知識圖譜、自然語言處理及深度學習技術,研發了能夠深刻理解用戶意圖、精準滿足搜索需求、提供更豐富知識內容的智能搜索引擎,並結合語音、圖像、AR等感知技術能力,更便捷地與用戶交互,爲用戶提供更精準高效的信息服務。當下,大數據、知識圖譜、機器學習、深度學習等技術快速發展,並與自然語言處理密切結合,推動語言智能持續發展和突破,並越來越多地應用於各個行業。

【環球網科技綜合報道】“理解和運用自然語言是人工智能的核心問題之一。大數據、機器學習、深度學習和知識圖譜等技術的發展,正在給語言與智能的發展帶來突破。”4月20日,第十四屆中國電子信息技術年會上,百度高級副總裁、AI技術平臺體系(AIG)和基礎技術體系(TG)總負責人王海峯發表題爲《語言與智能》的演講,以翻譯爲例介紹了人工智能技術的演進,闡釋近期語言與知識技術和大數據、深度學習等技術結合帶來的突破、行業應用,以及技術趨勢和挑戰。

百度王海峯:語言智能的發展將推動AI技術加快落地

王海峯表示,“通俗來講,人工智能是讓機器可以像人一樣,具備聽覺、視覺、語言、行爲能力,可以進行邏輯計算和推理規劃,並基於知識學習持續進化。”

衆所周知,語言是人類思考的媒介,是人類特有的高級智力活動。早期的簡單符號,到甲骨文,到紙質的書,以及現代互聯網上的文本,語言文字這一載體讓知識得以凝鍊和傳承,可以說,語言文字促進了人類文明的發展。因此,如何理解和運用自然語言,是人工智能需要解決的核心問題之一。當下,大數據、知識圖譜、機器學習、深度學習等技術快速發展,並與自然語言處理密切結合,推動語言智能持續發展和突破,並越來越多地應用於各個行業。

自然語言處理是人工智能皇冠上的明珠,而填補語言鴻溝的機器翻譯則是自然語言處理最典型的應用技術之一。王海峯從親歷的機器翻譯發展史中以小窺大,梳理介紹了人工智能技術的發展和演化歷程。

據瞭解,王海峯從1993年開始從事機器翻譯的相關研究,初期便採用基於規則的方法,在國家“863”評測獲得第一。2010年加入百度後,他帶領團隊融合統計與規則、實例和神經網絡等方法,實現了多方面的技術創新,打造出服務億萬用戶的百度翻譯,並在2015年率先發布互聯網神經網絡翻譯系統。目前,百度翻譯可支持全球28種語言互譯,覆蓋756個翻譯方向,超過15萬家第三方應用接入百度翻譯API,每日翻譯字符數超過千億。

王海峯表示,機器翻譯的發展從最初運用規則系統,到統計的機器學習方法,後又解決算法、算力等各方面的問題,不斷登上新的臺階。人工智能的發展脈絡與此相似,經歷多種方法的探索和實踐,有過低谷和高潮,總的趨勢是在持續進步。

另外,在自然語言處理領域,深度學習模型具有比傳統機器學習模型更強的數據學習能力,使得基於深度學習的依存句法分析等自然語言處理系統準確率得到大幅提升。

目前,深度學習領域主要有強化學習、監督學習、無/自監督學習三種學習範式,而無/自監督學習可以類比人類學習,是重要的一種學習方式。

依託深度學習技術的發展,語音、圖像等感知技術取得了巨大進步,但認知技術的突破,會越來越依賴知識,需要提升對知識和大規模知識圖譜的運用。在物理世界、人類社會和網絡空間中,匯聚了大量的多元、異構、多模態的數據,百度藉助無標籤大數據開放域知識挖掘、知識體系自動擴展、知識整合等技術,基於海量數據構建起了超大規模知識圖譜。目前,百度擁有世界上最大的多元異構知識圖譜,除了包含數億實體、千億級事實,能夠滿足90%用戶需求的實體圖譜,針對不同的應用場景和知識形態,百度還建立起關注點圖譜、行業知識圖譜、POI圖譜、事件圖譜等多種知識圖譜。比如在醫療領域,能夠從病歷等原始文本中,抽取出實體及多元關係,並進行文本結構化,最終構建起醫療圖譜,同時結合醫療大數據、醫療認知計算,應用於醫療臨牀輔助決策服務中。

語言理解技術持續發展,並通過與知識圖譜、深度學習等技術融合,不斷提高各種應用的智能化程度。

王海峯在演講中介紹,百度創新地融合知識圖譜、自然語言處理及深度學習技術,研發了能夠深刻理解用戶意圖、精準滿足搜索需求、提供更豐富知識內容的智能搜索引擎,並結合語音、圖像、AR等感知技術能力,更便捷地與用戶交互,爲用戶提供更精準高效的信息服務。

例如,用戶用自然語言搜索“林徽因的丈夫的父親是誰”,智能搜索引擎能夠理解用戶的意圖,並結合知識圖譜以圖文並茂的形式把答案“梁啓超”精準呈現給用戶。又如,用戶搜索“上面草字頭下面句子的句是什麼字”,智能搜索引擎能夠爲用戶提供“苟”的讀音、筆畫、釋義等豐富的信息。

其中,智能客服是結合自然語言處理、知識圖譜和語音等技術打造的行業解決方案。在智能客服場景中,基於語音語義一體化技術,百度大腦可以準確識別出用戶的話語,理解用戶意圖,進而通過行業知識圖譜的賦能理解業務流程,爲用戶提供相應的服務。整個服務過程流暢自然,實現了與用戶無障礙溝通,提升業務效率並滿足用戶需求。

王海峯表示,“隨着技術發展,我們會越來越深入地理解自然語言、掌握知識,推動人工智能發揮更大的價值,爲人類社會發展提供更大的助力。”

相關文章