摘要:我們團隊的科研重心集中在人機對話方面,我們希望研究人類對話的機制,並由此啓發對話交互的計算模型,在數據集建設、系統開發、平臺建設、前沿創新技術四個層面開展深入研究,爲推動學術研究和產業應用做出我們的貢獻。爲全面實施創新驅動發展戰略,貫徹落實國家《新一代人工智能發展規劃》,通過推薦評選優秀的智能科學技術成果,切實調動廣大智能科技工作者的積極性和創造性,表彰獲得2019年度吳文俊人工智能科學技術獎的學者與專家,促進人工智能技術在各行業領域賦能,大力提升我國智能科學技術創新與產業化發展水平,加快建設成爲世界人工智能創新中心和應用高地,中國人工智能學會將於 2019年11月29日—12月1日在蘇州隆重舉辦“第九屆吳文俊人工智能科學技術獎頒獎典禮暨2019中國人工智能產業年會”。

九年磨一劍,AI先鋒齊聚一試鋒芒。11月29日—12月1日, 由中國人工智能學會主辦的“第九屆吳文俊人工智能科學技術獎頒獎典禮暨2019中國人工智能產業年會”將在蘇州隆重舉辦。屆時,學會將對81個成果授獎。

伴隨智能科技的不斷深化,人工智能正在全球範圍內蓬勃興起,大批AI科技先鋒不斷湧現,他們以優質的科技成果大力推動了人工智能的發展。自2011年學會設立“吳文俊人工智能科學技術獎”以來,該獎項已成爲我國表彰、鼓勵科技從業者及企業的至高榮譽殿堂。

爲全面實施創新驅動發展戰略,貫徹落實國家《新一代人工智能發展規劃》,通過推薦評選優秀的智能科學技術成果,切實調動廣大智能科技工作者的積極性和創造性,表彰獲得2019年度吳文俊人工智能科學技術獎的學者與專家,促進人工智能技術在各行業領域賦能,大力提升我國智能科學技術創新與產業化發展水平,加快建設成爲世界人工智能創新中心和應用高地,中國人工智能學會將於 2019年11月29日—12月1日在蘇州隆重舉辦“第九屆吳文俊人工智能科學技術獎頒獎典禮暨2019中國人工智能產業年會”。誠邀您蒞臨本屆頒獎大會,共襄盛舉。

黃民烈,清華大學計算機科學與技術系副教授,主要研究語言理解、語言生成、語言匹配與推理中的科學問題,致力於解決對話系統、自動問答、閱讀理解中具有挑戰性的人工智能問題。2019年黃民烈教授及其團隊與阿里巴巴語音AI助手阿里小蜜聯合獲得吳文俊人工智能科技進步獎一等獎。

獲獎人物介紹

黃民烈博士,清華大學計算機科學與技術系副教授,智能技術與系統實驗室副主任。他的研究興趣包括強化學習、深度學習、自然語言處理等,尤其是對話系統,閱讀理解和情感分析。在國際頂級會議和期刊(ACL、EMNLP、AAAI、IJCAI、WWW、SIGIR等)上發表了60多篇論文,入選ACL 2019最佳演示論文候選,獲得IJCAI 2018傑出論文獎,CCL 2018最佳演示獎,NLPCC 2015最佳論文獎,2018年漢王青年創新獎(中文信息處理學會),2019年MSRA合作研究獎, 2019年獲得吳文俊人工智能科技進步獎一等獎(排名第一)。情感對話模型的工作被麻省理工技術評論、英國衛報、參考消息、新華社等媒體廣泛報道,常識對話模型的工作獲得人工智能頂級會議IJCAI 2018傑出論文。擔任TNNLS編委(2020年起),TACL的常務編審,ACL 2020/2016、EMNLP 2019/2014/2011的領域主席,AAAI 2017-2020和IJCAI 2017-2020的高級程序委員以及TASLP、TKDE、TOIS、TPAMI等國際頂級期刊審稿人。2019年獲得國家自然科學基金重點項目資助。以下內容爲黃民烈副教授的專訪報道。

實驗室及團隊介紹

本次獲獎的項目成果是由我所在的實驗室團隊和阿里小蜜團隊共同合作完成的。

我所在的實驗室名叫“語言交互式人工智能”實驗室,隸屬於清華大學人工智能研究院,計算機系智能技術與系統實驗室。課題組由朱小燕老師和我領導,我們組主要從事深度學習、機器學習以及自然語言處理領域的應用基礎研究,重點集中在通過對話交互體現的智能行爲與智能系統,包括泛問答系統、任務或目標型對話系統、開放領域對話系統等。近些年我們在國際頂級會議或期刊上發表論文超過100篇,並且多次獲得頂級會議的最佳論文或候選,比如ACL、IJCAI、KDD、COLING等。由於研究方向比較靠近應用,我們與谷歌、微軟、惠普、三星、斯倫貝謝、阿里巴巴、搜狗、美團、騰訊等都建立了合作關係。

我們團隊和阿里小蜜團隊有深厚的合作基礎。阿里小蜜團隊主要從事人機交互和智能客服系統的研發和應用,他們所開發的“店小蜜”、“雲小蜜”、“熱線小蜜”等智能產品,覆蓋了漢語、英語、俄語、西班牙語等11種語言,爲全球數億消費者提供服務。小蜜團隊有着很強的科研實力,我們合作發表過很多國際頂會論文,並且多次獲得過國際競賽的冠軍。我們共同開發的技術顯著地改進了阿里小蜜線上系統的性能,也創造了顯著的經濟效益。

研究成果

我們團隊的主要研究成果集中在人機對話領域。該成果提出了適用於文本處理的信息度量新理論,包括五十多篇頂會論文,在對話理解、情感理解、對話生成等人機對話核心技術上取得較大進展,有效提升了服務機器人的對話能力及服務效率。

理論創新

在理論創新方面,我們建立了自然語言處理中的信息度量理論,包括條件信息距離理論、短語非合成性度量、多對象信息距離度量等,這些成果不僅具有很強的理論創新性,而且實際應用效果突出。我們的論文也獲得COLING 2010最佳論文獎、ACL 2012最佳學生論文獎,並且多次在國際測評中獲獎。

技術突破

我們團隊在人機對話關鍵技術上也取得了一定成果,包括對話理解、情感理解和對話生成等關鍵技術的創新。對話理解方面,我們提出了字符串重寫匹配模型和高效語義匹配模型;在情感理解方面我們取得了系列成果,我們提出了第一個屬性嵌入的細粒度情感分類模型,不到3年時間引用400多次。特別是對話生成技術,我們團隊首次提出常識感知對話生成模型,這一工作獲得了IJCAI 2018傑出論文獎。

我們首次提出情緒對話生成模型,使得對話機器人具有表達喜怒哀樂的能力,在對話研究領域開闢了一個小的新方向。論文一年多被引用150多次,這個工作受到了國內外權威媒體的廣泛報道,包括參考消息、新華社、麻省理工技術評論、英國衛報等。此外,我們把這些算法和模型應用到工業場景的實際問題中,例如解決外賣訂餐場景的複雜查詢的語義理解問題,阿里小蜜用戶情感檢測和情感安撫問題,在實際業務系統中取得了顯著的性能提升,產生了良好經濟效益。

實際應用

我們團隊長期以來與企業界建立了廣泛的聯繫,我們所開發的核心算法在多家公司的產品和業務中實現了“落地”。

❖舉例來說,我們的情感分析技術應用在三星的數字產品分析系統中,並且兩項專利技術實現了授權應用。

❖在與美團的合作中,我們的複雜語義分析技術應用在美團外賣場景中,使得意圖理解的性能獲得了較大幅度的提升,在意圖分類、關鍵語義信息識別等任務上性能提升顯著。

❖在與阿里小蜜的合作過程中,我們的情感檢測、情感對話技術、話題分析技術使得阿里小蜜用戶的情感檢測準確率、用戶滿意度獲得了顯著提升,產生了顯著的經濟效益。

❖此外,我們的對話技術還應用在寶尊電商、薄言豆豆等公司的產品上,實際應用效果顯著。

遇瓶頸 求突破

目前人機對話領域所面臨的主要困難有兩個:一是數據問題,二是人機對話本身的研究難度。

研究困難

人機對話本身研究難度很大。目前對話系統的構建和研究還離不開數據的支撐,很大程度由數據來驅動,但相比英文數據,中文數據方面則嚴重不足。這很大程度上制約了中文對話系統研究的進展。因此,今年我們花了很大力氣構造了兩個獨特的中文對話數據集,我們也希望有更多學界同仁及企業在中文對話數據的構建和開放上更加活躍。

嘗試突破

衆所周知,自然語言處理是人工智能皇冠上的明珠,而人機對話則可以稱之爲明珠中的明珠。通用意義上對話系統可以等同於圖靈測試,需要實現真正的語義理解,這本身就是巨大挑戰,遠還沒有達到能解決的程度。這裏的核心問題就是對開放領域、開放話題的語義理解很困難。但是在某些特定場景,結合實際應用,則是有可能解決的。我們的很多研究嘗試也是圍繞這個思路展開,例如在電商客服、外賣、售前諮詢等領域,結合知識圖譜、專家知識、深度學習算法和模型,做到實際上線標準是可以實現的。但從學術研究的角度,我們還是要着眼於“詩和遠方”,聚焦在更難、更前瞻性的問題上。

技術研發與市場需求

作爲高校的一個研究者,同時在與企業廣泛合作過程更加能夠體會到,高校和代表市場需求的企業各有優勢,兩者結合能產生很好的相互促進作用。高校的優勢在於前沿理論、模型、算法研究,而企業的優勢在於工程優化能力,兩者具有很好的互補性。

我自己在與衆多企業合作過程中,就深刻體會到,只有雙方緊密合作,才能體現出產學研的威力。例如,我們和阿里巴巴合作的過程中,我們的學生和阿里的員工一起合作,將前沿的算法模型應用在實際業務中,取得了顯著性能提升,這裏面既有算法模型的威力,也有工程優化的功勞。我們在和美團外賣、搜狗等的合作中也都體現了這些特點。企業在實際業務需求中產生的挑戰性、前瞻性問題,也爲學術界提供了創新的動力。我也呼籲更多的企業能夠開放共享他們的數據,帶着他們的問題與學術界一起努力,實現真正的產學研一體化。

未來研究方向

立足當前

目前我們團隊在數據集建設、系統開發、平臺建設、前沿創新技術四個層面穩步推進。今年我們花費大量精力和財力構建了兩個大規模的中文對話數據集,將很快開放給學術界免費使用。

在平臺建設上,我們初步研發了針對研究者的開放域對話工具集CoTK和任務導向對話工具集TaTK,這兩個工具包提供了搭建對話系統所需的各類組件,包括標準化的數據準備流程,以及標準化的測試流程和測評標準。我們希望能夠踏踏實實地做一些小事情,真正推進這個領域的研究進展。

展望未來

我們團隊的科研重心集中在人機對話方面,我們希望研究人類對話的機制,並由此啓發對話交互的計算模型,在數據集建設、系統開發、平臺建設、前沿創新技術四個層面開展深入研究,爲推動學術研究和產業應用做出我們的貢獻。

相關文章