摘要:Rudnicky目前正致力於將語音對話系統技術落地在先聲智能的AI教學產品上。Alexander I. Rudnicky是卡內基梅隆大學的計算機科學教授,對AI和語音對話研究超過30年,近日,智東西就語音對話系統在AI語言學習上的應用對他進行了獨家採訪。

導語:美國教授來中國搞AI教育落地,用語音對話系統教中國孩子說外語。

Alexander I. Rudnicky是卡內基梅隆大學的計算機科學教授,對AI和語音對話研究超過30年,近日,智東西就語音對話系統在AI語言學習上的應用對他進行了獨家採訪。

Rudnicky目前正致力於將語音對話系統技術落地在先聲智能的AI教學產品上。Rudnicky認爲語音對話系統不僅能用於功課輔導功能,還能通過對學生興趣數據的分析與孩子產生情感溝通,建立信任。

但Rudnicky表示,目前語音對話系統技術仍需要突破“使對話前後一致”和“實現多模態”兩大難點。要在AI教師應用上落地不限定場景的對話系統,可能還需要多年的努力。

先聲智能成立於2016年4月,是一家提供B端服務的人工智能公司,垂直於基礎教育領域,提供語言輔導服務。先聲智能成立後兩年內完成3輪過千萬美金融資,投資方爲聯想之星、創世夥伴資本、思必馳,好未來等。

一、教授來中國:用語言對話系統教孩子說英語

Rudnicky博士是卡內基梅隆大學計算機科學教授,也是卡內基梅隆語言聯盟的主任,從事AI和語音對話研究超過30年,有100多篇學術成果。Rudnicky也是先聲智能CTO秦龍在卡內基梅隆大學的導師。

▲從左到右爲:先聲智能CTO秦龍和他的導師Alexander I. Rudnicky

Rudnicky於2018年加入先聲智能,“語音對話系統”是Rudnicky和先聲智能主要的業務交集點。他了解到,雖然市面已有一些AI老師直播,但是通常只能進行“很傻”的問答,難以有多輪流暢的交互,效果並不理想。

據稱,這次是Rudnicky第一次親身來到先聲智能公司,但Rudnicky會和先聲同事定期“見面”。通過線上溝通,Rudnicky每週都會了解對話系統搭建進度,並提出類似“某些技術是否值得運用”的建議。

先聲智能CTO總裁秦龍說,考慮到中美時差,和Rudnicky的溝通通常安排在晚上,計劃30-40分鐘的會議常常會開到一個小時。

Rudnicky表示語音對話系統對語言教學有兩方面的作用。首先在功能上提供一對一的交互式指導,和用戶進行復雜的多輪對話,並通過用戶數據優化語言學習效果;然後是在情感上建立信任,語音對話系統能通過交互數據瞭解學生的喜好,進而讓對話具有人情味。

目前,國內的智能音箱、智能客服等應用上已有語音智能對話,先聲智能也剛開始將這一技術用到了天貓精靈的“先聲學英語”AI老師上。“先聲智能並不是第一和唯一家將語音對話技術用到AI語言教育上來的,但我們是在認認真真的做這件事。”秦龍說。

二、已實現限定場景的智能對話,兩大難點待產業解決

Rudnicky說,在美國語音識別技術主要被用於智能客服、銀行APP交互、車載系統、智能家居、娛樂休閒等領域,像客服、家居這些在中國也被應用的比較多了。

“但總的來說就是兩類場景,一個是二人配合場景,比如在電話客服中,客服人員可以由對話系統取代;二是涉及到觸屏的任務,用語言交互取代觸屏操作。”Rudnicky說。

據瞭解,目前先聲智能的語音對話技術的落地和市面上許多企業一樣,適用於限定場景。Rudnicky說:“許多人都說,還有五年可以實現理想的機器語音對話,但明年問他們,這個回答還是五年。”

Rudnicky表示,語音對話系統目前有兩大難點。一是多輪對話中出現“前言不搭後語”,尤其是出現指代不明的問題,這主要是因爲需要的數據以指數函數增加,但實際可用的對話數據太少。

二是多模態,即除了語音,還通過視覺、觸覺等多種感知來支持機器對話決策,比如眼神、脣語等。在國內有公司已稱掌握了脣語識別技術進而將語音識別的準確度提升了30%,這也成了其的技術壁壘。

除了這兩點,Rudnicky還提到了知識庫方面的侷限,雖然這個問題相對容易解決。國內有一些公司在內容庫的處理上要動用上百人進行手動處理,這對中小型公司來說是不現實的,所以需要自動化。

三、單點技術已成熟,轉向綜合解決方案

Rudnicky所在的先聲智能公司成立於2016年4月,是一家提供B端服務的人工智能公司,垂直於基礎教育領域,提供語言輔導服務。

該公司的主要產品包括四個維度:語音測評技術、作文批改、智能對話、自適應學習,目前已經爲百度、小米、獵豹、新東方、好未來、海雲天等合作商提供綜合多維技術的方案。

具體來說,先聲智能的產品可以檢測發音對不對、給外語作文打分改正、預知學生做對題目的概率以及和學生對話。

先聲智能成立後兩年內完成3輪過千萬美金融資,投資方爲聯想之星、創世夥伴資本、思必馳,好未來等。

2018年3月和12月,先聲智能獲創世夥伴資本(CCV)及好未來數千萬A輪融資;2018年12月11日,蘇州思必馳信息科技有限公司股權比例由21.49%變更爲12.74%。

據瞭解,早期思必馳爲先聲提供了語音識別、語音合成、人機對話技術支持。現階段思必馳與先聲智能的合作重點則放在行業交互和教育場景的交互上,雙方將共同努力爲全行業賦能。

結語:AI教師語音對話系統待升級,創企聯合學界自我造血

Rudnicky教授認爲,目前市面上落地的AI對話輔導產品並不智能,他希望發力先聲智能落地的產品,使產品既具有高效的英語輔導功能,又能獲得學生的情感信任。

AI創企的生存受到互聯網巨頭和專業語音技術公司的雙面夾擊,尋求學界的合作成爲一種有力加持。許多AI創企的高管都來自世界名校,他們藉助校友等資源爲企業造血,以構建自己的技術壁壘,進而獲得佔領新興垂直領域的競爭力。

相關文章