近日,據騰訊高校合作組反饋的消息,我校計算機學院、陝西省語音與圖像信息處理重點實驗室謝磊教授帶領的語音技術團隊研發的“語音識別智能標點預測系統”,通過與騰訊的校企合作項目,已經成功在騰訊上線應用。

一、語音識別、智能標點,

新技術劃出新邊界

語音識別智能標點預測系統採用了目前最先進的深度學習技術,經過騰訊各大場景大數據自適應、模型速度優化、多線程優化等技術迭代,將大規模複雜信息場景標點符號自動加註的錯誤率降低到3%以內,達到業界領先水平。該系統已在騰訊部分業務場景上實現成功應用,日通過語音數據量超過300萬條,累計提升人工效能10%。從人工主觀測評來看,新版標點符號系統的引入,大大提升了音頻的可懂度、閱讀速度與準確率,在語音大數據違法信息攔截、低俗內容發現、黃賭毒信息檢測方面將發揮非常重要的作用。

語音識別是人工智能技術的典型代表,在智能人機交互、智能家居與物聯網、智能穿戴、智能車載、大數據內容分析與檢索方面具有重要的應用價值。一般來說,標準的語音識別系統,其輸出是缺乏標點的。而標點預測技術,又稱句邊界檢測或句切分技術,是一種典型的序列標註機器學習任務,是指在缺乏標點的文本(如語音識別抄本)中加入標點,對篇章文本進行句子單元切分,旨在提高文本的可懂度,降低人工閱讀的負荷。同時,準確的標點和句邊界也是自然語言理解、機器翻譯、大數據信息挖掘等任務的前提。

二、專注科研、厚積薄發,

校企合作頻結碩果

據悉,謝磊教授帶領的研究團隊近年來依託於空天地海一體化大數據應用技術國家工程實驗室和陝西省網絡創新研究院,圍繞網絡語音大數據信息挖掘的需求,在語音識別與合成、語音內容分析等技術方面取得了突破性成果。

團隊曾先後參加了首屆零資源語音國際挑戰(Zerospeech)賽、低資源關鍵詞檢測QUESST國際評測,均獲得了第一名的突出成績;同時,團隊成員的多篇論文獲得國際學術會議優秀論文獎。論文Investigating LSTM for Punctuation Prediction圍繞此次在騰訊上線應用的“標點預測”任務,獲得第十屆中文口語語言處理國際會議(ISCSLP2016)最佳學生論文提名獎。此次實驗室技術在騰訊在線系統上的成功應用,是對整個研究團隊科研能力的實踐驗證,也是我校校企合作推動技術成果轉化的有益成果。

校企合作捷報頻傳,吸引得各大知名企業競相與實驗室結對開展聯合研究與人才培養,目前已與包括百度、搜狗、華爲、小米、騰訊、京東、阿里巴巴、微軟、三星、雲知聲、出門問問、Roobo等在內的IT和人工智能公司開展了技術合作與聯合研究。2016年年底與騰訊聯合建立了“西北工業大學-騰訊媒體信息技術聯合實驗室”,2017年5月與人工智能明星創業公司雲知聲建立了“西北工業大學-雲知聲智能語音交互聯合實驗室”。

就在近期,該實驗室又入圍了“2018騰訊AI Lab犀牛鳥聯合研究計劃”,將與騰訊人工智能實驗室在基於少量說話人數據的端到端語音合成方面開展聯合研究。

近年來,實驗室與微軟、騰訊、百度、小米、雲知聲、出門問問等合作企業聯合發表學術論文15篇,聯合培養人才30餘人,畢業研究生更是遍佈各大IT公司,多數已經成爲技術負責人和技術骨幹。

三、聯合驅動、成果轉化,

語音技術前景廣闊

多年來,陝西省語音與圖像信息處理重點實驗室不斷推動語音技術的研究成果轉化,在智能語音處理方面的研究成果已經廣泛應用於智能手機、智能手錶、智能音箱與智能機器人上。

早在2012年,實驗室就與百度展開校企合作,在國內較早將深度學習技術運用到語音識別領域,將語音搜索、語音輸入的識別綜合識別準確率提升了8%,受到各大技術媒體的廣泛關注。2016年,實驗室和出門問問公司聯合研發的語音合成技術在智能手錶Ticwatch2上實現應用,成爲市面上第一款“能說話”的語音交互智能手錶。

就在去年,該實驗室攜手小i機器人研發的“虛擬說話人”技術精彩亮相中國大數據產業博覽會開幕式,虛擬主持人與現場主持人展開對話互動,成爲數博會上的亮點之一。與微軟亞洲研究院合作的語音關鍵詞檢出技術,應用在“微軟小英”的語言學習產品中,提升英語學習者的學習效率。

此外,實驗室近期聯合小米公司共同推出的基於注意力機制的中文語音識別算法,將小米電視上的語音識別率提升到97%,這也是基於注意力機制的端對端語音識別方法首次在中文數據集上達到可用水平。

版權所有

文稿來源|西工大官網

視覺|郭肖

責編|劉建平

相關文章