近日,据腾讯高校合作组反馈的消息,我校计算机学院、陕西省语音与图像信息处理重点实验室谢磊教授带领的语音技术团队研发的“语音识别智能标点预测系统”,通过与腾讯的校企合作项目,已经成功在腾讯上线应用。

一、语音识别、智能标点,

新技术划出新边界

语音识别智能标点预测系统采用了目前最先进的深度学习技术,经过腾讯各大场景大数据自适应、模型速度优化、多线程优化等技术迭代,将大规模复杂信息场景标点符号自动加注的错误率降低到3%以内,达到业界领先水平。该系统已在腾讯部分业务场景上实现成功应用,日通过语音数据量超过300万条,累计提升人工效能10%。从人工主观测评来看,新版标点符号系统的引入,大大提升了音频的可懂度、阅读速度与准确率,在语音大数据违法信息拦截、低俗内容发现、黄赌毒信息检测方面将发挥非常重要的作用。

语音识别是人工智能技术的典型代表,在智能人机交互、智能家居与物联网、智能穿戴、智能车载、大数据内容分析与检索方面具有重要的应用价值。一般来说,标准的语音识别系统,其输出是缺乏标点的。而标点预测技术,又称句边界检测或句切分技术,是一种典型的序列标注机器学习任务,是指在缺乏标点的文本(如语音识别抄本)中加入标点,对篇章文本进行句子单元切分,旨在提高文本的可懂度,降低人工阅读的负荷。同时,准确的标点和句边界也是自然语言理解、机器翻译、大数据信息挖掘等任务的前提。

二、专注科研、厚积薄发,

校企合作频结硕果

据悉,谢磊教授带领的研究团队近年来依托于空天地海一体化大数据应用技术国家工程实验室和陕西省网络创新研究院,围绕网络语音大数据信息挖掘的需求,在语音识别与合成、语音内容分析等技术方面取得了突破性成果。

团队曾先后参加了首届零资源语音国际挑战(Zerospeech)赛、低资源关键词检测QUESST国际评测,均获得了第一名的突出成绩;同时,团队成员的多篇论文获得国际学术会议优秀论文奖。论文Investigating LSTM for Punctuation Prediction围绕此次在腾讯上线应用的“标点预测”任务,获得第十届中文口语语言处理国际会议(ISCSLP2016)最佳学生论文提名奖。此次实验室技术在腾讯在线系统上的成功应用,是对整个研究团队科研能力的实践验证,也是我校校企合作推动技术成果转化的有益成果。

校企合作捷报频传,吸引得各大知名企业竞相与实验室结对开展联合研究与人才培养,目前已与包括百度、搜狗、华为、小米、腾讯、京东、阿里巴巴、微软、三星、云知声、出门问问、Roobo等在内的IT和人工智能公司开展了技术合作与联合研究。2016年年底与腾讯联合建立了“西北工业大学-腾讯媒体信息技术联合实验室”,2017年5月与人工智能明星创业公司云知声建立了“西北工业大学-云知声智能语音交互联合实验室”。

就在近期,该实验室又入围了“2018腾讯AI Lab犀牛鸟联合研究计划”,将与腾讯人工智能实验室在基于少量说话人数据的端到端语音合成方面开展联合研究。

近年来,实验室与微软、腾讯、百度、小米、云知声、出门问问等合作企业联合发表学术论文15篇,联合培养人才30余人,毕业研究生更是遍布各大IT公司,多数已经成为技术负责人和技术骨干。

三、联合驱动、成果转化,

语音技术前景广阔

多年来,陕西省语音与图像信息处理重点实验室不断推动语音技术的研究成果转化,在智能语音处理方面的研究成果已经广泛应用于智能手机、智能手表、智能音箱与智能机器人上。

早在2012年,实验室就与百度展开校企合作,在国内较早将深度学习技术运用到语音识别领域,将语音搜索、语音输入的识别综合识别准确率提升了8%,受到各大技术媒体的广泛关注。2016年,实验室和出门问问公司联合研发的语音合成技术在智能手表Ticwatch2上实现应用,成为市面上第一款“能说话”的语音交互智能手表。

就在去年,该实验室携手小i机器人研发的“虚拟说话人”技术精彩亮相中国大数据产业博览会开幕式,虚拟主持人与现场主持人展开对话互动,成为数博会上的亮点之一。与微软亚洲研究院合作的语音关键词检出技术,应用在“微软小英”的语言学习产品中,提升英语学习者的学习效率。

此外,实验室近期联合小米公司共同推出的基于注意力机制的中文语音识别算法,将小米电视上的语音识别率提升到97%,这也是基于注意力机制的端对端语音识别方法首次在中文数据集上达到可用水平。

版权所有

文稿来源|西工大官网

视觉|郭肖

责编|刘建平

相关文章