摘要:而本次推出的搜狗同传3.0,基于搜狗独创的“语境引擎”技术而打造,集“能听”、“会看”、“会思考”等能力于一身,相当于为演讲者创造了一个个性化的认知语境,这使得AI同传在识别正确率和翻译准确率方面大幅提升,这不仅是搜狗在AI同传领域又一次创新壮举,更意味着AI同传产业新时代的到来。据悉,搜狗同传3.0基于搜狗独创的“语境引擎”技术,以“多模态”和“自主学习“为核心,加入了视觉和思维能力,让机器同传不仅会听,还首次具备了会看、能理解会推理的能力,引领AI同传进入了多模态认知时代。

12月21日,搜狗公司宣布推出首个具备多模态认知的AI同传系统——搜狗同传3.0。据悉,搜狗同传3.0基于搜狗独创的“语境引擎”技术,以“多模态”和“自主学习“为核心,加入了视觉和思维能力,让机器同传不仅会听,还首次具备了会看、能理解会推理的能力,引领AI同传进入了多模态认知时代。

搜狗同传3.0上线:不仅能听会看,更善推理会思考

搜狗同传3.0上线,会听会看会思考

据了解,此次上线的搜狗同传3.0,搜狗开创性的将视觉能力和思维能力引入到AI同传领域。借助OCR(光学字符识别)和NLP(自然语言处理)等技术,搜狗同传3.0能够通过“观看”演讲者的PPT内容,从中找出核心词汇。然后,再通过搜狗领先的知识图谱-搜狗知立方实时推理拓展,获取充分的背景知识,同时基于搜狗百科的中英术语库得到中英双语对照,实时优化同传识别和翻译的效果。

在计算机领域,语音、视频、文字等每一种信息的来源或者形式,都可以看作是一种模态。所谓多模态认知,就是通过机器学习的方法实现处理和理解多源模态信息的能力。从技术角度讲,人其实是一个多模态认知的总和。

因此,搜狗同传3.0能够调动多重“感官“模态,实现了协同作业,同时具备了“能听”、“会看”和“会思考”等三大能力,这意味着AI同传拥有了与人“共情”的能力,更接近于“真人同传”。同时基于搜狗领先的“语境引擎”和机器翻译等AI技术加持,又使得搜狗同传能够实现更加自然、快速、准确的同传翻译,这使得AI同传行业向前跨越了一大步。


视频加载中...


搜狗独创“语境引擎”技术,让AI同传进入“思考”时代

回顾AI同传的演变历史,不难发现, AI同传行业每一次的创新和变革,几乎都是由搜狗推动和引领,而每次技术进步都让AI同传的产品体验大幅提升。

2016年,搜狗AI同传在乌镇世界互联网大会上首次亮相。利用搜狗领先的语音识别和机器翻译等技术,搜狗同传能够将声音实时转换为相应的中英文字幕,基本具备了同传翻译的能力,这是全球首次基于神经网络的实时机器翻译技术在大型活动上的展示,开创全新品类的同时,也引领同传行业进入了AI时代。

2018年,搜狗实现自我进化和颠覆创新,推出了更具个性化的语音同传,可以根据演讲者的语言习惯和声音特点,进行重点优化,这让搜狗AI同传的翻译速度和准确率得以进一步提升,再次引领行业实现技术升级。

一直以来,搜狗在文字图像识别、机器翻译等AI技术领域都具有非常显著的领先优势。近期,搜狗在OCR识别权威比赛ICDAR2019挑战赛中,刷行了任意形状文字识别(ArT)中检测、识别、端到端三项任务的新纪录,充分显示了搜狗在文字识别领域的领先优势。而在2018年的IWSLT国际口语机器翻译评测大赛上,搜狗更是击败讯飞、阿里、 APPTEK、AFRL及KIT等国内外多个对手获得第一。也因如此,搜狗始终引领着AI同传领域的技术创新。

而本次推出的搜狗同传3.0,基于搜狗独创的“语境引擎”技术而打造,集“能听”、“会看”、“会思考”等能力于一身,相当于为演讲者创造了一个个性化的认知语境,这使得AI同传在识别正确率和翻译准确率方面大幅提升,这不仅是搜狗在AI同传领域又一次创新壮举,更意味着AI同传产业新时代的到来。

搜狗用创新持续推动人工智能技术更普及

过去三年间,以2016年乌镇世界互联网大会为起点,搜狗同传已经支持了包括极客创新大会、苹果新品发布会等国内外上千场会议。并且搜狗同传系统不仅应用于体育赛事、科技发布会直播等领域,更将应用到医疗、影视、教育、法律等行业中。

不难预测,随着基于“语境引擎”技术的搜狗同传3.0上线,不仅将再次革新AI同传行业,更将引领AI同传产品的体验升级,进一步扩大AI同传产品的落地场景,从而让人工智能技术真正实现全面普及,走进每一个人的生活。而搜狗作为AI技术创新的引领者,必将拥有更加广阔的未来。

相关文章