【TechWeb】7月31日,百度大脑第四期开放日NLP专场正式举行,期间,百度自然语言处理部副总监忻舟分享了NLP领域的开放全景,并重点介绍了智能创作平台2.0的新特性、PaddleNLP(NLP开源工具与预训练模型集)、ERINE(知识增强的语义理解框架)等最新技术。

QQ图片20190731222020

忻舟介绍,可持续学习语义理解框架ERNIE2.0可通过建模海量数据中的词、实体及实体关系,学习真实世界的语义知识,目前累计学习超过10亿条知识,已在百度众多产品应用中显现效果。根据测试对比,ERNIE2.0在16个中英文任务上表现优于BERT和XLNet。

百度大脑工业级NLP开源工具与预训练模型集PaddleNLP,具备中文词法分析、文本情感分类等10项NLP应用任务,并且网络可灵活调整,场景也可高效迁移,具备业内领先的语义表示模型,可实现工业级的灵活应用,它也是当前业内最大的工业训练集。忻舟以“文本情感分析”为例,现场实操百度大脑NLP工具集,为开发者展示了直观易用的步骤。

QQ图片20190731222015

基于百度自然语言处理、知识图谱以及大数据技术打造的“智能创作平台2.0”可实现自动创作、辅助创作等功能,具备热点发现、热词分析、用词润色、标题生成、多模态创作、文本审核、文章分类、文章标签等8大技术能力,更有丰富的数据素材支持。

具体而言,智能创作平台2.0在创作前,能够提供实时领域热点、地域热点信息,同时对TOP热点事件提供Topic实时热度分析;创作中,能够预置素材数据,提供多模素材推荐,同时进行实时智能纠错;创作后,能够自动审校、自动标签分类,生成自动摘要,提供用词润色建议及多模发布功能。整个创作过程可节约大概80%的时间。

现场,央视网技术事业群副总经理朱立松表示:“当前传统视频生产运营面临着智能化生产 、信息风险管控、内容创新等挑战,中央电视总台就人工智能赋能新媒体做出了大量的探索与尝试,在智能创作、智能分析、智能审核、智能搜索、智能推荐等方面已有成效,其中NLP技术是自动文摘、文本挖掘(文本分类)、信息检索等功能的基础。”

朱立松还透露,央视网已经与百度合作,共建人工智能媒体研发中心,联合打造媒体产业人工智能产品。

相关文章