9月26日,开源生态论坛在浙江乌镇召开。在论坛第四个环节上,百度集团副总裁吴甜发表演讲,题为《人工智能开源开放平台支撑产业科技创新》。

百度集团副总裁吴甜

全文如下:

尊敬的各位领导、各位嘉宾、各位产业界的朋友们:

大家下午好!

我们下午听到了很多RISC-V相关的报告,在我的环节里,将向应用接近,我带来的主题是《人工智能开源开放平台支撑产业科技创新》。

相信开源的重要性已经不用再赘述,今天下午整场论坛中,我们从各个角度都看到了开源软件开发、开源生态建设及其重要性,通过国家的一系列政策也可以看到,人工智能平台以及开源社区等创新联合体的创建也是政府在大力推进的方向。

开源是将原代码、技术文档等在社区当中通过开源的方式共享出来,它是群智协同创新的一种方式。现在,全球企业都在积极参与开源开放,开源代码在各行业中广泛应用。对于人工智能创新来说,人工智能技术本身具有自己的一些特点。

首先,我们面向场景解决问题的时候,往往需要用多项技术进行整合来解决同样一个场景的问题。第二,人工智能技术在逐渐建设和使用过程中,越来越存在着复用性,不需要从头开始重复开发的工作。第三,在人工智能和产业进行结合的过程中,因为人工智能技术应用本身都会需要结合到业务逻辑本身,和产业有深度的融合。所以在产业中落地应用,越来越呈现出产业链打通的特色,需要有多生态角色结合创新、融合创新。第四,人工智能接触到大量数据,自主创新的平台对于产业及国家安全也是非常重要的。

我今天跟大家的分享是以飞桨作为代表的人工智能开源开放平台。

飞桨作为深度学习开源开放平台,在飞桨的建设中以核心框架为基础,核心框架部分支持了开发者在使用时候进行开发、训练、部署的整个环节。基于核心框架,在飞桨平台上构建了基础模型库。当产业在使用技术的时候,往往学术级的模型不能给大家解决所有问题,需要和产业中的各种场景相结合,在各种数据当中打磨。所以基础模型库对产业应用非常重要。

面向场景建设端到端的开放套件,以及由深度学习技术延展开的一系列工具组件,同时也提供了实训学习平台,供给整个开源社区进行学习和实训。飞桨平台从开发角度,结合了应用性和性能的便捷开发框架,以及超大规模深度学习模型训练技术,还有多端多平台部署的高性能推理引擎,让有产业级开源模型库供给开源社区中的开发者学习和使用。

依托于飞桨平台,我们进行了一系列的AI技术与突破。举个典型的例子,知识增强的语义理解技术,这项技术以预训练技术为核心思想,通过对任务的设定和学习,通过知识的引入,能够进行核心模型的学习和训练。

最新发布的知识增强大模型ERNIE3.0,依托于飞桨强大的分布式训练技术,将自然语言理解网络和自然语言生成网络融合在一起。ERNIE3.0在50多项中文NLP评测集上取得最好结果,在Super GLUE榜上位居榜首,超越了现在国际上所有的相应模型。

飞桨持续和硬件平台进行适配,广泛的适配使得作为生态中承上启下的角色,能够更好地发挥自己的作用。大量的开发者在飞桨平台上进行创新的工作,年龄小的有6年级的小学生,年龄大的也有退休专家。

我们依托于飞桨平台,也致力于培养人才,为产业界培养既懂得原有的业务逻辑,又能懂得新技术的复合型人才。

今天非常荣幸能够发布一批飞桨的最新数据。飞桨平台上,不管是开发者数量还是应用的企业数量以及模型数量,都在持续增长。这是最新数据:目前已凝聚了370万开发者,服务了14万企事业单位,创建了42.5万的模型。这表示人工智能技术正在与产业广泛结合起来,技术一天比一天繁荣。

谢谢大家!

【责任编辑:刁云娇】

相关文章