9月26日,開源生態論壇在浙江烏鎮召開。在論壇第四個環節上,百度集團副總裁吳甜發表演講,題爲《人工智能開源開放平臺支撐產業科技創新》。

百度集團副總裁吳甜

全文如下:

尊敬的各位領導、各位嘉賓、各位產業界的朋友們:

大家下午好!

我們下午聽到了很多RISC-V相關的報告,在我的環節裏,將嚮應用接近,我帶來的主題是《人工智能開源開放平臺支撐產業科技創新》。

相信開源的重要性已經不用再贅述,今天下午整場論壇中,我們從各個角度都看到了開源軟件開發、開源生態建設及其重要性,通過國家的一系列政策也可以看到,人工智能平臺以及開源社區等創新聯合體的創建也是政府在大力推進的方向。

開源是將原代碼、技術文檔等在社區當中通過開源的方式共享出來,它是羣智協同創新的一種方式。現在,全球企業都在積極參與開源開放,開源代碼在各行業中廣泛應用。對於人工智能創新來說,人工智能技術本身具有自己的一些特點。

首先,我們面向場景解決問題的時候,往往需要用多項技術進行整合來解決同樣一個場景的問題。第二,人工智能技術在逐漸建設和使用過程中,越來越存在着複用性,不需要從頭開始重複開發的工作。第三,在人工智能和產業進行結合的過程中,因爲人工智能技術應用本身都會需要結合到業務邏輯本身,和產業有深度的融合。所以在產業中落地應用,越來越呈現出產業鏈打通的特色,需要有多生態角色結合創新、融合創新。第四,人工智能接觸到大量數據,自主創新的平臺對於產業及國家安全也是非常重要的。

我今天跟大家的分享是以飛槳作爲代表的人工智能開源開放平臺。

飛槳作爲深度學習開源開放平臺,在飛槳的建設中以核心框架爲基礎,核心框架部分支持了開發者在使用時候進行開發、訓練、部署的整個環節。基於核心框架,在飛槳平臺上構建了基礎模型庫。當產業在使用技術的時候,往往學術級的模型不能給大家解決所有問題,需要和產業中的各種場景相結合,在各種數據當中打磨。所以基礎模型庫對產業應用非常重要。

面向場景建設端到端的開放套件,以及由深度學習技術延展開的一系列工具組件,同時也提供了實訓學習平臺,供給整個開源社區進行學習和實訓。飛槳平臺從開發角度,結合了應用性和性能的便捷開發框架,以及超大規模深度學習模型訓練技術,還有多端多平臺部署的高性能推理引擎,讓有產業級開源模型庫供給開源社區中的開發者學習和使用。

依託于飛槳平臺,我們進行了一系列的AI技術與突破。舉個典型的例子,知識增強的語義理解技術,這項技術以預訓練技術爲核心思想,通過對任務的設定和學習,通過知識的引入,能夠進行核心模型的學習和訓練。

最新發布的知識增強大模型ERNIE3.0,依託于飛槳強大的分佈式訓練技術,將自然語言理解網絡和自然語言生成網絡融合在一起。ERNIE3.0在50多項中文NLP評測集上取得最好結果,在Super GLUE榜上位居榜首,超越了現在國際上所有的相應模型。

飛槳持續和硬件平臺進行適配,廣泛的適配使得作爲生態中承上啓下的角色,能夠更好地發揮自己的作用。大量的開發者在飛槳平臺上進行創新的工作,年齡小的有6年級的小學生,年齡大的也有退休專家。

我們依託于飛槳平臺,也致力於培養人才,爲產業界培養既懂得原有的業務邏輯,又能懂得新技術的複合型人才。

今天非常榮幸能夠發佈一批飛槳的最新數據。飛槳平臺上,不管是開發者數量還是應用的企業數量以及模型數量,都在持續增長。這是最新數據:目前已凝聚了370萬開發者,服務了14萬企事業單位,創建了42.5萬的模型。這表示人工智能技術正在與產業廣泛結合起來,技術一天比一天繁榮。

謝謝大家!

【責任編輯:刁雲嬌】

相關文章