台湾 || 语言: 大陆简体港澳繁體台灣正體

百度“頂風”發佈文心一言，實測與Chat GPT尚存差距

界面新聞 2023-03-16 21:43

即便在前一天 OpenAI 剛剛發佈的 GPT-4 已經將用戶對ChatGPT的期望值拉得更高，百度的‘文心一言’還是如期而至。

3 月 16 日下午，百度首款多模態大模型‘文心一言’正式亮相發佈會。

按照會上李彥宏對於‘爲什麼要在這個時間點發布文心一言’的解釋，百度其實過去數年一直都會爆出每年正常迭代一個新版本出來的頻率，最終纔有了現在文心一言的誕生。

在會上，李彥宏一共展示了五個文心一言的應用場景：首先是幫大劉續寫《三體》：文心一言根據對話問題將知名科幻小說《三體》的核心內容進行了總結，並提出了五個續寫《三體》的建議角度，體現出對話問答、總結分析、內容創作生成的綜合能力。

此外，文心一言準確回答了《三體》作者、電視劇角色扮演者等事實性問題。面對‘於和偉和張魯一有哪些共同點’、‘於和偉和張魯一誰更高’這類問題，文心一言也基於推理能力得出了正確答案。

第二個展示的是商業文案創作場景：這同樣也是過去數月 ChatGPT 被很多人認爲即將要取代的創作領域：在這一創作場景中，文心一言展示了完成給公司起名、根據事件生成一篇公司的新聞稿的能力，甚至能順便生成一個對應的 Slogan。

在第三個案例中，文心一言還展現出的一定程度上的思維能力：這也正是 OpenAI 強調的 GPT-4 相比前代的最強大之處。而文心一言則能夠學會數學推演及邏輯推理等相對複雜任務。面對‘雞兔同籠’這類鍛鍊人類邏輯思維的經典題，文心一言能理解題意，並有正確的解題思路，進而像學生做題一樣，按正確的步驟，一步步算出正確答案。

除了常規的文本對話能力，百度還特別展示了文心一言在多種樣式內容上的生成能力：例如自動根主題創作海報、用四川話讀出來文本內容，甚至是直接生成視頻。

在現場展示中，文心一言還正確解釋了成語‘洛陽紙貴’的含義，以及‘洛陽紙貴’對應的經濟學理論，還用‘洛陽紙貴’四個字創作了一首藏頭詩。

從最後兩個場景能看出，百度不僅試圖讓文心一言展示出了不同於 ChatGPT 的本土化能力，還展現出了 ChatGPT 迄今都未出現的視頻內容生成能力。

不過截至目前，這些在發佈會中出現的演示片段都並非更有說服力的實機演示，而是全程採用的是錄製好的視頻來演示，身經百戰的李彥宏在臺上，也罕見地表現出了‘怯場’，在發佈會中多次卡殼。

不過《電廠》也拿到了文心一言的測試賬號，這裏就加入一些實際測試內容，幫大家快速瞭解一下文心一言的實際能力幾何。比如你可以問他如何炒好一盤魚香肉絲：

以及生成藏頭詩功能，文心一言也能快速生成一段七言絕句：只是這個功能似乎受限於藏頭四個字，在實際的測試中文心一言也只能生成最多四句古詩，但這相比目前的 ChatGPT 以及 New Bing 已經是相當本土化的功能了。

以及要求它列出特斯拉過去六個月的銷量，以及自動生成一份逐月銷量表格。只是它並沒有明確給出數據來源，以及並沒有準確識別出記者提問中留下的‘坑’——‘中國銷量’與‘全球銷量’這一至關重要的區別。

此外，從目前的多次測試來看，文心一言對於上下文的關聯對話程度要稍弱於 ChatGPT，以及目前的內測版本中，發佈會上提到的生成視頻功能其實還暫時未能上線，要求它生成一段視頻，只能返回一大段類似視頻腳本的文本。

最後，雖然文心一言今天展示了根據內容自動生成文本/圖片，甚至是視頻的能力，但作爲後來者的文心一言，面對 GPT-4 這樣的強力對手，也需要更多用戶的測試來推動迭代更新。因此百度今天也開啓了文心一言的測試，但需要邀請碼才能參與測試。

同時，百度還表示，未來的服務提供方式將變爲 MaaS，即將大模型作爲一種服務提供給其他應用服務，這也正是目前 GPT-4 展現出的前景，而目前在國內也確實缺乏對應的大模型提供商，至少在這個維度上百度已經走在了第一線。

‘我們相信，人工智能會徹底改變我們今天的每一個行業。AI的長期價值，對各行各業的顛覆性改變，纔剛剛開始。未來，將會有更多的殺手級應用、現象級產品出現，將會有更多的里程碑事件發生。’李彥宏在發佈會上如此說道。

責任編輯：劉萬里 SF014

相關文章