題圖|視覺中國

大模型的新一輪軍備競賽要開始了。

通俗地講,Scalinglaw就是通過更大規模的數據量和更高的算力,再加上更大參數的模型,讓大模型能夠處理更復雜的任務。最終,各家基礎大模型公司的競爭方向就是砸錢堆算力。

但這似乎是個無底洞,一些公司選擇了更正確的方式,開始通過積極尋求大模型商業化來應對這場持久戰,並以實際應用的反饋來提升大模型的能力,百度便是其中之一。

最新發布的2023年Q4和全年財報顯示,2023年總營收達1345.98億元,歸屬百度的淨利潤(non-GAAP)287億元,同比增速達39%。2023年,百度全年營收和利潤均超市場預期。其中,以文心大模型與文心一言爲代表的AI業務商業化方面取得重大進展。

這是大模型競爭邏輯轉變的一個重要信號:大模型的訓練、迭代升級不再是閉門造車,而轉向實戰。

這意味着大模型商業化能力的重要性進一步提升。一方面,市場將選擇出最符合實際需要的大模型產品;更重要的是,通過自我造血,大模型訓練需要持續投入的鉅額資金才更有保證。

實戰是大模型最好的訓練場

在基礎大模型領域重新錨定了10億美元的入場資格之後,勢必有一部分公司會被擠下牌桌。

這些面臨競爭挑戰的公司中,有很大比例是去年ChatGPT走紅之後,才湧入基礎大模型領域的創業公司。這些公司從零起步,對大模型的認識也不夠深入,其訓練的模型在理解、生成、邏輯和記憶能力沒有足夠的競爭優勢,團隊在尋求大模型商業化落地場景中也屢遭碰壁。

在新的競爭形勢下,有能力參與大模型接下來競爭的公司都擁有更深的技術積累和市場認知。從進入大模型的時間來看,無論是創業公司的頭部公司,還是互聯網大廠裏的做得好的公司,都是在ChatGPT走紅之前,就看到了大模型的機會,並開始了佈局。

比如,智譜AI和MiniMax分別成立於2019年和2020年,百度也在2019年3月就發佈了文心大模型1.0版,他們在ChatGPT發佈時已歷經了三四年的技術深耕和研發迭代。去年10月,文心大模型已升級到4.0版本,在理解、生成、邏輯和記憶能力上都有着顯著提升,綜合水平與GPT-4相當。

這也意味着大模型的競爭已進入硬仗階段。目前,最早一批研發的基礎大模型都已開啓商業化,對外開放調用之路,這也讓這些大模型擁有了實踐檢驗的機會,收穫更強的市場競爭力。

據瞭解,三星、榮耀、汽車之家均與百度達成合作,調用文心大模型來提升產品的AI能力。其中,三星在最新款的S24旗艦手機上集成文心大模型的多項能力,包括通話、翻譯、智能摘要等功能。尤其是 “即圈即搜” 功能,用戶可以通過簡單的手勢操作在文字、圖片或視頻上進行圈畫或劃線,即可立即獲得精準的搜索結果。

而此前百度公佈的信息顯示,截至去年12月底,文心一言用戶規模突破1億,累計完成了37億字的文本創作,輸出了3億行代碼,幫助用戶處理了累計4億字的專業合同,制定了500萬次的旅行計劃。

而去年11月,百度創始人兼CEO李彥宏在公開演講時稱,全國有200多家大模型,“文心大模型一家的調用量比這200多家大模型的調用量加起來還多。”

在百度2023年第四季度及全年財報電話會上,李彥宏透露了文心大模型的最新數據:文心大模型的日調用量已超過5000萬次,季度環比增長190%;12月,約有2.6萬家企業調用文心大模型,季度環比增長150%。

文心大模型日調用量持續上漲,相比於還在悶頭訓練的大模型,龐大的調用量給予文心大模型更多反饋,反向促進了文心大模型的能力提升,形成飛輪效應。

真實的應用是文心大模型能力提升的最佳催化劑,同時也讓百度能夠更加精準洞察到市場需求,讓大模型圖文、視頻等方向的迭代朝着市場需要的放心迭代進化。

市場會選擇什麼樣的大模型?

技術能力是大模型能夠獲得市場認可的關鍵因素,但不是唯一的因素。

當下市場對大模型的需求主要集中在翻譯、文案、客服、文檔處理等多個方面,對大模型有需求的相關企業或是爲了通過提升用戶體驗來獲得更好的市場份額,或者通過技術提升公司內部的工作效率,背後都包含着成本和收益的核算。

從抽象層面來說,只有大模型給這些企業帶來的收益高於使用成本,他們才願意使用。而從具體的應用場景來說,不同企業考量的成本因素也各不相同。比如,一些原本技術能力薄弱公司在調用大模型的過程中,如果需要從0到1搭建一個專業的技術團隊,這可能會最終促使其放棄,因爲這個過程中涉及了非常複雜的溝通和管理成本,做不好還可能會賠了夫人又折兵。

經歷過實戰檢驗的大模型,纔有可能洞察到不同客戶的真實需求和顧慮。比如,作爲國內最早一批開啓商業化的基礎大模型,文心大模型在和客戶溝通過程中,洞察到了成本和使用門檻方面的顧慮,並結合自身的技術能力和市場需求,進行了改進。

在平衡成本和收益上,百度通過四層技術架構優勢和端到端優化能力,不斷降低文心大模型推理成本,提升效率。李彥宏在財報電話會上透露,自去年3月文心一言發佈以來,文心大模型的推理成本已經下降至原來的1%。通過文心和飛槳的協同優化,文心大模型的周均訓練有效率超過98%,訓練算法效率提升3.6倍,推理性能提升50倍。對於企業和開發者來說,文心大模型已成爲性價比最高的大模型。

而在降低開發門檻和內部的管理成本上,文心大模型通過千帆AppBuilder和千帆ModelBuilder兩個應用開發工具解決了技術能力薄弱公司的顧慮。其中,AI原生應用開發工作臺AppBuilder可以讓不懂代碼的小白通過可視化工具組件搭建AI原生應用;ModelBuilder提供了一整套大模型開發的工具鏈,支持專有模型的開發和模型精調,開發者在上面精調和開發專有模型更簡單,而且性價比更高。

目前,千帆AppBuilder不僅爲開發者提供了豐富的開發套件和應用組件,而且提供了門檻更低的低代碼態,而千帆ModelBuilder已累計精調了10000個模型。

同時,百度還提供了多個尺寸的大語言模型,如 ERNIE Turbo、ERNIE Speed、ERNIE TIny等,這些模型可以在模型效果和效率之間取得平衡,更好滿足各類客戶場景需求。

從各家大模型的調用量來看,市場選擇大模型,是在成本和收益、開發門檻等方面權衡之後用腳投票的結果。

作爲支持生成式AI落地的技術設施,基礎大模型在競爭中也將呈現和互聯網平臺類似的趨勢:具備先發優勢、能夠率先滿足各式各樣市場需求並降低使用門檻的平臺,將呈現強者愈強的趨勢。

一旦某一個平臺在市場份額上佔據絕對優勢,其他平臺將很難再與其競爭。從這個角度來看,文心大模型當前積累的優勢在接下來新的競爭形勢下,擁有了更多競爭力。

更多營收才意味着更大想象力

如果說基礎大模型在2023年開了商業化的頭,那麼其在2024年則將讓市場呈現出更明顯的頭部效應。

就拿文心大模型來說,其帶來的更多營收可能性,也將給百度在大模型競爭中增加很多底氣。

一方面,AI營銷新工具正在重構內容和廣告生態,提高企業的內容生產和廣告投放效率,讓廣告主和平臺共同收益。目前,百度發佈了營銷平臺“輕舸”、品牌智能體等AI營銷新工具,與飛鶴、洋河、京東海爾等品牌達成合作並落地。比如,飛鶴基於品牌智能體打造了“飛鶴官方智能助手”,在百度搜索上,用戶可以直接向飛鶴官方智能助手諮詢,文本對答的表現形式更能滿足用戶個性化需求,提升商品匹配效率。

另一方面,更多AI應用的上線,將提升用戶生活、工作、學習效率,也讓AI原生應用公司獲得更多收益。在通過調用形式服務更多第三方客戶的同時,百度自身的產品也在通過AI應用重構,提升用戶體驗。比如,重構後的百度文庫推出了智能文本生成和編輯、智能PPT生成和編輯等AI新功能,這些新功能累計使用超7億次,拉動百度文庫AI用戶超8000萬,勢必也會拉動百度文庫用戶付費收入的提高。

財報顯示,在旗下產品及服務的AI原生化重構的帶動下,2023年12月,百度App月活用戶達到6.67億,2023年全年在線營銷收入751億元,四季度在線營銷收入192億元。

CMB招銀國際預計,百度生成式AI相關的廣告和雲的收入增長在2023年第四季度步入正軌,並將推動2024年的進一步收入增長。而摩根士丹利預計,2024年,生成式AI技術將爲百度帶來約30億元人民幣的廣告增量收入。

此外,李彥宏還在財報電話會上透露,百度智能雲四季度總營收84億元,其中大模型爲雲業務帶來約6.6億元增量收入。

百度核心業務保持韌性和健康發展,這也是未來其繼續堅定對生成式AI和基礎模型的投入,爲創造新增長引擎奠定基礎。

文心大模型給百度帶來更多的營收,還意味着百度有能力把更多資金投入到大模型數據和算力的提升上,讓文心大模型在理解、生成、邏輯和記憶能力上有更進一步的提升,也可以讓百度在大模型的訓練、研發上進行更多嘗試,在不遠的將來研發出國內版的Sora,甚至是一個市場上還不存在的全新大模型產品,來滿足更多元化的內容生產需求。

未來基礎大模型領域的競爭已經非常明確,誰能夠在數據和算力端投入更多,誰將有更大的可能成爲AI原生時代的操作系統,一統江湖。這個過程除了考驗基礎大模型公司當下的資金實力之外,還在很大程度上依賴大模型本身帶來的造血能力。

這考驗的正是各個基礎大模型當下的商業化能力。

特別策劃

相關文章