◎記者 羅茂林

年初爆火的《狂飆》,劇名正暗合了AI大模型的這一年。

2月ChatGPT“帶火”OpenAI時,行業還預測國內追趕尚需時日;但轉眼的5月,一場聲勢浩大的“百模大戰”便拉開帷幕。頭部公司爭先恐後,中小廠商一路追趕,生怕錯過時代的列車。

有人說這是人類“科技革命的前夜”,也有人在質疑其商業落地仍遙不可及。

這是一個註定不會寂寞的行業。“臥薪嚐膽”的谷歌“一聲長嘯”,推出匹敵GPT的新模型Gemini,也將“原生多模態”定格在了這新舊交替的節點上。

這也是一個註定不會一帆風順的行業。OpenAI高層“宮鬥”禍起,讓這家900億美元市值的“獨角獸”秒變“草臺班子”。這讓外界得窺狂飆之下,行業內部深層的分歧與矛盾的激化。

2024年,將是屬於大模型的一場歧路之旅。

分歧

在最近的一場論壇上,崑崙萬維CEO方漢提出了一個頗爲有趣的觀點——大模型行業裏,小廠纔有顛覆性創新。用他的話來說,本來就沒有用戶,沒有市場,不如放手一搏。

持同樣觀點的人還有百川智能創始人王小川,他相信,小廠更擁有顛覆傳統模式的能力。而這無疑與此前行業的預判有着明顯分歧。

直到今天,市場上對於大模型的普遍認知依然是——只有巨頭能夠參與的賽道。一家上海創投機構的負責人就算了一筆簡單的賬:“別的不說,光騰訊、字節跳動和百度儲備的GPU芯片,就是上百億的資產。”

但歷史一再證明,科技的突破有時並不遵循行業的“普遍認知”。就以大模型爲例,早在年初方漢就對記者預言,大模型的技術架構可能沒有想象中那麼複雜。“如果僅僅是做出大模型的話,中國可能不需要三五年。”

事實證明也是如此。一年來,大模型如雨後春筍,百度、阿里、華爲、京東等互聯網大廠重金押注,無一缺席。截至2023年10月,我國擁有10億參數規模以上大模型的廠商及高校院所共計254家,分佈於20多個省市/地區,國內大模型總數達238個。

隨着行業的快速發展,分歧與爭議也日益增多。通用模型好還是垂類模型好?是否商業化?如何商業化?何時商業化?誰能率先商業化?以至於在如今一場接一場的各類論壇中,大模型成爲“逢會必談”卻也“空泛無物”的熱門話題。

11月底,在OpenAI董事會內部上演的一場“權力遊戲”,或許可以視爲窺探如今行業深層分歧的一個契機。一方面是首席科學家對於AI安全性的高度擔憂,另一方面是CEO阿爾特曼對於AI激進的商業化策略。

有科學家直言,人類處於前所未有的AI威脅當中。但與此同時,大衆對大模型的感知依然停留在“聊天機器人”層面。似乎除了自動生成廣告圖和永遠看起來不怎麼聰明的AI客服外,大模型眼下並沒有更好的用武之地。

“大模型行業最終99%都會死去。”相較於許多人的樂觀讚美,王小川的話在此刻顯得頗爲殘酷。

關口

總體來看,國內頭部大模型的水平大致相當於OpenAI的GPT-3.5,距離GPT-4依然有差距。而要想實現技術上的突破,方漢認爲需要突破三大關口:算力、算法、數據。

最引人注目的莫過於算力之爭。事實上,大模型崛起的最先獲益者並非AI公司,而是芯片廠商英偉達。今年二季度,英偉達數據中心業務佔比首次全面超越遊戲板塊。

今年以來,“算力緊張”已經成爲行業常態,一張英偉達高性能顯卡價格更是“一天一價”。一位英偉達代理商告訴記者,目前國內所有英偉達系GPU配置的算力中心都處於“滿租”狀態。“只要有顯卡服務器來,根本不愁大廠簽約。”

也有業內人士感慨:過去一年見了100多家客戶,只有一家自己擁有算力,其他人都沒有。大模型所需的算力緊俏程度由此可見一斑。

中原證券電子行業分析師鄒臣認爲,AI大模型預訓練數據量呈指數級增長,算力已成爲推動數字經濟飛速發展的新引擎。而據AMD預計,2023年AI芯片市場的規模將達到450億美元左右,至2027年將飆升至4000億美元,2023年至2027年複合增速超過70%。

算力硬件上的短板,短期內可以通過算法優化加以解決,而這恰恰構成行業發展的另一關口。

據脈脈高聘人才智庫發佈的《2023泛人工智能人才洞察》顯示,今年1月到8月,新發AI崗位平均月薪超4.6萬元,人才供需比僅爲0.39,相當於5個崗位爭奪2個人才。

vivo副總裁周圍接受媒體採訪時曾表示:“vivo大模型現在每年20億至30億元的投入成本,總投入成本已經超過200億元,人才和數據算力各佔一半,人才成本平均每人稅後100萬元。”

而具體到部分領域,這種人才短缺就更爲明顯。商湯科技醫療板塊的相關負責人此前就告訴記者,如今跨專業複合學科背景的人才對於行業至關重要。

數據如今更是行業發展難以突破的“險關”。且不論數據訓練的方法是各家祕而不宣的核心機密,單數據篩選就已是巨大的挑戰。

高質量的數據對大模型訓練至關重要,天娛數科副總經理賀晗就曾對記者表示,國內各領域數據“多而不精”“壁壘森嚴”等問題都阻礙行業發展。網易伏羲工程機械產品負責人楊新偉也直言:“工業領域高質量數據太少。”

落地

今年年初OpenAI真正引爆市場的關鍵,在於ChatGPT成爲史上用戶數破億最快的應用。這讓資本看到了商業落地的可能性。經過一年發展,如今全球頭部的大模型都開始進入商業化落地的環節。

今年下半年,國內大模型的商業佈局落地速度也顯著加快。12月22日,在全國信息技術標準化技術委員會人工智能分委會全體會議上,百度、騰訊、阿里的大模型首批通過大模型標準符合性測試,標誌着在商業落地上,國產大模型又邁出重要一步。

據百度負責人介紹,今年以來,文心大模型保持快速迭代,5月升級至3.5版本,10月再次迭代至4.0版本,其理解、生成、邏輯、記憶四大能力顯著提升。同時,通過飛槳與文心的協同優化,模型周均訓練有效率超過98%,訓練算法效率提升3.6倍。

在商業方面,百度文心一言負責人王海峯日前透露,文心一言用戶規模現已達到7000萬,場景4300個。不過王海峯並未具體介紹如今文心一言具體的營收情況。

面向商業化場景的華爲盤古大模型,在年末也有新動作。在12月的活動上,華爲方面透露,目前有7家創業公司與華爲雲簽署合作協議。未來華爲雲將與簽約企業繼續基於昇騰AI雲服務和盤古大模型進行聯合創新,一派生態圖景已然徐徐展開。

不過記者也注意到,除了百度之外,目前其他大模型廠商大都未向外界披露具體用戶的情況,且很多大模型均爲垂類模型,僅對特定的用戶開放。

投融資活躍度是檢驗市場對於商業化落地情緒的最好指標。數據顯示,今年中國AI領域融資214億元,百川智能、Minimax和智譜AI三家公司在資本市場尤爲受歡迎,融資額佔比超過30%。

但除了三家頭部企業,其他初創公司的融資情況可能並非那麼樂觀。

據第三方數據機構企名片數據顯示,今年國內共有26家大模型初創公司拿到融資,基本是種子輪或天使輪。相比於“雷聲滾滾”的論壇會場,市場上真金白銀的“雨點”就略顯稀少。

有創業者發現,如今市場對於大模型項目的市場需求、技術實力、商業模式以及團隊能力等方面的情況會有更多考量。換言之,能否在短期內商業化賺到錢成爲重要的指標。顯然,在如今的大環境下,投資市場也變得異常謹慎。

“目前大家需要承認的是,大模型說了半天,但落地並不是很理想。”瀾舟科技創始人兼CEO周明說道,“我認爲過去一年大家在醞釀情緒,找對接口,明年可能是爆發點。”也有許多投資者認爲,儘管大模型市場曾有不少奇蹟,但明年這個市場最大的可能性,依然屬於頭部廠商。

相關文章