“百模大戰”開打,未來誰將脫穎而出?

在今年的世界人工智能大會上,大模型佔據當仁不讓的C位,國內外總計30餘款大模型集體亮相,據記者不完全統計,其中既有來自企業巨頭華爲、百度、阿里、京東等推出的通用大模型,也有來自清華、復旦等學院派大模型,還有包括出門問問、第四範式等創業公司入局,“廝殺”尤爲激烈。

從起初的算法、算力,到如今的應用場景、商業空間,業界對於對大模型的爭論,逐漸從方向前景嚮應用現實層面靠攏。

騰訊副總裁湯道生提到了“通用大模型”和“行業大模型”兩條不同路徑,如何在最低成本下實現大模型的最優選擇,創業公司如何在巨頭裹挾中找到生存機會,成爲今年產業界的熱議焦點。

入局大模型的兩種範式,有多燒錢?

所謂人工智能大模型,通常指的是經過大規模數據訓練後,能夠適應一系列任務的模型。

大模型的“燒錢”已成爲業內共識。此前,華爲雲人工智能領域首席科學家田奇曾在公開演講中表示,大模型可能收編高度定製化的小模型,導致市場向大公司集中,其資本門檻高,大模型開發和訓練一次1200萬美元。

崑崙萬維此前也在公告中表示,大模型市場已經進入10家左右中大型公司,打3-5年持久戰的格局,要做好這件事情,需要長期儲備至少10億美金以上的資金。

作爲行業人士,網易伏羲預訓練及生成式人工智能平臺負責人趙增向記者介紹,目前企業入局大模型主要分爲兩種範式:第一種是着力於通用能力的基礎大模型,這也是成本最高、最爲昂貴的大模型。另一種則是基於基礎大模型的行業垂直大模型,以大部分創業公司爲例。

基礎大模型以國外的OpenAI,國內的阿里、百度等爲例,據浙商證券分析師陳杭此前發佈報告,一片英偉達頂級GPU成本爲8萬元,GPU服務器成本通常超過40萬元,“對於ChatGPT而言,支撐其算力基礎設施至少需要上萬顆英偉達GPU A100,一次模型訓練成本超過1200萬美元。”

行業垂直大模型則以騰訊和大部分創業公司爲例。據騰訊高級執行副總裁湯道生表示,基礎通用大模型可以在100個場景中,解決70%-80%的問題,但未必能100%滿足企業某個場景的需求。基於行業大模型構建自己的專屬模型,雖然參數比通用大模型少,但是訓練和推理的成本更低,優化也更容易,可能是性價比更高的選擇。

“實際上,並不是所有的大模型研發都需要耗費很大的成本。”趙增向記者透露,具體還是要看其具體的切入點,以及結合具體場景的應用價值、是否使用開源模型等等。

值得注意的是,關於垂直大模型的成本究竟高不高,目前行業內也有不同說法。京東探索研究院院長、京東科技智能服務與產品部總裁何曉冬向記者坦言,目前垂直行業模型的訓練成本和難度並不低,因爲行業模型是建立在通用模型基礎上的。如果只用行業數據進行訓練,會缺乏常識,以電商退換貨爲例,比如客戶需要出門,無法在當天進行退換貨,如果過於垂直的行業模型可能無法準確的理解客戶的意圖,難以進行有效溝通並完成針對性的後續任務。

巨頭公司PK創業公司

據記者不完全統計,在今年人工智能大會發布的近30個大模型中,有近十個大模型來源於中小企業,其中不乏創業公司,包括雲天勵飛旗下的“雲天天書”、星環科技旗下的“星環無涯”、第四範式旗下的“式說”等,和大廠面對面掰手腕,初創公司的機會在哪裏?

“在國內,大模型研發本質不是錢和資源的問題,而是切入點和場景的問題。有很多公司可以通過融資獲得研發的第一桶金,門檻並不算特別高。”第四範式副總裁塗威威向記者坦言。“大廠的規模大,團隊也多,不同團隊之間可能出現賽馬競爭,浪費資源,而創業公司的優勢就是能集中大量資源,花費在某個具體模型上的投入未必遜色於大廠。”

他舉例說,大模型就像造工廠,如果建造工廠只爲了造一輛車,那確實成本很高,但如果在工廠建成後源源不斷地生產車輛,對每輛車的成本而言並不是很高。目前,各大廠商,包括創業公司,都還處於“造工廠”的階段,但隨着生態的不斷完善,未來的成本必然會顯著降低。

“ChatGPT太強大了,對創業公司很不友好。創業公司基於ChatGPT能夠創造的價值非常單薄。”此前,知名投資人朱嘯虎曾經和獵豹移動 CEO傅盛在朋友圈就創業公司該不該入局大模型互懟。朱嘯虎認爲,大模型摧毀了創業,因爲模型、算力和數據,三大支柱都向大廠集中,看不到創業公司的機會,且直接在大模型上做應用護城河太低。

傅盛卻認爲,大模型催生了很多新的架構在大模型之上的創業機會,包括直接在大模型上搭建的不同應用和由於數據私有帶來的垂直領域的大模型等等。行業大模型以及基於大模型的應用開發,纔是大部分創業者真正能夠抓住的機會。

從資本角度來看,哪怕是大模型“先行者”OpenAI都處於連年虧損的狀態,甚至虧損額還在逐年增加。據外媒報道,OpenAI去年虧損額度翻倍,達到5.4億美元左右。OpenAI首席執行官山姆·奧特曼(Sam Altman)曾私下表示,公司可能會在未來幾年籌集至多1000億美元資金以進一步開發人工智能的能力。

也有業內人士看好創業公司的機遇。一位大廠技術負責人私下透露,實際上,在生成式AI賽道,目前表現亮眼的都是“小廠”的產品,而大公司的產品往往中規中矩,缺少亮點,相比大廠,創業公司的思路更靈活,對新的理念接受也更快,容易誕生有創新和革命性的模式。而且目前較爲常規的通用大模型成本已經在可控制的範圍內,並沒有外界想的那麼高。

儘管大模型賽道確實有資金門檻,但其商業前景受到業內的一致認可,不少業內人士向記者透露,目前大模型賽道已經催生出大量商業機會,其盈利空間是明確的。

“現在各行各業都結合大模型的技術,落地場景非常豐富,既有通用場景,也有行業場景。此前,騰訊已經將大模型的能力融入到旗下企點智能客服、數智人等產品中,也在嘗試雲上代碼助手,在普適性的場景下有很多應用,同時,各種行業客戶也帶來了大量的需求。”騰訊雲副總裁、騰訊雲智能負責人吳運聲告訴記者。

吳運聲認爲,目前仍然是大模型發展的早期階段,呈現出“百花齊放”的狀態,只有更多嘗試和更多投入,才能擁有更多可能性,目前判斷大模型數量太多或太少,還爲時過早。

“哪怕就在當下,行業大模型的應用已經被證明是可行的。”趙增坦言,以網易遊戲的美術設計爲例,隨着AI大模型的應用,原先的生產力得到釋放,可以快速縮短原來所需的設計流程,實現生產效率的大幅提升。

而據崑崙萬維CEO方漢預測,在未來3-5年內,大模型將產生更多的端到端內容製作工具,徹底改變文學、音樂、漫畫、動畫、短視頻、長視頻和影視等行業的內容生產形式和流程。這將使更多人無門檻地進入內容創作領域,豐富娛樂生活。

在今年大會上,啓明創投發佈報告稱,三年內顛覆式的AI應用的核心驅動力來自於底層模型的創新,模型的作用將大於產品設計的作用。目前,生成式AI仍然處於技術主導的早期階段,未來將存在誕生千億美元市值的平臺型企業機會。

相關文章