“只要有一家降價都得跟,要不然估計就會掉隊。”

大模型價格戰打得幾近瘋狂。

5月21日上午,阿里雲宣佈通義千問GPT-4級主力模型Qwen-Long降價97%,1塊錢可以買200萬tokens。

這一舉動頗有些劍指字節的味道。此前,字節跳動5月15日發佈豆包大模型,宣佈其主力模型市場定價爲0.0008元/千tokens,較行業平均價格便宜99.3%。阿里雲降價後,其API輸入價格從0.02元/千tokens(文本單位)降到了0.0005元/千tokens。

但儘管降價97%,阿里雲的價格優勢也僅維持了幾個小時。21日下午,百度智能雲便宣佈文心大模型兩大主力模型全面免費,立即生效,包括ERNIE Speed和ERNIE Lite。

“只要有一家降價都得跟,要不然估計就會掉隊。”針對大模型廠商近期降價,新浪微博新技術研發負責人張俊林對第一財經記者表示。激昂又慘烈的價格戰背後,大模型廠商有許多不得不跟的理由。

大模型掀起降價潮

事實上,這一輪大模型降價潮從5月起就初露端倪。

5月6日,幻方量化旗下DeepSeek(深度求索)發佈第二代MoE(專家模型)DeepSeek-V2,API(接口)定價每百萬tokens輸入1元、輸出2元(32K上下文),價格爲GPT-4-Turbo的近百分之一。

5月13日,智譜大模型開放平臺上線新的價格體系,入門級產品 GLM-3 Turbo 模型調用價格下調80%,爲1元/百萬tokens。隨後,OpenAI推出GPT-4o,價格爲GPT-4 Turbo的一半,輸入、輸出每百萬 tokens收費5美元、15美元。字節豆包大模型隨之加入降價潮。

而隨着阿里雲4款通義千問商業化模型和3款通義千問開源模型的不同程度降價以及文心大模型兩大主力模型的全面免費,大模型廠商似乎正在“榨乾”自己的利潤空間。

爲什麼大模型能有如此幅度的降價?對此,阿里雲方面表示,這主要因爲公共雲的技術紅利和規模效應帶來的成本和性能優勢。通過模型和AI基礎設施兩個層面的不斷優化。

Canalys雲分析師章一則對第一財經記者表示,中國客戶羣體其實對價格特別敏感,大模型廠商的降價,更多是爲了吸引更多客戶使用大模型。同時,許多降價的大模型廠商也是雲廠商,雲廠商讓大模型降價最本質的目的還是拉動雲消費。

在不斷擊穿底價甚至免費的“激進”策略下,大模型廠商“搶陣地”的決心遠超其對短期利潤的渴望。章一分析,中國廠商本身做生意比較擅長採用的手段是低價打入市場,再通過走量的形式把成本鋪開。目前,中國B端市場實際使用AI的客戶比並不高,通過降價,大模型廠商希望降低使用其大模型的門檻。

5月21日,針對阿里雲宣佈通義千問GPT-4級主力模型降價,字節跳動火山引擎相關負責人向第一財經記者回應稱,非常歡迎通義千問大模型降價,共同助力企業以更低成本探索AI轉型,加速大模型應用場景落地。

光降價並不夠

大模型的降價背後,值得關注的是,其背後算力成本的下行也是行業趨勢。

阿里雲表示, 彈性的AI算力調度系統,並結合百鍊分佈式推理加速引擎,阿里雲優化了大規模推理集羣,大幅壓縮了模型推理成本並加快推理速度。

騰訊雲近日也提及大模型算力成本下降情況。 騰訊集團副總裁蔣傑透露, 針對 低端卡算 力 低、顯存小的不足, 騰訊使用自研 Angel訓練推理平臺,調度 異構卡集羣 ,萬億大模型推理成本比開源減少70%。

火山引擎總裁 譚 待 此前 表示,字節通過優化模型結構、將單機推理改爲分佈式推理、混合調度雲計算 算 力等降低成本。 DeepSeek 相關負責人則在知乎上解釋 ,DeepSeek-V2兼顧成本和效果基本靠的都是模型結構創新 。

但降價之外,大模型領域還需要更多新故事。

阿里雲智能集團資深副總裁、公共雲事業部總裁劉偉光在今天提起大模型降價的行業趨勢時表示,價格戰要遵循市場的基本原則,降價一定要普惠於市場,以推動市場的發展爲目標,“不以流量博噱頭”。

什麼樣的企業可以用降價普惠市場、推動市場發展?劉偉光提到了四個原則:首先,要普惠市場,模型的的基模能力要足夠領先;其次,要看模型有沒有真正的推理資源;其三,當下的模型是不是有很多客戶在使用,能夠產生商業價值;最後,大模型是不是這家公司主要的業務,企業有沒有戰略定力。

針對如何看待大模型價格戰、騰訊是否會降價的問題,騰訊雲副總裁、騰訊雲智能負責人吳運生近日在採訪中則未直接回應。“我們這幾天也關注到業界的相應情況。其實我們是把大量精力投入到底層大模型能力提高、讓用戶真正用起來之中。”吳運生向第一財經等媒體表示。

“最後一公里”的問題仍橫在大模型面前。”章一分析,大模型降價潮可能在短期內吸引一部分客戶,但長期來看,要吸引更多用戶,大模型仍面臨着如何產生更多落地價值的問題。

大模型究竟能給客戶的實際業務帶來什麼價值?AI的生產力能否讓客戶在實際過程中降低成本、提升企業的效率和實際效益,這纔是對客戶來說另一個層面上的省錢,也是大模型商業化落地進程中的重要問題。無論是國內還是國外,大模型落地產生價值的故事仍不夠完整。

相關文章