近期,火山引擎官網更新了豆包大模型的定價詳情,全面展示豆包通用模型不同版本、不同規格的價格信息。在模型推理定價大幅低於行業價格的基礎上,豆包通用模型的 TPM(每分鐘Tokens)、RPM(每分鐘請求數)均達到國內最高標準。以豆包主力模型 pro-32k 爲例,價格比行業低99%,TPM限額則高達同規格模型的2.7倍到8倍。

官方信息顯示:在按照 Tokens 實際使用量計算費用的“後付費”模式下,豆包通用模型-pro、豆包通用模型-lite的 32k 及以下窗口版本,模型限流爲 10K RPM 和 800K TPM(以 RPM 和 TPM 其中之一到達上限爲準)。國內其他主流模型的 TPM 限額大多在 100K 到 300K 之間,RPM則是在60到120區間,輕量級模型的RPM限額相對較高,但僅僅在300到500之間。

按照 10K RPM 限額計算,企業客戶平均每秒可以同時調用167次豆包通用模型,從而滿足絕大多數業務場景在生產系統的大模型應用需求。這一標準,已經達到 OpenAI 爲高級別客戶( Tier4 及 Tier5 等級客戶)提供的 RPM 上限。

在算力挑戰更大的長文本模型上,豆包通用模型 pro 和 lite 的 128k 版本,模型限流爲 1K RPM 和 400K TPM,同樣大幅高於國內其他的128k長文本模型。

此外,豆包大模型公佈了最新的“預付費”模型單元價格。“預付費”是以調用某個特定模型的 TPM 配額,企業購買後無需再爲 Tokens 消耗付費,提前爲可以預見的流量波動規劃好算力 。

以豆包通用模型 pro-32k爲例:

按照 “預付費”模型單元價格計算,10K TPM 的包月價格爲2000元。10K*60*24*30=43200K。即 432000K Tokens的價格爲2000元,平均價格爲 0.0046元/千Tokens。

按照“後付費”模式計算:在模型推理的計算成本中,推理輸入通常佔絕大部分比例,業界一般認爲推理輸入是輸出的5倍。根據豆包通用模型 pro-32k 推理輸入 0.0008元/千Tokens、推理輸出 0.002元/千Tokens 計算,模型推理的綜合價格爲 0.001元/千Tokens。

火山引擎方面表示,豆包大模型爲客戶提供了靈活、經濟的付費模式,“後付費”即可滿足絕大多數企業客戶的業務需求,助力企業以極低成本使用大模型、加速大模型的應用落地。

“豆包模型的超低定價,來源於我們有信心用技術手段優化成本,而不是補貼或是打價格戰爭奪市場份額。”火山引擎總裁譚待認爲,“羊毛出在豬身上”在企業市場行不通,技術驅動的極致性價比才能真正創造價值。火山引擎與字節跳動豆包大模型團隊正在密切合作,將持續優化模型效果和推理成本,爲企業和開發者提供更好模型、更低成本和更易落地的平臺支持。

附:火山引擎官網的模型服務價格文檔https://www.volcengine.com/docs/82379/1099320

相關文章