豆包大模型公佈價格清單支持國內最高併發標準

近期，火山引擎官網更新了豆包大模型的定價詳情，全面展示豆包通用模型不同版本、不同規格的價格信息。在模型推理定價大幅低於行業價格的基礎上，豆包通用模型的 TPM（每分鐘Tokens）、RPM（每分鐘請求數）均達到國內最高標準。以豆包主力模型 pro-32k 爲例，價格比行業低99%，TPM限額則高達同規格模型的2.7倍到8倍。

官方信息顯示：在按照 Tokens 實際使用量計算費用的“後付費”模式下，豆包通用模型-pro、豆包通用模型-lite的 32k 及以下窗口版本，模型限流爲 10K RPM 和 800K TPM（以 RPM 和 TPM 其中之一到達上限爲準）。國內其他主流模型的 TPM 限額大多在 100K 到 300K 之間，RPM則是在60到120區間，輕量級模型的RPM限額相對較高，但僅僅在300到500之間。

按照 10K RPM 限額計算，企業客戶平均每秒可以同時調用167次豆包通用模型，從而滿足絕大多數業務場景在生產系統的大模型應用需求。這一標準，已經達到 OpenAI 爲高級別客戶（ Tier4 及 Tier5 等級客戶）提供的 RPM 上限。

在算力挑戰更大的長文本模型上，豆包通用模型 pro 和 lite 的 128k 版本，模型限流爲 1K RPM 和 400K TPM，同樣大幅高於國內其他的128k長文本模型。

此外，豆包大模型公佈了最新的“預付費”模型單元價格。“預付費”是以調用某個特定模型的 TPM 配額，企業購買後無需再爲 Tokens 消耗付費，提前爲可以預見的流量波動規劃好算力。

以豆包通用模型 pro-32k爲例：

按照 “預付費”模型單元價格計算，10K TPM 的包月價格爲2000元。10K*60*24*30=43200K。即 432000K Tokens的價格爲2000元，平均價格爲 0.0046元/千Tokens。

按照“後付費”模式計算：在模型推理的計算成本中，推理輸入通常佔絕大部分比例，業界一般認爲推理輸入是輸出的5倍。根據豆包通用模型 pro-32k 推理輸入 0.0008元/千Tokens、推理輸出 0.002元/千Tokens 計算，模型推理的綜合價格爲 0.001元/千Tokens。

火山引擎方面表示，豆包大模型爲客戶提供了靈活、經濟的付費模式，“後付費”即可滿足絕大多數企業客戶的業務需求，助力企業以極低成本使用大模型、加速大模型的應用落地。

“豆包模型的超低定價，來源於我們有信心用技術手段優化成本，而不是補貼或是打價格戰爭奪市場份額。”火山引擎總裁譚待認爲，“羊毛出在豬身上”在企業市場行不通，技術驅動的極致性價比才能真正創造價值。火山引擎與字節跳動豆包大模型團隊正在密切合作，將持續優化模型效果和推理成本，爲企業和開發者提供更好模型、更低成本和更易落地的平臺支持。

附：火山引擎官網的模型服務價格文檔https://www.volcengine.com/docs/82379/1099320

豆包大模型公佈價格清單支持國內最高併發標準

圖：豆包系列模型“後付費”定價信息

圖：豆包系列模型“預付費”模型單元價目表

熱門新聞

週熱門

豆包大模型公佈價格清單 支持國內最高併發標準

圖：豆包系列模型“後付費”定價信息

圖：豆包系列模型“預付費”模型單元價目表

你降97%，我免費！大模型，迅速開打價格戰！

星宸科技(301536.SZ)：主要專注於端側AI和邊緣側AI推理芯片的研發和銷售

周觀點：英偉達財報超預期，關注GB200的增量機遇

0.35美元vs 5美元，硅谷巨頭的Token價格戰！不僅“卷”價格，還在拼推理速度

阿里降價97%，百度免費 大模型價格戰打得比“618”還猛

阿里雲官宣：通義千問GPT-4級主力模型價格直降97%

百度緊急宣佈：這兩款模型免費！

305個大模型備案率僅45.9% 如何尋找破局之路？

字節跳動將大模型價格打進“釐時代” 騰訊跟不跟？

作品火爆全網，炒地產股虧到炸裂！知名作家曬單：認輸“割肉”虧246萬元，賣掉後股價竟大反彈

快訊 | 商湯5日連升累漲超80%，股價創逾3個月新高

華爲雲在香港提供AI雲服務 爲大模型訓練和推理提供AI算力

Meta繼續押寶開源大模型 Llama 3拿下“賽點”？

文心大模型推理性能提升了105倍 推理成本降到原來的1%

火山引擎回應阿里通義大模型降價

熱門新聞

週熱門

豆包大模型公佈價格清單支持國內最高併發標準

阿里降價97%，百度免費大模型價格戰打得比“618”還猛

華爲雲在香港提供AI雲服務爲大模型訓練和推理提供AI算力

文心大模型推理性能提升了105倍推理成本降到原來的1%