【TechWeb】5月21日消息,在今天上午阿里雲宣佈旗下通義千問GPT-4級主力模型降價97%後,剛剛,百度發文宣佈,旗下兩款大模型ERNIE Speed、ERNIE Lite免費。

ERNIE Speed和ERNIE Lite是今年3月百度正式推出的“輕量級”大模型。“輕量級”大模型即用小尺寸的專家模型也能夠達到通用大模型的效果,而小尺寸專家模型的推理成本會更低,更便宜。

ERNIE Speed推理場景下擁有最高128k的上下文長度,在處理知識問答等任務時,能夠更好的處理上下文的依賴關係,生成更加連貫和準確的預測或回答。

ERNIE Lite參數量相比ERNIE Speed更小,更加適合搭載在低算力的AI加速卡上處理推理任務,在兼顧模型效果與推理性能的同時,大幅降低客戶落地應用成本。

今年以來,國內AI大模型行業價格競爭越來越激烈。

上週,字節跳動旗下豆包主力模型在企業市場的定價低至0.0008元/千Tokens,DeepSeek-V2價格做到了每百萬tokens1元。此前,智譜AI也把glm3-turbo價格調整到每百萬tokens 1元。

今天上午,阿里雲宣佈通義千問GPT-4級主力模型Qwen-Turbo、Qwen-Plus、Qwen-Long等9款主力AI大模型宣佈全面降價,其中Qwen-Long API輸入價格從0.02元/千tokens降至0.0005元/千tokens,最高直降97%。(宜月)

相關文章