撰文 | 張宇編輯 | 楊博丞

“追趕OpenAI”“對標Open AI是智譜AI成立以來的目標”,是智譜AI CEO張鵬在對外分享時屢次提及的幾句話,但現在,智譜AI追趕OpenAI的困難程度增加了不少。

繼OpenAI在春季發佈會上發佈全新旗艦語言模型GPT-4o之後,谷歌也在I/O開發者大會上推出了一系列基於Gemini的“AI超級全家桶”。儘管智譜AI被認爲是最有可能成爲“中國OpenAI”的大模型企業之一,但隨着國內外“百模大戰”愈演愈烈,智譜AI面對的形勢難稱喜人。

以智譜AI旗下生成式AI助手智譜清言爲例,這是一款基於ChatGLM2人工智能語言模型開發而來的大模型產品,通過萬億字符的文本與代碼預訓練,結合有監督微調技術,具備通用問答、多輪對話、創意寫作、代碼 生成、虛擬對話、AI畫圖、文檔和圖片解讀等能力。

但與OpenAI基於GPT-4人工智能語言模型開發的ChatGPT相比,智譜清言仍然處於劣勢地位。一個最直接的差距在於,ChatGLM2在訓練數據和多樣性、跨語言能力、模型規模和參數和推理能力等方面均不如GPT-4。

爲了彌補與OpenAI之間的差距,智譜AI在2024年1月舉行的首屆技術開放日(Zhipu DevDay)上發佈了新一代語言模型GLM-4,雖然GLM-4整體性能相比上一代大幅提升60%,號稱“比肩GPT-4”,但實際上也只是達到GPT-4約90%左右的水平。

值得一提的是,OpenAI新發布的GPT-4o在處理速度上提升了200%,基於GPT-4o,OpenAI對ChatGPT進行了更新升級,增加了更強的語音和視覺功能,這讓ChatGPT對現實的感知能力大大增強——GPT-4o可以在短至0.23秒的時間內響應音頻輸入,音頻響應速度已經達到與人類相似的水平。

顯然,追趕GPT-4已然是智譜AI當下最迫切的任務,其能否訓練出真正比肩GPT-4的語言模型,對於商業化和生態的進階尤爲關鍵。

01.與OpenAI仍存較大差距

智譜AI成立於2019年6月,由清華大學知識工程實驗室(KEG)技術成果轉化而來,是目前國內唯一全內資、全自研的大模型企業,早在2020年開始GLM預訓練架構的研發,並訓練了100億參數模型GLM-10B;2022年合作研發了1300億級超大規模預訓練通用模型GLM-130B;2023年,智譜AI推出千億開源基座對話模型GLM系列,並在2024年1月推出GLM-4。

由於智譜AI入局較早且直接對標OpenAI,也因此成爲資本機構眼中的寵兒。2023年7月至9月,智譜AI共拿到了5輪融資,融資金額超過25億元,主要投資機構包括中關村自主創新基金、美團戰略投資部、螞蟻集團、阿里巴巴、騰訊投資、高瓴資本、紅杉資本等等,目前估值更是達到了200億元,躋身國內AI領域“獨角獸”企業。

不過,目前智譜AI與OpenAI仍有較大差距。

從技術路線來看,OpenAI更加註重通用性、可移植性和可擴展性,其GPT系列語言模型可以在多個場景下應用,並且具有高度的可定製性。相比之下,智譜AI的技術路線是“大模型+小模型”,通過大模型的預訓練和微調,來適應不同場景和任務的需求。這種技術路線可以提高模型的泛化能力和應用範圍,但也存在着模型複雜度高、計算量大、訓練時間長等問題。

在模型規模方面,OpenAI的GPT系列語言模型規模較大,可以處理大量的自然語言數據,從而獲得更好的模型性能,而智譜AI的模型規模可能較小,處理數據的能力有限,這可能會影響其模型性能和泛化能力;在數據資源方面,OpenAI擁有大量的自然語言數據資源,可以用來訓練和優化其模型,而智譜AI的數據資源可能相對較少,導致其模型訓練的效果和性能受到限制。

兩者而定直接差距體現在用戶數上。2022年11月,OpenAI旗下ChatGPT僅上線五天用戶數便突破百萬,2023年1月,其月活用戶數突破了1億,成爲歷史上用戶數增長速度最快的消費級應用。相比之下,根據機構測算,截至2023年11月,智譜AI旗下智譜清言的日活用戶數區間僅爲10萬至40萬。

值得一提的是,智譜清言甚至不是百度旗下文心一言的對手,截至2023年11月,文心一言的日活用戶數約爲80萬左右,而截至2024年4月,文心一言的用戶數已經突破了2億。

張鵬也坦言,和國外大模型相比,國內的大模型發展起步晚了一些,加上高性能算力限制、數據質量的差距等,國內大模型在規模和核心能力上都與世界先進水平存在一定差距,這樣的差距大約在一年左右。

02.智譜AI商業化路漫漫

大模型商業化如何落地,是擺在包括智譜AI在內的所有大模型企業面前的巨大挑戰。

智譜AI是國內最早推進商業化的大模型企業之一,並且率先提出了“模型即服務(MaaS)”的落地路徑,目前智譜AI探索出四種商業模式:一是輕量級的,將大模型封裝成開放平臺,提供API(應用程序接口)給開發者、企業等進行調用,按照調用量進行付費,這種方式非常簡單、成熟,與國外並沒有太大差別;二是面向一些中大型企業對於數據安全保障的需求,智譜AI提供雲端私有化部署的方案,基於雲端算力幫用戶開闢專門的模型專區;三是完全私有化的部署,在企業自己的硬件及算力平臺上提供大模型的基座能力,滿足企業開發相關應用及業務發展的需求;四是一種軟硬件結合的方案,將大模型與國產化信創硬件適配綁定,可以免除在客戶環境中進行部署和實施調試的過程,通過軟硬件一體化進行銷售和部署。

張鵬認爲,B端的付費意願比C端好很多,尤其是行業頭部企業,在大模型方面普遍投入多、動作快。所以智譜AI從一開始就瞄準B端。截至2023年,智譜AI已擁有超2000家生態合作伙伴、超1000個大模型規模化應用,另有200多家企業跟智譜AI進行了深度共創,覆蓋傳媒、諮詢、消費、金融、新能源、互聯網、智能辦公等多個領域的多個頭部企業。張鵬透露,2023年下半年智譜AI簽單客戶約幾百家,2023年整體有億級簽單額。

然而智譜AI還未實現商業化,大模型行業便打起了“價格戰”。

5月15日,字節跳動宣佈,豆包主力模型(豆包通用模型pro)在企業市場的定價爲0.0008元/千Tokens,而市面上同規格模型的定價一般爲0.12元/千Tokens,是豆包模型價格的150倍。5月14日,OpenAI在春季發佈會上宣佈,GPT-4o的API價格下降50%。

在此之前,法國AI企業Mistral AI發佈了最新大模型Mistral Large,並推出對標ChatGPT的首個聊天機器人Le Chat。在定價上,Mistral Large的輸入、輸出價格比GPT-4 Turbo便宜約20%;幻方量化旗下AI公司DeepSeek發佈的全新第二代MoE大模型DeepSeek-V2的API定價爲每百萬Tokens輸入1元、輸出2元(32K上下文),價格爲GPT-4 Turbo的近百分之一。

面對“價格戰”,智譜AI也宣佈入門級產品GLM-3 Turbo模型調用價格從5元/百萬Tokens降至1元/百萬Tokens,降幅高達80%。

值得一提的是,大模型定價的持續走低有望帶來更快的商業化落地,但同時“價格戰”往往意味着企業需要在價格上做出讓步,對於智譜AI而言,其自身盈利能力有限,如果再進行“價格戰”,或將導致利潤進一步下降,實現盈利也將變得更爲艱鉅。

張鵬也坦言,2024年智譜AI所面臨的挑戰是非常艱鉅的,一方面,2024年OpenAI在超級認知、超級對齊上的技術會實現新的突破,這要求智譜AI不斷迭代技術,跟進世界領先腳步;另一方面,2024年大模型會迎來商業化落地潮,智譜AI的商業化競爭壓力也會加大。

對於智譜AI而言,目前商業化路徑已經較爲清晰,但能否走通大模型的商業化之路,關鍵不僅在於商業模式的探索嘗試,更在於解決大模型發展的底層問題。

03.抱團取暖

開源開放也是智譜AI的一大特色,智譜AI希望營造繁榮的社區和生態,爲了更進一步促進大模型開源社區的發展。

張鵬曾表示,智譜AI是國內少數能對標OpenAI的頭部技術企業。公司希望與產業鏈上下游的合作伙伴、開發者社區、學術界等AI領域所有的參與者一同努力,爲中國AI新未來貢獻自己的努力。

2024年,智譜AI將發起開源開放的大模型開源基金,該計劃包括三個“1000”:智譜AI將爲大模型開源社區提供1000張計算卡,助力開源開發;提供1000萬元的現金用來支持與大模型相關的開源項目;爲優秀的開源開發者提供1000億免費API tokens。張鵬表示,大模型開源基金的目的在於推動大模型研發的大進展,促進大模型整個開源生態的大繁榮。

面對全球大模型創業者,智譜AI將升級“Z計劃”,聯合生態夥伴發起總額10億元的大模型創業基金用於支持大模型原始創新,覆蓋大模型算法、底層算子、芯片優化、行業大模型和超級應用等方向。

此外,智譜AI還入股衆多AI產業鏈企業,截至目前,智譜AI以產業型投資方式,已投資、入股超過10家初創公司,單筆參投規模在百萬元級別,其中包括AI模型層企業“聆心智能”,AI模型層企業“面壁智能”,智能法律服務產品提供商“冪律智能”,企業大模型服務平臺“智異璧”,軟件和信息技術服務商“數道智算”,生成式AI應用提供商“生數科技”等等。

對於智譜AI的未來,張鵬十分樂觀,“2024年,大模型市場將從野蠻生長迴歸冷靜,對於大模型的投資與炒作將會告一段落,行業焦點也將從模型本身轉向尋找應用。不過這並不代表大模型的技術演進速度會下降,向上探索的天花板還遠遠沒到。”

本文來自微信公衆號“DoNews”(ID:ilovedonews),作者:張宇,36氪經授權發佈。

相關文章