李開復露面的頻率越來越高,都是因爲大模型。

沒有上週發佈會上精緻講究的穿搭和標誌性的領帶,這次李開復只是一件西服配上襯衫就出現在攝像頭前,顯得有些倉促。

“昨晚技術團隊看到這個突破很激動,我們就迫不及待想在今天和大家分享了。”5月21日上午,李開復在這場臨時小規模線上發佈會上作如是開場發言。

讓他和團隊激動的消息是,零一萬物提交的“Yi-Large”千億參數閉源大模型在LMSYS Org(Large Model Systems Organization大模型系統組織)發佈的Chatbot Arena總榜單上排名第七,以機構排序,零一萬物01.AI排名僅次於OpenAI,Google和Anthropic。

李開復分析稱,從這個榜單可以看出,中國大模型與OpenAI旗艦模型的差距已經從去年的7-10年縮短到了如今的6個月。“6個月的差別我覺得不是很大,我覺得是一個不可思議的超級速度的趕追,這方面我還是非常自豪的。”李開復在接受包括《每日經濟新聞》記者在內的媒體採訪時表示。

一週前(5月13日),李開復公開發布千億參數Yi-Large閉源模型。他當時表示,Yi-Large的多項評測結果超越Chat GPT4。在一週前,OpenAI又推出了其最新模型GPT-4o,不僅性能有大幅提升,價格也下調了50%。國內市場,字節跳動、阿里等大廠紛紛大幅度降低大模型價格,百度5月21日更直接宣佈文心大模型兩大主力模型免費,掀起國內大模型一輪價格戰。

當被問及如何看如今市場上的大模型價格戰時,李開復表示,在一定程度上,整個大模型行業每年推理成本降低到1/10是可以期待的,而且是必然也應該發生的,通過降低價格讓更多的人體驗到大模型產品對行業是一件好事。

不過他也提到,相信大部分大模型創業者不會不理智地“卷價格”,但是如果中國市場未來真的到了只卷價格、“賠光通輸也不讓你贏”的程度,零一萬物就會轉向國外市場。中國大模型與美國頂尖差距從7年縮短至6個月?

自ChatGPT橫空出世引發國內外的大模型創業浪潮以來,有不少創業者通過各種大模型榜單來證明自己大模型產品的能力,但是各類榜單魚龍混雜,也缺少統一的對比標準。

爲什麼零一萬物和其他幾家中國大模型公司出現在LMSYS發佈的盲測榜單上更值得中國大模型創業者關注?

李開復表示,LMSYS發佈的盲測榜單獲全球大模型巨頭引用率最高、最具有真實參考價值,是大模型領域“絕對的金標準”。就在上週,OpenAI CEO奧爾特曼也通過LMSYS盲測榜單低調測評Chat-GPT4o,並轉發至社交平臺表示對盲測結果的認可。

《每日經濟新聞》記者發現,在最新的盲測榜單中,國內大模型廠商中,智譜GLM4、阿里Qwen Max、Qwen 1.5、零一萬物Yi-Large、Yi-34B-chat都有參與,在總榜上,GPT系列佔了前10的4個,以機構排序,零一萬物01.AI次於OpenAI,Google,Anthropic,智譜GLM4排名15、阿里Qwen Max排名12。

LMSYS榜單上的中國大模型產品

在總榜之外,LMSYS的語言類別上新增了英語、中文、法文三種語言評測,零一萬物的Yi-Large大模型在中文語言分榜上與GPT-4o並列第一,阿里的Qwen-Max和智譜的GLM-4在中文榜上排名則分別爲第7名和第10名。

在李開復看來,中國大模型公司出現在這個榜單中,且排名靠前,對於行業來說最大的意義在於,中國大模型和世界頂尖大模型的差距縮短到只有6個月。

“我們的GPU算力只有Google、OpenAI的1/10,我們的模型尺寸也不到他們的1/10,能夠把一個7~10年的落後縮短到6個月,這絕對是一件令人自豪的事。”李開復表示。同時他也鼓勵更多國內大模型公司參與到更權威的評測中,證明自己的產品競爭力。

6個月的時間差距是如何計算的?李開復表示,可以回到LMSYS 6個月以前的榜單,如今零一萬物發佈的最新大模型已經可以打敗去年11月之前的任何模型,“所以我覺得這也可以科學地推理出我們比國外的頂尖大模型落後6個月。”李開復表示。

“我們能把7-10年的差距快速降低到只有6個月,就驗證了做好一個模型絕對不只是看你多能寫論文,多能發明新的東西,先做或後做。做得最好纔是最強的。”李開復表示。

他認爲,中國的大模型團隊有後發優勢,中國創業者尊敬美國的創造性和學術能力,但是比執行力,比做出很好的體驗,比產品,比商業模式,中國的大模型公司強於美國公司。如果中國市場“賠光通輸也不讓你贏”,就走國外市場

一面是和國外的頂尖大模型“卷”能力,另一面,國內大模型也正在進入“卷”價格的新階段。

今日(5月21日)上午,阿里雲宣佈通義千問主力大模型Qwen-Long的API價格直降97%。具體來看,API輸入價格從0.02元/千Tokens降至0.0005元/千Tokens。該價格也低於字節跳動旗下上週剛剛推出的比行業價格便宜99.3%的豆包主力模型。

在阿里雲宣佈大幅度降價之後,百度當日在其公衆號發文稱,文心大模型兩大主力模型ERNIE Speed和ERNIE Lite全面免費,即刻生效。在此之前,智譜AI也把glm3-turbo價格調整到每百萬tokens 1元。

雖然李開復在上週剛剛呼籲行業應當共同避免陷入不理性的ofo式流血燒錢打法,讓大模型能夠健康良性發展。結果國內大模型價格戰比想象中來得更早,也更刺激。

互聯網大廠的大模型產品不斷“擊穿底價”,零一萬物和其他大模型初創公司如何在競爭中跑贏互聯網大廠?李開復坦言他這幾天也關注到這個現象,“我覺得整個行業每年推理成本降低到1/10是可以期待的,而且必然也應該發生的。今天的API模型調用還是一個非常非常低的比例,如果一年降低到1/10讓更多的人可以用上,這是一個非常利好的消息。”李開復表示。

當被問及零一萬物未來是否有降價的計劃時,李開復表示,目前沒有價格調整的消息,“我認爲模型要看它的表現,可能有些領域,比如說一些很難收回錢的領域要看價格,我們剛上線,有很多忠誠的愛好者選擇了我們,我先服務好他們,價錢再說吧。”他同時提到,零一萬物今年海外產品預期會有大概1個億的收入,這也不是燒錢模式燒出來的。

“在過去十多年的互聯網市場競爭中,國內經常看到共享單車式的瘋狂降價,雙輸的打法,我覺得大模型公司不會這麼不理智,在追求推理成本下降的過程中,技術還是最重要的,如果是技術不行,就純粹靠貼錢賠錢去做生意,零一萬物絕對不會跟這樣的定價做對標。”李開復表示。

特斯拉不會因爲其他車賣得更便宜而降價,我們就是大模型公司中的特斯拉。”李開復說。

相關文章