來源:華夏時報

本報記者石飛月 盧曉 北京報道

從ChapGPT到Sora,從數千億參數到千萬長文本,大模型浪潮下,永遠不缺熱點。近日,“Kimi概念股暴漲”“Kimi爲宕機道歉”等詞條先後衝上微博熱搜,讓月之暗面這家剛成立一年的人工智能公司進入越來越多公衆的視野。

3月18日,月之暗面宣佈Kimi智能助手啓動200萬字內測的動作,這引燃了大廠們新一輪“內卷”的熱情,阿里巴巴直接將行業最高水平拉到1000萬字,百度被曝下月開放200萬-500萬長度。3月23日下午,360也來湊熱鬧了,宣佈正式內測500萬字長文本處理功能。

去年還在拼參數,今年又拼起了長文本/無損上下文,一個大模型讓互聯網大佬們使盡了全身解數,可見萬物皆可AI的大勢已經不可阻擋。然而,數據上的領先只是暫時的理論成果,未來,解決問題的能力纔是AI公司們真正築起商業化大樓的底氣。

數據比拼

和此前的參數競賽不同的是,這輪大模型之間的競爭,不只停留在數據層面,還有概念上的“拉扯”。

僅從表面上的數據水平來看,360和百度打的是“安全牌”,並未在數據上猛衝。3月23日,360AI瀏覽器宣佈正式內測500萬字長文本處理功能,據用戶反饋,該瀏覽器目前已可一分鐘讀完《三體》,並就文本外的“超綱”問題進行問答和延展學習。而在2月底時,360AI瀏覽器就已向用戶免費開放100萬字長文本閱讀功能。

目前,360AI瀏覽器PC端已可免費下載使用,移動端也即將上線各大移動平臺,該瀏覽器同時也支持對視頻、音頻、網頁和中英文論文等常用文檔類型的處理,可以幫助用戶自動總結要點、生成思維導圖等。

百度也被曝將於下個月對文心一言進行升級,屆時也將開放長文本能力,文本範圍在200萬-500萬。

相較於360和百度的“安全牌”,阿里巴巴打出的則是“一鳴驚人牌”,通義千問升級後直接向所有人免費開放1000萬字的長文檔處理功能,成爲全球文檔處理容量第一的AI應用。據悉,所有金融、法律、科研、醫療等領域的專業人士,都可通過通義千問網站和App快速讀研報、分析財報、讀科研論文、研判案情等。

要知道,目前國外頭部大模型中,Open AI的GPT-4Turbo上下文窗口爲12.8萬tokens,谷歌的Gemini1.5支持100萬tokens上下文。1個漢字通常相當於1-2個token,單從理論上分析,360AI瀏覽器、文心一言和通義千問的上下文窗口已經是這些頭部大模型的好幾倍。

而一開始引燃這場“戰爭”的月之暗面,給出的數據是200萬,雖然和以前的20萬字相比有極大提升,但和阿里巴巴的1000萬字相比,還是小巫見大巫了。

概念“拉扯”

對於數據上的差距,月之暗面有自己的想法。

首先在概念上,月之暗面給出的是200 萬字無損上下文長度,而不是長文本。“之所以不能稱爲‘長文本’,是因爲輸入的信息不只是文本,也可以是圖片、錄音、視頻、動作等多模態的信息。”月之暗面相關負責人對《華夏時報》記者表示。

另外,上述負責人指出,一些產品對數百萬甚至上千萬字的文檔支持,通常採用的並不是無損長上下文窗口的方案,而是一種被稱爲檢索增強生成(RAG)的方案,這種方式是從文檔中搜索出相關的部分內容,然後將這些內容給到大模型去做推理,模型的真實上下文窗口長度,也就是真正輸入給模型去推理的內容,仍然是 3 萬字左右(以當前市場上常見的32K上下文窗口模型爲例)。“以讀書來比喻的話,支持長上下文窗口的模型是真的逐字讀了一本書,然後跟你討論書的內容;RAG方案是讀了幾個摘抄片段,然後跟你討論書的內容。討論的深度和精度自然不可同日而語。”

一石激起千層浪,或許就連月之暗面也沒想到,自己的一個動作能引發這麼多互聯網大佬的競逐,讓AI市場再起漣漪。

月之暗面爲200萬字無損上下文的能力提供了多個場景,也確實吸引了衆多嚐鮮的用戶:上傳一份完整的近百萬字中醫診療手冊,讓 Kimi 針對用戶的問題給出診療建議;上傳英偉達過去幾年的完整財報,讓 Kimi分析總結英偉達歷史上的重要發展節點;上傳幾十萬字的經典德州撲克長篇教程,讓 Kimi 扮演德撲專家提供出牌策略的指導……

由於衆多用戶湧入,系統流量持續異常增高,3月21日Kimi的App和小程序出現宕機現象,月之暗面對此表示抱歉。

有意思的是,當國內大模型卷向長文本的同時,愛跨界的馬斯克還在卷參數。3月18日,馬斯克的AI創企xAI正式發佈開源大模型Grok-1,其參數量達到3140億,超過Open AI GPT-3.5的1750億,一舉成爲迄今參數量最大的開源大語言模型。

艾媒諮詢CEO兼首席分析師張毅對《華夏時報》記者表示,參數之爭到長文本之爭的變化,本質上是大模型更加貼近用戶的使用和需求場景。“長文本的主要應用領域,目前主要集中在方案、合同、論文、法律文書、科普、小說、文字策劃、廣告創意等文本處理的場景。”

因此當Kimi突然爆火時,大漲的概念股基本爲影視、傳媒類的公司。截至3月22日收盤,慈文傳媒漲停,華策影視掌閱科技中廣天擇都是三連板。

商業價值待估

除了引燃概念股,Kimi的跨越式升級也在業內引發了對AI應用落地和商業化的期待。

平安證券發佈研究報告稱,Kimi無損長文本模型的出現,解決了很多大模型在應用中的痛點,打開了大模型的應用空間,AIGC最終的落地,還是要找到合適的場景,Kimi作爲千億大模型,能夠支持複雜運算,同時還能接受和處理大文本,解決了很多大模型實際應用中的難題,後續商業化潛力將凸顯。

那麼,接下來要探討的問題,就是商業模式。

張毅推斷,GPT是用戶通過付費方式使用的,但國內的大模型競爭在初期就如此激烈,很有可能會走上過去搜索引擎的路子,免費恐怕是一個主要方向。“所以未來也可能是‘羊毛出在豬身上’成爲普遍現象,當然,垂直化應用場景、個性化解決方案,也是大模型文本未來的商業突破之道。”

隨着Kimi的爆火,月之暗面自身的商業化訴求正在變得強烈。該公司相關負責人向《華夏時報》記者透露,面對高峯時期 Kimi 會提示需要等待等問題,有用戶反映是否可以付費解決,所以今年公司會有初步的方案出來。

商業化訴求背後是文本能力越強成本越高的現實問題。上述負責人表示,當模型支持的上下文窗口長度越長,精度越高(信息越無損),模型推理成本也會呈指數級上升,所以月之暗面會在工程上做一些創新探索,想辦法儘快降低成本,讓更多有需求的用戶體驗到超長無損上下文窗口能力。“如果是檢索增強生成(RAG)的方案,模型本身的推理成本幾乎沒有變化,因爲實際輸入模型的上下文窗口長度沒有發生變化。”

對於長文本帶來的成本變化和商業化問題,《華夏時報》記者也採訪了360方面,截至發稿,對方未給出回覆。

但數據上的比拼,以及商業化能力的體現,最終還是要落實到真正的應用、用戶體驗上。

在張毅看來,從某種意義上講,如果應用體驗做得足夠好,大模型長文本的商業化應用場景是存在的。“目前大模型的智能化程度還有待改善,結合具體的應用需求,國內大模型在數據、文字和設計創新上與國外頭部大模型相比還有一定的差距,未來長文本的發展格局,或許就是看哪家能在這些方面有更好的表現,是否能夠形成更大的競爭力。”

責任編輯:黃興利 主編:寒豐

相關文章