來源 | 鹽財經

大模型賽道的參與者一度處於比以往更深的焦慮中。這一領域內,基礎技術研究動輒融資上億,而可行的商業模式,卻還在空中摸索。

但三月的“長文本”概念破圈,重新攪動了一池心意。

自3月18日,剛滿一歲的中國初創AGI公司月之暗面宣佈旗下大模型Kimi智能助手開啓200萬字無損上下文內測後,國內各家大廠先後下場,秀肌肉一般宣佈起各自在長文本領域的升級。

3月中旬,阿里旗下大模型工具通義千問宣佈,向用戶開放免費長文檔解析處理功能,支持約1000萬字的超長文檔處理;

百度向《科創板日報》透露,4月將在版本升級後開放長文本能力,文本處理範圍在200萬-500萬,是當下最高2.8萬字文檔處理能力的上百倍;

360智腦宣佈內測500萬字長文本處理功能,並表示早在2月底,360AI瀏覽器已向用戶開放100萬字長文本閱讀和拓展功能。

被濃烈的FOMO(Fear of Missing Out)情緒裹挾,這場大模型文本處理能力比拼,掀起二級市場一股猛烈的跟投風。三月下旬,與Kimi有關聯的上市公司被打包進“Kimi概念股”板塊,強勢拉漲AI應用板塊。與Kimi存在關聯的華策影視掌閱科技中廣天擇等多股,在18日後股價相繼迎來漲停。

高燒兩週後,如今“Kimi概念”逐漸降溫,但其背後這個閃爍着“小天才”光環,由90後創始人建立的、估值達25億美元的國內初創公司,無疑讓更多人看見低門檻投身大模型領域淘金的抓手。

對資本市場而言,2023年的初始基建時期已經過去,這一領域的商業落地故事,纔剛剛起勢。

01

長文本,關用戶什麼事?

在技術圈內,風頭正勁的長文本並不是一個稀奇物。

簡單來說,大模型支持的上下文窗口容量,可類比計算機的運行內存,也可理解爲大模型的理解力與記憶力。在與大模型進行內容交互(如問答對話)的過程中,大模型有一個可容納的文本容量上限。這一上限不僅關係到大模型單次處理文本的能力,也關係到大模型記憶連續對話的容量。

當大模型的長文本容量增加,該大模型在對話時可以考慮的上下文信息就越多,越有助於產生有針對性的連貫對話,也能確保在這一容量內的文本信息丟失情況減小。用戶可以餵給大模型更多信息,而大模型根據這一用戶與機器的歷史互動,回以個性化解釋。

月之暗面CEO楊植麟曾詩意地表示,長文本(long context),是做成通用世界模型的第一步,“登月第一步”。

這一步,在技術圈內被認可爲重要但並非獨特的一步。

正如曾經計算機內存在過去幾十年內漲了好幾個數量級一樣,越來越大的長文本容量同樣出現在大模型領域。各家均會發力做內存升級,但受限於長文本對算力消耗大、成本高,真正入局卷基礎技術的公司有限,長文本也不是各家大模型的宣傳重心。

月之暗面則另闢蹊徑,看見了長文本技術在用戶端可以產生的影響,並實行了Kimi與長文本強綁定的宣傳策略。

早在2023年10月,推出Kimi應用的第一天,月之暗面便在官方公衆號上宣傳,“歡迎與Moonshot AI共同開啓Loooooooooong LLM時代”。

它高調宣稱,Kimi Chat是首個支持輸入20萬漢字的智能助手產品,其文本容量2.5倍於Cloude的100K,8倍於GPT-4的32k。

容量升級,導向的是更好的用戶體驗。月之暗面表示,當前大模型使用過程中的遺漏重要信息、不支持長文本prompt輸入導致的場景設定不清晰、無法基於大量給定材料給出專業回應等問題,均會在大模型擁有足夠長的上下文輸入容量後迎刃而解。

這相當於一個記憶容量更大、理解能力更好的大腦。

“它很本質。”楊植麟如是說。

如此強調,是爲了搶奪產品在用戶心中的定位。成立之初,月之暗面便定下了獨特的商業模式,不做目前看來商業模式更清晰的B端,而是在做基礎大模型研究的同時,面向C端發力,意圖通過技術提升,攻克C端用戶個性化服務的需求。

楊植麟曾表示,在大模型領域,基礎技術突破和提供個性化服務走的是同一條路。通過不斷升級這一“大腦”的“腦容量”,每個C端用戶都會獲得一個更能記憶與自己的互動歷史的模型,從而得到更獨特的、無法被複刻的反饋。

這是一招燒錢獲客的險棋。由於當前各家大模型C端應用同質化程度高,普遍爲對話助手形式,在資金充裕的阿里、百度等大廠仍提供免費應用的情況下,各家公司不敢貿然進行收費。當公司將商業模式定在用戶端,暫時看來,其只能仰賴投資人的源源不斷的資金流入,以保證研發及運營的現金流。

根據《新浪科技》報道,月之暗面當前投放廣告獲客成本約爲10元,加上拉新後用戶問答產生的算力成本,每個用戶的獲客成本約爲12-13元。

按照第三方數據平臺七麥數據的用戶下載量預估,近一個月IOS端Kimi累計下載量超82萬,僅iPhone端日均獲客成本已超32萬,近一個月iPhone端獲客成本近一千萬。若加上安卓端、網頁端的運營成本,獲客成本更要上一級臺階。

儘管費用不低,但這一數據某種程度上驗證了月之暗面發展策略的有效性。

在文心一言、通義千問這類大廠產品已形成一定的用戶口碑的當下,Kimi憑藉其對長文本技術和使用場景的強調,在用戶心中營造出“精確+個性化”的觀感,爲許多用戶找到了試用Kimi的理由。

此外,在發佈Kimi的半年內,月之暗面進一步宣佈升級Kimi長文本容量爲200萬漢字,比今年2月谷歌Gemini1.5支持的100萬token還高。這一技術升級在用戶端完成了口碑積累與破圈。

根據AI產品榜(aicpb.com),2023年2月,Kimi在2月訪問量驟增一倍,增速在國內訪問量前十的AI產品中位居第一。

也正因這一脫胎於初創公司的軟件在用戶端獲得如此大的反響,各家大廠才按耐不住,參與進自家大模型長文本能力的展示中。

在許多投資人看來,技術已不是當前大模型下一步發展的難點,更困難的在於找到適應市場的產品模式。

多名AI行業分析師向鹽財經表示,大模型技術領域的突破依賴人才、資金和數據,技術升級背後的邏輯往往能歸因於規模定律。在資本投資意願仍然旺盛、商業模式尚不清晰的當下,初創企業和大廠各有優勢。

正如峯瑞資本投資合夥人陳石在Sora發佈後所言,“這輪AI行情有一個突出的特點,就是‘天底下沒有祕密’。”對擺出更大數據來“圍剿”Kimi的大廠而言,這不僅是秀實力,更是爭奪用戶市場的先聲。

02

搶灘入局,機會與恐懼

儘管Kimi激起了一陣水花,但在兩週內迅速降溫的概念股指數,展現了當下大模型領域尷尬的商業現狀:不想錯過,害怕做錯。

早在“Kimi概念”興起之前,大模型領域已經歷了數輪類似的技術比拼。如在更爲吸睛的多模態大模型領域,國內大廠在2023年年底,已在文生視頻、圖生視頻領域暗暗角力。

2023年11月18日,字節跳動推出了視頻生成模型PixelDance,緊隨其後,阿里上線Animate Anyone模型,並先後宣佈開源圖生視頻模型I2VGen-XL和文生視頻模型ModelScopeT2V。

今年1月,大廠在文生視頻、圖生視頻領域角逐更甚,字節跳動、騰訊、百度相繼推出視頻生成模型MagicVideo-V2、VideoCrafter2和UnivG,均支持文圖生成視頻。

站在未來的風口面前,各家均不想錯過搶佔先機的可能。但這也導致了在技術門檻不高、規模定律起主導作用的當下,企業堆疊大量資金與精力於其中,做出來的模型卻面臨“重複造輪子”的窘況。

更殘酷的是,當Sora這類支持生成60秒視頻,達成技術突破的大模型出現後,此前辛苦做出的“輪子”,也面臨被迭代風險。

對月之暗面這類技術信仰派的公司而言,大模型領域的種種廝殺故事,確實是在一次次驗證其創始人楊植麟的“第一性原理”,即未來屬於一個超級應用AGI(人工通用智能),而當前唯一要做的事是做到最強的技術能力,走向這一超級應用。

當前,外部整體投資意願收縮,這也導致大模型領域的投資人雖身處熱門賽道,也不得不在開始時便爲自己多想退路。

根據投中研究院數據,2024年2月,中國VC/PE市場投資總規模同比下降33.17%,環比下降40.31%。

儘管AI領域展開的投資畫卷仍有吸引力,讓人工智能成爲當期細分領域下獲投規模最高的細分賽道,但冷靜的資本市場,也讓投資人更願意分散下注,期待在大模型應用領域跑出黑馬。

資本對重複造輪的厭倦與猶豫,正如市場派的投資者,金沙江創投主管合夥人朱嘯虎所言:“整出200多個大模型有啥意義呢?沒啥意義。但在應用層有很多創新。中國在數據和應用場景上是遠遠超過美國的。”

對技術派而言,大模型的終極意義或許在實現AGI,但在更實際的市場派看來,更終極的問題在於,“大模型的商業模式到底怎樣纔有效”?

多位產業分析師向鹽財經表示,當前,大模型商業化尚處於萌發期,2024年可被看作大模型應用元年,資本與技術都已積累到一定程度,在迫切地尋找可行的商業模式。比起模糊不定的C端市場,當前發展垂域大模型,與行業相結合,是一個較爲可行的方向。

創道硬科技創始人步日欣表示,當前的基礎大模型由於數據來源龐雜,是一個難以實現專業化應用的泛化大模型。因此,將大模型與垂直領域數據結合,培育出專業小模型,是一條能走出差異化的路徑。這類模型在預處理後可以面向B端客戶,而其內部數據的稀缺性,便是產品的護城河。

“這類似於上一個互聯網時代,利用大模型技術,在各個細分領域與行業耦合。”

這同樣需要儘早入局。步日欣指出,誰在行業內有足夠的數據積累,誰便更能在這場應用變革中佔據優勢。

至於基礎大模型的贏家將在出現在哪邊,人們觀感並不一致。步日欣表示,AI領域需要的資金投入遠大於此前SaaS發展時期,資本雄厚的傳統互聯網大廠,更有發展大模型的優勢。

艾媒諮詢創始人張毅則認爲,在互聯網大廠抬高入局門檻的情況下,新銳企業有更強的融資能力、引才能力。這就像互聯網發展的早期階段,大廠尚未成型,新銳企業更願意試錯,而新的道路往往誕生於這無畏的嘗試中。

這場圍繞Kimi而起的長文本大戰,背後湧動的是兩種發展觀唸的交鋒。站在技術果實成熟的前夜,原本漸趨固化的競爭格局,重新展現出許多可能。

責任編輯:張恆星 SF142

相關文章