“今年下半年,中國泛AIGC賽道將會出現具有里程碑意義的投資交易”。

6月伊始,國產大模型明星團隊MiniMax傳出了新的融資消息,規模將超過2.5億美元,推動MiniMax的整體估值規模超過12億美元,成爲標準意義上的“獨角獸”。

與此同時,本輪融資也吸引了新的投資方參與,其中包括與騰訊有關聯的投資實體。一旦消息坐實,MiniMax將成爲騰訊在國產大模型熱之後的第一次相關佈局。

MiniMax的創始團隊稱得上是“中科院系”。它由前商湯科技副總裁、通用智能技術負責人閆俊傑成立,他博士畢業於中科院自動化所,而技術合夥人楊斌,則是閆俊傑的中科院校友。

對這筆交易,人們感嘆“這體現了中國投資者對大模型賽道的興趣仍然在上升階段”,並通過對相關投資者和行業顧問的交談做出預測,“今年下半年,中國泛AIGC賽道將會出現具有里程碑意義的投資交易”。

這個論述邏輯不難理解。MiniMax成立於2021年12月,用不到一年的時間就完成了兩輪融資,囊括了讓國內人工智能賽道多家有頭有臉的代表性玩家,包括天使輪的雲啓資本、Pre-A輪的明勢資本、高瓴創投、IDG資本、米哈遊,這種堪稱“衆望所歸”的成長速度顯然很難直接用“明星團隊”來簡單概括。

順帶提一嘴,按我聽到的消息,Minimax這一輪融資份額,各家頭部VC爭得可是相當激烈,但率先傳出入局的卻是騰訊,接下來可以再看,等融資正式發佈,有沒有VC最終投得進去。

更重要的是,進入2023年之後MiniMax並不是貨架上的唯一選擇——王慧文在即刻上官宣帶資創業,5000萬美元成立了“光年之外”,還爭取到了王興“仗義合夥”;李開復牽頭了Project AI 2.0,喊話“AI 2.0就是來掀桌子的”;王小川同樣帶着5000萬美元成立了“百川智能”,和百度打起了“是不是一線從業者”的嘴仗——可以說MiniMax在其初創階段所呈現的成長節奏,清晰地折射出資本市場對於大模型賽道的堅決與耐心。

就在MiniMax新一輪融資即將完成的消息傳出來四天後,也就是6月5日,光年之外將成爲“騰訊大模型第一投”的消息迅速佔領了熱搜。據量子位的消息,光年之外以10億美元的估值,已在近期完成了新一輪2.3億美元(摺合人民幣16.3億)融資,由源碼資本領投,騰訊、五源資本和快手創始人宿華參與其中。

雖然這條消息在當天就被“闢謠”,但也有一種說法是:因爲參投的美元基金礙於某些因素而不能公開確認此消息,而宿華也確實參與了這一筆的融資,並且投資額“相當可觀”。

其實無論如何,從市場表現出來的熱情來看,國產大模型賽道確實到了“需要獨角獸出現”的時候。

獨角獸?吞金獸?

首先需要明確的一點是,儘管到2023年纔出現了獨角獸級別的估值,但國產大模型賽道的成型其實遠遠早於ChatGPT的發佈。第一個正式對外發布的國產AI大模型,可以追溯到2021年3月由智源研究院發佈的“悟道1.0”,其中就已經包括面向中文的預訓練語言模型悟道·文源、中文通用圖文多模態預訓練模型悟道·文瀾、具有認知能力的超大規模預訓練模型悟道·文匯、超大規模蛋白質序列預測預訓練模型悟道·文溯。

而智源研究院的成立更是可以追溯到2018年11月在北京舉辦的中國(北京)跨國技術轉移大會。當時北京市科學技術委員會主任許強作爲代表正式發佈北京智源行動計劃,旗幟鮮明地指出智源研究院的使命就是“推動共享數據、智能計算編程框架和算力基礎設施建設”“圍繞人工智能領域重大核心基礎理論問題,佈局研究團隊和項目”。

光年之外4月併購的AI架構公司“一流科技OneFlow”也是這個狀況。創始人袁進輝2008年從清華大學計算機專業畢業,拿到博士學位,一年之後就草創了世界上最快、被微軟研究院全球副總裁周以真稱讚“年度最好成果”的主題模型訓練算法系統LightLDA。2017年因爲預判到深度學習框架市場在“大模型分佈式”方向上有着空缺決定創業,對標的產品是谷歌TensorFlow和臉書PyTorch。

王慧文也因爲這筆併購交易在即刻、知乎上大受好評,一個頗具代表性的觀點是“袁總(指袁進輝)及OneFlow一直深耕於深度學習框架和算法部署,在大模型算法的並行訓練和部署方面有很多積累,執着的技術專家”,併購OneFlow證明光年團隊對LLM(大語言模型)生態的理解上,擁有比其他團隊“更好的判斷力”“更早的視野”——當然這都是後話。

總之早在2019年,美國白宮就在《國家人工智能研發戰略規劃》中敏銳指出中國將是美國人工智能的主要對手,並通過深度觀察點出中國人工智能產業的短板:“缺點亦十分明顯,硬件、算法、人才……人工智能框架創新能力薄弱。”

而正是這種首尾分離的行業狀態,決定了中國投資者們一方面獲得了相對於歐洲、日韓市場更好的配置機會,另一方面又不得不接受流向國產大模型賽道的熱錢,將不可避免地長期作爲沉沒成本,用於“補齊”必要的水下部分。以至於當時一些路子比較野的自媒體,直接玩梗式地調侃“搞深度學習框架的那幫人,不是瘋子,就是騙子”。

但即便是在公認的發達市場美國,大模型也很難說浮上了水面。

2020年3月,《福布斯》雜誌指出當時人工智能行業面臨的最大挑戰“不是技術問題,而是如何從技術中獲得價值”,論據來自麻省理工斯隆管理學院的調研。調研報告顯示“在接受調查的10家公司中,有7家公司表示截止提交報道,人工智能業務在財務上帶來的積極影響很小或沒有……在那些90%的業務佈局圍繞着人工智能展開的公司裏,只有不到2/5的公司表示在過去三年中從人工智能中獲得了業務收益……如果將調研樣本擴大到對人工智能有過‘大筆投資’的企業,這個數字也僅僅只被提到到3/5。這也意味着在所有對 AI 方面進行重大投資的公司裏,有40%暫時沒有因爲人工智能獲得過收益。”

買到即血虧,美國商業精英們很現實地選擇用腳投票。美國策略顧問NewVantage Partners在2019年的調查中發現,雖然有91.5%的公司表示已經嘗試了對人工智能的佈局,但認爲在人工智能領域佈局應該加快節奏的受訪投資者,從2018年92%下降到了52%。

作者因此悲觀地認爲這種美國企業缺乏數據驅動文化(data-driven culture),企業的決策者們缺乏瞭解人工智能的興趣和動力。再加上人工智能技術本質上是一次“範式革命”,與人工智能的結合將導致全流程“端對端”的改造,——例如新產品和服務開發、客戶服務、訂單管理、“採購到付款”等——從而實際增加企業運營成本,作者進一步認爲短時間內“即便人工智能開發出應用場景,也很難完成推廣”。

2022年後,ChatGPT的出現很大程度上改變了這個現狀。在過去一年,人工智能幫助13家初創團隊成長爲獨角獸,在經濟指標上打了一場漂亮的翻身仗,之前用腳投票的商業精英們紛紛迴流。但這時人們又發現,當所謂的市場經濟充分發揮了調配職能,人工智能乾脆直接向資源導向型行業狂奔。

例如據調研機構TrendForce指出,OpenAI訓練GPT-3時,大概用到2萬個英偉達A100 GPU的算力;迭代到ChatGPT時GPU數量進一步上漲到了3萬個以上,另外還需要搭載芯片的數千臺服務器和數百個標準機櫃。按照A100芯片售價1萬-1.5萬美元的大致區間計算,這意味着Open AI僅在GPU芯片上所消耗的硬成本至少3億美元。

同樣爲了支撐大模型的不斷迭代與優質體驗,OpenAI也對雲服務的需求也水漲船高。2017年,OpenAI在雲服務上的總花費爲790萬美元,佔公司總支出的1/4,到了2020年這筆費用上漲到了7500萬美元。OpenAI也正是在2019年底決定接受微軟10億美元的投資,逐漸將更多服務轉移到Azure平臺上,使得雲服務需求增長帶來的壓力得到緩解。

OpenAI甚至需要借用“鈔能力”來解決人力資源。

據公開信息,截止2023年3月,OpenAI目前擁有超過200名員工,其中大部分來自谷歌和人工智能研究實驗室DeepMind的母公司Alphabet,也有相當部分員工來自Meta、亞馬遜、Uber。知名獵頭公司Punks & Pinstripes的CEO Greg Larkin因此向傳統巨頭們發出警告“大公司們需要優化在人才方面的投資”。

而資源導向型行業的本質,決定了在行業平均利潤短時間內無法快速提到的情況下,生產成本的增加必然會帶來虧損的增加。根據5月公佈的數據,2022年OpenAI的虧損相較去年翻了一番,達到5.4億美金,主要出口正是ChatGPT的運維成本以及員工跳槽所產生的人力成本。OpenAI的CEO Sam Altman直接攤牌,表示如果要執行預期中的開發計劃,OpneAI除了要提高自身的盈利能力,還需要未來幾年完成多達1000億美元的融資。

應景的是,幾乎就在同期(也就是截止2023年1月),日本的日經新聞通過調研發現中國學界發表的與人工智能相關的研究論文數量是美國的兩倍左右,同時在論文引用率方面美國學界落後中國約70%。

誰也沒辦法用三言兩語來解釋這個“資源集羣”是怎樣悄然形成的,但可以肯定的是,在這個時間節點上,中國市場幾乎是配置大模型的最後機會。

投資人?CEO?

還有一個值得注意的點。據天眼查顯示,5月31日,北京深言科技有限責任公司發生工商變更,股東新增騰訊旗下廣西騰訊創業投資有限公司、好未來旗下公司欣欣相融教育科技 (北京)有限公司等。深言科技核心團隊來自清華大學,主要方向爲通過 NLP 技術聚焦在大模型的一體化文本信息處理平臺研發。這意味着騰訊實際上已經完成了“大模型第一投”。如果再算上MiniMax和光年之外這兩筆潛在的交易,騰訊堪稱完成了一場“奇襲”。

要知道此前騰訊在自研大模型方面的佈局,在時間線上呈現出來是這樣的:

2022年4月,騰訊就發佈了混元AI大模型,其中包含NLP、CV和多模態等基礎模型和衆多行業/領域模型,並且在發佈之前初步應用到廣告創作、廣告檢索、廣告推薦等騰訊業務場景中,實現了一定的應用效果提升;

2022年底,混元AI大模型團隊推出國內首個低成本、可落地的萬億中文NLP預訓練模型HunYuan-NLP-1T,速度提升至用256卡在一天內即可完成;

2023年2月,官宣成立對類ChatGPT產品“混元助手(HunyuanAide)”項目組,目標是聯合內部團隊構建大參數語言模型,通過性能穩定的強化學習算法訓練……

這種節奏上的劇烈變化很容易讓人聯想到馬化騰5月18日在騰訊股東大會上的講話。會上馬化騰在回應有關ChatGPT和AI相關的提問時,進行了一次無限類似於“自省”式的發言。他說:“我們最開始以爲(人工智能)是互聯網十年不遇的機會,但是越想越覺得,這是幾百年不遇的、類似發明電的工業革命一樣的機遇……關鍵還是要把底層的算法、算力和數據紮紮實實做好,而且更關鍵的是場景落地,目前(我們)還在做一些思考。我感覺現在有很多公司太急了,感覺是爲了提振股價,我們一貫不是這種風格。”

結合當時的語境,很多人認爲這次“自省”與騰訊最新的財報表現高度相關。雖然2023年Q1季度的財報顯示,騰訊呈現出全面復甦態勢,總營收、遊戲營收、廣告營收、金融科技及企業服務業務收入等關鍵數據都實現了超過10%的增長,但這些增長基本都由傳統業務完成。

沒有人比馬化騰更懂這種局面背後的隱憂。2011年騰訊在贏得3Q大戰的“勝勢”下,被百度搶走了保持了五年的中國互聯網企業市值頭把交椅。那段時間又恰逢所謂“web2.0時代社交平臺”崛起,新浪微博快速成長,人人網帶着中國版Facebook的概念去紐約上市,根據潘亂寫的那篇《騰訊沒有夢想》,“看衰騰訊”幾乎是一夜之間成爲了輿論場中的政治正確,就連高盛也直言不諱地批評騰訊“管理層習慣性地持保守態度,導致騰訊的核心平臺面臨新浪和人人等威脅”,直接逼出了騰訊創業史上一個名場面的誕生:

2011年初,“陷入嚴重自我懷疑”的馬化騰在一次總辦會上邀請16名高管一起在紙上寫下他們心中最真實的“騰訊核心競爭力”,最後在全部21個答案裏篩選出兩個,分別是“流量”和“資本”——劉熾平的釋義是“通過資本形成結盟關係,既可以實現開放的目的,同時也可以讓騰訊龐大的流量資源獲得一次資本意義上的釋放”。

據說騰訊因此一度出現了所謂投資部的“當權派”和做業務的“少壯派”之間的對立,但在這之後馬化騰確實“Make Tencent Great Again”。

此去十二年,或許又是一個輪迴。

其實,這屆大模型明星創業者們說不定也是這麼想的。

MiniMax雖然早在Pre-A輪融資時就被廣泛認爲擁有與OpenAI相似的商業模型,業務圍繞着to B與to C兩條線展開。但實際上to B業務起步緩慢,直到今年3月才逐漸開始AI服務接口,不到一個季度的運營時間很難幫助MiniMax API形成足夠的競爭壁壘。上個月,金山辦公CEO章慶元在直播裏聊到大模型應用時就非常坦誠地表示“之前與MiniMax合作,接下來也會與百度深度合作”。

To C業務相對成熟,目前主打的對話式AI軟件Glow目前已經積累了數百萬用戶,初步具備了通過“內容生成與用戶反饋內循環”的“user-in-the-loop”的方式來不斷迭代基礎大模型的能力,在形態上已經儘可能地向ChatGPT的人類反饋強化學習機制(RLHF)看齊。但由於Glow與ChatGPT、文心一言不同,產品定位向“AI情感機器人”傾斜,MiniMax在運營層面承擔着超額的監管壓力。今年3月的短暫下架,就被認爲是其內部屢禁不止的“磕炮”等灰色應用場景,觸及了年初出臺的《互聯網信息服務深度合成管理規定》中關於“深度合成服務提供者有義務建立健全用戶管理制度、制定和公開管理規則、加強內容管理”的要求。

2月份王慧文剛剛宣佈下場創業、準備尋找聯創搭建核心團隊的時候,同樣作爲併購傳聞當事方的西湖心辰的創始人藍振忠曾經在朋友圈裏進行了一次“兩段式的闢謠”:前半段是一次禮貌地婉拒,藍振忠表達了“心辰打造成中國的OpenAl”的決心以及“心辰的打法更適合中國國情”的自信;後半段是一則招聘啓事,藍振忠希望招聘一名CEO,找到屬於西湖心辰“Sam Altman”。

當時很多人對此的解讀是,西湖心辰在等待比王慧文更合適的領路人。而莊明浩、陳巍等則相信藍振忠是在談一個共性問題:人工智能賽道的競爭,早就不是一個純粹的技術問題了。

本文來自微信公衆號“投中網”(ID:China-Venture),作者:蒲凡,36氪經授權發佈。

相關文章