刷到知名投資人朱嘯虎給大模型創業潑的一盆冷水後,正在着手推進ChatGPT與原有機器人創業項目結合的傅盛,開始坐不住了。

近日,傅盛在朋友圈轉發朱嘯虎對外演講的一篇文章(《朱嘯虎:ChatGPT對創業公司很不友好,未來兩三年內請大家放棄融資幻想》),並評論道:“硅谷一半的創業企業都圍繞ChatGPT開始了,我們的投資人還能這麼無知者無畏。”

圍繞“大模型創業價值到底有多大”“大模型創業機會到底有多少”等問題,雙方展開了一場隔空爭辯。

杜克大學電子與計算機工程系教授、計算進化智能中心主任陳怡然總結了兩人的不同立場:

朱嘯虎覺得大模型摧毀了創業,因爲模型、算力和數據,三大支柱都向大廠集中,看不到創業公司的機會,且直接在大模型上做應用護城河太低。傅盛反而認爲大模型催生了很多新的架構在大模型之上的創業機會,包括直接在大模型上搭建的不同應用和由於數據私有帶來的垂直領域的大模型等等。

爲了消解外界對金沙江創投在大模型投資領域的誤解,在與傅盛朋友圈爭辯後的當晚,朱嘯虎又特意發了條朋友圈解釋,稱金沙江創投應該是國內投資垂直AIGC創業項目最多的早期投資人,自己並非否定大模型領域創業機會,而是希望提醒創業者不要迷信通用大模型。

朱嘯虎的上述觀點基本已成爲當下國內投資圈的共識。恆業資本創始合夥人江一告訴字母榜,國內最終能夠存活下來的通用大模型玩家,“可能有個3家就已經不錯了。因爲訓練大模型需要大量投入,要燒很多錢,而且還不一定能追得上ChatGPT或者GPT-4。”

將通用大模型從創業方向中篩掉之後,朱嘯虎和傅盛其實在另一個維度上也達成了共識,即行業大模型以及基於大模型的應用開發,纔是大部分創業者真正能夠抓住的機會。

垂直領域的大模型需求強勁到什麼程度?杜克大學教授陳怡然表示,“幾乎每週都會有人問我相關的技術可能性,國內國外都有,涵蓋了各種行業。當務之急是趕緊deliver所期望的性能,否則就會和上一波AI發展一樣,投資者和用戶會逐漸地失去耐心。”

在今年6月份的奇績創壇春季創業路演上,奇績創壇創始人陸奇分享過一組數據:創業營最終錄取的60個項目中,大模型項目39個,佔比高達65%,幾乎都圍繞垂直大模型應用開發展開。

接下來,考驗這些垂直大模型領域創業者的,將是誰能率先找到落地場景,並持續不斷獲取高質量行業數據。

在OpenAI爆火之後,擺脫對國外大模型提供商的依賴,打造中國版OpenAI就成了中國IT產業勢在必行的一件大事。

但通用大模型的訓練並非一朝一夕之功,每前進一步都需要耗費巨大的資源,包括更強的算力、更豐富的數據,和更先進的算法。

調研機構TrendForce在一份報告中指出,OpenAI訓練ChatGPT的前身GPT-3時,大概用到2萬個英偉達A100 GPU的算力,以每塊A100芯片售價約1萬美元計算,這就相當於2億美元的投入。有業內人士估計,ChatGPT所需的GPU數量,達到了3萬個以上。

大規模投入的另一面,OpenAI不僅連年虧損,甚至虧損額還在逐年增加。據媒體爆料,OpenAI去年虧損額翻倍,達到5.4億美元左右。爲了開發足夠先進的通用AI,同時維持公司的正常運轉,OpenAI CEO 山姆·阿爾特曼(Sam Altman)更是表示,OpenAI可能需要在未來幾年嘗試籌集多達1000億美元的資金。

高昂的前期投入成本讓不少公司在大模型研發上望而卻步。金山辦公CEO章慶元在解釋自己不做大模型時就提到,緊缺的英偉達GPU芯片,昂貴的算力成本,以及自研大模型商業化上的不確定性,都決定了這不是任何公司都願意承擔的風險。

創業公司不適合研發通用大模型的認知,不僅僅侷限在朱嘯虎和他的金沙江創投,越來越多投資機構在這一點上達成了共識。

線性資本創始合夥人兼CEO王淮坦陳,創業公司的機會相對很小,“歷史上創業公司能夠成功,很大的緣故是你‘爲別人所不敢爲’,或者做別人認爲不會起來、不太看得重的東西,這一類的創業模式我們稱之爲‘桃花源式的創業’。而大模型需要一些必須成功的要素,要有算力,要有錢等。”

遠望資本程浩則更爲直接,認爲中國版的ChatGPT只會在5家公司裏產生:BAT+字節+華爲。在程浩看來,創業者只有在具有先發優勢的情況下,纔有可能跑贏大廠。

正是因爲當初谷歌等國外大廠並不看好OpenAI的大語言模型路線,才讓ChatGPT藉助先發勢能跑了出來。但是,當下研發大模型已經成爲中國科技大廠的共識,甚至百度阿里推出產品的動作,比創業公司還快。

傅盛此前也發表過類似的看法,認爲國內未來的大模型競爭會朝着兩個方面走:一個是大公司主攻通用大模型;另一個則是創業者在大模型基礎上開發各式各樣的行業大大模型應用,做平民化的大模型。

在通用大模型上比拼不過大廠的創業者,只能被迫選擇做行業大模型或者垂類應用,以此來避開前期大模型訓練的無底洞式投入。

頭部雲廠商大模型研發工程師吳偉向字母榜解釋道,不同的參數量對於數據和算力的要求,完全不一樣,數據量越少,需要的算力也越低,就能帶動整體訓練成本的下降。

而且,大部分的企業場景,也並不需要ChatGPT那樣參數量過千億的通用大模型來滿足需要。“像邏輯推理、數學推理等,確實要用到百億甚至千億參數量,才能實現比較理想的能力提升,但是一些開放問答等,維持在數十億參數量的大模型,就可以滿足客戶用大模型提升現有業務能力的需求。”吳偉表示。

如何在合理成本下,能夠選擇到性價比最高的模型,這纔是B端客戶做出最終決策的核心依據。

對於依賴外部大模型打造垂類應用的創業者來說,其調用大模型的成本將變得越來越低,已成爲可預見的趨勢。

阿里雲表示,希望未來企業在阿里雲上訓練一個模型的成本,“能夠降低到現在的十分之一,甚至是百分之一。即使是中小企業,也能通過雲平臺獲得AI大模型的能力和服務。”

百度大模型服務在推出三個月後,已經實現了超過十倍的成本下降,“價格應該不會成爲大家所使用或者是擁抱大模型的瓶頸。”百度雲表示。

除了成本考量之外,通用大模型也並非滿足所有行業場景需求的最優解。遠望資本程浩指出,這方面更核心的問題是各行各業都有自己的Know-How。這些最有價值的Know-How很可能不在互聯網上,而是在企業的私有數據庫裏,甚至在一部分專家的腦子裏。

科技大廠即便通過燒錢提升通用大模型能力,也難以跨越上述這道數據門檻,這也恰恰是擁有行業資源積累的創業者,有針對性開發行業大模型和垂類應用的機會所在。

還有一點值得注意的是,正如同樣在做大模型的360創始人周鴻禕所言,通用大模型在落地政府、城市、行業和企業場景時並不能直接使用,存在着缺乏行業深度、易帶來數據安全隱患、無法保障內容真正可信及無法實現成本可控等痛點。這都給行業大模型創業留出了生長空間。

正是基於此,在百度、阿里搶發通用大模型產品之後,騰訊反而率先選擇了行業大模型的落地方案,在爭奪B端客戶上與百度、阿里展開了同頻競爭。

但留給行業大模型和垂類應用創業者的挑戰同樣不少。除了需要應對來自BAT的競爭之外,更重要的考驗在於,如何提前大廠一步,找到適合自己產品的落地場景,並挖掘到行業數據。

如同朱嘯虎在與傅盛爭辯中所說,投資機構同樣在找擁有上述特徵的創業項目,但符合要求的很少。

相比創業公司重構新的場景,大模型反而更加利好每個行業中的現有玩家。在朱嘯虎看來,已經擁有使用場景的玩家,通過ChatGPT很容易就能爲自己的產品加上人工智能的功能,如眼下的智能客服。

如何獲取差異化競爭優勢,一家即將發佈大模型產品的公司給出了自己的解決方案。該公司負責人李振告訴字母榜,自己即將推出的行業大模型方案,已經全部被客戶買過單了,“沒被買過單的我們還沒發。”

除此之外,在與大廠的同位競爭中,李振祭出的另一殺手鐧是簽署獨家合作,目前其服務的快消飲料前十廠商中,基本都已經達成了獨家大模型開發方案。

留給行業大模型創業者的另一重挑戰,則在於數據。在李振看來,算法和算力都可以短時間追趕或者複製,但對數據的處理,反而可能是對整個行業大模型影響最大的一個因素。“在以數據爲中心(data-centric)的AI新時代,模型能不能出彩實際上主要是靠數據。”李振表示,數據裏面潛藏的諸多魔鬼細節,甚至決定着大模型產品的成敗。

谷歌就是前車之鑑。不管從算力還是算法,谷歌並不比OpenAI差,甚至還要強,但恰恰是藉助基於人類反饋的強化數據訓練工作,OpenAI最終趕在谷歌前面做出了ChatGPT。

根據OpenAI公開的資料,旗下數據團隊被建設成爲不同水平的層級,數據量大、標註要求簡單明確的淺層數據,交給肯尼亞等廉價外包勞工,高等級的數據則交給更高素質標記人員,不少都是訓練有素的高校博士。“OpenAI在數據採集方面的有效探索,目前沒有任何一個團隊可以匹敵。”李振說道。

在解決了場景落地和數據採集問題之後,生產出來的行業大模型,還面臨另一個急迫的問題——知識產權歸誰。

吳偉表示,與某一企業合作研發的大模型,能不能複用給其他行業內的企業,要看客戶的意願,只能逐個談判解決。

但走到與企業客戶利益綁定後的行業大模型,在獲取確定性商業回報之外,也同時失去了大規模擴張的可能性,很容易成爲朱嘯虎口中“零零散散的小機會”。

失去通用大模型創業機會後,留給創業者做出下一個BAT的機會也無限渺茫,傅盛在這方面顯然已經有了足夠清醒的認識,“我已經放棄BAT的創業夢了,那的確沒機會。”

相關文章