來源:市值風雲

商湯在生成式AI上確立正向曲線。

AI邁入2.0,意味着要打破1.0時代單領域、多模型的限制,用無需人工標註的海量數據訓練跨領域知識的基礎大模型,高泛化地適配和執行各種各樣的任務,真正實現“賦能”千行百業,這也是AI2.0的關鍵價值。

第一個爆款應用是生成式AI,也就是國內流行的AIGC(人工智能內容生成),初步實現了從“輔助”人類到“替代”人類的進階,而這僅僅只是AI2.0的開端。

在此當中,商湯成爲了快速摘到果實的企業。

2023年,商湯的生成式AI收入達11.84億元,實現了同比200%的飛速增長,是業界快速突破10億的公司之一。商湯稱:“這是商湯成立十年以來,以最快速度從無到有、超過10億收入體量的新業務。”

在此帶動下,2023年全年商湯實現收入34.06億元,其中生成式AI收入佔比達34.8%,相較2022年提升了24個百分點。

(來源:商湯2023財報)

商湯是如何做的呢?

前瞻性佈局“大裝置+大模型”,搶市場先機

早在2014年,商湯就以人臉識別技術起家了。但其目標絕不僅限於視覺AI,而是做全能型的AI選手。

01 率先自建SenseCore大裝置,算力居亞洲前列

在生成式AI世界的中心,以GPU爲代表的智能算力是根本基石,它支撐着龐大的系統和訓練、推理任務。

特別在當前全球追逐AI大模型的浪潮之下,算力需求集中爆發,近乎影響着整個人工智能時代的發展演進,這就好似工業時代的電力先行,甚至成爲大國博弈的核心競爭力。

而當下,算力供給卻相對有限,算力成爲一種稀缺性資源,近一年更被直接看做“錢袋子”。

但對於商湯科技而言,算力似乎與“稀缺”搭不上邊,這就不得不提及其前瞻性佈局的算力中心。

2018年起,商湯在自建算力中心的基礎上,着手打造了SenseCore AI大裝置;2020年斥資56億元在上海臨港建設了AIDC智算中心,並於2022年正式運營;2023年又在上海、深圳、廣州、福州、濟南、重慶等地拓展了新的計算節點。

(來源:商湯官方微信)

商湯的SenseCore AI大裝置以AIaaS的模式面向行業夥伴提供服務,具體包括計算基礎設施服務(Iaas)、深度學習平臺服務(Paas)、模型部署及推理服務(Maas)三大部分。

在Iaas層面提供高性能計算資源,截至2023年底共上線GPU4.5萬塊,相較2023年3月底增加1.8萬塊。在複雜的國際形勢和地緣政治危機下,總算力實現了翻倍增長,目前達到12,000 petaFLOPS。

在Paas層面提供深度學習平臺和大模型訓練服務,現已在最大程度實現了萬卡的超大集羣互聯,保持90%的加速效率,達到了30天穩定訓練不間斷的能力,並將出現訓練間斷時的診斷恢復時長也優化到了半小時。

同時,商湯現已開源了InternLM2-7B(70億參數)與20B(200億參數)兩種基模型,性能超越了Meta的Llama2和谷歌的Gemma等同級別的開源模型,被認爲是性能最好的輕量級基模型。

在Maas層面針對30多款芯片、100多個平臺進行了常規模型的適配和優化,並在2023年增加對華爲昇騰、寒武紀等主流國產芯片的適配,一年內將推理服務的性價比提升3倍,以此爲客戶提供業界性價比最優的大規模彈性推理服務。

實現這一點的關鍵,在於商湯聯合開發的DeepLink開放計算體系,其是目前國內並行計算平臺裏的佼佼者,有300多個標準化算子接口,基本上CUDA能夠支持的AI大模型計算需求,DeepLink也完全能夠支持,覆蓋率在99.5%以上。

有了DeepLink,各類國產芯片就可以輕鬆適配主流的大模型訓練框架和算法庫,比如PyTorch、DeepSpeed等常見的開源訓練框架,還有商湯推出的OpenMMLab、OpenDILab、OpenGVLab等開源算法庫,充分發揮國產芯片的性能。

目前,商湯的SenseCore大裝置可有效支持20個億參數量超大模型(以千卡並行)並行訓練,最高可支持萬億參數超大模型的訓練,並新增了對多模態模型和混合專家模型的支持。

2023年以來,已有上千個參數量數十億至上千億的大模型在SenseCore大裝置上完成訓練,實現了領跑行業的技術迭代速度,服務客戶不乏小米、閱文、微博等行業領軍企業,以及HiDream.AI、瀾舟科技、Tiamat等AI初創公司。

放眼國內乃至亞洲市場,商湯的智算中心在算力質量上基本穩居第一梯隊。

(來源:國資委官網、國際科技創新中心官網、各公司公告等)

截至目前,商湯的SenseCore大裝置仍處於持續升級中,商湯表示預計在2024年將會更大面積地拓展全國算力節點,輔以國產算力芯片的配置,持續輸出豐厚的新質生產力,爲後續規模化獲客以及生成式AI發展提供基礎。

02 “日日新”大模型高速迭代,性能居國內第一梯隊

正是基於SenseCore大裝置的強大算力,商湯建立了“日日新”大模型體系,不僅包括通用能力更加強大的基礎模型,還高效融合了不同垂直領域的專業知識,以實現模型在不同行業的落地應用。

商湯也藉此成爲國內首個發佈超過千億參數級大模型的廠商,國內首個具備訓練性能超越GPT3.5基模型的廠商。

以日日新•商量SenseChat爲例,是一款基於自然語言處理技術的人工智能大語言模型,商湯在2023年4月發佈後,一年內又迭代升級了3個版本。

日日新•商量3.0版,在全球51個知名評測集共計30萬道問題集合上測試成績排名第二,超越GPT-3.5-turbo以及Meta的LLaMA-2-70B等模型,在中文通用大模型綜合性評測基準SuperCLUE總排行榜中,位列中文大模型榜單第一。

(來源:SuperCLUE官網)

2024年2月,商湯又快速迭代出日日新4.0版本,在代碼編寫、數據分析和醫療問答等多場景中達到了與GPT-4相匹配的能力。目前正致力於研發能夠全面對標GPT4V的5.0版本,預計於今年4月發佈。

還有日日新•秒畫SenseMirage,是一款融合了超10億參數的自研文生圖生成模型,在歷經約2,000張GPU的投入訓練後,已於2023年7月迭代到4.0版本。

這一版本的基模型參數量提升至百億,採用全新的生成模型架構,實現專業攝影級的圖片細節刻畫,疊加十倍級推理加速的優化,成爲國內最好用的文生圖產品。

基於此,商湯還要進一步創建文生視頻大模型,達到電影級流暢畫質。

此外,商湯還推出了“模型即服務”商業模式,使客戶能夠輕鬆地在大裝置微調和調用各類生成式AI能力,無需自己建設和管理底層基礎設施。

“日日新”模型的代碼生成及工具調用能力也在賦能數字化辦公的領域中取得了不錯的成績,特別是在賦能金山辦公WPS的Copilot應用中展現了顯著的技術優勢。

該模型在SuperClue代碼評測中榮獲榜首,其HumanEval測試集的一次通過率高達76%,超越了GPT-4的74%的成績。

總的來說,根據弗若斯特沙利文發佈的《AI大模型市場研究報告(2023)》,商湯的AI大模型在產品技術、戰略願景、生態開放構建等綜合競爭力,在2023年位列國內第一。

更爲重要的是,大模型的研發並非一次性成果,而是需要連續不斷的迭代升級,目前商湯的“日日新”大模型基本每季度迭代一次,國內能做到這一頻率的大模型廠商實際上並不多。

時至今日,商湯“大裝置+大模型”的前瞻性戰略價值和管理層長遠眼光已然得到證明,築牢了領先於其他同業的科研實力與技術底蘊。

以傳統式AI爲基,聚焦生成式AI

“大裝置+大模型”只是第一步,商湯進一步的目標是完成大模型業務閉環,讓生成式AI真正商業化,實現價值的有效循環。

01 過往商業化經驗爲生成式AI賦能

談及商業化,除了具備強大的算力和模型外,豐富的實戰經驗同樣不可或缺。

一方面,商湯深耕AI多年,在AI1.0時代就賦能了不少垂直行業,並在智慧城市、智慧商業、智能汽車和智慧生活四大板塊的20多個場景中實現落地。

(來源:商湯微信公衆號)

而這每一次場景賦能,背後都有豐富的高質量數據做支撐,數據背後更是蘊含着多年的行業實踐以及完整的客戶服務體系。

正是憑藉着商湯過去十年在實踐經驗上的積累、在多模態數據上的儲備、以及在感知智能、決策智能上的積澱,有效強化其基礎模型對物理世界的理解和多模態能力,才使得商湯能夠推出最滿足客戶需求、具有性價比的生成式AI解決方案。

02 傳統AI客戶帶來虹吸效應

另一方面,在於傳統AI業務客戶帶來的虹吸效應。

商湯在AI 1.0時代就積累了來自各行各業的優質客戶,過往的這些優勢客戶,會由此背書產生虹吸效應,迅速轉換爲生成式AI客戶,並吸引更多優質客戶選擇商湯大模型服務。

根據2023財報,在生成時AI業務中超過70%的客戶在過去12個月內是商湯的新客戶,而餘下30%的存量客戶的客單價也取得了約50%的增速。

商湯生成式AI的典型客戶就包括三大運營商,招商銀行海通證券等金融機構,京東、小米、閱文等頭部互聯網公司,清華大學、上海交通大學等學術機構等。

拿智能終端的客戶來說,自2015年起商湯便與全球幾乎所有頭部安卓手機廠商展開合作,由商湯的傳感器、AISDK軟件、AIISP芯片賦能的手機數量已經超過20億臺,這無疑都是商湯端側生成式AI的潛在客戶。

商湯基於AI 1.0時代在智能終端領域多年的積累,搭建了行業領先的、不同規格的小模型。

2023年,高通、MTK在其發佈會上展示了商湯子公司慧鯉生成式AI端側模型在其旗艦芯片上的應用成果;商湯7B級小型模型在高通最新款芯片上,實現了業界領先的16tokens/秒的推理速度。

這些智能終端模型對於AI手機來說至關重要,它們能夠聽取用戶的指令,並調用手機上的各類應用程序完成複雜任務。目前,商湯已與小米、榮耀等手機品牌合作,共同研發這些創新的功能特性。

憑藉着業界性能最好和推理速度領先的端側小模型,有望打通這超過20億臺的已賦能客戶羣,或將在2024年實現端側生成式AI業務的爆發。

智能汽車領域亦然,商湯推出的絕影平臺是國內第一批率先激活L2++級別自動駕駛量產的服務商,截至2023年末,已累計交付195萬輛智能汽車,覆蓋90多款車型。

單是2023年,絕影便又新增了1,600餘萬臺的定點訂單,並擴充了41款車型,實現收入3.84億,同比增長31.1%。

這些已經賦能的汽車客戶,也有望搭載上商湯端側小模型,爲生成式AI打開新的應用場景。

總結:打通AI商業閉環,會幫助商湯實現業績放量

商湯2023財報顯示,其正迎來越來越多的規模更大、戰略意義更深的客戶合作。截至目前,其訂單金額超過千萬人民幣的客戶達到數十家,商湯日日新大模型賦能C端的調用量呈現近120倍的增長。

商湯科技前瞻佈局的“大裝置+大模型”,輔以豐富的商業化經驗和客戶資源,是商湯率先打通“大模型業務閉環”、在生成式AI業務上取得領先的關鍵所在。

接下來,商湯將把生成式AI作爲核心業務持續深耕,進一步發揮“大裝置+大模型”的深度協同優勢,持續擴充算力規模,提升基礎設施和大模型的綜合服務能力,並帶來高計算密度、高能效芯片的協同發展,爲行業夥伴提供優質的算力和模型服務,推動業績持續放量。

相關文章