每經編輯 畢陸名

積弱已久的商湯(HK00020)今日硬氣了一把,股價開盤即大漲,一路拉昇,一度漲超36%。截至發稿,該股漲約31%,成交12.61億港元。最新市值267億港元。

市場目前將商湯今日股價大漲,歸因於此前一日發佈日日新5.0大模型,官網稱其能力可以達到或者超過GPT-4 Turbo。

4月23日,商湯科技在上海舉行的SenseTime技術交流日活動現場發佈行業首個“雲、端、邊”全棧大模型產品矩陣,以滿足不同規模場景的應用需求,同時升級“日日新SenseNova 5.0”大模型體系,且稱綜合能力全面對標GPT-4 Turbo。

4月24日上午11點15分左右,商湯集團在香港暫停交易。

據第一財經,今日商湯方面對記者回應:昨日日日新大模型5.0發佈會廣受好評,受到市場極大關注;依照上市規則及港交所建議,公司將進一步刊發相關公告,敬請關注。

昨天商湯在上海發佈“日日新SenseNova”5.0多模態大模型系列,採用混合專家(MoE)架構,支持多達10TB tokens中英文與訓練數據,推理合成數據高達數千億Token,推理時上下文窗口可以有效到200K左右,擁有端側擴散和語言模型,知識、推理、數學、代碼等綜合能力全面對標GPT-4 Turbo。

在文科能力方面,“日日新5.0”的創意寫作能力、推理能力以及總結能力均大幅提升,相同的中文知識注入後,可以獲得更好的理解總結及問答,爲教育、內容產業等垂直應用場景提供有力輔助。

據證券時報,商湯科技董事長兼CEO徐立在現場演示中,問了“日日新5.0”和GPT-4同一個趣味推理問題:“媽媽給圓圓衝了一杯咖啡,圓圓喝了半杯後,將它加滿水,然後她又喝了半杯後,再加滿水,最後全部喝完。問圓圓喝的咖啡多,還是水多?”結果顯示,“日日新5.0”回答正確。

在理科能力方面,“日日新5.0”數理能力、代碼能力及推理能力也達到業內領先水平,爲金融、數據分析等場景落地提供堅實基礎.

在應用產品層面,“日日新SenseNova5.0”也實現了多模態能力,支持高清長圖的解析和理解以及文生圖交互式生成,還可以實現複雜的跨文檔知識抽取及總結問答展示,還具備豐富的多模態交互能力。

“一個生日蛋糕,上面寫上‘happy birthday’的字樣,有草莓點綴,紫色奶油”,在交流日體驗現場,證券時報記者看到,工作人員在商湯日日新·秒畫文生圖大模型中輸入這句話,片刻即可生成四幅逼真的生日蛋糕照片。徐立表示:“商湯在尺度定律的指導下,會持續探索大模型能力的KRE三層架構(知識-推理-執行),不斷突破大模型能力邊界。”

商湯科技表示,這是行業內首個“雲、端、邊”全棧大模型產品矩陣,以滿足不同規模場景的應用需求。公司技術領跑加速生成式AI向產業落地的全面躍遷,實現大模型按需所取。

商湯科技董事長兼CEO徐立認爲,商湯在尺度定律的指導下,會持續探索大模型能力的KRE三層架構(知識-推理-執行),不斷突破大模型能力邊界,“2024年是端側大模型爆發的一年”。

3月26日,商湯集團股份有限公司(以下簡稱“商湯集團”或“商湯”)公佈截至2023年12月31日的經審覈全年業績。財報顯示,2023年生成式AI業務增長超預期,收入達12億元,同比增長200%。

“2023年,商湯生成式AI業務實現了同比200%的飛速增長,佔總收入比例超過35%。生成式AI對商湯來說已不僅僅是技術領域的變革性創新,更成爲公司的核心業務。”商湯集團董事會執行主席兼首席執行官徐立表示,商湯生成式AI業務的增長,得益於各行各業對大模型的訓練和推理的廣泛需求,這預示着中國硬科技投資的新週期正式開啓。商湯通過在各業務層面深入融合生成式AI能力,正在贏得新客戶,並推動效率和生產力的全面提升。

財報顯示,2023年,商湯集團整體收入表現穩健,營業收入34億元,同比下降11%,主要原因是集團主動收縮了智慧城市業務,智慧城市在2022年收入佔比約30%,2023年已經降低到10%以內;毛利潤爲15億元,毛利率44%。回款金額39億元,同比增長49%。

對此,國投證券研報稱,商湯推出日日新大模型5.0版本,採用混合專家架構,推理時上下文窗口達到200K左右,在數學、推理及代碼能力上全面對標GPT-4 Turbo。此外,公司發佈面向終端設備的“商湯端側大模型”,以及面向金融、代碼、醫療、政務等多個領域的邊緣產品“商湯企業級大模型一體機”。至此,公司已經完成了大模型在“雲端邊”全棧佈局,形成了全面的產品體系。

每日經濟新聞綜合第一財經、證券時報、公開信息

免責聲明:本文內容與數據僅供參考,不構成投資建議,使用前請覈實。據此操作,風險自擔。

封面圖片來源:每日經濟新聞 靳水平 攝

相關文章