2024北京國際車展｜加速智能汽車駛入AGI時代商湯絕影系列原生態大模型亮相

4月25日，商湯絕影攜系列原生態大模型及相關產品矩陣首次亮相2024北京國際車展。作爲首個提出感知決策一體化自動駕駛通用模型的公司，商湯絕影在本屆車展上首次向公衆展示面向量產的真·端到端自動駕駛解決方案UniAD（Unified Autonomous Driving）的道路測試表現，同時還帶來了以多模態場景大腦爲核心的AI大模型座艙產品矩陣以及全新座艙3D交互演示，全景展示通用人工智能（AGI）技術驅動的靈活自適應、深度個性化、安全可信賴、有人文關懷的未來出行全新體驗。

商湯科技聯合創始人、首席科學家、絕影智能汽車事業羣總裁王曉剛表示，未來汽車智能化的競爭，本質上是通用人工智能技術融合應用的比拼。商湯絕影致力於成爲加速智能汽車駛入AGI時代的核心技術夥伴，給智能汽車產業帶來生產效率和交互體驗的雙重革新。

本屆北京國際車展上，商湯絕影UniAD自動駕駛解決方案在無高精地圖且僅依靠視覺感知的實際道路測試成果顯示，無論複雜城市道路還是無中線的鄉村道路上，車輛均能高效準確地完成包括大角度左轉上橋、避讓佔道車輛及施工區域、繞行跑步行人等一系列高難度操作，做到“像人一樣開車”。

同時，憑藉商湯大裝置的豐沛算力、高質量仿真數據和行業領先的模型性能，UniAD端到端方案有更高的能力上限，以及強大的學習和思考能力；數據驅動的端到端模型泛化能力強、迭代效率快，可以幫助車企低成本快速開城；純視覺感知的無圖方案，進一步降低系統的軟硬件成本，助力智駕普及，實現全國都能開。

在端到端系統基礎上，商湯絕影還在本屆北京國際車展期間介紹了新一代自動駕駛大模型—DriveAGI，推動自動駕駛從數據驅動向認知驅動的躍遷。依託多模態大模型強大的世界理解、推理能力、決策能力以及交互能力，DriveAGI將是目前最貼近人類思維模式、最能理解人類意圖並有最強解決駕駛困難場景能力的技術方案。

值得一提的是，前不久上市的小米SU7將AI大模型帶進座艙，而商湯“日日新”大模型也全面助力小愛同學車載語音場景應用。

此外，今年4月23日，商湯科技發佈全新升級的“日日新SenseNova 5.0”大模型。6000億參數的“日日新5.0”採用混合專家架構（MOE），具備更強的知識、數學、推理及代碼能力，成爲國內首個全面對標甚至超越GPT-4 Turbo的大模型，多模態能力領先GPT-4V。基於端雲結合的架構，商湯端側大模型大幅超越同量級大模型，越級比肩7B、13B大模型，更適合車端部署。

基於多模態大模型、大語言模型、文生圖模型等能力組合，商湯絕影構建以多模態場景大腦爲核心的一系列全景感知、主動關懷且富有創造力的大模型座艙產品。

此外，人機交互的創新也是驅動座艙體驗升維的重要因素，去年Apple Vision Pro的問世展現了3D交互的創新體驗和應用潛力。商湯絕影憑藉深厚的感知技術研發實力和高效的創新迭代效率，將3D Gaze高精視線交互和3D 動態手勢交互這兩大全新座艙3D交互演示帶到現場，讓觀衆體驗到更符合人類直覺的艙內交互方式，推動座艙交互向更安全、更便利的3D交互升維進化。

其中， 3D Gaze高精視線交互是商湯絕影全球首創的能夠通過視線定位與屏幕圖標進行交互的智能座艙技術，讓用戶無需點按屏幕，通過眼神即可精準控制中控圖標，完成多種交互操作；3D 動態手勢交互是行業領先的支持動態手勢和手部微動作識別的智能座艙技術，用戶通過手勢“隔空”實現各類座艙精細化的交互，打破傳統按鍵和屏幕觸控方式的繁瑣和侷限。

未來一到兩年，智能汽車處在一個關鍵的時間節點，它與通用人工智能的深度融合將開啓一個全新的時代。而依託商湯大裝置深厚的算力儲備、原生的汽車垂類大模型、領先的軟硬件架構和全棧數據生產管線，商湯絕影率先構建四大技術基座，正在成長爲加速智能汽車駛入AGI時代的核心技術夥伴。

SenseCore商湯大裝置是行業領先的AI基礎設施，能夠以高達12000 petaFLOPS的豐沛算力支持商湯絕影系列原生態大模型的高效迭代；商湯絕影爲智能汽車前瞻構建UniAD、DriveAGI以及面向座艙的多模態場景大腦等系列原生態大模型，加速端到端自動駕駛和大模型在智能座艙場景的落地；端雲協同和艙駕融合的創新軟硬件架構，讓智能汽車降本增效、湧現創新功能；全棧的數據生產管線，實現大模型的高質量訓練。

如今，商湯絕影已經構建了智能駕駛、智能座艙和AI雲的多元AGI產品體系，正在加速推動原生態大模型產品在汽車智能化領域的全方位深度應用，加速AGI融入汽車產業，與廣大車企合作共贏，開啓未來出行的新篇章。

北京商報記者劉曉夢