本文是36氪汽车对智能驾驶技术报道的第四篇。2023年以来,高阶智驾领域云波诡谲,技术与商业化同时爆发,行业在混乱中寻找方向。本系列文章主要关注智能驾驶铺向全国的进程,以及以及端到端、大模型等技术的落地。后续还将持续跟进大算力计算方案、世界模型等新技术给智能驾驶带来的突变。

往期内容:

城市NoA,自动驾驶的“ChatGPT时刻”

智驾开城,没有「银子弹」

蔚来任少卿:AI进入现实世界,车企会更有优势

文 | 李安琪

编辑 | 李勤

“感觉几个月干了别人好几年的活。”经历大半年高强度开发后,一位理想汽车智驾工程师语气中透露着疲惫。

急行军,是过去一年理想汽车智驾团队的真实写照。CEO李想有时候会半夜测试智驾功能,然后在工作群里扔出问题,工程师们只能连夜解Bug。一周七天、凌晨时段下班,是封闭式开发期间智驾工程师们的常态。

2023年,华为、小鹏、理想等掀起了智驾开城大战。但头部玩家之间没有显示出断层式差距,所以在主动“卷”对手的同时,也不断被对手的进度所刺激。

烈火烹油下,今年智驾行业的竞争已经扩大到全国范围。

华为率先喊出了“智能驾驶全国道路都能开”,目前已全量推送给智驾车型用户,蔚来汽车紧随其后,开启全域全量智驾推送;小鹏与理想虽未明确透露时间,但全国能开的智驾功能已经在小规模内测。

而特斯拉FSD(全自动驾驶软件包)的入华,更让国内智驾赛道云波诡谲。同行如坐针毡,一些车企智驾团队已经在积极打听FSD的具体推送时间,试图抢先体验功能。

特斯拉在国内起步虽晚,但势能充沛。“一旦进来,FSD可能都没有全国道路开通的概念,而是哪里都能用。”有行业人士猜测。

陷在价格战泥潭中的汽车产业,连领头羊特斯拉都不堪重负,开启了一轮又一轮裁员。智能驾驶似乎在技术高强度竞争中,成了那个为数不多的技术变量,它离成为行业风暴还有多远?

智驾全国都能开:热闹的、质疑的

今年3月19日,华为问界宣布高阶智驾全量推送给用户,称覆盖全国99%道路。

“全国都能开”的智驾范围,也被华为具象化为4万个城镇与乡村。华为的目标是,到今年底搭载华为智驾系统的车辆将超过50万辆。

这为高阶智驾的破圈凿开了裂缝,也让同行倍感压力。如果智驾进度落后于华为,新势力们的品牌声量与销量可能会持续被华为压制。

对蔚来而言,今年没有新车发布,智驾成为了为数不多刺激销量的底牌。于是继华为之后,4月30日蔚来汽车成为国内第二家,全域全量推送高阶智驾功能的车企,用户覆盖超过20万。

小鹏汽车向来以智驾作为王牌筹码,阵地更不可丢。理想汽车也在朝AI科技公司转型,也势必要保持在智驾第一梯队。

据36氪汽车了解,跟激进的营销口号相比,车企智驾的实际推送要相对谨慎。

无论华为还是蔚来,都需要用户先通过考核和测试,同时在高速路段积累一定智驾里程后,才能在城区开启智驾功能。

事实上,有多位智驾从业者都向36氪表达了对“智驾全国都能开”的困惑与质疑。

首先,各家车企智驾对“全国都能开”的推送标准并不一致。比如华为的颗粒度很细,强调的是“40000个城镇”都能开;蔚来更强调用户能开启智驾的道路里程长度;小鹏则更多强调智驾的接管次数。

标准不一致,功能测试的强度也随之模糊。

在推送给用户之前,车企基本都会进行智驾功能测试与验证。“但全国道路范围相当大,现阶段几乎不可能每一条路都测试完。而推送给用户之前,车企智驾做了多少测试,全凭良心。”多位行业人士对36氪汽车如此说道。

当前高阶智驾还没有形成统一的产品可用标准,各家车企智驾只能比拼嗓门与营销力度。

同时,智驾在全国道路可开,并不意味着好用与功能完善。

有位智驾技术人士向36氪表示,在一些大型路口,智驾系统的感知能力还面临很大挑战。

比如拥堵情况、晴天雨天、白天夜晚等场景性变化,都可能导致无图智驾的功能一致性较差。比如车辆拥堵时,地面标线被遮挡严重,无图智驾可能就应付不了;等道路畅通的时候,车辆又能自己开启。

“所以,评价智驾功能的好坏,要关注在不同场景条件下功能的一致性。”上述技术人士说道。

也有智驾公司技术管理层向36氪给出参考,可以将智能驾驶产品分为可用,够用,好用三个等级。

可用,代表产品功能可用,比如智驾全国能开。够用,则是在用户高频使用的路段表现足够好,而不是开几公里就要接管。好用,则是让用户主动愿意开,只要上车都想开启智驾功能。

“特斯拉实现了够用,摸到了好用的边界。但国内的头部玩家基本还处于可用到够用之间。全国都能开,都只是可用。”上述行业技术人士如此评价道。

蔚来智驾负责人任少卿在接受36氪采访时也表示,智驾“全国都能开”整体需要两年多时间,第一年主要保证智驾功能可用,接下来还需要一年时间来持续优化功能体验。

可见,所谓的“智驾全国都能开”,只是功能“可用”话题的终结,但也是产品体验打磨、漫长商业化较量的开始。这离不开端到端等新技术的持续落地。

端到端,是噱头还是良药?

在大洋彼岸,特斯拉FSD v12版本已经进化到了相当拟人的智能驾驶效果。该版本采用的端到端大模型,也被视为自动驾驶下一代方案。

传统的智驾系统分为感知、预测、规划和控制等多个独立模块,方案基本依赖于工程师们一行行代码制定的规则,来驯化自动驾驶车辆。

而端到端自动驾驶方案,则是把传感器数据作为输入,然后输出车辆控制指令。因为中间过程都靠AI神经网络模型来完成,信息传递不会减损。“就像两个大脑神经元的连接一样。”有行业人士比喻道。

换句话说,基于AI神经网络,智驾系统在海量数据的训练下,会自主学习、模仿人类的驾驶经验。

有行业人士对36氪汽车表示,基于端到端方案,智驾系统可以在复杂城市路口场景表现得更加拟人,过红绿灯可以更加丝滑。

不过,特斯拉至今没有公布过端到端具体技术实现,行业也很难判定其是否真正从“图像输入”到“控制输出”、完全抛弃了传统模块的任何中间环节。

有行业技术高层告诉36氪,目前国内端到端方案基本不会采取特斯拉那么激进的方式,而是采取更柔和的方案。

事实上,2023年初智驾行业集体抛弃高精地图后,头部公司的技术路线基本已经合流,形成了感知大模型的三件套:基于Transformer的BEV(鸟瞰图)、Occupancy(占据网络)、道路拓扑关系网络。

沿着这条路,头部车企智驾团队也在筹备训练规划控制大模型,通过感知与规控大模型后续持续融合成一个神经网络,最终实现端到端。

以华为前段时间发布的乾崑ADS 3.0高阶智能驾驶为例,就在感知大模型基础上,提出了预测-决策-规划大模型。小鹏也表示,在感知大模型下游引入了基于神经网络的规划控制大模型XPlanner。

不过国内的端到端方案,基本还是从感知,到预测决策,到规划阶段,智驾系统还不会完全直接输出控制指令。

同时,引入端到端也不意味着,要全部抛弃传统基于规则的方案。

有头部车企智驾人士告诉36氪,比如感知大模型中往往只检测出红绿灯的位置与颜色,但“如果遇到前后左右都有红绿灯的场景,还是要用到一些规则,告诉车辆当前车道应该遵循哪个红绿灯的信息。”

同时,在规划预测模块中,加入的AI神经网络也只是作为一部分参考,最后的方案仍然有规则来兜底。“目前还是靠规则更多,系统会存在两种模式。”

此前,前小鹏汽车智驾负责人,现英伟达汽车事业部负责人吴新宙在小范围的媒体沟通会上也表示,端到端是自动驾驶的最终一步。

但他也表示:“不要从字面理解(端到端)就是从像素到动作,可能会有一些别的东西配合。端到端的模型上线之前一定会有‘护栏’,因为需要不停地优化和成长,要是一开始就上线端到端的模型是非常困难的。”

换句话说,传统方案与端到端思路的结合,会是行业更主流的方案,而国内智驾玩家可能还需要用1-2年时间来持续验证。

迈过城区智驾,迎接局部L3

但特斯拉FSD v12的惊艳效果,并不只依赖端到端方案,更依赖百万量级的车辆数据,以及超10 Eflops的训练算力。这是特斯拉FSD甩开同行,在北美地区更快开启商业化篇章的原因。

马斯克此前在社交平台上称,今年特斯拉将投资约100亿美元,用于AI的训练和推理,AI推理部分主要用于汽车。“任何公司如果不能达到这一水平的支出,且不能高效地进行支出,就无法竞争。”

而想要追上特斯拉的步伐,车企智驾团队除了采用端到端方案之外,还需要在数据与算力方面实打实投入。

但海量数据的积累,基本只能依赖车企们的高阶智驾硬件车型。车企需要卖出更多的车,才能积累更广泛地域的量产数据。

从云端算力来看,目前华为是国内智驾算力最大的玩家。华为表示,6月智驾 ADS训练算力将达3.5EFLOPS。小鹏、蔚来、理想的智驾算力中心算力分别是0.6EFLOPS、1.4 EFLOPS、1.4 EFLOPS。

至于车端算力,从行业人士的反馈来看,目前英伟达的Orin芯片已经可以支持端到端方案运行。

不过英伟达的下一代智驾芯片平台Thor也已经在路上,这将是智驾领域的新变量。据英伟达官方,Thor的AI算力达1000 Tops,专门针对Transformer、大语言模型(LLM)和生成式 AI 等技术框架而设计。

有行业人士表示,Thor落地后,未来可以进一步支持大模型在车端本地化部署、多模态大模型落地等。“车辆可以成为可以自主进化的机器人。”

目前,比亚迪、蔚来、小鹏和理想、广汽等车企都将采用英伟达的Thor芯片,该芯片将于 2025 年量产。

而迈过城区智驾的分水岭,智能驾驶行业有望来到L3级自动驾驶领域。

此前蔚来智驾负责人任少卿告诉36氪,在L3以下,车主是智驾系统的主要责任人,但进入L3以后,车企需要厘清人机共驾的边界,智驾功能的保险逻辑和商业逻辑也需要发生变化。

这不仅仅是技术与工程的挑战,更是保险和政策等全方位商业形态的变化,这会是一场更加漫长的商业战争。任少卿也认为,在大规模L3到来前,行业会率先进入局部L3,进行方向性探索。

而L3阶段的较量,也从此刻的全国全量智驾开始,埋下胜负的种子。

相关文章