2024智驾行业报告:技术突破与成本降低推动发展

1、技术角度:特斯拉端到端打开智驾新高度,中美智驾阶段性脱钩

1.12022-2023:特斯拉引领下感知技术收敛,国内头部厂商城市NOA功能开始落地

2021年AIDAY,特斯拉提出以Transformer为主干网络的BEV空间构建方式,也即通过Transformer模型将多视角图像信息重建至向量空间下,且该向量空间在大模型的加持下拥有更高的环境感知精度,从而降低对高精度地图的依赖。•Occupancy则在2DBEV的基础上增强对于物体高度信息的感知,有效解决了对于异形障碍物识别的问题。Occupancy占用网络的核心思想在于将三维空间划分为无数个微小立方体,面对障碍物时“不再考虑这个物体到底是什么,只考虑对应区域的微小立方体是否被占用”

2024智驾行业报告:技术突破与成本降低推动发展

1.22024:明确端到端为智驾算法迭代方向,但具体技术路线尚未收敛

端到端”智能驾驶的三层概念•全局端到端:从传感器输入到控制信号输出(PhotontoControl),中间所有步骤都是端到端可导,可进行全局的优化。•模块化端到端:在最终输出控制信号之外,引入一些中间任务的监督。和全局端到端相同的地方在于同样可以进行全局的优化,整个模型可以进行联合训练和调优。•“伪”端到端:在规控端用神经网络替代基于程序员自己写规则的方式,感知大模型网络和规控大模型网络之间不可导。‘


什么需要端到端智能驾驶?•规控端仍是主要基于程序员自己写规则的方式,城区场景下仅一个十字路口可能就存在上百种交互情景,靠人类程序员手写规则无法穷尽,造成的结果就是强博弈场景通行效率低。上述三种端到端均可以解决与复杂交通参与者的交互问题。


传统分模块的自动驾驶模型架构下,不同模块之间的接口输出结果均基于人工的选择,感知输出的信息都是人工定义的显示抽象(如车道线、障碍物等信息),但现实中可能存在难以充分表达但会影响下游决策的因素。同时模块之间的误差结果会累计,使得最终的输出结果有较大的偏差。针对这个问题只有前两种端到端才可以解决。

1.22024:明确端到端为智驾算法迭代方向,但具体技术路线尚未收敛

模型层面:基于全局端到端自动驾驶模型•目前特斯拉未召开第三届AIDay,行业内尚不知道特斯拉端到端自动驾驶模型具体的网络架构,我们仅能从23年CVPR以及马斯克采访/博文的只言片语中得到一些基本的判断。1)特斯拉端到端模型很可能是基于生成式AI。2)在特斯拉很可能在原有Occupancy模型的基础上构建世界模型,为端到端提供场景演化的理解。


特斯拉端到端模型很可能是基于生成式AI判别式模型vs.生成式模型:•判别式模型:学习输入数据到输出结果的映射关系,需要人工标注的数据进行有监督的训练。之前特斯拉、国内自动驾驶厂商主要采用的就是判别式模型,为了提高效率,特斯拉逐步从人工标注向自动化标注转变。但自动标注过程非常占用算力资源,影响模型的scaleup能力。


生成式模型:可以利用自然数据做自监督训练,无需标注,模型的scaleup能力大幅提升。比如GPT会读取一段连续的文本,尝试预测这段文本中的下一个词,再比较预测的单词与实际的单词进行迭代优化。自动驾驶最终任务可以抽象为“生成自车的未来轨迹”,与生成式模型的原理非常类似,且相比于判别式模型,生成式模型在scaleup上具备明显的优势,因此我们判断,特斯拉端到端模型很可能是基于生成式AI模型。


特斯拉端到端模型很可能是基于生成式AI•以学界OccWorld模型解释生成式AI在自动驾驶模型中的应用:采用类似GPT的生成架构,以自回归方式从先前场景预测下一个场景,实现了对自车运动和周围环境演化的同时建模。•特斯拉FSDV11的算法架构中,已经在Lanesnetwork模型中部分应用了类似的思路:将来自视觉模块和地图模块的所有信息进行编码,类似于语言模型中单词token,再以序列自回归的方式预测节点的位置、属性以及连接关系。

2024智驾行业报告:技术突破与成本降低推动发展

什么是世界模型?•worldmodel世界模型的核心任务是预测出未来怎么发展,背后的本质在于模型能够自己习得因果关系。当前神经网络和人类的差距在于,神经网络的预测结果是概率输出,知其然而不知其所以然;而人类可以通过观察、以及通过无监督的方式进行交互来学习积累大量关于物理世界如何运行的常识,这些常识告诉人类什么是合理的、什么是不可能的,因此人类可以通过很少的试验学习新技能,可以预测自身行为的后果。所谓世界模型就是希望神经网络可以同样具备上述的能力。


特斯拉在2023年CVPR上曾展示了对于世界模型的探索:构建向量空间的世界模型特征(一种三维重建方式能描述物理世界的全部特征),所有的智能驾驶任务都可以通过简单地插入(plugging)任务头来实现。•端到端模型不等于抛弃之前的感知网络架构:特斯拉在2023CVPR的演讲上曾表示“Occupancy模型实际上具有非常丰富的特征,能够捕捉到我们周围发生的许多事情。整个网络很大一部分就是在构建世界模型特征。


随着模型架构的改变,数据闭环流程也随之改变。在FSDV11的技术栈下,数据闭环包括数据采集->数据清洗->自动化标注->模拟仿真->云端训练->模型部署等多个环节。若模型架构从判别式模型向生成式模型转变,训练方式从有监督向自监督转变,并省去了复杂的数据清洗和自动化标注环节(仅需要删选出来人类优质的驾驶行为数据即可),数据闭环流程大幅简化。


云端算力资源的重要性进一步提升。马斯克曾多次在推特上表示“FSDV12端到端模型迭代主要受到云端算力资源的掣肘”。•特斯拉针对超算中心大幅投入,云端算力快速提升。截至22年AIDay,特斯拉具有1.4万个A100(<5EFLOPS算力),到23年8月马斯克直播时特斯拉已经具备1.6万个A100+1万个H100+Dojo,算力合计超过16EFLOPS,同时马斯克提到特斯拉23/24年对超算中心的年投入都会超过20亿美金。在大幅投入的背景下,特斯拉云端算力快速提升,至24年4月,具有约35EFLOPS云端算力,预计到24年底提升到85EFLOPS。

2024智驾行业报告:技术突破与成本降低推动发展

获得2023年CVPR最佳论文奖的《Planning-orientedAutonomousDriving》提出UniAD自动驾驶大模型,以“规划”为目标,利用多组query实现了全栈Transformer的端到端模型。但需要注意的是,UniAD模块之间有明显的区隔,模块之间可导,可实现全局调优。•UniAD将三大类主任务感知、预测、规划等进一步划分为六小类子任务(目标检测、目标跟踪、场景建图、轨迹预测、栅格预测和路径规划),模型整体由2个感知模块,2个预测模块以及一个规划模块组成。


模型层面:国内对端到端的探索主要为模块化端到端和“伪”端到端•百度于ApolloDay2024发布自动驾驶的端到端大模型ApolloADFM,整体思路与UniAD类似,有明显的模块区隔,但模块之间可导。•与UniAD的区别在于ApolloADFM将预测和规划融合在一张网络里,跳出原决策规划任务中阶段性任务,直接生成最终可执行轨迹。


模型层面:国内对端到端的探索主要为模块化端到端和“伪”端到端1.2.2目前国内智驾厂商在研的端到端与特斯拉相差较远Vision目标障碍物LidarNavigationGOD网络道路结构场景理解PDP网络预决策规划一张网Radar运动控制国内头部智驾主机厂目前在研的“端到端”模型架构仅为在规控端用神经网络模型替代了手写规则,分别实现了感知端到端和规划决策端到端,与特斯拉有本质不同。•华为ADS3.0模型架构:感知端基于Occupancy占用网络(取消BEV),将预决策规划融合进一张网(PDP)网络•小鹏面向全场景智驾的终极架构XBrain:Xnet2.0(具备空间理解的下一代感知)+XPlanner(规控端神经网络)+Mor


前我国头部主机厂自动驾驶功能对标特斯拉FSDV10/11(相当于1-2年前特斯拉FSD的水平)•算法构建能力:收敛至BEVOccupancy感知架构,技术路线趋同。•数据闭环能力:由主机厂工程化能力决定。•FSDV12:基于端到端打开智驾新高度,中美阶段性脱钩•算法构建能力:目前端到端的智能驾驶技术尚未收敛,特斯拉暂未召开AIDay,并不知道特斯拉具体的算法构建方式。但仅从基本思路上来说,国内基于UniAD模块化的端到端或仅在规划决策端用神经网络替代规则的方式与特斯拉差距较大。•超算中心:端到端架构下,主机厂云端算力的重要性进一步提升,国内外算力差距同样非常大。

2、应用角度:平价化是用户买单的前提,降本是当前产业链首要目标

.1规模效应降本

对于智驾Tier1而言,规模效应降本体现在以下两个方面:•研发成本:研发投入主要包括给芯片厂商的开发费和智驾域控制器系统开发的成本(简单理解为攒板子投入的资源)。以德赛为例,在IPU04研发初期,需要一次性支付英伟达大额的开发费,随着出货量的增多,开发费逐步摊薄。同时,高阶智驾处于0-1阶段时,项目的定制化属性强,随着产业发展到1-10的阶段,项目的标准化程度增强,单个项目需要投入的研发成本下降。•物料采购成本:智驾域控除了主控SoC芯片以外,还包括大量电子元器件,如MCU、存储芯片、交换机以太网芯片、Serdes等,此外还需要PCB、结构件、水冷板、连接器等。随着出货量的增多,在物料采购端同样具有规模效应,进而降低BOM成本。

2.2技术降本

提高软硬件的协同效率,城市NOA的硬件门槛逐步降低:在高阶智驾0-1阶段,头部厂商主要基于双OrinX(508Tops)平台落地了城市NOA功能,随着当前一代智驾在算法端逐步成熟,行业技术创新的重心也逐步从算法端向后端更底层的部分转移,以此来提高软硬件协同效率,进而实现降本。目前城市NOA的硬件门槛逐步从双OrinX降低到单OrinX,成本大幅降低,如智己LS6/L6、零跑C10/C16、乐道L60等均仅搭载单OrinX芯片,目标实现全国无图城市NOA。


从技术实现实现的角度:•元戎启行:自研DeepRoute-Engine的推理引擎技术压榨芯片算力:元戎启行推理引擎技术包含了模型解析前端、图融合终端、后端算子的自动生成和编译优化等等多方面工作,具有自有的框架支持底层算子,可适配多种主流的神经网络模型,针对智能驾驶做专门的优化,以此来实现更高的软硬件协同效率。•Momenta:通过核心算子自动调优、跨层融合、模型压缩等技术方式使模型运行效率提升500%,算力需求降低90%,仅通过单OrinX+单激光雷达是实现无图城市NOA功能。


惯导三目及激光雷达总成:由惯导立体双目+一个长焦单目+一个激光雷达构成的的车规级集成一体式传感器,激光雷达作为辅助增强车辆的纵向控制安全感,该方案还具备以下优势:1)前前融合:硬件设计整合激光雷达和摄像头,由中央域控芯片替代激光雷达主控芯片,激光点云处理软件可随智驾软件OTA;2)舱内集成:系统可整体内置于车舱内,仅要求挡风玻璃透光率>70%,降低综合装配成本,造型美观、不影响风阻系数、不增加噪音;3)标定同步:硬件刚性互联,两个传感器的坐标几乎一致,时间同步和空间同步精度上升、难度下降。•量产计划:根据大疆车载在中国电动汽车百人会论坛上披露,激目方案最早2025年开始上车;2026年左右与L3异构域控制器组合配置,把L3级自动驾驶下放至25万左右级别的车型上。


L2ADAS前视一体机的供应模式简单,由芯片厂商或Tier1负责算法环节;而由于L3功能复杂度高,因此在原有产业链基础上,逐步分化出单独的算法供应商,供应模式复杂度提升。但随着技术路线的逐步收敛、高阶智驾产品标准度提升,产业链之间逐步整合、减少环节,通过增强纵向一体化能力实现降本。•芯片厂商英伟达、地平线均积极补足算法能力,未来将具备提供智能驾驶完整解决方案的能力;智能驾驶算法龙头Momenta组建芯片团队,补足底层能力;经纬恒润作为传统汽车电子Tier1具备强大的制造能力,投资辉羲智能布局高算力芯片。

3、行业渗透率开始从1到10,高阶智驾即将走向千家万户

3.1新势力厂商和自主品牌纷纷在20-30万价格带主力车型上搭载城市NOA功能

内卷压力之下,新势力厂商和传统主机厂的新能源品牌纷纷在20-30万价格带主力车型上搭载城市NOA功能,2023年20-30万成为城市NOA功能渗透率最高的价格带。•20-30万价格带新能源车竞争激烈,根据乘联会数据,截至2024年3月,20-30万价格带新能源渗透率已达到57.3%。•23年以来小鹏G6、智己LS6等代表性车型已率先将高阶智能化功能作为该价格带车型的卖点之一,24年以来更多该价格带的主力车型搭载城市NOA功能。


2023年是城市NOA功能落地的元年,城市NOA硬件配置渗透率约为5%,实际城市NOA功能渗透率仅为1.5%。•2024年开始行业渗透率进入1-10阶段,我们测算24/25年城市NOA硬件配置渗透率分别为10%/15%,实际城市NOA功能渗透率为7%/11%。测算口径说明:•根据主机厂智驾车型规划测算•硬件配置渗透率和功能渗透率的差异主要来自于部分相关硬件配置的车型城市NOA功能尚未向用户推送。•未假设特斯拉FSD入华,因此仅计入硬件配置渗透率,未计入功能渗透率。

4.风险提示

技术进步不及预期:2022-2023年之前我国自动驾驶主要参与者算法均依赖于高精度地图,从小模型向Transformer大模型需要对底层算法进行重构并需要大量数据进行迭代优化。特斯拉从2020年8月份重构底层算法,经过近一年的时间,至2021年7月才推送城市领航辅助驾驶功能。


目前国内自动驾驶主要参与者均明确提出城市领航辅助驾驶及大模型推送时间表,若技术进步不及预期,将影响国内城市NOA落地节奏。p市场竞争加剧:目前造车新势力、传统主机厂以及百度、华为等科技大厂纷纷布局自动驾驶,并且不断有新的自动驾驶初创公司参与竞争,未来竞争可能进一步加剧。


p假设不及预期的风险:本文对2024年城市NOA渗透率的测算基于主机厂车型规划及新车型所在的车型系列对其硬件配置进行假设,但如果主机厂出于成本控制等因素对新车型智驾硬件进行了减配,则可能会造成高阶智驾功能的渗透率不及预期。


收益评级:领先大市—未来6个月的投资收益率领先沪深300指数10%以上;同步大市—未来6个月的投资收益率与沪深300指数的变动幅度相差-10%至10%;落后大市—未来6个月的投资收益率落后沪深300指数10%以上;p风险评级:A—正常风险,未来6个月投资收益率的波动小于等于沪深300指数波动;B—较高风险,未来6个月投资收益率的波动大于沪深300指数波动;

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)


上一篇

2024通信行业报告:英伟达业绩超预期与大模型价格战

2024-05-25
下一篇

2024电力设备行业报告:全球电网投资加速下的机遇与挑战

2024-05-25