智能驾驶感知算法梳理
智能驾驶系统按工程落地可分为两类:1)模块化:将整个系统划分为环境感知、决策规划、控制执行,车辆将 传感器采集到的信息进行感知处理,再将感知结果输入至决策规划层进行分析决策并生成控制命令,最终将控 制命令下达至各执行器完成加速、转向、刹车等操作;2)端到端(end-to-end):车辆将传感器采集到的信息 通过深度学习神经网络直接输出驾驶命令(可实现输入图像等感知信息到输出方向盘转角等控制量、输入感知 信息到输出车模的状态量如速度和坐标等)。当前,端到端仅应用于感知系统;全面端到端智能驾驶系统需要 大量数据支持,具备精简人工复杂升级+泛化性高+硬件成本小等优势,是智能驾驶的终极实现方案。
智能驾驶,主要包括感知(环境感知与定位)、决策(智能规划与决策)、以及执行(控制执行)系统。当前 技术难度排序分别为感知、执行、决策;其中,决策系统的难度随L3级及以上等级的推进而逐步增加。 按《汽车驾驶自动化分级》规定,L3级及以上才属于高阶智能驾驶( 允许脱手);其中,系统需满足360°感知+ 车辆精准定位+对驾驶员接管能力实时判断。我们分析,路径规划需依赖感知结果,感知系统是L2级至L3级及以 上跨越的关键。
从感知算法的推进来看,行业总体2022年及之前的的商业化应用主要为2D+CNN算法;随着ChatGPT等AI大模 型的兴起,感知算法已经升级至BEV( Bird’s eye view )+Transformer。 目前,特斯拉(2021年)、小鹏+华为+理想等(2023年)已切换至BEV+Transformer,但仍应用于感知端(vs. 学术界以最终规划为目标,已提出感知决策一体化的智能驾驶通用大模型UniAD+全栈Transformer模型)。 我们判断,1)感知算法的技术突破+工信部明确扶持L3级商业化落地,有望带动国内向L3级商业化加速迈进;2) 当前端到端算法仍应用于感知端,受限于算法复杂性+大算力要求,感知决策一体的端到端算法落地尚需时日。
全新BEV+Transformer算法有三种技术路线:1)纯视觉BEV感知路线(特斯拉):仅用摄像头,将摄像头感知 到的2D特征输入至算法,生成BEV 3D空间,并输出感知信息;2)BEV融合感知路线(华为):除摄像头的感知 信息外还加入激光雷达,在BEV 3D空间进行融合后再输出感知信息(预计小鹏+理想或采用相近方案);3)车 路一体BEV感知路线(百度UniBEV):在BEV 3D空间内将车端+路端V2X等多传感器采集到的感知信息全部融合。
BEV(Bird’s eye view),是在融合车载多视角摄像头感知输入信息后,得到鸟瞰图的感知输出信息(用于后 续路径规划与决策)。与2D+CNN相比(提取2D特征后通过CNN卷积算法得出3D感知输出信息或结果),BEV 通过Transformer可将提取2D特征通过BEV Queries映射到3D的BEV空间:1)BEV视角下可减少物体遮挡问题; 2)BEV空间内可融合不同视角的传感器信息至同一坐标系,方便编写后续规划和控制命令;3)BEV可实现时序 融合。对应BEV特征级融合,具备更高的感知信息精准度(vs. 2D+CNN采用不同角度拼接+语义分割,后融合)。
Transformer是一种基于注意力机制的神经网络大模型,算法参数达到亿级以上(vs. CNN仅为千万级别)。 Transformer算法更适用于大数据,同时具备较高的鲁棒性(可缓解一定程度的系统+网络风险)+较强的泛化 能力(可缓解Corner-case比如恶劣天气下的模型不稳定性)等特点;具备更稳定+更准确的感知输出信息。除特斯拉之外的智能驾驶系统主要依赖于高精地图:1)辅助环境感知;2)路径规划与决策;3)确定车辆精准 定位。高精地图可视为超距传感器,可形成感知传感器冗余(vs. 特斯拉算法冗余),提升自动驾驶体验和安全。 高精地图存在使用成本高/更新频率慢+法规限制严格+各城市县区推进不统一等风险; BEV+Transformer具备 更强泛化能力(可缓解无图环境下的感知信息预测偏差风险),全新技术落地更有助于城市高阶智能驾驶落地。
特斯拉智能驾驶技术路线梳理
特斯拉的智能驾驶系统推进大致分为三大阶段。1)2016年之前,Mobileye;2)2016-2017,英伟达过渡;3) 2018年至今,FSD软硬件全栈自研。其中,重大技术突破点包括,1)2018年软硬件全栈自研;2)2021年采用 自动标注;3)2021-2022年算法持续升级;4)规划推出全新车载芯片+云端超算平台Dojo。从HW1.0到HW3.0,特斯拉逐渐步入智能驾驶技术全栈自研时代,自HW3.0开始,特斯拉FSD芯片专为自动驾驶 打造(软硬件+整车强耦合),可实现充分利用计算单元+高效迭代产品+成本可控。FSD硬件当前已有HW4.0版 本(2023/3美版Model S/X或已试搭载),包含2个FSD2.0芯片,算力可达300-500TOPS(vs. 英伟达Orin芯片 算力254TOPS),基本可满足L3-L4级自动驾驶算力需求(预计L3级为100-200TOPS,L4级为400-600TOPS)。
我们分析,1)硬件决定软件算法开发与迭代的上限。2)随着智能驾驶等级的推进,软件算法复杂程度+训练数 据规模在逐步增加,对应数据存储+传输需求也在逐步增加;云端超算平台具备更高算力+高带宽+低延时等特点, 是高阶智能驾驶后阶段硬件发展的主要方向(vs. 当前行业车载芯片或已可满足L3-L4级需求)。 从行业推进来看,1)特斯拉2021年宣布自研超算平台Dojo(当前仍采用英伟达A100算力芯片),规划2H23E 推出;2)华为或采用自研超算平台;3)小鹏、理想、蔚来或租用/外购外部超算中心。
特斯拉2016年自研自动驾驶算法,其迭代可分为四个阶段。1)2018年之前:采用2D+CNN算法框架,以人工对 数据进行标注;2)2018-2020年:构建多任务学习神经网络架构HydraNet,采用RegNet+BiFPN提取特征;3) 2021年:对软件底层代码重写+深度神经网络重构,感知去雷达、推出BEV+Transformer,首次引入大模型、 提出自动标注、规划开发超算Dojo;4)2022年至今:算法从BEV升级到Occupancy,增加时序信息。 我们判断,1)算法从端到端的程度正在加深(当前仍在感知层);2)算法或可开源,依赖于参数+试错学习。
我们分析,数据的数量(实测+仿真)+质量(自动标注)是决定智能驾驶算法模型能否进一步优化提升的关键。 1)数量:特斯拉全球车队规模领先,可通过数据引擎+数据单元+影子模式采集大量数据;针对真实道路场景中 不常见+数据量不足的案例,可通过仿真模拟丰富数据来源+发掘“长尾场景”(corner case),用于进行大规 模训练更新完善模型。2)质量:特斯拉采用自动标注,通过算法实现数据筛选、分类和标框等操作;与人工标 注相比,自动标注可以减少人为因素干扰,提高数据质量+降低成本+提高效率。
国内车企自动驾驶进展对比
自2022年末起,小鹏、华为、理想、蔚来均规划落地城市领航辅助驾驶功能;预计均将基于BEV+Transformer搭 建。小鹏(2022/10)、华为(2023/4)、理想(2023/4)先后宣布/公开城市领航辅助驾驶功能落地,我们预计 均将于2H23E实现大规模推广城市领航辅助驾驶功能。我们判断,各车企在数据+硬件+软件算法的布局或将成为 L3级能否兑现的关键。
华为+新势力均具备领航辅助驾驶;其中,我们判断,1)华为ADS 2.0、以及蔚来NOP+,在变道策略调整/人机 共驾方面的体验感更佳。2)华为基于智能驾驶的软硬件占优;理想基于智能驾驶的数据规模占优。 1)智能驾驶设计(华为占优):硬件方面,华为采用自研超算+芯片,蔚小理仍采用外购车载芯片+租用/外购 超算中心 ;软件算法方面,华为已采用GOD(融合激光雷达的Occupancy+Transformer,或已领先特斯拉), 小鹏/理想/蔚来跟进BEV+Transformer。2)数据方面(理想占优):理想销量爬坡(2023年销量目标30-35万 辆)+AD Max智能驾驶系统标配+门店拓宽+从一二线城市向三四线城市推进布局。
高阶自动驾驶落地关键分析
大模型在高阶智能驾驶的应用已成趋势(BEV+Transformer仅为大模型在感知端的应用);大模型符合高阶智 能驾驶数据规模增加+模型精度呈指数型增加的算法升级需求。我们分析,大模型涵盖车端、云端算法。 1)在车端:大模型主要用于合并检测不同任务小模型、物体检测和车道拓扑预测等;2)在云端:大模型主要 应用在数据自动标注、数据挖掘、小模型训练、自动驾驶场景重建等方面。我们判断,大模型对算法+算力+数 据的要求更高,主要挑战在于数据存储和传输、网络架构搭建、模型训练效率等方面;其中,数据尤为关键。
高阶智能驾驶最大风险为“长尾问题”(corner cases),增加训练数据规模+提高大模型泛化能力可缓解“长 尾问题” 。我们判断,鉴于大模型应用对数据规模的要求在增加,建立数据闭环是实现高阶自动驾驶的前提。 数据闭环体系包括:1)数据采集:通常在车端设置trigger层,针对特定场景采集数据;2)数据回传:建立车 云一体传输机制(特斯拉通过影子模式实现大量数据采集+回传);3)数据标注:可通过自动标注获取大规模+ 高质量数据集训练;4)模型训练:大模型训练要求高算力+部分训练自动化(特斯拉自建超算平台);5)仿真 测试:搭建丰富场景库解决场景不全问题(特斯拉采用仿真模拟+数据引擎)。
我们判断,L2/L2+级向L3级高阶智能驾驶迈进的三大要素重要性排序分别为数据>算法>硬件;后阶段向更高阶 智能驾驶迈进的三大要素重要性排序或为硬件>=算法>数据。 1)实现L3级智能驾驶的关键在于全面感知,主要依赖海量+长尾场景数据驱动算法升级优化;其中,无图场景 覆盖还需低线城市数据(vs. 当前车载算力已基本满足L3-L4级需求);2)高阶智能驾驶等级推进对决策算法要 求增加,全面端到端大模型+车端/云端大模型应用,对算法升级(受制于算法专用芯片利用率+算力)和数据存 储/传输(硬件存储容量/带宽限制)要求也在增加,硬件或为后阶段高阶智能驾驶系统推进的关键。 从具备高阶智能驾驶属性的整车标的推荐顺序来看,首推特斯拉(数据+硬件+算法全面领先)、理想汽车(销 量爬坡);建议关注2H23E具备销量边际改善机会的小鹏汽车,长期建议关注华为智选车模式合作车企。
高阶智能驾驶量产需要电子电气架构向中央集中式升级(当前为域集中式 vs. 此前为分布式架构)。在域集中式 趋势下,行泊一体是当前L2/L2+级向L3级迈进、打造全场景(高速/低速/行车/泊车)智能驾驶方案落地的最佳路 径,可实现硬件成本降低(减少控制器数量)+硬件复用(提高各传感器和芯片算力利用率)+传感器配置灵活, 从而可应对城市NOA(领航辅助驾驶)+AVP(自主代客泊车)等复杂场景。
我们判断,行泊一体方案的技术难点在于单芯片功能集成(当前多数行泊一体方案仍采用两颗SoC),高性能智 驾域控落地还需要芯片算力和功耗升级配合。预计未来随着域集中程度加深,域控制器最终形态或为单一中央域 控制器。我们看好:1)与芯片供应商深度合作、积极布局上游传感器;2)具备自研算法能力;3)具备智能座舱 +智能驾驶域控制器技术的智驾域控制器供应商。建议关注德赛西威(002920.SZ)、经纬恒润(688326.SH)、 科博达(603786.SH)。
高阶智能驾驶不仅要求数据/算法/算力提升,还要求:1)智能驾驶系统的功能安全等级提高(L2/L2+级要求ACC 功能满足ASIL A或QM vs. L3级及以上要求ASIL C甚至ASD);2)人机解耦+执行机构存在冗余(脱手情况下,主 电子制动/转向系统失效时,系统也能执行制动/转向);3)对执行层响应速度(缩短响应时间保证安全)和执行 精度要求更高(提供精准底盘信号提升感知结果准确性)。
我们判断,1)执行端的线控底盘重要性凸显;2)由 于安全冗余方案验证尚未充分+路感模拟技术不成熟+控制算法不足,预计线控转向商业化量产节奏相对滞后。 我们判断,线控底盘为新能源车+高阶智能驾驶应用的基础。预计2025E线控制动、线控转向新能源车渗透率分别 可达约40%-50%、10%。看好国产线控底盘零部件供应商崛起机会。线控制动推荐国内首家自主one box量产供 应商伯特利(603596.SH);线控转向建议关注全球转向系统龙头企业之一的耐世特(1316.HK)。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
相关报告
AI大模型应用于汽车智能驾驶梳理专题分析:吐故纳新,如日方升.pdf
知行汽车科技研究报告:港股智能驾驶第一股,利润爆发在即.pdf
高精度定位行业专题报告:智能驾驶的可靠辅助.pdf
中国L4智能驾驶电动卡车行业市场调研报告.docx
激光雷达产业梳理:再看汽车智能驾驶之眼.pdf
汽车智能驾驶行业专题报告:特斯拉专题.pdf
汽车空气悬架行业研究:高附加值集成部件,国产替代新蓝海.pdf
零跑汽车研究报告:全域自研驱动技术降本,汽车出口盈利前景可期.pdf
华为汽车专题分析:X界智选,鸿蒙智行.pdf
麦肯锡&中国电动汽车百人会-新能源汽车行业驶向2030:全球新能源汽车产业发展格局与展望.pdf
长安汽车研究报告:汽车央企转型新生,产品向上开启新周期.pdf