2024汽车智能化行业报告

一、特斯拉智能化进展梳理

外采转自研,特斯拉FSD引领全球智驾软硬件升级

2020年为特斯拉“硬件为先,软件随后”策略的重要窗口,【大模型】是特斯拉引领本次变革的核心抓手。【HydraNet/FSD芯片+Transformer/Dojo】等6次硬件变化升级+3次软件架构的重大创新变革,均体现特斯拉第一性原理的经营思想。

边缘硬件:自研FSD(NPU),保障算力及功能领先

特斯拉自动驾驶硬件解决方案持续升级,2016年10月由Mobileye黑盒转为英伟达开放,逐步掌握智驾算法后,2019年全自研FSD芯片上车,2023年新一代FSD方案上车,芯片再升级。➢自研智驾芯片保障成本与性能双领先。特斯拉自2016年2月组建智驾芯片研发团队,2019年4月FSD芯片正式搭载上车,单车搭载2颗FSD芯片;每颗配置4 个三星2GB内存颗粒,单FSD总计8GB,同时每颗FSD配备一片东芝的32GB闪存以及一颗Spansion的64MB NOR flash 用于启动。凭借NPU针对AI计算更好的专业适用性,3.0时代FSD芯片以14nm制程+260mm²面积实现144TOPS算力,相比英伟达12nm制程+350mm²支持30TOPS AI算力更为领先。

边缘硬件:HW4.0强化摄像头视觉,留毫米波雷达

特斯拉坚持视觉主导的周身智驾传感器解决方案,当前HW4.0采用12个摄像头(其中1个为备用)+1个毫米波雷达解决方案,相比2019年推出的HW3.0增加3颗摄像头,包括2个侧摄像头(L-FF-Side和R-FF-Side摄像头)和1个前保险杠摄像头(F-SVC),加上原本就有的1个倒车影像摄像头、4个侧向ADAS摄像头,以及座舱内的1颗摄像头,合计11颗,但前视ADAS摄像头由3目变为2目。除摄像头外,HW4.0还新增了Phoenix高精度雷达(相比2023年的新款),12颗超声波雷达则依然保持去除状态。

2024汽车智能化行业报告

HydraNet赋能多传感器融合,特斯拉基于全自研软硬件实现有限范围的智能领航辅助驾驶,追平行业。2016年起特斯拉自研软件算法上车,2D网络的CNN架构+人工数据标注的迭代模式下,特斯拉智驾功能表现逊于长期深耕的Mobileye;2019年4月配合自研FSD芯片,HydraNet九头蛇架构实现更好的特征提取以及多头任务并行,催化特斯拉追平Mobileye L2+级别智驾功能。◼BEV+Transformer开启大模型时代,软件能力跨时代跃迁,引领行业变革。1)Transformer赋能2D图像升维实现BEV转换,占用网络(加入时序的BEV)进一步泛化异形场景,实现无高精度地图化及传感器精简化;2)特征级融合取代后融合,减少信息损耗,还原更真实的场景信息;3)人工标准转向自动标注,庞大数据预训练大模型,进行云端预标注,车端蒸馏筛选得证。◼FSD升级,全栈端到端落地。车端感知规控全融合,大模型覆盖范围深化,数据赋能加速迭代。


特斯拉早于2023年提出世界模型World Model,即通过神经网络结构化表示事物,并预测未来,将自动驾驶决策问题转为预测视频的下一帧。世界模型用于理解世界,不仅能用于自动驾驶也能用于机器人,是特斯拉自身端到端智驾解决方案的基础原理,自动驾驶是世界模型的具身智能。➢Sora的发布是催化产业内实现世界模型技术路线收敛的重要时刻。Sora文生视频首次实现在视频长度和质量上的跨越,包括编码+序列分割+学习生成(DiT)+解码四个步骤。其技术创新点在于时空编码以及DiT模型的应用,高效进行特征提取训练大量视频数据,并生成强相关预测值。➢DiT(Diffusion Transformer)是继模型结合了Diffusion 扩散模型和Transformer 模型的优点,将传统扩散模型中采用的U-Net 网络结构替换成Transformer,使得模型更擅长捕捉长距离的相关关系,并且随计算输入的数据量越大,模型的输出预测值越加接近真实值。

云:放弃通用GPU自研专用D1芯片,强化计算+传输

可扩展+强计算,特斯拉D1性能表现业内领先。1)基础性能方面,特斯拉D1由台积电代工,采用7nm制程工艺,芯片面积为645mm²,小于英伟达A100(826 mm²);D1芯片拥有多达354个训练节点,是特斯拉专门设计的特别用于AI训练相关的8×8乘法的芯片,浮点计算性能FP32算力22.6TFLOPS(英伟达A100为19.5),对应热功耗仅为400W;D1芯片集成四个64位超标量CPU核心,支持完整向量以及矩阵计算,灵活性远超众核架构的GPU 。2)高带宽+低延迟保障强可扩展性:D1芯片采用带宽最高可达10TB/s的“延迟交换结构”进行互连,加速数据传输。D1芯片运行频率2GHz,拥有440MB SRAM,是存算一体架构,降低过程数据缓存压力。Tile角度,每个D1训练模块由5x5的D1芯片阵列排布而成,以二维Mesh结构互连,片上跨内核SRAM达11GB,每个训练模块外部边缘的40 个I/O 芯片达36/10TB/s的聚合/横跨带宽,保障信息传输过程的低损耗。

Dojo超算中心高算力+低功耗+高带宽,行业领先

Dojo从底层开始由Core、D1、Tile、Tray、Cabinet、ExaPOD构成:D1芯片由354个Core构成,强算力+高带宽;Tile由25个D1芯片打造,通过InFO_SoW封测技术实现低延迟、高带宽,4边对外传输带宽均为9TB/s;ExaPOD由3000个D1芯片构成,在BF16精度下算力高达1.1 EFLOPs。特斯拉预计将Dojo打造成全球五台最先进的超级计算机之一,总算力达到100 Exa-Flops。➢特斯拉为追求Dojo极致算力性能,在算法通用性和生态角度做了较大牺牲,为此,特斯拉为Dojo全新编译一套完整软件栈,包括Dojo编译器、Dojo Ingest Pipeline、Dojo Runtime和Dojo Library,实现对神经网络模型的自动调优和并行化,并使Dojo支持ensorFlow、PyTorch等流行的深度学习框架。

世界模型应用利好生成泛化数据,加速云端仿真

世界模型有望提供真实且多样化的仿真数据,即加速泛化,加速云端算法迭代。1)当前智能驾驶仿真的主流技术方案为【NeRF+素材库+游戏引擎,基于真实数据进行道路重建,并保证和真实场景的相似程度,再依靠交通元素的不同排列组合进行有条件泛化,最后通过游戏引擎输出高质量的仿真画面】。2)世界模型与之相比,具备能够凭借对于物理世界运行规律的理解,自身泛化到样本以外的能力,覆盖更多Corner Case,有效降低厂商对于真实数据的依赖程度,提升效率;但大模型的基础前提决定其比较依赖大算力+大规模数据喂养持续训练,方能避免出现违背客观规律的情况。Tesla可以做到多个摄像头同步联合预测;并支持prompt嵌入,可以提出要求生成车辆直行或者对向车道视角的未来数据。

根据特斯拉季度财务报表,自2023年3月FSD v11发布之后,FSD累积行驶里程增加速率陡然加快,主要系占用网络(3D BEV)+Transformer技术的上车应用,高速与城区道路的架构统一有效改善消费者的使用体验;➢2024年初特斯拉依托于端到端解决方案的FSD v12版本小范围推送,由数据感知的输入直接跨过预测和规划决策,输出为执行端指令,规则驱动转为数据驱动,不依赖算法工程师的能力而转为依赖数据的保有数量和质量,FSD累计里程数增长再次提速。

二、国内车企智能化进展梳理

智驾路线方向趋同,国内OEM玩家快速追赶

智能驾驶软件算法架构历经两次框架变化:➢1)2D+CNN小模型向Transformer大模型进化,智驾迭代由工程师驱动转为数据驱动:2020年特斯拉BEV上车,数据后融合变为特征级融合,提升数据利用效率和结果准确性,同时数据标注由人工转为模型自动,迭代提效;2022年占用网络落地,泛化能力进一步增强,实现感知维度端到端;2023年数据驱动算法持续迭代,规控环节端到端落地,rule-base比例降低,能力优化。➢2)模块化端到端进化为全栈端到端,World Model逐步完善,数据驱动变为认知驱动,向L4迭代。特斯拉FSD v12起转向智驾环节全栈端到端,数据闭环后World Model逐步演化完善,基于历史数据去理解未来的范式进步为基于常识和规律自我学习进化的范式,实现无接管的L4智驾。


横向比较国内各车企当前开城进度以及未来开城规划:华为/小鹏最为领先,理想/蔚来紧随其后,极越/小米/长城等自研以及智己/腾势/极氪等联合开发者再次之。


华为ADS智驾系统历经三次迭代:2021~2023年,BEV+GOD(类似于占用网络)支持感知端大模型化,实现感知维度端到端,在感知硬件逐步简化的同时支持无图模式城市NCA加速开放;2024年华为重磅迭代模块化端到端,覆盖感知及规控环节,全场景贯通。


2023H2以来,以问界M系列车型为代表,华为ADS2.0功能持续迭代升级,NCA领航功能覆盖面不断开拓,由部分城区至全国高速再升级至全国城区;GOD+PDP架构下,类比特斯拉,实现全场景NCA功能全覆盖,并加速迭代。

2024汽车智能化行业报告

激光雷达方案保留,多传感器融合依然是华为主线

华为ADS解决方案与特斯拉FSD最大区别点在软硬件维度均有体现:➢依然保留激光雷达传感器,以保证全天候适应能力(覆盖扬尘、飞雪、雨天、雾霾等恶劣气候)和小目标检测能力。➢特斯拉FSDv12版本当前已实现融合感知-规控在内的全栈端到端,华为以模块化+端到端模式实现类似于FSDv12的效果,增强流程可解释性,在算法架构升级的同时保障产品功能体验。


硬件维度:小鹏以英伟达智驾芯片为基础,算法能力提升同时感知硬件不断简化。XNGP相比Xpilot摄像头数量-1,并在max版本实现轻地图;2024年升级XNGP+,有望推出纯视觉方案。➢功能维度:2019年实现L2级别Pilot2.5,2020~2021年L2+级别Xpilot3.0/3.5,2023年L3级别无图XNGP覆盖多城区道路,达到比肩特斯拉FSD v11水平;2024年5月预计迭代XNGP+。


软件维度:小鹏Xpilot/XNGP/XNGP+迭代围绕【增加learning-base使用率,端到端全覆盖】的目标架构,XNGP落地BEV+Transformer架构实现感知维度端到端,规控环节逐步引入learning-base;2024年XNGP+有望在rule-base基础上实现感知-规控模块化端到端XBrain。➢Xbrain:XNet2.0融合了行业最高精度的纯视觉占据网络,可实现动/静态BEV、占据网络三网合一;基于神经网络的XPlanner可结合分钟级以上的时序连续动机,并依据周边环境信息及时变通,生成最佳运动轨迹。5月OTA上车的XNGP+将实现上述感知大模型升级和规控大模型上车。


硬件维度:理想采用Max-英伟达双Orin+单激光雷达+11摄像头和Pro-地平线征程芯片+10摄像头两套解决方案,其余感知硬件相同(1毫米波雷达+12超声波雷达),两套方案预计长期维持。➢功能维度:2022年底理想迭代至高速NOA,2023年底OTA5.0大规模升级,BEV大模型+占用网络推动感知维度端到端落地,城市NOA迭代上车,并支持全国通勤NOA,达到特斯拉FSDv10阶段;公司预计2024年6月完成Pro版本感知大模型(不含占用网络)上车,统一Max/Pro技术栈底层逻辑。


软件维度:理想AD Max实现感知大模型落地,AD Pro预计24年中迭代与Max技术路线趋同;2024年理想预计完成规控环节端到端落地,实现全技术栈可训练的“端到端模型化”。➢展望未来,理想基于【认知模型】(即特斯拉世界模型)做预研,目标是开发L4场景,基于1.4EFLOPS云端算力,更充分的利用多模态AIGC,短期进行场景重建和衍生,加速仿真数据生成和算法训练;中长期做到知识驱动形式的“场景理解”,真正实现L4覆盖100%的Corner Case。

极越:百度智驾赋能,LD地图+视觉大模型上车

极越以吉利+百度合作赋能,利用百度自研LD车道级地图,坚持纯视觉智驾方案,迅速追赶。➢硬件维度:极越外采英伟达双Orin芯片,采用11摄像头/5毫米波雷达/12超声波雷达感知硬件,通过无激光雷达的视觉方案实现L3高阶智驾功能;同时云端百度2.2EFLOPS算力加速算法训练。➢功能维度:极越于2024年初OTA V1.3实现北上深杭广五城高精地图加持下的城市PPA,预计24H1开放300城,24年全年实现全国覆盖(有百度地图的地方均可使用)。➢软件维度:1)大模型通用纯视觉方案上车,类比特斯拉FSDv10+阶段:百度VTA视觉大模型实现感知端到端,OCC感知模型实现占用网络+Transformer加持后对通用异形障碍物的检测。2)LD智驾车道地图形成差异化:由视觉大模型端到端生成,保留必要精度基础上增加经验地图+安全图层+实时图层,目前已覆盖全国360城,支持PPA全国都能开。

蔚来:NT2.0硬件标配,感知端到端对标FSD v10+

蔚来自NT2.0平台起加速自研算法迭代,24年4月底迭代全域领航NOP+,对标FSD v10+。➢硬件维度:蔚来自NT2.0平台起全系切换英伟达,标配4*OrinX芯片(2主控/1冗余/1训练)以及1激光雷达/11摄像头+5毫米波雷达+12超声波雷达,标配硬件支持3.8EFLOPS端云一体化算力。➢功能维度:蔚来于23年初上车自研高速NOP领航智驾,23年中/底分别将BEV/占用网络架构迭代上车,23年底/24Q1城市领航分别开城6/20万km,24年4月底实现全域领航辅助NOP+推送。➢软件维度:落地感知维度端到端,全域推送NOP。蔚来打造NAD Arch智能驾驶架构,该架构包含Lane 2.0感知网络、NADCloudM云、NADHVH等算法模型应用。其中,Lane 2.0可支持城区场景路口通行的实时感知,NADCloudM可借助云端大模型,提升感知能力;而NADHVN可通过数据驱动的规划网络,使全域领航辅助NOP+拥有更细腻的交互能力。


自研:自研智驾方案落地速度较快的以小米为代表。➢小米汽车:当前类比FSD v9-v10。硬件维度小米顶配搭载英伟达OrinX芯片及激光雷达等核心传感器,目标2024年5月底实现全国10城领航辅助,2024年底覆盖100城。◼联合开发:长城、上汽智己、吉利极氪、比亚迪腾势等均以联合开发的形式实现L3高阶智驾。➢长城汽车:以魏牌蓝山为代表,2024Q2上市蓝山激光雷达版本,搭载英伟达Orin芯片,2024年预计落地全国百城城市NOH。未来,长城毫末也将基于高通智驾硬件平台自研,进一步开发自动驾驶语义感知大模型(万物识别能力)以及认知大模型(世界模型)。➢上汽智己:以英伟达芯片/激光雷达多传感器融合的感知硬件搭配Momenta合作开发的软件解决方案,2023年4月上车高速/高架/城快NOA后逐步普及,2024年4月开放上深广苏四城NOA,预计年底全国➢比亚迪腾势:以英伟达芯片/激光雷达多传感器融合的感知硬件搭配Momenta合作开发软件解决方案,2024Q1末首批开城,后续预计批量推广覆盖更多城市。➢吉利极氪:外采Mobileye软硬件一体化纯视觉解决方案,2023年9月实现高速NZP上车,年底开17城高速。

三、FSD入华:加速L3渗透率+淘汰赛进程

15-30万元价格带可实现【L3智能化性能与成本】的最佳平衡。相比于豪华车市场(30-50万元为主):虽然豪华车群体购买力强于15-30万元,但市场容量占比小(以中国为例,我们预估2018-2023历年平均30万元以上乘用车销量占比约15%,对应约300万辆容量)。另外,L3智能化需要持续迭代大模型,越多的人使用不同场景对模型迭代能力越强。这点,显然15-30万元的市场容量更具有吸引力。相比于低端市场(5-15万元为主):虽然低端市场容量更大于15-30万元(以中国2018-2023历年平均角度来看,5-15万元群体销量占比约50%,15-30万元群体销量占比约35%),但L3智能化成本难以下放到这个价位,同时低端市场群体对新事物接受意愿较低,属于跟随消费风格。因此15-30万元具备优势:1)市场容量够大;2)消费者购买力较强且对新事物接受度较高;3)L3智能化技术进步带来的成本下降可支持

2024汽车智能化行业报告

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)


上一篇

2024年货币政策框架调整与流动性分析报告

2024-06-25
下一篇

2024卫星互联网行业报告

2024-06-25