【华宝证券】人形机器人专题报告三:拆解人形机器人结构,寻找高价值量细分领域.pdf

2024-01-23
31页
4MB

1. 以特斯拉人形机器人为例,拆解人形机器人硬件方案

1.1. 特斯拉 Optimus 代表当前商业化人机产品的最快速度与先进技术


特斯拉人形机器人 Optimus 迭代迅速,短短两年半时间内共迭代3 次,Gen1/2均为间隔半年更新,期间亦有产品新进展发布。特斯拉 2021 年 8 月首次公布人形机器人(以下简称人机)项目,此时 Optimus(擎天柱)还是人形机器人(Tesla Bot)概念设想。2022年9月特斯拉 AI DAY,Optimus 首次亮相,但并未现场展示相应能力,而是通过Demo演示,展示了其搬箱子、浇花以及在特斯拉超级工厂工作的画面。2023 年3 月,特斯拉在2023InvestorDay上展示了关于人形机器人 Optimus 的最新视频,这个版本的Optimus 可以到处走动、可进行拧螺丝等工作。2023 年 5 月股东大会,特斯拉展示 Optimus 新的研发成果,包括运控能力进一步提升(具备流畅行走和抓取能力)、实现一定程度 FSD(完全自动驾驶)算法复用。2023年 9 月,特斯拉通过社交平台 X 发布视频,展示了人形机器人Optimus 的进化情况:1、可以基于纯视觉和关节位置编码器,自我校准双手、手臂和腿,可以在空间中精准定位四肢;2、学习与处理复杂多任务的效率更高,深度学习神经网络完全基于控制器和纯视觉感知(端到端学习,输入视频、输出控制),如可以自主对物体进行分类,应对外界干扰;3、姿态控制和自平衡能力提升,如能做瑜伽、单腿站立等。2023 年 12 月,特斯拉通过X平台发布第二代Optimus 人形机器人(Gen2),相比上一代(Gen1)在感知与性能有较大改进,包括颈部与手部灵活度增加、整体重量减轻 10kg、行走速度提高 30%、手部增加力传感器(实现了基于触觉的物体抓取以及操作)、脚部仿生设计并增加力传感器等。此外在外观上,颈部使用弹性织物包裹,遮盖内部结构和走线,手臂、膝盖、腿部均有新的覆盖件或装饰件包裹,美观程度有所提升。总的来看运动能力是有超预期表现的,例如手部精细化动作(复杂物体鸡蛋的拿取、放置)、深蹲动作均体现了 Optimus Gen2 较强的运动和质心控制能力。从首次公布人机项目(2021 年 8 月)后,尤其在 2023 年,特斯拉机器人在硬软件性能上迭代速度较快,几乎在3-4 个月的时间就会有新进展。


尽管特斯拉 Optimus 运动性能不算最强,但工作能力、灵活程度、静态稳定性、智能水平已达到同行先进水平。首先,Optimus 仿生性较强,从目前公布的数据来看,Optimus整身采用 28 个执行器方案+11 自由度灵巧手方案+2 灵活度颈部+人体脚部设计,选择更加灵活的负载设计与 6 种类型的执行器,用来模拟人类的关节以及肌腱状态,已经成为最像人类的人形机器人产品之一。其次,过去较多人形机器人专注于提升运动能力及平稳性,追求高爆发的运行性能,但 Optimus 在物品识别与搬运、易碎物品抓取等偏实际工作应用的运动控制领域已取得一定进展,同时在具身智能方面具备领先优势(FSD 自动驾驶系统已部分复用于机器人),在功能方面正加速步入实际应用层面。


Optimus 在具体业务规划和招聘节奏上也是加紧步伐,可复用造车技术与供应链,在未来成本有较大降低空间,商业化脚步较快。2022 年 9 月特斯拉AI DAY,Optimus首次亮相时马斯克表示 3 年实现量产、5 年实现商用,目标售价在 2 万美元/台(按汇率美元对人民币7计算,约 14 万元)内。2023 年 7 月特斯拉二季度财报会上,马斯克表示Optimus 已经生产5-6台人形机器人,并预计在 2023 年 11 月进行行走测试(已推迟),2024 年在特斯拉自己的工厂进行实用性测试。2023 年 10 月,特斯拉官网放出了人形机器人多个岗位的招聘信息,包括软件工程师、机电一体化工程师、机器人 CAE 工程师、嵌入式软件工程师、机器人操作工程师和联合控制工程师等。此外,特斯拉依仗其造车经验和技术的累积,在人机产品上具备一定后发优势和降本优势,例如车辆硬件制造与测试经验、纯视觉感知系统和FSD自动驾驶系统,均已经或未来可复用在机器人项目中,可降低成本、提高效率。预计2024 年将有行走测试结果、硬件方案定型、工厂实用性测试结果等事件公布,Optimus 商业化落地的效果值得期待。总的来说,特斯拉人形机器人代表着当前商业化人机产品的最快速度和先进技术,值得作为案例深入研究。本章节将以特斯拉 Optimus 为例,对人形机器人的运控、感知硬件结构进行拆解,同时对人机软件算法方案进行分析。


1.2. 拆解 Optimus 的运控、感知、软件方案


1.2.1. 运控——执行器方案


关节执行器(Actuators,简称为执行器)即机器人一体化关节,是影响机器人硬件成本和运动性能的关键部分。关节执行器是驱动机器人执行机构(手臂、腿部等)运动的组件,安装在机器人关节处(连杆机构的连接处),通过将电机的旋转运动转化为驱动连杆机构运动,又被成为(关节)驱动器、(关节)致动器、关节模组。执行器有多种零部件组成,主要包括电机(驱动装置)、减速器(传动装置)、编码器(传感装置)、控制板和控制软件(控制装置)等。 按照运动类型,执行器可分为旋转执行器(Rotary Actuator)、线性执行器(LinearActuator)。两者区别在于,线性(直线)执行器最终让物体沿直线移动,而旋转执行器则是让物体按一定角度转动,即线性执行器执行往复直线运动,旋转执行器执行旋转运动。执行器中,不同类型的电机可以提供旋转运动(旋转电机)、也可以提供直线运动(直线电机),而不同传动装置也可以将电机的运动进行传递和转化,例如减速器可以将旋转电机的旋转运动以降低速度、提高转矩的方式传递出去,而皮带和滑轮、齿轮箱以及丝杠等减速装置可将电机的旋转运动转换成线性运动。一般来说,旋转执行器主要分布于肩髋等需要大角度旋转的关节,线性执行器分布于膝肘等摆动角度不大的单自由度关节、腕踝两个双自由度但是体积紧凑的关节。


驱动器方案经历了从刚性驱动器到弹性驱动器和准直驱驱动器的发展变化。针对双足机器人(属于人形机器人)的驱动器研究已有 30 多年的历史,其中有三个关键事件:(1)1983年,早稻田大学研究的 WL-10R 机器人使用刚性驱动器(一般被称为常规方案,TraditionalStiffness Actuator,简称 TSA),自此双足机器人开始广泛使用刚性驱动器为关节动力源;(2)1995 年,麻省理工学院的 Pratt 等提出了串联弹性驱动器(Series Elastic Actuator,简称SEA)的概念,拉开了弹性驱动器研究的序幕,弹性驱动器以 SEA 为主。(3)2016年,麻省理工学院的 Wensing 等提出了准直驱驱动器(又被成为本体驱动器、半直驱驱动器,ProprioceptiveActuator 或 Quasi-Direct Drive,简称 PA 或 QDD)的概念,并将其应用于四足机器人Cheetah和双足机器人 Hermes。总的来说,驱动器方案整体设计经历了刚性驱动器到弹性驱动器和准直驱驱动器的变化,准直驱驱动器成为最近几年研究的热点。


不同执行器方案在零部件构成、力矩测量方式、能量效率、机械复杂性、成本等方面存在区别,因此各自的应用场景略有差异。


刚性驱动器主要由电机、高传动比减速器、编码器、力矩传感器(选配)和控制板等组成。其中,减速器一般使用谐波等大减速比的减速器,以保证足够的扭矩输出;此外过去 TSA 一般使用位置控制,随着对足式及人形机器人的动态性能要求的变高,当前力位混合控制或直接扭矩控制成为常采用的控制方案,因此一般会配置有力矩传感器。总的来看,TSA 应用在双足机器人最早,设计理论也相对成熟,当前此方案的优化主要体现在电机和减速器整体优化设计上。该方案在传统双足机器人、工业机器人、协作机器人和工业精密转台等方面得到了广泛应用。但由于电机和减速器功率密度限制,在合适工作区间内的最大输出功率密度只能到200-300W/kg,远没有达到动物肌肉的 500W/kg,这限制了其在人形机器人上的应用,例如采用TSA的机器人在行走、奔跑、跳跃等运动能力上远远没有达到人类和动物的水平。同时TSA也解决不了机器人受外部冲击导致零部件损坏问题,以及还没有建立标准检测方法和性能评价标准。


弹性驱动器结构与 TSA 类似,但一般不包含力矩传感器,同时在驱动元件和负载间增加弹性单元,这样可以缓冲外部冲击和储能。弹性驱动器可以通过输出端的绝对式编码器和电机端的增量式编码器测量到的位置差,结合弹性体刚度,即可在不加装力矩传感器的情况下实现对力矩的采集,进而得以实现精确的力控输出。经过多年的发展,弹性驱动器取得了许多成果,并在一些机器人产品上得到应用,如苏黎世理工的四足机器人 ANYmal、美国宇航局的人形机器人 Valkyrie 和意大利技术研究院的人形机器人 COMAN 等。但由于弹性体引入,整个系统为欠驱动,运动控制精度较低且给控制带来了难度,尤其在机器人腿部使用,将使得机器人整机的运动控制比较难实现。弹性驱动器除了常规的串联弹性驱动器(即 SEA)外,还包括并联弹性驱动器(PEA)、离合弹性驱动器(CEA)、多模态弹性驱动器(MEA),但PEA、CEA和MEA技术应用于产品的相对较少,PEA 很难控制并联弹性体的能量吸收和释放的时机,CEA很好解决串联弹性体何时开关的问题,但增加了辅助控制装置或机构,MEA结构和控制复杂,因此本文后续提及弹性驱动器均指 SEA。


准直驱驱动器含义是依靠驱动器电机开环力控,不依赖于附加力或力矩传感器,就可以本体感知机器人脚部和外界的交互力。该驱动器最理想的方案是电机直接驱动,但受限于电机工艺和技术,电机当前的扭矩密度不能满足机器人应用的需求,因此在实际应用中折中采用电机+低传动比减速器的方案,同时要求负载质量和转动惯量尽可能地小,这样可以实现高带宽力控和良好的抗冲击能力。PA 具有功率密度高、力控带宽大、抗冲击能力强、成本低等优点。PA 作为最近几年的新兴技术发展迅速,并在很多四足机器人产品上得到应用,如麻省理工的四足机器人Cheetah、宇树科技的四足机器人 Laikago、云深处科技的四足机器人绝影等。但由于PA只有在电机端有位置编码器,目前尚未有很好的方案解决机器人断电后驱动器如何回到机械零位的问题。此外,PA 使用的高力矩密度电机(无框力矩电机)一般半径尺寸较大,对于关节尺寸有严格要求的人形机器人适用性不足。


当前各人机产品在驱动器零部件选用细节上略有差异,主要与驱动器方案的选择有关,而不同方案的选择往往是应用场景和制造成本之间权衡的结果。从代表性产品厂商披露的执行器方案来看,以刚性驱动器和准直驱驱动器为主。


特斯拉 Optimus 执行器采用的是 TSA 方案。全身共计52 个关节(自由度),其中有部分自由度为被动自由度。全身执行器(驱动器)可分为三大类——旋转关节(14个)、直线关节(14 个)与空心杯/灵巧手关节(12 个),其中旋转、直线执行器向下又分为三种型号。




1、旋转关节


旋转关节(旋转执行器)按照不同的输出力矩(20Nm、110Nm、180Nm)分为三类,但均由定制的永磁电机(无框力矩电机)+角接触球轴承+谐波减速器+交叉滚子轴承+力矩传感器+位置传感器(双编)+驱动器+机械离合器+关节 CNC 件组成,采取了非中空走线方式。机械离合器(高速端/电机端):可将传动系统随时分离或接合。 角接触球轴承(高速端/电机端):支撑机械旋转体,用以降低设备在传动过程中的机械载荷摩擦系数,角接触球轴承具有高刚度和高精度,适用于高速运转的机器。 应变波齿轮(低速端/传动端):根据特斯拉 2022 年AI Day 公布的驱动器选型参数预计主要采用谐波减速器,用于减速传动。 交叉滚子轴承(低速端/传动端):一般内置在减速机输出侧作为主承载轴承使用,与减速机主体组合为一个整体,首先大幅减小了体积,扩大了适用范围;采用刚性较强的交叉滚子轴承内置的方式,负载可以直接作用到输出部分,得到较高的力矩;同时,降低了组合难度和整体成本。 传感器:输入端和输出端配置位置传感器,采用双编码器方案(电感式),高速端(电机端)的增量式编码器做电机拖动 FOC(Filed Oriented Control,磁场定向控制),即提供 FOC 矢量控制算法的位置信号输入,低速端(输出端)的绝对式编码器记录实际输出位置,用于反馈控制;无接触式扭矩(力矩)传感器,用于检测力矩输出数据,预计采用了非接触式的磁致伸缩原理,通过类似感知交叉滚子轴承形变时变化的磁场来判断力矩。 定做的永磁电动机:表贴式永磁无刷电机,采用外定子、内转子的结构,具体为无框力矩电机。


2、直线关节


类似地,直线关节(线性执行器或直线驱动器)也按照不同的输出力矩(500N、3900N、8000N)分为三类,但均由永磁电机(无框力矩电机)+球轴承+四点角接触轴承+反向式行星滚柱丝杠+力传感器+位置传感器(单编)+驱动器+关节 CNC 件组成。直线型驱动器采用内转子电机与球轴承驱动倒置滚柱丝杠旋转,从而驱动行星滚柱从动,最终实现直线运动传递。 倒置滚柱丝杠:作为减速装置(反向/倒置式行星滚柱丝杠)的零部件,将旋转运动变为直线运动的传动副零件。 行星滚柱:作为减速装置(反向/倒置式行星滚柱丝杠)的零部件,利用丝杠带动行星齿轮旋转。 球轴承:支撑作用,将运转的轴与轴承座之间的滑动摩擦变为滚动摩擦,从而减少摩擦损失。 四点角接触轴承:支撑机械旋转体,用以降低设备在传动过程中的机械载荷摩擦系数。 定子:固定于电机外围,产生交流电。 传感器:力传感器,用于检测驱动器输出力的大小;位置传感器,单个编码器,检测位移,用于反馈控制。 定做的永磁电动机:类似旋转关节的电机类型。


特斯拉 Optimus 是首个大面积使用直线关节的人形机器人,线性执行器相对旋转执行器紧凑性、耐用度更高,且利于产品用于工厂操作(精度、稳定、效率要求更高),但成本相比旋转执行器更高。


3、空心杯/灵巧手关节


从目前方案来看,Optimus 灵巧手属于欠驱动、电机驱动、线绳驱动的类型。单只灵巧手主要由 6 个空心杯关节(空心杯驱动器/执行器)驱动,大拇指三个自由度,相比其余手指多了一个内收外展的自由度,由两个执行器驱动,其余手指均为两个自由度,分别由一个执行器驱动。空心杯关节由空心杯电机+多级行星减速器+蜗轮蜗杆+位置传感器(双编)+驱动器+金属腱绳构成。Optimus 手指具有防反驱特性,可以避免电机在抓握物体时长时间堵转发热。


空心杯电机:一般采用无刷空心杯电机,电机定子线圈无铁芯,解决了传统铁芯电机因铁芯形成涡流而造成的电能损耗,线圈作为转子,转动惯量小、好控制、效率高、转速快。


多级行星减速器:一般空心杯电机均需搭配行星减速器使用,由于空心杯电机多呈现高速、低扭矩的特性,故为了在较小空间内获得较大的手指抓握力,一般都会集成2-3级的行星减速器。


蜗轮蜗杆:一级蜗轮蜗杆传动机构,手指电机输出端为蜗杆,带动蜗轮旋转。另一方面利用蜗轮蜗杆的自锁特性去提升灵巧手的负载(自锁)能力。


金属腱绳:金属腱绳(线)带动远端手指运动,蜗轮上有绕线轴,当电机转动时,绕线轴会转动通过卷线来实现手指运动。Optimus 之所以选择绳驱,原因在于一是考虑量产难易程度;二是相比连杆,绳驱可以消隙,手指的运动不会滞后。


传感器:输入端和输出端均配置位置传感器,采用双编方案,高速端做电机拖动FOC,低速端记录实际输出位置,用于反馈控制;Gen2 在手指末端增加了触觉传感器(阵列传感器),提升物体操作和环境感知能力,且从宣传视频中看,对比Gen1的手部结构,我们预计 Gen2 在手腕处增加了多维力传感器。


回扭弹簧:Optimus 为欠驱动灵活手,部分自由度为被动自由度,回扭弹簧使被动自由度可以自主张开,无需多配置一个执行器并可实现手部的自适应抓取。


1.2.2. 感知——传感器方案


从传感器(外部传感器)配置上,Optimus 主要配备了视觉传感器和触觉传感器、多维力传感器。


视觉感知上,Optimus 主要采用纯视觉方案(3D 多目视觉),使用3个不同种类的2D 摄像头(2 个高清 2D 摄像机,一个广角的鱼眼摄像机,均基于Autopilot),鱼眼摄像头可以拓展视野范围,高速摄像头可以提供清晰的画面和快速的传输。相比其他人机产品视觉方案较多采用主动视觉的感知方案,特斯拉选择的是被动视觉感知方案,主要原因是特斯拉 FSD 软件算法较强,无需采用硬件较强的主动视觉,可降低硬件成本。


力觉感知上,除了各执行器使用了力或力矩传感器(内部传感器)外,Gen2在手部和脚底新增了触觉传感器,在脚踝处与手腕处增加了多维力传感器。Gen2手指增加触觉传感器(阵列传感器)、手腕增加多维力传感器以提升灵活手柔顺控制以及复杂物体操作的能力。Gen2 足部分为脚趾和脚掌两个部分,脚掌增加触觉(压力)传感器(预计仍为阵列传感器)、脚踝安装多维力传感器(预计为六维力矩传感器),用于检测脚部所受作用力,维持在不平衡地面上的平衡。




1.2.3. 软件——环境感知、思考决策、运动控制软件方案


特斯拉打通 FSD 在自动驾驶和机器人 Optimus 中的底层模块,在一定程度上实现算法复用,并在不同模块(环境感知、思考决策、运动控制)上进行了机器人适用性优化。FSD全称为 Full Self-Driving,即完全自动驾驶,FSD V12 是目前特斯拉提供的测试版最高水平的自动驾驶系统。最终目标是实现车辆可以在没有人类干预的情况下,自己识别路况、规划路线、控制速度和方向,完成从起点到终点的行驶。特斯拉的 FSD 由三大模块组成,包括环境感知模块、思考决策模块和运动控制模块。FSD 通过环境感知模块对外部环境信息进行感知与预测,提供思考决策所需的关键环境信息,包括当下及未来的趋势信息。通过思考决策模块对路径与运动进行规划,主要包括基于模型控制的显性规控模块和基于神经网络的规划模块,主要用于生成决策路径→生成路径下的驾驶行为→生成车辆控制信息,最终将车辆控制信息传递给运动控制模块,形成对车辆的控制。因此 FSD 可以根据感知的环境信息进行路径规划和车辆控制,这种方法同样可适用于机器人,在特斯拉 2022 年 AI DAY 上,特斯拉机器人团队表示Autopilot的大部分组件都可以很容易地移植到机器人的环境中,机器人只是轮式机器上长了两条腿。因此在复用 FSD 的基础上,Optimus 可以通过感知系统,从复杂的环境中识别周围环境、物体状态以及自身状态,并对运动/操作路径进行规划与决策,最终输出机器人运动控制的关键信息对执行器进行控制,完成任务命令。


环境感知


在视觉层面,Optimus 复用了 Autopilot 的视觉神经网络——占用网络模型(OccupancyNetwork)来感知与理解周围物体,获取场景中物体的相关信息(体积、速度、距离、轨迹等),以实现室内三维导航、物体抓取、视觉自标定、颜色分拣等任务。什么是占用网络模型?Occupancy Network 是自动驾驶中使用的一种深度学习方法,是一种 3D 语义占用感知方法,可以从多视图图像中生成车辆周围环境的三维占用网格。其基本思想是将三维空间划分成体素(voxel),通过 0/1 赋值对 voxel 进行二分类:有物体的voxel赋值为 1,表示 voxel 被物体占据;没有物体的 voxel 被赋值为0。当然实际中的赋值可以是概率值,表示 voxel 存在物体的概率,这个概率也可以理解成密度或者透明度。voxel 的属性除了是否被占据(Occupancy),还包含语义信息和速度信息(Occupancy Flow)等。其中速度信息是一个三维向量,用于表述 voxel 运动的速度和方向,因此通过Occupancy Flow可以用于判断物体是否运动。其工作原理为:首先,Occupancy Network 将来自多视图图像的输入数据转换为一个三维特征空间;然后,使用深度神经网络来学习这个特征空间中的占用概率以及动静状态;最后,将占用概率转换为一个三维占用网格,同时输出动静状态信息。


占用网络的优点?使用占用网络进行视觉感知的优点在于以下几点。首先,对硬件要求不高,其本身基于纯视觉的硬件方案,因此对视觉硬件要求较低,成本较低。其次,对通用障碍物具备良好的泛化能力。过去的计算机视觉算法依赖白名单,即通过人工标注之后训练网络实现检测或者分割任务,但是真实场景中存在很多非白名单物体,如异形车、路上的石头、散落的纸箱等,这些通用障碍物很难通过白名单的方式进行穷举识别,而占用网络可对环境进行三维重建,获取 low-level(低层)的信息,相比高度依赖于语义信息的白名单方法更加通用。最后,感知信息维度提升。与 LiDAR 等非纯视觉方案相比,纯视觉的语义感知能力更强,而占用网络被引入自动驾驶领域后,让摄像头将语义信息与立体几何信息统一起来,三维感知能力得到提升,与人眼更加相似。


在 FSD 中占用网络的作用?在 FSD 中,占用网络模型作为该系统的几何层,是一个多摄像头的视频神经网络模型,它从感知的图像信息中预测出汽车周围世界的完整占用情况以及障碍物未来运动情况。具体来说,其在 FSD 中主要用于障碍物检测(检测车辆周围的障碍物)、路径规划(可以用于生成车辆的路径,并避免障碍物)、车辆控制(可以用于控制车辆的速度和方向,以确保安全行驶)。 在 Optimus 中占用网络的作用?该模型直接从 Autopilot 中移植到了Optimus中,同样可用于机器人对于障碍物的检测、路径规划、机器人行走或操作速度以及方向的控制。与汽车不同的是,机器人通常低速运动,对算法的实时性、感知精度的要求可以相对放低。从特斯拉2022年 AI DAY 上的演示画面来看,在占用网络模型下的 Optimus 对环境空间有着相对精准的识别能力,通过基于神经网络模型的学习和训练,Optimus 就能清楚的知道自己位置,具备分析与执行的工作能力,包括即将需要去做的工作以及如何完成工作等。此外,特斯拉正在利用神经辐射场(Neural Radiance Fields,NeRF)对占用网络模型进行优化,以获得对机器人周围环境的更好的体积渲染效果。


在环境感知层面,Optimus 与特斯拉汽车在使用 FSD 上的主要区别在于:首先,感知模型所需的训练数据不同。Occupancy Network 是基于大型自动标注的数据训练得到的,但由于机器人的运动环境与汽车的运动环境不同,因此原本特斯拉汽车占用网络训练的数据不能复用,而需要针对机器人重新配备训练数据进行模型训练。其次,正由于人机的运动环境相对汽车更为复杂,获取的环境信息更复杂丰富,人机的感知模型中需要训练更多的神经网络。特斯拉汽车运行场景主要为室外的、相对标准的道路交通环境,获取的主要为视觉信息,且工作任务、控制的肢体相对单一,主要为控制车辆在车道进行正常行驶,因此在感知层面使用的神经网络包括 Occupancy Network、Lanes & Objects(车道识别及障碍物感知算法),而特斯拉机器人 Optimus 运行场景主要为室内的、非标准化的场景,获取的环境信息除了视觉外、还包括力觉(触觉)、平衡觉等,面临的道路是非标的,面临的工作任务和操纵的肢体更多元,例如控制脚部在室内平衡行走、控制手部进行协调抓取等,甚至需要与人类进行协作,因此所需要的神经网络模型更多。例如在室内三维导航中,由于室内一般没有GPS 信号,Optimus需要训练更多的神经网络,在摄像帧流中识别高频特征和关键点,并随着机器人在环境中导航,进行跨帧跨时间的跟踪,利用这些关键点进行行走轨迹规划和姿势估计。


思考决策


我们将机器人思考决策与运动控制层面的指令分为四个级别——任务级、动作级、初始级、伺服级。能自主生成任务级指令的机器人智能化、泛化程度最高,随后依次降低,同时四个指令可分别对应人类的大脑功能(任务级、动作级)、小脑(初始级)、脑干(伺服级)。以任务“A 想喝水”简单举例,任务级指令指“从水壶里倒水在杯子中,递给A”;动作级(或技能级)指令指“运动到水壶所在位置→拿起水壶→运动到杯子所在位置→拿起杯子→将水壶中的水倒在杯子中→运动到 A 所在的位置→将杯子递给 A”,即机器人所需要进行的末端行为动作和运动轨迹;初始级(指令级)指令指为实现以上行为动作和运动轨迹中,不同关节的运动轨迹(包括不同轨迹点上的位置、速度、加速度等信息);伺服级指令指为实现以上关节运动轨迹,不同关节电机的目标电流、速度、位置以及力/力矩信息。初始级与伺服级指令属于底层规划,一般由机器人自主生成与执行,但任务级、动作级指令,在传统机器人中主要由人通过人工示教等方式完成的,而对于智能化程度更高的人形机器人,通过AI 技术(强化学习、模仿学习)实现任务级、动作级指令的自主生成逐渐成为可能。Optimus 在思考决策(规划)层使用了端到端的神经网络模型,进行任务级、动作级的决策。结合特斯拉 2021 年及 2022 年 AI DAY 上公布的信息以及2023 年9 月X官方账号公布的视频,我们认为 Optimus 通过神经网络技术已可进行一定的任务级、动作级的决策。当前Optimus 已集成了 FSD 使用的端到端神经网络(已训练好的、且完全部署在本地的多模态模型),使之能够处理传感器所收集的多模态数据输入并端对端的生成控制输出,由此Optimus可具备自主学习各种任务的能力,最终达到无需人类代码控制、仅依靠训练好的本地神经网络即可对所处场景进行自主理解、决策和反应,其智能程度和泛化水平大幅提升。


在思考决策与运动控制层面,Optimus 与特斯拉汽车在使用FSD上的主要区别在于:首先,根据特斯拉 2021 年及 2022 年的 AI DAY 公布的信息来看,我们认为相对汽车,Optimus的环境感知、思考决策与运动控制模块区分较为模糊,或者说感知、规划与控制联系得更为紧密。其次,由于汽车与机器人的运动方式存在不同,一是机器人运动方式更多样,二是机器人的运动更复杂,机器人不仅包括腿部运动、还包括手臂和手部运动,还需要向下分解为各个关节的运动。因此我们认为 Optimus 在思考决策与运动控制层面的模型未完全复用汽车的模型,进行了机器人适用性优化。 例如机器人在进行行走规划时,需要物理层面的自我感知、使用能效步态、保持平衡与协调运动等一系列过程,这与汽车规划模型不同。以行走规划为例,Optimus 的运动规划以简单机器人模型(Simplified Bot Model)以及理想路径(Desired Path)出发,在对现实世界进行简单建模的基础上,生成参考轨迹以及力/力矩信息。其中简单机器人模型包括传统的建立机器人运动学模型、动力学模型和接触属性模型(the Model of the Contact Properties),即使机器人先拥有物理层面的自我感知(了解自身四肢长度、四肢质量、脚大小等)。模型运行主要包括三个步骤:第一步规划脚步轨迹,在规划范围内,按照期望路径规划脚步,从起始点开始,添加轨迹以连接所有的脚步;第二步规划步态轨迹,使 Optimus 可以像人类一样走路,用脚趾和脚跟着地,获得更大的步幅和更少的膝关节弯曲,以保证系统的高效率;第三步保持平衡与协调,寻找机器人质心的轨迹,以获得整个系统可以保持动态平衡的运动轨迹。最后生成系统的完整运动参考轨迹以及参考的力/力矩。




运动控制


Optimus 在运动控制层使用了模仿学习等技术。根据特斯拉2022 年AI DAY的介绍,我们把 Optimus 的运动控制分为两个方面,一个是关于肢体的运动控制(主要针对下肢),一个是关于肢体的操纵控制(主要针对上肢)。


1、肢体运动控制。尽管在运动规划模型中已经生成了参考轨迹和力/力矩,但规划模型仅仅是基于对现实世界的简单假设,在实际机器人与现实世界进行交互的过程中,包含着规划模型未考虑的干扰因素,例如传感器噪声、外界突然干扰等,易造成机器人状态的不稳定。因此需要加入状态估计模型(State Estimation),对现实进行测量,使用传感器和环境感知的信息来进行机器人状态估计,例如估计行走时骨盆的位置和姿态进行质心控制、使用纯视觉对肢体空间中的位置进行确认,并比较参考轨迹和现实世界对机器人的影响,对机器人的行为进行修正。


2、肢体操纵控制。Optimus 实现对物理世界物体的控制过程主要分为两步。第一步特斯拉建立了一个自然动作库(A Library Of Natural Motion References)参考人类示范动作。示范动作的获取主要通过动捕装置来获取人类的一组动作向量,并被可视化为一系列关键帧,代表了手部、肘部和部分躯干的关键数据。特斯拉收集了各种各样的动作最终构建了一个自然动作库,这些动作可通过反向运动学映射到机器人身上。第二步Optimus 选择了适配的示范动作后,在线进行动作轨迹优化,根据真实世界场景来调整原始示范动作的运动轨迹,最终实现对真实物理世界物体的控制,即在线轨迹优化模型(Online Motion Adaptation)。


2. 总结特斯拉 Optimus 人机方案,寻找高价值量细分领域


根据前文对人形机器人的拆解,我们首先可得到人形机器人产业链的基本情况。人形机器人产业链主要包括上游的核心零部件,例如无框力矩电机、空心杯电机、传感器、芯片等,其中机械结构相关的上游领域包含一级供应商(例如集成好的执行器)和二级供应商(执行器向下的零部件)等;中游为机器人本体制造和系统集成;下游为人形机器人应用领域,包括工业制造、仓储物流、商业服务、家庭消费等。本章节,我们将对第一部分的Optimus方案进行总结,向上游寻找高价值量的硬件零部件细分领域,为后续投资指明方向。


从特斯拉 Optimus 的运控硬件、感知硬件以及人机软件方案,我们总结得到人形机器人与传统机器人在执行器、传感器以及软件方案上的不同之处。


从执行器方案来看:1、人形机器人相比传统机器人(本章节以工业机器人为例,下同)灵活度更高,故首先从执行器使用数量上人机远高于传统机器人。2、由于人机需要更为紧凑的机械设计,因此人机执行器一体化程度高于传统机器人(除协作机器人外),即高度集成了电机、驱动器、编码器、力/力矩传感器和减速装置等零部件形成了一体化关节模组。3、人机减速装置以谐波减速器、行星减速器、行星滚柱丝杠为主,而传统机器人以谐波减速器或行星减速器、RV 减速器为主。4、人机所采用的电机以体积更小的无框力矩电机、空心杯电机为主,而工业机器人(除协作机器人外)主要以伺服电机、步进电机为主。


从传感器方案来看:1、由于人机柔顺性高、工作类型更多元化,因此人形机器人使用传感器的数量与种类均高于传统机器人。2、力传感器方面,一般协作机器人会使用六维力传感器或力矩传感器,垂直关节机器人一般采用各关节配置关节力/力矩传感器或仅末端配置多维力传感器,而人形机器人若采用TSA 方案,则基本每个关节均会使用力矩传感器,此外在手部或脚部有可能加装六维力传感器或触觉传感器。3、视觉传感器是人形机器人的标配,尽管特斯拉 Optimus 选用的是纯视觉的被动视觉方案,但当前人机主要还是以 3D 主动视觉方案为主,工业机器人一般在特定应用场景才会进行视觉传感器的装配,且主要以 2D 视觉为主,使用算法相对简单。4、其他传感器方面,人机有较大可能性会配备 IMU、触觉传感器等,以上在传统机器人(除协作机器人)上并不常见。


从软件算法来看:人形机器人将更多地使用大模型、强化学习、模仿学习等AI 技术以提升机器人的认知与决策水平,例如包含任务级、动作级指令的自主产生,同时提高了机器人泛化能力、减少人类代码控制;而传统机器人主要还是由人类输入任务级、动作级指令,一般仅使用传统的规控算法进行机械臂位置、速度与力的控制。


因此,首先从与传统机器人对比分析,我们可以总结出人机在执行器、传感器、软件算法方面的细分领域均有值得关注的点:1、关注用量增加的零部件细分领域,人机在执行器、传感器的用量上就已超过传统机器人,因此在未来人机产品大规模量产的预期下,相应部分细分领域将直接面临用量需求的增加,例如同属于人机和传统机器人的执行器或传感器的组成零件——谐波减速器、编码器、力/力传感器在量上的需求会增长;2、关注属于人机新增需求的零部件细分领域,例如执行器上可重点关注行星减速器、行星滚柱丝杠、无框力矩电机、空心杯电机,传感器上可重点关注 3D 视觉传感器,软件算法方面可重点关注AI 技术在人机产品上的落地(具身智能)。


其次,我们通过梳理特斯拉 Optimus 的执行器、传感器的硬件零部件方案,定量分析人机细分零部件领域的价值量大小:1、若以 Optimus 方案——旋转执行器(TSA方案)+线性执行器(高精度方案)+灵巧手方案(包括触觉传感器)+其他(多维力/力矩传感器、3D纯视觉方案、脚掌触觉传感器)为例,整体方案硬件零部件成本总计约35 万元人民币,距离特斯拉 Optimus 的目标单价 2 万美元(以美元对人民币汇率 7 换算,合计14 万人民币),仍约有60%的下降空间,其中价值量占比较高的细分领域为行星滚柱丝杠(40%)、关节力/力矩传感器(16%)、多维力/力矩传感器(15%)、无框力矩电机(8%)、谐波减速器(6%);2、若以较高性价比方案(牺牲性能,降低成本)——旋转执行器(PA 方案)+线性执行器(低精度方案)+灵巧手方案(不包括触觉传感器)+其他(3D 纯视觉方案)为例,整体方案硬件零部件成本总计约 12 万元人民币,已低于特斯拉 Optimus 的目标单价,其中价值量占比较高的细分领域为无框力矩电机(23%)、关节力/力矩传感器(23%)、行星减速器(21%)、编码器(16%)、空心杯电机(10%);3、若以高性能硬件方案(硬件性能提升,不考虑成本)——旋转执行器(TSA 方案)+线性执行器(高精度方案)+灵巧手方案(包括触觉传感器)+其他(六维力/力矩传感器、3D 非纯视觉方案、IMU、脚掌触觉传感器)为例,整体方案硬件零部件成本总计约 40 万元人民币,距离特斯拉 Optimus 的目标单价,约有65%的下降空间,其中价值量占比较高的细分领域为行星滚柱丝杠(34%)、六维力/力矩传感器(24%)、关节力/力矩传感器(14%)、无框力矩电机(7%)、谐波减速器(5%)。



(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)


相关报告

人形机器人行业专题报告:拆解人形机器人结构,寻找高价值量细分领域.pdf

行星滚柱丝杠行业研究:高精技术集成之作,人形机器人线性关节.pdf

人形机器人金属材料行业深度报告:人形机器人加速发展,钕铁硼、镁合金显著受益.pdf

新材料产业深度报告:人形机器人带来新材料机遇.pdf

人形机器人行业执行器系统专题报告:核心部件,顺势启航.pdf

人形机器人减速器行业深度研究:人形机器人带来产业深度变局.pdf

【华宝证券】人形机器人专题报告三:拆解人形机器人结构,寻找高价值量细分领域.pdf-第一页
联系烽火研报客服烽火研报客服头像
  • 服务热线
  • 4000832158
  • 客服微信
  • 烽火研报客服二维码
  • 客服咨询时间
  • 工作日8:30-18:00