【财通证券】智能机器人行业深度报告：NVIDIA加码机器人赛道，引领具身智能浪潮.pdf

2024-04-18

26页

3MB

1 全球 AI 算力龙头，前瞻布局智能机器人领域

1.1 新一轮 AI 技术革命催生高算力需求，英伟达业绩创历史新高

英伟达是全球 AI 算力龙头，总市值跃居全球前三。英伟达起步于游戏 GPU 市场，并于 2006 年推出 GPU 计算的革命性架构 CUDA ，正式进入 AI 加速计算领域。 2021 年，英伟达发布首款 CPU 处理器，并将公司产品路线升级为 “GPU+CPU+DPU”的三芯战略。2023 年，英伟达受益生成式 AI 浪潮的持续催化，凭借旗舰 AI 芯片 A100/H100 跃升为全球 AI 领域“卖铲人”。截至 2024 年 4月 16日 (北美时间)，英伟达收盘价为 874.15美元，总市值高达 2.19万亿美元，市值位列全球前三。

算力是 AI 核心要素，以 LLM 为代表的新一轮 AI 技术革命催生新的算力需求。 AI三大要素包括算法/算力/大数据，AI深度学习需要很高的并行计算、浮点计算以及矩阵运算能力，基于 CPU 的传统计算架构无法充分满足人工智能高性能并行计算的需求，因此需要发展适合 AI 架构的专属芯片，常见的 AI 加速芯片按照技术路线可以分为 GPU/FPGA/ASIC 三类。其中，应用于图形、图像处理领域的 GPU 是目前主流的 AI 计算架构。现阶段，全球智能算力 (GPU 等芯片算力) 增速远超通用算力 (CPU芯片算力)，算力正在被当作国家科技竞争的关键因素，AI芯片是人工智能领域竞争的制高点。

2023 年英伟达成为全球最大芯片公司，AI 芯片市占率高达 98%。根据 Wells Fargo数据显示，2023年英伟达在数据中心 AI芯片市场拥有 98%的市场份额，第二名的 AMD 市场份额仅为 1.2%，第三名的英特尔不足 1%。英伟达/英特尔 /AMD 是全球芯片市场上最主要的供应商，从 2023 财务年度来看，英伟达/英特尔/AMD 分别实现营业收入 609 亿美元/542 亿美元/227 亿美元，英伟达的营收规模首次超过英特尔，正式成为全球最大芯片公司。

受益于生成式 AI 浪潮，2023 年英伟达业绩创历史新高。2024 年 2 月，英伟达公布了 2024 财年 (1M23-1M24) 业绩报告，全年实现营业收入 609.2 亿美元，同比 +126%，营业利润 329.7 亿美元，同比+681%，营业利润率高达 54.1%，净利润 297.6 亿美元，同比+581%，全年公司营收/营业利润/净利润均创历史新高。尤其是在数据中心领域，受益于 23 年全球范围内的生成式 AI 浪潮带动的算力需求大幅提升，FY24公司数据中心领域实现营收475亿美元，同比+217%，其中第四季度实现营收 184 亿美元，同比+409%，环比+27%。

1.2 NVIDIA 前瞻布局智能机器人领域，拥抱生成式 AI 新方向

NVIDIA 在机器人领域的核心目标是打造底层开发生态。NVIDIA 在智能机器人领域的布局主要围绕着大模型、数据、开发平台三大核心领域展开，其终极目标是借助芯片等核心产品，为打造机器人底层开发生态，抢占产业链价值制高点并赋能其他主机厂、加速产业落地。

英伟达早在 2018 便前瞻布局智能机器人领域。英伟达通常会采用“处理器+平台+ 开发工具”三件套的方式进入新兴市场，其对于机器人领域的布局也采用类似方法。2018 年，英伟达推出全新硬件、软件、虚拟世界机器人模拟器的 NVIDIA Isaac，同时还推出专为机器人设计的计算机平台 Jetson Xavier 和相关的机器人软件工具包，正式布局智能机器人领域。

2019-2022 年，英伟达从底层芯片、到计算平台、到训练与验证，开启智能机器人领域的全方位布局。2019 年，英伟达推出 lsaac 软性开发套件 (SDK)，为机器人提供更新的 AI 感知和仿真功能；2021 年，英伟达推出 Omniverse 平台，支持机器人的协作和模拟，其中 Omniverse Avatar 可生成交互式人工智能化身，对协作机器人影响深远。2022 年，英伟达推出 Isaac Nova Orin，其配置的计算和传感器参考平台旨在帮助 AMR (自主移动机器人) 制造商缩短开发时间并降低成本。

2023 年，“生成式 AI+机器人”成为 NVIDIA 机器人全线产品技术演进和重塑的核心方向。 (1) 2023 年 5 月，英伟达发布全新 Jetson AGX Orin 工业级模块。该模块在极其恶劣的环境下可以提供更高的服务器性能级别的计算能力， “服务器性能级别” 意味着在嵌入式 s 的端侧/边缘侧也能部署 AI 并让传感器融合算法；“极其恶劣的环境”意味着智能机器人在农业/建筑/能源/航空抗体/卫星等极端环境领域的应用存在可能性。 (2) 2023 年 10 月，英伟达宣布对 Jetson 平台上的 Metropolis 和 Isaac 框架进行有史以来规模最大的软件扩展，用以来满足边缘 AI的快速部署需求。与此同时，英伟达还宣布创建 Jetson生成式 AI 实验室，供开发者学习和利用开源生成式 AI 模型进行开发。另外，英伟达宣布推出 Isaac ROS 和 Isaac Sim 软件的全新版本，对感知和仿真功能进行了重大改进，这次改进同样还是与 AI高度相关。整体来看，英伟达在机器人领域的芯片技术和工具领域有几个重要的迭代方向，分别是增强性能、模块化布局、降低使用门槛。

2 正式成立 GEAR 实验室，引领具身智能浪潮

2.1 具身智能为 AI 新一波浪潮，英伟达已有深度布局

具身智能 (Embodied AI) 被认为是人工智能的下一波浪潮。具身智能是指一种基于物理身体进行感知和行动的智能系统，其通过智能体与环境的交互获取信息、理解问题、做出决策并实现行动，从而产生智能行为和适应性。在 ITF World 2023 大会上，英伟达创始人黄仁勋表示，人工智能的下一个浪潮是具身智能 (Embodied AI)，这种智能系统能够理解、推理并与物理世界交互，并举例机器人、自动驾驶汽车，包括因为理解物理世界而变得更加聪明的聊天机器人。

具身智能有感知、理解和交互三个主要特征。(1) 感知：指具身智能设备可以通过各种传感器感知周围环境中的物体/声音/光线等信息，并将其转化为数字信号进行处理；(2) 理解：是指具身智能设备可以通过各种算法对感知到的信息进行分析和解释，并生成相应的语义表示或知识图谱；(3) 交互：是指具身智能设备可以通过语音/图像/动作等方式与人类或其他设备进行沟通和协作，并根据反馈进行自适应和学习。具身智能借助具有泛化能力的 LLM/VLM/VLA 等模型，赋能人形机器人大脑。具身智能的目标是让具有感知和行动能力的智能体（如人形机器人），在与环境的交互中持续演进，逐渐产生认知能力，能够理解、推理、学习、规划和决策，甚至具备常识和情感，从而实现更复杂的功能。具身智能的“头脑”通常由深度神经网络模型驱动，结合 LLM/VLM/VLA 等模型，赋予了强大的泛化能力，使得机器人从程序执行导向转向任务目标导向，不再受限于特定的程序执行，而能够根据任务目标智能地采取行动，从丰富的数据和任务中学习决策和控制，它们不断演化以适应更复杂的任务和环境。

NVIDIA 在具身智能领域不断进行深度布局，以下是现阶段最显著的四项成果：

在智能体接口上：2022 年 10 月，英伟达发布基于 Transformer 架构的支持多模形态的（仿真）智能体 VIMA。VIMA能像 GPT-4一样接受 Prompt输入，而且输入可以是多模态的（文本、图像、视频或它们的混合），然后输出动作，完成指定任务。该项目为研究自然语言理解任务传达给智能体提供了一种便捷灵活的接口，并提出了一种新的多模态 prompting 形式，将各种各样的机器人操作任务转换为一个序列建模问题。

在智能体架构上：2022 年 11 月 22 日，英伟达发布具有互联网规模知识的开放式具身智能体——MinDojo。MineDojo 是一个建立在流行的 Minecraft 游戏之上的新框架，用于具身代理研究。该模型构建了具身智能体最关键的三个要素：一是支持多种任务和目标的环境，二是大规模的多模态知识数据库，三是灵活且可扩展的智能体架构。

在智能体自主学习上：2023 年 5 月 25 日，英伟达发布 VOYAGER 智能体，这是第一个由 LLM 驱动的可以终身学习的智能体，可以在《我的世界》中驱动探索，掌握广泛的技能，并在没有人类干预的情况下不断地做出新的发现。其可以最大限度地探索自动化项目，并拥有可以不断存储和检索复杂行为的技能库，为具身控制生成可执行代码。

在智能体机器训练上：2023 年 10 月 20 日，英伟达发布了 Eureka 智能机器人训练工具。Eureka 的全称是 Evolution-driven Universal Reward Kit for Agent，本质是一种由大模型驱动的算法生成工具。借助 GPT-4 写代码的能力， Eureka拥有了出色的奖励函数设计能力，可以自主编写奖励算法来训练机器人。Eureka生成的奖励程序在超过 80%的任务上优于专家编写的奖励程序。这使得机器人的平均性能提高了 50%以上。

对外投资方面，NVIDIA 积极投资具身智能机器人本体厂商 Figure AI。Figure 公司成立于 2022 年，公司团队包括来自 IHMC、波士顿动力和特斯拉的机器人专家。2024 年 2 月 29 日 (北美时间)，Figure 公司通过 X 平台宣布已从英伟达 /OpenAI/微软/亚马逊等巨头筹集合计约 6.75 亿美元，公司估值达 26 亿美元。同时，Figure 宣布与 OpenAI 展开深度合作，开发新一代的人形机器人专用 AI 模型，还将使用微软的 Azure 云服务搭建人工智能基础设施和存储数据等。

Figure AI 持续推动具身智能进展，AI+机器人进展顺利。2023 年 10 月， Figure 发布了代号为 Figure 01 的首款人形机器人，Figure 01 的设计主要用于搬运重物等以最终解决美国劳动力短缺的问题；2024 年 1 月，Figure 01 更新最新进展，仅需 10 小时的端到端训练，通过观看人类的示范视频就能学会并完全自主搞定煮咖啡任务，还具备自主纠错和动作优化等功能。

2024 年 3 月，Figure 通过 X 平台更新 Figure 01 的最新进展，机器人在视觉识别/ 推理能力/命令执行等方面均有明显进展。(1) 视觉识别：在陈述周边环境时， Figure 01 可具体描述苹果/盘子/桌边人的位置、姿态、颜色等多维度信息；(2) 推理能力：在接受人类想吃东西的指令后，Figure 01 从面前诸多物品中挑选出苹果并送出，并做出合理解释，可自主思考后并整齐放置餐具；(3) 命令执行：在收拾物品过程中，Figure 01 灵巧手可快速抓取并整理苹果/餐碟杯等不同形状的物品，动作轻巧灵敏。另外，视频为 1.0x 倍速拍摄，体现机器人在反应速度/语态/ 动作等方面已做到高度类人化。此视频为 Figure公布与 OpenAI合作之后仅 10天 (视频拍摄日期为 3 月 9日) 的阶段性进展，体现现阶段 AI 已对机器人提供了较高程度的赋能。

2.2 英伟达成立 GEAR 实验室，研究围绕四大关键领域

2024 年 2 月，英伟达成立通用具身智能体研究 GEAR (Generalist Embodied Agent Research) 团队。GEAR 团队将由 AI 高级研究科学家，AI 代理计划的负责人 Jim Fan 和 Yuke Zhu 教授领导，目标是在虚拟和现实世界中建立具身智能体基础模型，致力于实现跨多模态、多场景的智能应用。GEAR 有足够的资金一次性解决机器人基础模型、游戏基础模型和生成式模拟。英伟达 GEAR 实验室的成立，旨在推动大模型等人工智能技术进一步由虚拟世界向现实世界发展，通过机器人等载体实现人工智能与物理世界的交互，加速感知智能时代的到来。

GEAR 团队的成立表明英伟达先进 AI 和自主系统领域积极抢占技术和应用的制高点，未来 GEAR 的研究工作将主要围绕四个关键领域开展：多模态基础模型：开发基于大规模互联网数据源训练的 LLMs（大型语言模型），用于规划与推理，视觉-语言模型以及世界模型，旨在打通不同模态信息间的壁垒；通用型机器人研究：研发能够适应复杂环境、实现稳健移动与灵巧操作的机器人模型与系统，以提升其在各类实际场景下的普适性与效能；虚拟世界中的基础智能体：创建能够在多种游戏与模拟环境中自主探索并持续自我提升能力的大型动作模型，为虚拟世界的智能交互设定新标准；模拟与合成数据技术：构建大规模学习所需的仿真基础设施及合成数据流水线，为智能体的学习过程提供有力支持。

3. GTC推出 GR00T模型，构筑机器人底层开发生态

GTC 2024 见证 AI+机器人的最前沿升级。2024 年 3 月 18 日-21 日，NVIDIA 在圣何塞会议中心举办 GTC 2024 大会，也是英伟达近 5 年来的首届线下 GTC。(1) 从参会嘉宾来看，谷歌 DeepMind 机器人技术高级总监、OpenAI 首席运营官、波士顿动力首席技术官、斯坦福李飞飞博士、xAI 联合创始人等机器人行业先进企业的领导人悉数出席。(2) 从展示产品来看，众多全球机器人领先公司将展示最新机器人产品，谷歌 DeepMind、波士顿动力、Agility Robotics、迪士尼等公司将在现场展出 25 款机器人，包括人形机器人、工业机械手等。

英伟达重磅推出人形机器人 GR00T 通用模型。2024 年 3 月 19 日 (北京时间)，英伟达 CEO 黄仁勋在 GTC 2024 大会上重磅推出人形机器人通用基础模型 Project GR00T。GR00T 全称是“Generalist Robot 00 Technology”，旨在进一步推动其在机器人和具身智能方面的突破。 GR00T 驱动的机器人将能够理解自然语言，并通过观察人类行为来模仿动作，以便导航、适应现实世界并与之互动。同时英伟达也宣布，正为领先的人形机器人公司开发综合 AI 模型，海外公司包括 Figure AI/1X Technologies/Agility Robotics/Apptronik/ Sanctuary AI/波士顿动力等，国内公司包括傅利叶智能/宇树科技/小鹏鹏行等。

英伟达正在构建 IAI/Omniverse/ISAAC 三大平台，全方面赋能机器人智能化。 IAI/Omniverse/ISAAC 三大平台均与机器人产业高度关联，其中 IAI 搭载 DGX 系列产品，用于模拟物理世界；Omnivese搭载 RTX和 OVX系列产品，用于驱动数字孪生的计算系统; ISAAC搭载AGX系列，用于驱动人工智能机器人。此次GTC 大会上，英伟达发布了配套 GR00T 项目的新型人形机器人计算机 Jetson Thor，以及对 Isaac Lab 进行了重大更新。

(1) Jetson Thor 计算机：在 GTC 2024 上，英伟达 CEO 黄仁勋还推出了新型人形机器人计算机平台 Jetson Thor。Jetson Thor 是一款专为运行模拟工作流程、生成人工智能模型等人形外形而设计的新型计算机。该平台的设计基于 NVIDIA Thor 系统级芯片 (SoC)，由 Thor 系统级芯片提供动力，将成为人形机器人的大脑。Jetson Thor 芯片带有 Transformer Engine 的新一代 GPU，其采用 NVIDIA Blackwell 架构，可提供每秒 800 万亿次 8 位浮点运算 AI 性能，以运行 GR00T 等多模态模型。

(2) Issac Lab 平台: 在 GTC 2024 大会上，黄仁勋还宣布将对 Isaac 机器人平台进行重大更新，用于为在任何环境中的任何机器人创建新的基础模型，平台工具包括用于强化学习的 Isaac Lab 和用于计算编排服务的 OSMO。训练具身智能模型需要海量的真实数据和合成数据。新的 Isaac Lab 是一个 GPU 加速、性能优化的轻量级应用，基于 Isaac Sim 而构建，专门用于运行数千个用于机器人学习的并行仿真。为了扩展异构计算的机器人开发工作负载，OSMO 在分布式环境中协调数据生成、模型训练和软硬件在环工作流。伴随着 Isaac的更新，英伟达还发布 Isaac Manipulator (机械臂加速库) 和 Isaac Preceptor (感知能力软件库) 等一系列机器人预训练模型、库和参考硬件。

英伟达将机器人与 AI 放在同一战略高度。在大会收场阶段，黄仁勋还和使用英伟达软硬件平台开发的 9 款人形机器人共同登台，并且黄仁勋还亲自介绍了迪士尼 BDX机器人，BDX机器人由 Jetsons系统提供动力，通过 Issac Sim学习走路，并现场进行快速行走/蹲下起身/语音交互等。在黄仁勋的总结材料中，机器人事业部被放在了与 Blackwell GPU/AI Foundry/NIM 等并列的位置，体现机器人业务在英伟达未来商业版图中十分重要的战略地位。

在 GTC 2024 的机器人专题论坛中，波士顿动力的首席技术官 Aaron Saunders 将主题聚焦“如何有效地将 AI 技术与现实世界中的机器人相结合”，展开深入探讨。在机器人技术领域，波士顿动力公司的 SPOT 机器人在设计上针对高级别用户允许全程控制，即用户只需告诉 Spot 目的地，它便能独立计算出如何到达。波士顿动力和英伟达强强联手，宣布合作推出 SPOT RL Researcher Kit 产品。尽管 SPOT 机器人车队在商业部署上规模庞大。但当前版本的 Spot并未完全适配广泛的机器人研究需求。这一局限性源于波士顿动力公司尚未向开发者社区开放对 SPOT 机器人关节的访问权限，因而限制了深入研究四足移动性的可能性，导致研究者们不得不转向其他开放性更强、支持自由实验的平台。在 GTC 2024 大会上，波士顿动力和英伟达宣布联手推出 SPOT RL Researcher Kit 产品，该研究工具包包含了关节级控制 API、英伟达 Jetson AGX Orin 有效载荷以及基于英伟达 Isaac Lab 构建的仿真环境，预计该套件计划在 2024 年晚些时候正式推出。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）