1 全球 AI 算力龙头,前瞻布局智能机器人领域
1.1 新一轮 AI 技术革命催生高算力需求,英伟达业绩创历史新高
英伟达是全球 AI 算力龙头,总市值跃居全球前三。英伟达起步于游戏 GPU 市场, 并于 2006 年推出 GPU 计算的革命性架构 CUDA ,正式进入 AI 加速计算领域。 2021 年 , 英 伟 达 发 布 首 款 CPU 处 理 器 , 并 将 公 司 产 品 路 线 升 级 为 “GPU+CPU+DPU”的三芯战略。2023 年,英伟达受益生成式 AI 浪潮的持续催 化,凭借旗舰 AI 芯片 A100/H100 跃升为全球 AI 领域“卖铲人”。截至 2024 年 4月 16日 (北美时间),英伟达收盘价为 874.15美元,总市值高达 2.19万亿美元, 市值位列全球前三。
算力是 AI 核心要素,以 LLM 为代表的新一轮 AI 技术革命催生新的算力需求。 AI三大要素包括算法/算力/大数据,AI深度学习需要很高的并行计算、浮点计算 以及矩阵运算能力,基于 CPU 的传统计算架构无法充分满足人工智能高性能并 行计算的需求,因此需要发展适合 AI 架构的专属芯片,常见的 AI 加速芯片按照 技术路线可以分为 GPU/FPGA/ASIC 三类。其中,应用于图形、图像处理领域的 GPU 是目前主流的 AI 计算架构。现阶段,全球智能算力 (GPU 等芯片算力) 增速 远超通用算力 (CPU芯片算力),算力正在被当作国家科技竞争的关键因素,AI芯 片是人工智能领域竞争的制高点。
2023 年英伟达成为全球最大芯片公司,AI 芯片市占率高达 98%。根据 Wells Fargo数据显示,2023年英伟达在数据中心 AI芯片市场拥有 98%的市场份额,第 二名的 AMD 市场份额仅为 1.2%,第三名的英特尔不足 1%。英伟达/英特尔 /AMD 是全球芯片市场上最主要的供应商,从 2023 财务年度来看,英伟达/英特 尔/AMD 分别实现营业收入 609 亿美元/542 亿美元/227 亿美元,英伟达的营收规 模首次超过英特尔,正式成为全球最大芯片公司。
受益于生成式 AI 浪潮,2023 年英伟达业绩创历史新高。2024 年 2 月,英伟达公 布了 2024 财年 (1M23-1M24) 业绩报告,全年实现营业收入 609.2 亿美元,同比 +126%,营业利润 329.7 亿美元,同比+681%,营业利润率高达 54.1%,净利润 297.6 亿美元,同比+581%,全年公司营收/营业利润/净利润均创历史新高。尤其 是在数据中心领域,受益于 23 年全球范围内的生成式 AI 浪潮带动的算力需求大 幅提升,FY24公司数据中心领域实现营收475亿美元,同比+217%,其中第四季 度实现营收 184 亿美元,同比+409%,环比+27%。
1.2 NVIDIA 前瞻布局智能机器人领域,拥抱生成式 AI 新方向
NVIDIA 在机器人领域的核心目标是打造底层开发生态。NVIDIA 在智能机器人 领域的布局主要围绕着大模型、数据、开发平台三大核心领域展开,其终极目标 是借助芯片等核心产品,为打造机器人底层开发生态,抢占产业链价值制高点并 赋能其他主机厂、加速产业落地。
英伟达早在 2018 便前瞻布局智能机器人领域。英伟达通常会采用“处理器+平台+ 开发工具”三件套的方式进入新兴市场,其对于机器人领域的布局也采用类似方 法。2018 年,英伟达推出全新硬件、软件、虚拟世界机器人模拟器的 NVIDIA Isaac,同时还推出专为机器人设计的计算机平台 Jetson Xavier 和相关的机器人软 件工具包,正式布局智能机器人领域。
2019-2022 年,英伟达从底层芯片、到计算平台、到训练与验证,开启智能机器 人领域的全方位布局。2019 年,英伟达推出 lsaac 软性开发套件 (SDK),为机器 人提供更新的 AI 感知和仿真功能;2021 年,英伟达推出 Omniverse 平台,支持 机器人的协作和模拟,其中 Omniverse Avatar 可生成交互式人工智能化身,对协 作机器人影响深远。2022 年,英伟达推出 Isaac Nova Orin,其配置的计算和传感 器参考平台旨在帮助 AMR (自主移动机器人) 制造商缩短开发时间并降低成本。
2023 年,“生成式 AI+机器人”成为 NVIDIA 机器人全线产品技术演进和重塑 的核心方向。 (1) 2023 年 5 月,英伟达发布全新 Jetson AGX Orin 工业级模块。该模块在极其恶 劣的环境下可以提供更高的服务器性能级别的计算能力, “服务器性能级别” 意味着在嵌入式 s 的端侧/边缘侧也能部署 AI 并让传感器融合算法;“极其恶 劣的环境”意味着智能机器人在农业/建筑/能源/航空抗体/卫星等极端环境领 域的应用存在可能性。 (2) 2023 年 10 月,英伟达宣布对 Jetson 平台上的 Metropolis 和 Isaac 框架进行有 史以来规模最大的软件扩展,用以来满足边缘 AI的快速部署需求。与此同时, 英伟达还宣布创建 Jetson生成式 AI 实验室,供开发者学习和利用开源生成式 AI 模型进行开发。另外,英伟达宣布推出 Isaac ROS 和 Isaac Sim 软件的全新 版本,对感知和仿真功能进行了重大改进,这次改进同样还是与 AI高度相关。 整体来看,英伟达在机器人领域的芯片技术和工具领域有几个重要的迭代方向, 分别是增强性能、模块化布局、降低使用门槛。
2 正式成立 GEAR 实验室,引领具身智能浪潮
2.1 具身智能为 AI 新一波浪潮,英伟达已有深度布局
具身智能 (Embodied AI) 被认为是人工智能的下一波浪潮。具身智能是指一种基 于物理身体进行感知和行动的智能系统,其通过智能体与环境的交互获取信息、 理解问题、做出决策并实现行动,从而产生智能行为和适应性。在 ITF World 2023 大会上,英伟达创始人黄仁勋表示,人工智能的下一个浪潮是具身智能 (Embodied AI),这种智能系统能够理解、推理并与物理世界交互,并举例机器人、 自动驾驶汽车,包括因为理解物理世界而变得更加聪明的聊天机器人。
具身智能有感知、理解和交互三个主要特征。(1) 感知:指具身智能设备可以通 过各种传感器感知周围环境中的物体/声音/光线等信息,并将其转化为数字信号 进行处理;(2) 理解:是指具身智能设备可以通过各种算法对感知到的信息进行 分析和解释,并生成相应的语义表示或知识图谱;(3) 交互:是指具身智能设备可以通过语音/图像/动作等方式与人类或其他设备进行沟通和协作,并根据反馈 进行自适应和学习。 具身智能借助具有泛化能力的 LLM/VLM/VLA 等模型,赋能人形机器人大脑。 具身智能的目标是让具有感知和行动能力的智能体(如人形机器人),在与环境 的交互中持续演进,逐渐产生认知能力,能够理解、推理、学习、规划和决策, 甚至具备常识和情感,从而实现更复杂的功能。具身智能的“头脑”通常由深度 神经网络模型驱动,结合 LLM/VLM/VLA 等模型,赋予了强大的泛化能力,使 得机器人从程序执行导向转向任务目标导向,不再受限于特定的程序执行,而能 够根据任务目标智能地采取行动,从丰富的数据和任务中学习决策和控制,它们 不断演化以适应更复杂的任务和环境。
NVIDIA 在具身智能领域不断进行深度布局,以下是现阶段最显著的四项成果:
在智能体接口上:2022 年 10 月,英伟达发布基于 Transformer 架构的支持多 模形态的(仿真)智能体 VIMA。VIMA能像 GPT-4一样接受 Prompt输入, 而且输入可以是多模态的(文本、图像、视频或它们的混合),然后输出动 作,完成指定任务。该项目为研究自然语言理解任务传达给智能体提供了一 种便捷灵活的接口,并提出了一种新的多模态 prompting 形式,将各种各样 的机器人操作任务转换为一个序列建模问题。
在智能体架构上:2022 年 11 月 22 日,英伟达发布具有互联网规模知识的开 放式具身智能体——MinDojo。MineDojo 是一个建立在流行的 Minecraft 游 戏之上的新框架,用于具身代理研究。该模型构建了具身智能体最关键的三个要素:一是支持多种任务和目标的环境,二是大规模的多模态知识数据库, 三是灵活且可扩展的智能体架构。
在智能体自主学习上:2023 年 5 月 25 日,英伟达发布 VOYAGER 智能体, 这是第一个由 LLM 驱动的可以终身学习的智能体,可以在《我的世界》中 驱动探索,掌握广泛的技能,并在没有人类干预的情况下不断地做出新的发 现。 其可以最大限度地探索自动化项目,并拥有可以不断存储和检索复杂 行为的技能库,为具身控制生成可执行代码。
在智能体机器训练上:2023 年 10 月 20 日,英伟达发布了 Eureka 智能机器 人训练工具。Eureka 的全称是 Evolution-driven Universal Reward Kit for Agent, 本质是一种由大模型驱动的算法生成工具。借助 GPT-4 写代码的能力, Eureka拥有了出色的奖励函数设计能力,可以自主编写奖励算法来训练机器 人。Eureka生成的奖励程序在超过 80%的任务上优于专家编写的奖励程序。 这使得机器人的平均性能提高了 50%以上。
对外投资方面,NVIDIA 积极投资具身智能机器人本体厂商 Figure AI。Figure 公 司成立于 2022 年,公司团队包括来自 IHMC、波士顿动力和特斯拉的机器人专 家。2024 年 2 月 29 日 (北美时间),Figure 公司通过 X 平台宣布已从英伟达 /OpenAI/微软/亚马逊等巨头筹集合计约 6.75 亿美元,公司估值达 26 亿美元。同 时,Figure 宣布与 OpenAI 展开深度合作,开发新一代的人形机器人专用 AI 模型, 还将使用微软的 Azure 云服务搭建人工智能基础设施和存储数据等。
Figure AI 持续推动具身智能进展,AI+机器人进展顺利。2023 年 10 月, Figure 发布了代号为 Figure 01 的首款人形机器人,Figure 01 的设计主要用于搬运重物 等以最终解决美国劳动力短缺的问题;2024 年 1 月,Figure 01 更新最新进展,仅 需 10 小时的端到端训练,通过观看人类的示范视频就能学会并完全自主搞定煮 咖啡任务,还具备自主纠错和动作优化等功能。
2024 年 3 月,Figure 通过 X 平台更新 Figure 01 的最新进展,机器人在视觉识别/ 推理能力/命令执行等方面均有明显进展。(1) 视觉识别:在陈述周边环境时, Figure 01 可具体描述苹果/盘子/桌边人的位置、姿态、颜色等多维度信息;(2) 推 理能力:在接受人类想吃东西的指令后,Figure 01 从面前诸多物品中挑选出苹果 并送出,并做出合理解释,可自主思考后并整齐放置餐具;(3) 命令执行:在收拾物品过程中,Figure 01 灵巧手可快速抓取并整理苹果/餐碟杯等不同形状的物 品,动作轻巧灵敏。另外,视频为 1.0x 倍速拍摄,体现机器人在反应速度/语态/ 动作等方面已做到高度类人化。 此视频为 Figure公布与 OpenAI合作之后仅 10天 (视频拍摄日期为 3 月 9日) 的阶段性进展,体现现阶段 AI 已对机器人提供了较高 程度的赋能。
2.2 英伟达成立 GEAR 实验室,研究围绕四大关键领域
2024 年 2 月,英伟达成立通用具身智能体研究 GEAR (Generalist Embodied Agent Research) 团队。GEAR 团队将由 AI 高级研究科学家,AI 代理计划的负责 人 Jim Fan 和 Yuke Zhu 教授领导,目标是在虚拟和现实世界中建立具身智能体基 础模型,致力于实现跨多模态、多场景的智能应用。GEAR 有足够的资金一次性 解决机器人基础模型、游戏基础模型和生成式模拟。英伟达 GEAR 实验室的成立, 旨在推动大模型等人工智能技术进一步由虚拟世界向现实世界发展,通过机器人 等载体实现人工智能与物理世界的交互,加速感知智能时代的到来。
GEAR 团队的成立表明英伟达先进 AI 和自主系统领域积极抢占技术和应用的制 高点,未来 GEAR 的研究工作将主要围绕四个关键领域开展: 多模态基础模型:开发基于大规模互联网数据源训练的 LLMs(大型语言模 型),用于规划与推理,视觉-语言模型以及世界模型,旨在打通不同模态 信息间的壁垒; 通用型机器人研究:研发能够适应复杂环境、实现稳健移动与灵巧操作的 机器人模型与系统,以提升其在各类实际场景下的普适性与效能; 虚拟世界中的基础智能体:创建能够在多种游戏与模拟环境中自主探索并 持续自我提升能力的大型动作模型,为虚拟世界的智能交互设定新标准; 模拟与合成数据技术:构建大规模学习所需的仿真基础设施及合成数据流 水线,为智能体的学习过程提供有力支持。
3. GTC推出 GR00T模型,构筑机器人底层开发生态
GTC 2024 见证 AI+机器人的最前沿升级。2024 年 3 月 18 日-21 日,NVIDIA 在 圣何塞会议中心举办 GTC 2024 大会,也是英伟达近 5 年来的首届线下 GTC。(1) 从参会嘉宾来看,谷歌 DeepMind 机器人技术高级总监、OpenAI 首席运营官、波 士顿动力首席技术官、斯坦福李飞飞博士、xAI 联合创始人等机器人行业先进企业的领导人悉数出席。(2) 从展示产品来看,众多全球机器人领先公司将展示最 新机器人产品,谷歌 DeepMind、波士顿动力、Agility Robotics、迪士尼等公司将 在现场展出 25 款机器人,包括人形机器人、工业机械手等。
英伟达重磅推出人形机器人 GR00T 通用模型。2024 年 3 月 19 日 (北京时间),英 伟达 CEO 黄仁勋在 GTC 2024 大会上重磅推出人形机器人通用基础模型 Project GR00T。GR00T 全称是“Generalist Robot 00 Technology”,旨在进一步推动其在 机器人和具身智能方面的突破。 GR00T 驱动的机器人将能够理解自然语言,并 通过观察人类行为来模仿动作,以便导航、适应现实世界并与之互动。同时英伟 达也宣布,正为领先的人形机器人公司开发综合 AI 模型,海外公司包括 Figure AI/1X Technologies/Agility Robotics/Apptronik/ Sanctuary AI/波士顿动力等,国内 公司包括傅利叶智能/宇树科技/小鹏鹏行等。
英伟达正在构建 IAI/Omniverse/ISAAC 三大平台,全方面赋能机器人智能化。 IAI/Omniverse/ISAAC 三大平台均与机器人产业高度关联,其中 IAI 搭载 DGX 系 列产品,用于模拟物理世界;Omnivese搭载 RTX和 OVX系列产品,用于驱动数 字孪生的计算系统; ISAAC搭载AGX系列,用于驱动人工智能机器人。此次GTC 大会上,英伟达发布了配套 GR00T 项目的新型人形机器人计算机 Jetson Thor, 以及对 Isaac Lab 进行了重大更新。
(1) Jetson Thor 计算机:在 GTC 2024 上,英伟达 CEO 黄仁勋还推出了新型人形 机器人计算机平台 Jetson Thor。Jetson Thor 是一款专为运行模拟工作流程、 生成人工智能模型等人形外形而设计的新型计算机。该平台的设计基于 NVIDIA Thor 系统级芯片 (SoC),由 Thor 系统级芯片提供动力,将成为人形 机器人的大脑。Jetson Thor 芯片带有 Transformer Engine 的新一代 GPU,其采 用 NVIDIA Blackwell 架构,可提供每秒 800 万亿次 8 位浮点运算 AI 性能, 以运行 GR00T 等多模态模型。
(2) Issac Lab 平台: 在 GTC 2024 大会上,黄仁勋还宣布将对 Isaac 机器人平台进 行重大更新,用于为在任何环境中的任何机器人创建新的基础模型,平台工具包括用于强化学习的 Isaac Lab 和用于计算编排服务的 OSMO。训练具身智 能模型需要海量的真实数据和合成数据。新的 Isaac Lab 是一个 GPU 加速、 性能优化的轻量级应用,基于 Isaac Sim 而构建,专门用于运行数千个用于机 器人学习的并行仿真。为了扩展异构计算的机器人开发工作负载,OSMO 在 分布式环境中协调数据生成、模型训练和软硬件在环工作流。伴随着 Isaac的 更新,英伟达还发布 Isaac Manipulator (机械臂加速库) 和 Isaac Preceptor (感知 能力软件库) 等一系列机器人预训练模型、库和参考硬件。
英伟达将机器人与 AI 放在同一战略高度。在大会收场阶段,黄仁勋还和使用英 伟达软硬件平台开发的 9 款人形机器人共同登台,并且黄仁勋还亲自介绍了迪士 尼 BDX机器人,BDX机器人由 Jetsons系统提供动力,通过 Issac Sim学习走路, 并现场进行快速行走/蹲下起身/语音交互等。在黄仁勋的总结材料中,机器人事 业部被放在了与 Blackwell GPU/AI Foundry/NIM 等并列的位置,体现机器人业务 在英伟达未来商业版图中十分重要的战略地位。
在 GTC 2024 的机器人专题论坛中,波士顿动力的首席技术官 Aaron Saunders 将 主题聚焦“如何有效地将 AI 技术与现实世界中的机器人相结合”,展开深入探讨。 在机器人技术领域,波士顿动力公司的 SPOT 机器人在设计上针对高级别用户允 许全程控制,即用户只需告诉 Spot 目的地,它便能独立计算出如何到达。 波士顿动力和英伟达强强联手,宣布合作推出 SPOT RL Researcher Kit 产品。 尽管 SPOT 机器人车队在商业部署上规模庞大。但当前版本的 Spot并未完全适配 广泛的机器人研究需求。这一局限性源于波士顿动力公司尚未向开发者社区开放 对 SPOT 机器人关节的访问权限,因而限制了深入研究四足移动性的可能性,导 致研究者们不得不转向其他开放性更强、支持自由实验的平台。在 GTC 2024 大 会上,波士顿动力和英伟达宣布联手推出 SPOT RL Researcher Kit 产品, 该研究 工具包包含了关节级控制 API、英伟达 Jetson AGX Orin 有效载荷以及基于英伟达 Isaac Lab 构建的仿真环境,预计该套件计划在 2024 年晚些时候正式推出。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
相关报告
智能机器人行业专题报告:NVIDIA加码机器人赛道,引领具身智能浪潮.pdf
2924年智能机器人行业技术产业发展白皮书.pdf
智能机器人行业技术产业发展白皮书(2023版).pdf
机器人行业专题分析:为什么智能机器人需要力控?.pdf
2023闵行智能机器人产业发展白皮书.pdf
柔性传感器在智能机器人和脑机接口应用前瞻分析.pdf