2024计算机行业报告:英伟达业绩超预期与华为算力崛起

1.本周热点:英伟达业绩大超预期,华为国产算力崛起

英伟达Q1业绩大超预期。Q1营收为260.44亿美元,超出市场预期的246.5亿美元同比增长262%,环比增长18%。净利润则达到了148.81亿美元,同比大幅增长628%。财报发出后,英伟达股价再度大涨,截至周五涨幅达12%,股价达到1064.69美元,市值也达到2.62万亿美元。英伟达业绩大超预期的核心因素在于Hopper架构的供不应求。

Blackwell出货时间超预期:在英伟达电话会议上,科莱特·克雷斯(Colette Kress)称,H200和Blackwell芯片都供不应求,这样的状态可能会维持到2025年。英伟达CEO黄仁勋宣布:“Blackwell已经生产一段时间了,我们将在Q2开始出货,Q3逐步增产,Q4投放到数据中心。所以今年会看到很多来自Blackwell芯片的收入。”此外,本周5月24日路透社消息,英伟达下调供应中国市场的H20 AI芯片价。

华为领衔演绎国产生态崛起:算力方面,我们认为昇腾910芯片单卡算力已经可以与英伟达A100相媲美。算法层面,目前CANN已经兼容主流学习框架。在近期中国移动智算中心近期191亿元的招标中,根据福布斯中国消息,均为华为服务器的代理商。因此我们认为2024年昇腾引领国产算力全面加速。

2.本周热点内容

2.1.英伟达Q1业绩大超预期

英伟达Q1业绩大超预期:本周三,英伟达2025财年第一财季财报。其营收为260.44亿美元,超出市场预期的246.5亿美元,同比增长262%,环比增长18%。净利润则达148.81亿美元,同比大幅增长628%。财报发出后,英伟达股价再度大涨,截至周五涨幅达12%,股价达到1064.69美元,市值也达到2.62万亿美元,年初至今股价涨幅超115%。该公司对下一财报季的预期也非常乐观,预计第二财季收入约为280亿美元,上下浮动2%,强于分析师预期的218亿美元。GAAP和非GAAP毛利率预计分别为74.8%和75.5%,上下浮动50个基点。在备受关注的数据中心方面,一季度收入创下226亿美元的纪录,较上一季度增长23%,较去年同期增长427%。

一季度超预期的核心因素在于Hoopper架构的供不应求:在发布财报后的电话会上,英伟达首席财务官科莱特·克雷斯(Colette Kress)指出,第一财季数据中心业务的增长源自H100这样的Hopper架构的GPU芯片出货增加。她以Meta(美国互联网公司)推出Llama-3开源大模型为例,这一AI大模型使用了2.4万个H100GPU,称“由于CUDA算法的创新,我们已经能够将H100的LLM推理加速3倍,这可以转化为成本降低3倍,为像Llama 3这样的热门模型提供服务。”

算力云服务受益较大:此外,英伟达首席财务官科莱特·克雷斯,每花费1美元采购英伟达人工智能基础设施,云提供商在未来四年内就有机会通过提供算力服务(GAAS)赚取5美元收入。并且透露,目前大型云服务提供商大概占英伟达数据中心收入的45%,即云厂商是现在买英伟达芯片的主力。

目前公司的客户包括OpenAI、Anthropic、DeepMind、xAI、Cohere、Meta和Mistral等知名人工智能公司。

游戏和AIPC方面:公司第一季度游戏收入为26亿美元,较上一季度下降8%,较去年同期增长18%。公司在GDC(游戏开发者大会)上,介绍了用于NVIDIA ACE 和神经图形的全新AI 游戏技术;推出面向Windows 的全新AI性能优化和集成,可在NVIDIA GeForce RTX AI PC 和工作站上实现最佳性能;宣布将集成RTX 技术的多款重磅游戏,包括《星球大战:亡命之徒》(Star Wars Outlaws) 和《黑神话:悟空》(Black Myth: Wukong);我们判断未来有望受益于AIPC的爆发;在专业视觉方面,第一季度收入为4.27亿美元,较上一季度下降8%,较去年同期增长45%。公司在一季度推出针对AI 增强型工作流的NVIDIA RTX™500 和1000 Ada Generation 笔记本电脑GPU;推出用于桌面工作站的NVIDIA RTX A400 和A1000 GPU,这两款GPU 均基于NVIDIA Ampere 架构,可将AI 引入设计和生产力工作流;

在汽车和机器人方面,第一季度汽车收入为3.29亿美元,较上一季度增长17%,较去年同期增长11%。公司已经宣布比亚迪、小鹏汽车、广汽埃安昊铂、Nuro 等公司采用搭载Blackwell GPU 架构的下一代NVIDIA DRIVE Thor™平台,为其下一代乘用和商用电动汽车车队提供助力;同时公司一季度已经对发布Project GR00T 人形机器人基础模型和Isaac 机器人平台重大更新。

此外,英伟达在财报中也宣布了拆股计划。从6月10日开始,该公司将完成股票的1拆10,截至6月6日收盘之前在册的股东,每份普通股可获得额外9股。英伟达还将股息按拆股后提高150%至每股0.01美元,支付给6月11日之前在册的股东。

2.1.1.Blackwell出货速度大超预期,Q2开始出货

Blackwell出货速度大超预期,目前依旧供不应求:在英伟达电话会议上,科莱特·克雷斯(Colette Kress)称,H200和Blackwell芯片都供不应求,这样的状态可能会维持到2025年。公司透露,英伟达在Q1开始对H200进行取样,目前正在生产中,预计在Q2发货。与此同时,Blackwell正在全面生产。随后,英伟达CEO黄仁勋宣布:“Blackwell已经生产一段时间了,我们将在Q2开始出货,Q3逐步增产,Q4投放到数据中心。所以今年会看到很多来自Blackwell芯片的收入。”并且宣布,在Blackwell之后,预计一年时间,会再推出另一款芯片,表示投资者可以指望英伟达以非常快的节奏拥有新的网络技术。

公司于一季度正式发布Blackwell架构:在北京时间3月19日凌晨4点,黄仁勋在英伟达GTC大会上正式宣布,英伟达发布Blackwell架构。根据机器之心消息,Blackwell的发布意味着近八年来,AI算力增长了一千倍。Blackwell在数万亿参数上构建和运行实时生成式AI大型语言模型的成本和能耗降低到此前的1/25 。具体来讲,采用Blackwell 架构的GPU 分为了B200 和GB200 产品系列,后者集成了1 个Grace CPU 和2 个B200 GPU。其中B200 GPU 通过2080 亿个晶体管提供高达20 petaflops 的FP4 吞吐量。而GB200 GPU 通过900GB / 秒的超低功耗芯片到芯片连接,将两个B200 GPU 连接到1 个Grace CPU 上

Blackwell性能较佳:Blackwell 在单芯片训练方面的FP8 性能是其上一代架构的2.5 倍,在推理方面的FP4 性能是其上一代架构的5 倍,它具有第五代NVLink 互连,速度是Hopper 的两倍,并且可扩展至576 个GPU。从整机的解决方案来说,可以简单将英伟达的Blackwell产品分为三类:英伟达HGX B100、HGX B200、DGXGB200。其中HGX B100和HGXB200 是配备了B100 GPU和B200 GPU的单基板,其参数性能如下。

Blackwell NV 72/36是重磅嘉宾。基于Blackwell 的AI 算力将以名为DGX GB200 的完整服务器形态提供给用户,结合了36 颗NVIDIA Grace CPU 和72 块Blackwell GPU。这些超级芯片通过第五代NVLink 连接成一台超级计算机(后文称GB200 NVL72)。与相同数量的72个H100相比,GB200 NVL72的大模型推理性能可以提升30倍,并且成本和能耗只有前者的1/25。

2.1.2.英伟达H20价格下调

H20是中国地区的特供版本:据华尔街见闻去年11月10日报道,英伟达即将推出至少三款新的AI芯片,包括H20 SXM、PCIe L20 和PCIe L2,以替代被美国限制出口的H100。这三款芯片均基于Hopper GPU 架构。从型号来看,H20 应该是训练卡,而L20、L2 应该是推理卡,H20 基于最新的Hopper 架构,而L20、L2 则基于Ada 架构。从之前曝光的规格来看,H20內存容量96 GB,运行速度高达4.0 Tb/s,运算能力为296 TFLOPs,使用GH100芯片,性能密度(TFLOPs/Die size)仅为2.9。也就是说,H20的AI算力只有H100的不到15%。

根据IT之家今年2月3日消息,英伟达专为中国市场设计的AI芯片H20 系列已经开始接受经销商的预购,定价几乎与国产的华为Ascend 910B 一致。据其援引路透社报道,英伟达在此报道时间附近几周将H20 的中国渠道定价设定在12000~15000 美元之间。同时,一些分销商开始对这款芯片进行大幅加价,部分渠道商的报价最高达到了约11万元,而华为昇腾910B 约为12万元左右。

目前,英伟达下调供应中国市场的H20 AI芯片价。据路透社消息,英伟达下调供应中国市场的H20人工智能芯片价格。此次,H20芯片的售价比华为Ascend 910B低10%以上。中国服务器经销商正在以每组约人民币10万元的价格销售H20芯片,搭载八组芯片的服务器每台售价约介于人民币110万元~130万元。

2.2.华为领先演绎国产生态崛起

美国限制高端芯片流入中国,自主可控势在必行:根据新浪新闻报道,在2023年10月17日,拜登政府更新了针对AI芯片的出口管制规定,计划阻止英伟达等公司向中国出口先进的AI芯片。英伟达包括A800和H800在内的芯片对华出口都将受到影响,这些限制还将影响AMD和英特尔等公司向中国销售的芯片,包括应用材料公司、泛林集团和KLA等芯片设备厂商也受牵连。

华为生态已经崛起:根据IT之家报道,在2024年5月举办的第二届昇腾AI 开发者峰会中,华为ICT Marketing 总裁周军在致辞中表示,目前已有200 多款基于昇腾的AI 硬件产品进入到各行各业。300 多万开发者和1600 多家行业伙伴相聚昇腾AI 生态,共同孵化了2900 多个行业AI 解决方案。

算力方面:昇腾910 和昇腾310 两款AI 芯片均使用华为的达芬奇架构,每个AI 核心可以在1 个周期内完成4096 次MAC 计算,集成了张量、矢量、标量等多种运算单元,支持多种混合精度计算,支持训练及推理两种场景的数据精度运算。参数方面,我们认为昇腾910芯片单卡算力已经可以与英伟达A100相媲美。

计算平台已经实现从零到一突破,支持主流算法:Pytorch与Tensorflow依旧是大模型的主要深度学习框架,值得关注的重要边际变化是,华为官方发布消息称,PyTorch社区正式发布2.1版本,经过PyTorch社区与昇腾的持续合作和共同努力,Pytorch 2.1版本已同步支持昇腾NPU,意味着开发者可直接在PyTorch 2.1上基于昇腾进行模型开发。此外,第三方开源社区也是CANN生态重要参与者,根据清华官网及博客消息,目前Jittor(清华开源学习框架)、飞桨Paddle FastDeploy已支持接入CANN。

2024计算机行业报告:英伟达业绩超预期与华为算力崛起

本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。


上一篇

2024棉花行业分析报告:新疆种植与市场展望

2024-05-31
下一篇

2024医药生物行业报告:政策利好驱动市场持续上行

2024-05-31