"2024年中国AI芯片行业发展跟踪报告"
1、国产AI芯片先行者,产品技术国内领先
1.1专注人工智能芯片领域,注重研发构筑护城河
我国稀缺的AI算力芯片厂商。寒武纪成立于2016年,自成立以来一直专注于人工智能芯片产品的研发与技术创新,致力于打造人工智能领域的核心处理器芯片。公司的主营业务是各类云服务器、边缘计算设备、终端设备中人工智能核心芯片的研发、设计和销售,主要产品为云端智能芯片及加速卡、训练整机、边缘智能芯片及加速卡、终端智能处理器IP以及上述产品的配套软件开发平台。随着人工智能市场需求潜力逐步释放,通用型人工智能芯片未来将成为该市场的主流产品。
公司全面系统掌握了通用型智能芯片及其基础系统软件研发和产品化核心技术。公司能提供云边端一体、软硬件协同、训练推理融合、具备统一生态的系列化智能芯片产品和平台化基础系统软件。通用型智能芯片及其基础系统软件的研发需要全面掌握核心芯片与系统软件的大量关键技术,技术难度大、涉及方向广,其中处理器微架构与指令集两大类技术属于最底层的核心技术。
公司在智能芯片领域掌握了智能处理器微架构、智能处理器指令集、SoC芯片设计、处理器芯片功能验证、先进工艺物理设计、芯片封装设计与量产测试、硬件系统设计等七大类核心技术;在基础系统软件技术领域掌握了编程框架适配与优化、智能芯片编程语言、智能芯片编译器、智能芯片高性能数学库、智能芯片虚拟化软件、智能芯片核心驱动、云边端一体化开发环境等七大类核心技术。
云端智能芯片及加速卡是云服务器、数据中心等进行人工智能处理的核心器件,其主要作用是为云计算和数据中心场景下的人工智能应用程序提供高性能、高计算密度、高能效的硬件计算资源,支撑该类场景下复杂度和数据吞吐量高速增长的人工智能处理任务。得益于公司领先的智能处理器架构技术以及成熟的芯片设计能力,云端智能芯片产品具有卓越的性能和能效,可覆盖视觉处理、语音处理、自然语言处理、推荐系统搜索引擎及传统机器学习等多样化应用领域,支持人工智能推理和训练任务,为云计算与数据中心场景的行业客户和互联网客户提供高效可靠的产品。公司于2018年推出了中国首款高峰值云端智能芯片思元100,之后通过技术创新和设计优化,相继推出思元270和思元290,芯片架构针对人工智能应用及各类算法进行了优化,持续提升产品的性能、能效和易用性。
公司已量产的云端智能芯片及加速卡产品可提供从30TOPS到128TOPS的单加速卡单芯片计算能力。浪潮、联想、新华三等厂商与公司开展密切合作,可为客户提供一机双卡、一机四卡、一机八卡等不同配置的服务器产品,单台服务器的人工智能计算能力最高可达1,024TOPS。在云计算数据中心场景下,可由多台服务器组成智能计算集群,为客户提供更高的人工智能计算能力。公司为云边端全系列智能芯片与处理器产品提供统一的平台级基础系统软件Cambricon Neuware(含软件开发工具链等),打破了不同场景之间的软件开发壁垒,兼具高性能、灵活性和可扩展性的优势,无须繁琐的移植即可让同一人工智能应用程序便捷高效地运行在公司云边端系列化芯片与处理器产品之上。
在Cambricon Neuware的支持下,程序员可实现跨云边端硬件平台的人工智能应用开发,以“一处开发、处处运行”的模式大幅提升人工智能应用在不同硬件平台的开发效率和部署速度,同时也使云边端异构硬件资源的统一管理、调度和协同计算成为可能。Cambricon Neuware 是公司打造云边端统一的人工智能开发生态的核心部件。公司自有的云端智能芯片加速卡是服务器集群核心智能计算能力的来源;公司将加速卡集成到配套服务器及相关系统中,并根据实际应用场景需求配置相应的基础系统软件与开发工具,最终形成智能计算集群系统交付客户验收。
1.2创始人学术背景强大,技术实力深厚
寒武纪于2020年在科创板上市。截至2024年3月31日,中国科学院计算机技术研究所全资子公司北京中科算源资产管理有限公司持有寒武纪15.76%的股权。寒武纪创始人、董事长、实际控制人陈天石博士:曾就读于中国科学技术大学少年班,获中国科学技术大学计算机软件与理论专业博士学位,曾于中国科学院计算技术研究所任研究员(教授)和博士生导师。陈天石博士是人工智能芯片领域基础学术研究和商用产品研发的关键推动者之一,曾获国家自然科学奖二等奖、中国科学院杰出科技成就奖等荣誉。陈天石博士在人工智能和处理器芯片等相关领域从事基础科研工作十余年积累了坚实的理论功底和丰富的研发经验,曾获“中国科学院杰出科技成就奖”(2019年)、“北京市有突出贡献的科学技术管理人才”(2019年)、“上海市五一劳动奖章”(2019年)、“科技部科技创新创业人才”(2018年)、“央视年度科技创新人物”(2017年)、“上海市青年五四奖章”(2017年)等众多荣誉。
股权激励计划彰显企业信心。2023年11月公司公告股权激励计划,本激励计划拟向激励对象授予800万股限制性股票,约占激励计划草案公告时公司股本总额的1.92%,其中首次授予650万股,预留150万股。公司激励计划首次授予的激励对象总人数为715人,考核年度为2024-2026年,针对每个会计年度均设置清晰的考核目标。公司此次股权激励计划涉及范围较广,有助于增强内部整体信心。
1.3财务分析:23年亏损同比收窄,注重研发投入
2023年亏损同比收窄。2023年,公司凭借人工智能芯片产品的核心优势,拓展算力基础设施项目,深耕行业客户,实现营收7.09亿元,同比下滑2.70%;实现归母净利润-8.48亿元,同比亏损收窄。2024Q1实现营收0.26亿元,实现归母净利润-2.27亿元。智能计算集群系统业务营收持续增长。2023年公司的智能计算集群系统业务贡献收入6.05亿元,同比增长31.85%,主要系公司成功在沈阳、台州实施智能计算集群项目,保持了智能计算集群系统业务收入的持续增长。公司云端产品线目前包括云端智能芯片及加速卡和训练整机产品。受供应链影响,2023年云端产品线贡献收入0.91亿元,同比下降58.73%。
公司聚焦云端大算力AI芯片核心赛道,持续推动产品迭代,技术壁垒不断巩固。公司2023年毛利率为69.16%,同比增长3.40pct;2024Q1毛利率为57.61%。公司研发费用率仍维持相对高位,2023年和2024Q1研发费用分别为11.18亿元和1.70亿元,研发费用率为158.53%和660.83%。
2、全球AI芯片空间广阔,美国制裁有望持续提升中国AI芯片份额
2.1全球AI芯片空间广阔
全球:算力军备竞赛持续,AMD看27年AI芯片市场规模4000亿美元。AMD CEO Lisa SU在23年12月7日宣布将2027年AI芯片市场1500亿美元的规模上调到4000亿美元。计算系统要满足行业AI场景的复杂巨大且多样性的计算需求,从2012年开始的6年中,AI计算的需求增加了30万倍,远远超过了摩尔定律的增长速度。
英伟达公布未来3年路线图,Blackwell已开始投产。2024年6月2日晚间,台北国际电脑展(COMPUTEX)开幕前夕,英伟达联合创始人兼首席执行官黄仁勋在台湾大学综合体育馆发表主题演讲,分享了人工智能时代如何助推全球新产业革命。黄仁勋公开展示英伟达目前最强性能产品GB200主板。这块主板搭载两颗Blackwell B200 GPU芯片、一颗Grauce CPU芯片,通过其互联技术组合为一体。该产品首次亮相是在今年3月份的英伟达GTC大会上。据英伟达2024年3月宣称,训练一个1.8万亿个参数的模型以前需要8000个Hopper GPU和15兆瓦的电力。如今,2000个Blackwell GPU就能完成这项工作,耗电量仅为4兆瓦。在具有1750亿个参数的GPT-3 LLM基准测试中,GB200的性能是H100的7倍,而英伟达称其训练速度是H100的4倍。
Blackwell全面投产,八年间算力增长1000倍。黄仁勋认为,随着CPU扩展速度放缓,最终会基本停止,然而需要处理的数据继续呈指数级增长,最终导致计算膨胀和计算成本的提升。而GPU将是改变这一切的关键。此外,黄仁勋还在这次演讲中介绍了英伟达一系列新产品服务的落地情况,包括帮助企业部署AI大模型的NIM云原生微服务、专为AI打造的新型以太网Spectrum-X,以及英伟达开发的机器人技术平台Isaac等等。
英伟达2025财年Q1实现营收260亿美元,环比增长18%,同比增长262%,远高于预期的240亿美元。其中数据中心营收226亿美元,创历史新高,环比增长23%,同比增长427%,主要得益于对NVIDIA Hopper GPU计算平台的持续强劲需求。英伟达2025财年Q2收入指引为280亿美元(±2%),GAAP和NON-GAAP毛利率为74.8%(±50pct)和75.5%(±50pct)。2025财年预计毛利率为75%左右。
国内:与海外相比,算力差距持续拉大。根据Omida数据,2023年微软或者meta一家的H100采购量已经超过国内BBAT。中国算力资源位居世界第二,仅次于美国,但算力利用效率并不高。其中有两个重要表现,一是数据中心上架率偏低,二是算力形态中云计算的占比也低。
2.2美政府对英伟达禁令加速国产替代
美政府对英伟达禁令加速国产替代。制裁持续加码,利好国产GPU厂。2022年8月26日,美国政府通知NVIDIA,美国政府对英伟达A100和即将推出的H100集成电路今后向中国(包括香港)和俄罗斯的任何出口提出了新的许可要求,立即生效。AMD收到类似通知暂停对中国区所有数据中心GPU卡MI100和MI200发货。2023年10月,路透独家报道称,美国将出台新规,进一步限制GPU出口中国,限制H800性能密度、通信速率等;同时,新规或将限制中国企业通过设在海外的子公司获得美国AI芯片的途径。2024年3月30日,美国商务部下属的工业与安全局(BIS)发布“实施额外出口管制”的新规措施,修订了BIS于2022、2023年10月制定的两次出口限制新规,全面限制英伟达、AMD以及更多更先进AI 芯片和半导体设备向中国销售。
2.3政府智算中心、运营商、互联网,各大下游需求增长
政府智算中心:2025智能算力超105EFLOPS。工业和信息化部等六部门2023年10月8日关于印发《算力基础设施高质量发展行动计划》的通知。2025年计算力方面,算力规模超过300EFLOPS,智能算力占比达到35%。运载力方面,国家枢纽节点数据中心集群间基本实现不高于理论时延1.5倍的直连网络传输,重点应用场所光传送网(OTN)覆盖率达到80%,骨干网、城域网全面支持IPv6,SRv6等新技术使用占比达到40%。存储力方面,存储总量超过1800EB,先进存储容量占比达到30%以上。应用赋能方面,围绕工业、金融、医疗、交通、能源、教育等重点领域,各打造30个以上应用标杆。
工业和信息化部等六部门2023年10月8日关于印发《算力基础设施高质量发展行动计划》的通知。《行动计划》中提到2023年智算中心数量为30个,2025年达到50个。根据IDC圈不完全统计,截至2023年底,全国带有“智算中心”的项目有129个,其中83个项目有规模披露,规模总和超过7.7万P,其中在建规模4.9万P。这些智算中心标准不一、规模各样,算力规模一般在50P、100P、500P、1000P、有的甚至达到12000P以上。
运营商:掘金“算力网络”。虽然三大运营商纷纷降低了2024年的资本开支金额,但他们均计划今年增加在AI基础设施等方面的投资。1)中国移动算力领域投入475亿元,同比增长21.5%,占资本开支比重提升5.8个百分点至27.5%;2)中国电信今年将在云/算力投资180亿元,智算规模超过21EFLOPS,同比增长超过10EFLOPS;3)中国联通固定资产投资预计约650亿元,算网数智投资坚持适度超前、加快布局。
中国移动:4月18日,中国移动发布2024年至2025年新型智算中心采购招标公告,该次项目采购总规模达到8054台。项目分为2个标包:标包1为7994台人工智能服务器及配套产品,中标人数量为5至7家;标包2为白盒交换机60台,中标人数量为1家。标包1:采购特定场景AI训练服务器7994台及配套产品,中标人数量为5至7家;若中标人数量为5家,中标份额依次为27.78%、22.22%、19.44%、16.67%、13.89%;若中标人数量为6家,中标份额依次为23.91%、19.57%、17.39%、15.22%、13.04%、10.87%;若中标人数量为7家,中标份额依次为21.05%、17.54%、15.79%、14.04%、12.28%、10.53%、8.77%。标包2:采购白盒交换机60台,中标人数量为1家,中标份额为100%。
中国联通:3月23日,中国联通总部人工智能服务器集采采购总规模为2503台人工智能服务器,688台关键组网设备RoCE交换机。中国联通公示了2024年人工智能服务器公开集采的结果,昆仑、宝德、虹信和长江4家入围。从4家中标候选人的中标情况看,该项目平均中标价约为20460万元(不含税)。其中,昆仑投标报价比平均中标价略高,斩获第一名;宝德的投标报价也高于平均中标价,获得第二名。虹信和长江分别获得第三名和第四名。中国电信:2023年10月13日,中国电信发布AI算力服务器集中采购项目中标候选人公示,共80亿元服务器大标,采购4175台AI服务器和1182台交换机,14家中标,AI智算布局加速。服务器采购已经是仅次于5G基站的第二大采购品类。中国电信AI算力服务器集中采购共计4个标包,标包1、2为I系列服务器,CPU采用Intel至强可扩展处理器,标包3、4为G系列服务器,CPU采用鲲鹏处理器。
3、寒武纪:壁垒深厚,未来可期
3.1云边端业务线协同发力,产品矩阵逐渐完善
公司是智能芯片领域全球知名的新兴公司,能提供云边端一体、软硬件协同、训练推理融合、具备统一生态的系列化智能芯片产品和平台化基础系统软件。公司掌握的智能处理器指令集、智能处理器微架构、智能芯片编程语言、智能芯片数学库等核心技术,具有壁垒高、研发难、应用广等特点。公司的主营业务是应用于各类云服务器、边缘计算设备、终端设备中人工智能核心芯片的研发、设计和销售,以及为客户提供丰富的芯片产品。目前,公司的主要产品线包括云端产品线、边缘产品线、IP授权及软件。自2016年3月成立以来,公司快速实现了技术的产业化输出,先后推出了用于终端场景的寒武纪1A、寒武纪1H、寒武纪1M系列智能处理器;基于思元100、思元270、思元290芯片和思元370的云端智能加速卡系列产品;基于思元220 芯片的边缘智能加速卡。其中,寒武纪智能处理器IP产品已集成于超过1亿台智能手机及其他智能终端设备中,思元系列产品也已应用于浪潮、联想等多家服务器厂商的产品中。思元220自发布以来,累计销量突破百万片。
云边端业务线协同发力。公司以云端芯片为业务核心,延伸至边缘产品线服务客户需求。基础系统软件平台打破不同场景之间的软件开发壁垒。智能计算集群系统业务核心算力来源是公司自研的云端智能芯片,聚焦人工智能技术在数据中心的应用,提供软硬件整体解决方案,以科学地配置和管理集群的软硬件、提升运行效率。
3.2掌握智能芯片和基础系统软件领域核心技术
从系统角度看人工智能领域,智能芯片是最底层的硬件物质载体,提供了充裕的智能计算能力;基础系统软件位于智能芯片和人工智能程序之间,向下管理、调用和控制智能芯片、向上支撑人工智能程序的开发和运行。在通用型智能芯片及基础系统软件之上,开发者可以研发各类人工智能算法、实现各类人工智能程序,最终实现机器视觉、语音处理、自然语言处理以及推荐系统等多样化的人工智能功能。公司全面系统掌握了通用型智能芯片及其基础系统软件研发和产品化核心技术,能提供云边端一体、软硬件协同、训练推理融合、具备统一生态的系列化智能芯片产品和平台化基础系统软件。公司不直接从事人工智能最终应用产品的开发和销售,但对各类人工智能算法和应用场景有着深入的研究和理解,能面向市场需求研发和销售性能优越、能效出色、易于使用的智能芯片及配套系统软件产品,支撑客户便捷地开展智能算法基础研究、开发各类人工智能应用产品。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)