1. 公司概况:国产 CPU 及 DCU 领军企业
公司为国产通用处理器及协处理器的领军企业。公司成立于 2014 年,是国 内少数几家同时具备高端通用处理器(CPU)和协处理器(DCU)研发能力的集 成电路设计企业,专注于研发、设计和销售应用于服务器、工作站等计算、存储 设备中的高端处理器,建立了完善的高端处理器的研发环境和流程,产品性能逐 代提升,功能不断丰富。 通用处理器(CPU)产品性能强劲,产品线丰富,兼容 x86 指令集,生态优 势显著。公司 CPU 产品内置多个处理器核心,集成通用的高性能外设接口,拥有 完善的软硬件生态环境和完备的系统安全机制。针对不同应用场景对高端处理器 计算性能、功能、功耗等技术指标的要求,分别提供海光 7000 系列产品、5000 系列产品、3000 系列产品,其中海光 7000、5000 系列主要应用于服务器,海光 3000 系列主要应用于工作站和边缘计算服务器。目前公司 CPU 全系产品已迭代 至第三代(海光三号),产品性能提升显著,海光三号为公司 2023 年主力销售产 品,截至 23H1 海光四号、海光五号处于研发阶段。同时公司 CPU 系列产品兼容 x86 指令集及国际主流操作系统和应用软件,软硬件生态丰富,已广泛应用于电 信、金融、互联网、教育、交通等重要行业或领域。
协处理器(DCU)产品兼容“类 CUDA”环境,应用场景广泛。公司 DCU 产品以 GPGPU 架构为基础,内置大量运算核心,具有较强的并行计算能力和较 高的能效比,适用于向量计算和矩阵计算等计算密集型应用。目前公司 DCU 产品 为 8000 系列,截至 23H1,8000 系列第一代产品深算一号已实现量产销售,深 算二号即将发布,深算三号研发进展顺利。同时公司 DCU 产品兼容 ROCm GPU 计算生态,能够较好地适配国际主流商业计算软件和人工智能软件,可广泛应用 于大数据处理、AI、商业计算等计算密集类应用领域,主要部署在服务器集群或 数据中心。
1.1. 股权结构:与 AMD 共同成立子公司,获 x86 技术授权
公司与 AMD 建立子公司海光微电子和海光集成以实现 x86 技术授权。公司 无控股股东、实际控制人,2018 年以来公司前两大股东分别为中科曙光和成都国 资(含成都产投有限、成都高投有限及成都集萃有限,系一致行动人),两者持股比例分别为 27.96%和 17.00%,股权结构较为稳定清晰。2016 年和 2017 年,海 光微电子、海光集成分别与 AMD 签署了《技术许可协议》,约定了 AMD 将高端 处理器相关技术及软件许可给两家合资公司。AMD 按照协议约定向海光微电子、 海光集成交付了相关知识产权,海光微电子、海光集成依照协议约定向 AMD 支 付了相关费用,不存在知识产权方面的纠纷及潜在纠纷。
公司多名董事、高管及核心技术人员拥有在中科曙光、AMD、Intel 任职经历, 其研发和管理经验能够为公司的发展提供稳定支撑。高素质的研发团队是公司核 心竞争力的重要组成部分,截至 1H23,公司研发技术人员 1,382 人,占员工总人 数的 90.33%,多数核心研发人员具有二十年以上高端处理器研发经验,骨干研发 人员拥有成功研发 x86 处理器或 ARM 处理器的经验,为公司自研芯片提供强有 力的技术支持。
1.2. 财务分析:营收规模快速增长,盈利能力持续提升
公司营业收入快速增长。2022 年,公司营业收入为 51.25 亿元,同比增速 121.83%,其增长主要受益于 1)产业发展以及众多行业对国产处理器需求的大 幅增加,促进了公司占据更大的市场份额;2)公司通过产品迭代、功能提升等 方法,不断提升产品竞争优势,公司 2022 年推出海光三号并实现量产,产品线 不断丰富,满足客户需求。 2021年公司实现扭亏为盈,2022年归母净利润大幅提升。公司2018年-2020 年出现连续亏损,主要原因为公司产品上市初期营业收入规模相对较小,公司设 立以来研发资金投入较大,对骨干员工实施了多次股权激励并相应确认了较大金 额的股份支付。2021 年公司自设立以来首次实现盈利,主要原因是市场需求增加 较快,以及公司DCU产品实现规模销售。2022年归母净利润同比增长145.65%, 主要系收入增长,同时利息收入和政府补贴增加所致。
公司营收结构逐步多元化,下游应用领域广阔。公司最初产品以高端服务器 产品 7000 系列为主,近年面向中端服务器市场的 5000 系列、面向工作站市场的 3000 系列同样开始快速放量贡献营收。在 2021 年,公司 8000 系列深算一号实 现销售,公司营收结构进一步多元化。在下游应用领域方面,2019 年,公司互联 网、电信行业市场推广初见成效,基于前期电信、金融、互联网等终端领域对公 司产品的测试和认可,2020 年公司实现了电信运营商集采、金融行业入围等市场 突破,市场需求旺盛,产品主要用于电信运营商云服务资源池系统支撑云业务, 银行和证券公司查询、交易系统,互联网的搜索、计算服务、存储等应用。公司 同年进入专项目录,党政等终端领域市场需求快速增长。
公司毛利率稳中有升,1H23 实现 62.87%的较高水平。2019 年-2021 年, 公司毛利率从 37.31%增长到 55.95%,总体呈现逐步增长的趋势,主要原因为公 司早期阶段业务规模较小,自研无形资产摊销金额占营业收入的比例较高,拉高 了产品的单位成本,后续随着公司产品大规模放量,公司毛利率逐步稳定。2022 年公司毛利率为 52.42%,较 2021 年降低 3.5pcts,主要系 22 年封装测试成本上 涨所致。与同业公司相比,公司 22 年及以前毛利率与国产 CPU 龙头龙芯中科基 本相当,1H23 毛利率大幅超越龙芯中科并向国内 AI 芯片龙头寒武纪靠拢,我们 认为随着公司高毛利业务DCU产品占比的不断增加,公司毛利率有望持续提升。
公司费用率呈下降趋势,盈利能力持续改善,研发投入持续加强。由于公司 营业收入规模快速增长及运营效率提升,2022 年公司销售费用率下降至 1.58%, 管理费用率下降至 2.63%。2022 年公司研发总支出 20.67 亿元,研发投入率 40.33%,研发投入总量显著高于同业公司。截至 1H23,公司研发技术人员 1,382 人,占员工总人数的 90.33%,累积取得发明专利 550 项、实用新型专利 81 项、 外观设计专利 3 项、集成电路布图设计登记证书 200 项、软件著作权 206 项。
2. CPU:信创产业持续推动国产替代,公司有望充分受益
2.1. 全球 CPU 市场:Intel 与 AMD 双寡头格局,x86 生态占据话语权
CPU(Central Processing Unit)是计算机的运算和控制核心,是信息处理、 程序运行的最终执行单元,是计算机、服务器等设备的核心组成部件。由于宏观 经济压力导致的消费电子需求疲软,CPU 市场规模在 2022 年有所下降,根据 Gartner 数据,2022 年全球 PC 出货量达到 2.86 亿台,同比下降 16.2%。Canalys 通过对渠道伙伴 PC 库存调查得知,库存不足一周的渠道商自 23 年 1 月的 33% 增至 6 月的 41%,即 2Q23 库存情况进一步改善。在库存持续修正和季节性因素 影响下,3Q23 起 PC 市场有望逐渐开始复苏(据 Yole、Canalys)。
2.1.1. x86 为主流架构,具备显著生态优势
应用程序最终需要转化为“指令”才能在 CPU 上运行,所以采用的指令集 对于 CPU 的设计尤为重要。按照采用的指令集,CPU 可以分为复杂指令集(CISC) 和精简指令集(RISC)两大类。复杂指令集架构与精简指令集架构是基于两种不 同的指令集思路进行设计,这两种架构有着各自不同的特点:复杂指令集指令丰 富、寻址方式灵活,以微程序控制器为核心,指令长度可变,功能强大,复杂程 序执行效率高;精简指令集指令结构简单、易于设计,具有较高的执行能效比。
x86 架构拥有更高的软硬件成熟度,具备显著的生态优势。在操作系统领域, Windows 和 Linux 均兼容 x86 架构;在应用软件方面,得益于对独立软件开发商 的指令集开放与应用平台操作系统一致性,显著降低了技术开发门槛,使得 x86 架构下的软硬件环境的成熟度相较于其他架构具有明显优势;在指令集扩展方面, 主流 x86 CPU 扩展了 MMX、SSE、AVX、SIMD 等指令集,取得了巨大成功。 当下不论是在 PC 还是在服务器领域,x86 都是主流选择。根据 Mercury Research 数据,1Q23 消费级产品中 x86 架构市占率约为 85.2%;另根据 IDC 数 据,1Q23 服务器中 x86 架构市占率为 90.3%,使用 x86 架构能够更好的匹配当 下的软硬件生态,降低应用迁移转换等适配工作成本。
2.1.2. AI 服务器市场驱动 CPU 需求蓬勃发展
CPU 可以应用在服务器、工作站、个人计算机(台式机、笔记本电脑)、移 动终端和嵌入式设备等不同设备上,根据应用领域的不同,其架构、功能、性能、 可靠性、能效比等技术指标也存在一定差异。服务器具有高速的数据处理能力、 强大的 I/O 数据吞吐能力、良好的可扩展性,并需要长时间可靠运行,其 CPU 芯 片在性能、可靠性、可扩展性和可维护性等方面要求较为苛刻。因此,服务器处 理器是数据处理能力最强、设计工艺最复杂、可靠性最高的处理器。服务器的应 用领域包括实时分析、5G 应用、人工智能、机器学习、金融、大数据和云计算等 领域。
服务器 CPU 市场中 Intel 及 AMD 占据约九成的市场份额(出货量口径),共 同构筑 x86 垄断地位。根据 IDC 数据,1Q23 全球服务器 CPU 中 Intel 出货量占 比达 71.1%,AMD 出货量自 2019 年开始快速增长,1Q23 占比达 17.3%,其他 x86 架构 CPU 厂商的出货量占比仅为 1.8%。随着企业对于云端工作负载转趋多 元,ARM 架构服务器 CPU 占比亦逐步提升,1Q23 出货量占比达 9.6%。
展望未来,AI 服务器蓬勃发展,有望成为服务器 CPU 市场的增长动力。根 据 The next platform 预测,除非 AI 模型增长减缓,或者 AI 训练和推理计算价格 下降,否则有理由认为到 2026 年或 2027 年 AI 服务器有可能占到整个服务器市 场收入的一半左右。根据台积电于 2Q23 业绩会上给出指引,目前,AI 服务器处 理器(CPU、GPU 和 AI 加速器)的需求约占台积电总收入的 6%,未来 5 年这 一需求将以接近 50%的 CAGR 增长,占台积电收入的比例将上升到十几个百分点。 我们认为随着 AIGC 应用快速发展带动 AI 服务器需求提升,服务器 CPU 市场未 来值得期待。
2.2. 信创“2+8+N”快速发展,打开国产服务器 CPU 空间
信创产业正以“2+8+N”的节奏快速发展。信创产业,即信息技术应用创新 产业,与“863 计划”“973 计划”“核高基”一脉相承,旨在实现我国信息技术 产业自主可控。(1)“2”:2022 年,是党政信创三年全面推广阶段的收官之年, 市级以上电子公文系统的国产化改造已经基本完成,2023 年及以后,还将进一步 向区县层面下沉拓展。2022 年 9 月,国家下发 79 号文,全面指导国资信创产业 发展和进度,要求到 2027 年央企国企 100%完成信创替代,其中,芯片、整机、 操作系统、数据库、中间件是最重要的产业链环节。(2)“8”:在党政部门的引领 下,金融、电信、电力、交通等八大重点行业也开始加快自主可控步伐。在行业 信创中,金融行业推进最快,2020 年和 2021 年,金融信创试点启动了两期,对 金融机构 IT 软硬件采购和办公、业务系统国产化替代比例提出具体要求;电信、 交通、电力、石油、航空航天等行业有望紧跟其后。
服务器、CPU 作为信创产业基础硬件板块的重要组成部分,国产替代进程有 望加速。信创产业可分为基础硬件、基础软件、应用软件、信息安全四大板块。 其中,基础硬件包括:芯片、服务器/PC、存储、交换机、路由器等;基础软件包 括:数据库、操作系统、中间件等;应用软件包括:OA、ERP、办公软件、政务 应用、流版签软件等;信息安全包括边界安全产品、终端安全产品等各类产品。 CPU 已经广泛应用到消费电子、工业电子、物联网、数据中心等领域并已成为信 创产业中关注度最高的品类之一,CPU 国产化亦成为我国实现信息技术产业自主 可控的必经之路。
伴随着信创产业政策的实施,国产处理器的市场规模快速增加。相对其他国 产处理器,海光处理器产品具有优异的性能和生态优势,产品兼容性高,可以直 接适配最终客户复杂应用场景,用户接受度较高。随着用户对海光产品认可度的 持续上升,公司积累了大量的采购需求,基于海光处理器的国产服务器和工作站 需求旺盛。据公司 2022 年发行注册环节问询函回复公告,行业重要大型集采订 单陆续披露,其中金融、电信运营商是国产化推进最快的两大重点行业,相关大 型集采订单可作为影响市场预期的标杆案例。截至 2022 年 2 月 27 日,中国移动、 中国电信 2021-2022 服务器集采中标名单中,合计国产服务器整机集采额 73.47 亿元,其中搭载海光处理器的服务器整机集采额 37.84 亿元,占比达到 50%。2021 年,国内最终客户对海光的需求日益强劲,持续经营前景良好。随着浪潮、联想、 新华三、同方、中兴通讯等整机厂商搭载海光处理器的服务器、工作站产品陆续 推出,搭载海光处理器的国产服务器厂商的数量日益增长。
2.3. 强劲性能+成熟生态,公司 CPU 产品在国产替代中具备显著优势
2.3.1. 公司服务器 CPU 产品性能国内领先,实现引进、吸收、再突破
公司引进吸收 Zen 架构,为公司 CPU 产品性能打下良好基础。从 2016 年 开始,公司就开始了利用 AMD 的 Zen 架构进行 x86 处理器的研发,AMD 分别于 2016 年 12 月、2018 年 9 月完成授权技术整套源代码交付,公司已经完整取得并 消化吸收了 AMD 授权技术。公司从成立之初就制定了中长期的高性能处理器研 发规划,在 AMD 授权技术的基础上,根据信息产业行业的实际需要,通过持续 的自主创新,不断丰富海光处理器的功能,持续提升海光处理器的性能,保持海 光处理器的技术竞争力。
在 Zen 架构之上公司凭借自主研发实力持续突破,产品性能快速提升。海光 一号产品设计时,公司重点对引进技术进行“消化吸收”,海光一号 CPU 主要基 于 AMD 交付的源代码进行研发,同时进行了部分自主创新,包括基于中国密码 算法的安全增强技术等。海光一号 CPU 基本达到 AMD 授权技术同代产品技术指 标。海光二号 CPU 在海光一号 CPU 成功研发的基础上,对 CPU 处理器核心的 微体系结构进行了较大程度的自主创新,产品性能实现提升。根据 SPEC 官方网 站相关数据,AMD 基于授权技术的第二代同类型产品 AMD EPYC 7542 的相关性 能指标仍比海光 7285 性能强劲,但差距不大。 从海光三号处理器开始,公司独立开展 CPU 产品的迭代开发,整体实测性 能相较上一代提升约 45%。海光三号 CPU 在微体系结构上进一步自主创新:优 化取指单元中的分支预测器,实现了更精确的分支预测算法和更高的预测带宽; 优化 PCIe 控制器,将带宽从 8Gbps 升级到 16Gbps;优化内存控制器,将内存 频率从 2667MHz 提升到 3200MHz,增加内存读写错误时的重传机制,提升服务 器系统的 RAS 能力;优化片上网络,提升带宽,修改内部通信协议,提升工作频 率等。海光三号系列芯片最高规格具备 32 核心 64 线程,拥有多达 128 条 PCle4.0 通道,据公司投关记录,相比上一代产品,海光三号的整体实测性能提升了约 45%。 在 SOC 设计、I/O 带宽、取指单元、功能模块、防御机制等方面,海光三号均做 了不同程度的优化,综合性能大幅跃升。
公司 CPU 产品性能可与国际厂商同期发布产品总体相当,在国内厂商中处 于领先地位。由于 Intel 公司的处理器产品在市场上处于主导地位,因此公司对标 Intel 公司区分产品定位。公司通过综合比较处理器市场定位、核心数量、产品售 价等因素,选取了 Intel 在 2020 年(与海光 7285 同期)发布的 6 款至强铂金系 列产品(能够反映 Intel 2020 年发布的主流 CPU 产品的性能水平),与海光 7285 进行性能对比(采用业界国际通用的测试程序 SPEC CPU 2017 测试数据)。通过 对比可以看出,海光 7285 CPU 的 SPEC CPU 2017 的实测性能与国际领先芯片 设计企业 Intel 同期发布的主流处理器产品的实测性能总体相当。
公司高度重视处理器的安全性,通过扩充安全算法指令集及原生支持可信计 算等方法,有效地提升了海光处理器的安全性。处理器安全技术主要包括可信执 行环境、密码运算加速、可信计算、漏洞防御等。可信执行环境方面,基于数据 自动加解密,有效防止安全攻击,提供先进的云计算上全流程安全执行环境;海 光加密安全容器方案使用不同密钥对容器的运行状态进行加密。密码运算加速方 面,海光 CPU 集成符合国密标准的密码协处理器,支持国密标准 SM2、SM3、 SM4。处理器内置可信计算平台,支持中国标准 TPCM 和国际标准 TPM 2.0。可 信计算平台不仅实现了可信计算所需的信任根,还可以对系统进行主动的度量及 监控,并在检测到异常时及时采取措施,有效保护系统,符合等保 2.0 要求。在 CPU 漏洞防御方面,海光 CPU 对熔断漏洞免疫,对幽灵漏洞和侧信道漏洞则采 用有效的软硬件技术进行防御。高端处理器是所有高端信息设备的“大脑”和“中 枢”,是信息安全的基石,研制和推广安全可控的高端处理器对我国至关重要。
2.3.2. 公司为国内稀缺 x86 架构服务器 CPU 标的,成长空间广阔
指令系统属于计算机中硬件与软件的接口,是构建 CPU 生态的重中之重。 目前 CPU 行业由两大生态体系主导:一是基于 X86 指令系统和 Windows 操作系 统的 Wintel 体系;二是基于 ARM 指令系统和 Android 操作系统的 AA 体系。Intel 于上世纪 80 年代自研 X86 指令系统架构,凭借先发优势迅速扩大市场份额并构 建生态优势,并通过与 Windows 联盟形成“Wintel”联盟逐步占领桌面 CPU 市 场;ARM 则在苹果、高通、三星、华为、英伟达等方面的努力下,凭借其指令系 统开源、异构运算、可定制化等一系列优势,立足于低功耗的移动市场。 国产 CPU 企业目前主要有 6 家,分别是龙芯中科、电科申泰、华为海思、 飞腾信息、海光信息、上海兆芯。按采用的指令系统类型可大致分为三类:(1) 海光信息和上海兆芯,采用 X86 指令系统;(2)华为海思和飞腾信息,采用 ARM 指令系统;(3)龙芯中科和电科申泰,早期曾分别采用 MIPS 兼容的指令系统和 类 Alpha 指令系统,现已分别自主研发指令系统。海光 CPU 系列产品兼容 x86 指令集以及国际上主流操作系统和应用软件,软硬件生态丰富,相较于其他服务 器 CPU 厂商来说,有望在国产服务器替换及新增需求中获得相对更大的市场份 额。
2.3.3. 公司根植本土市场,充分受益于优质产业链
海光产品得到浪潮、联想等国内知名服务器厂商认可,本土优势显著。公司 在国内率先研制完成了高端通用处理器和协处理器产品,并实现了商业化应用。 相较于国外厂商,海光专注中国本土市场,更了解中国客户的需求,能够提供更 为安全可控的产品,具有本土化竞争优势,得到了国内行业用户的广泛认可。据 公司招股书,自 2018 年来,浪潮、联想、新华三、同方等多家国内知名服务器 厂商的产品已经搭载了海光 CPU 芯片,并成功应用到工商银行、中国银行等金融 领域客户,中国石油、中国石化等能源化工领域客户,并在电信运营商的数据中 心类业务中得到了广泛应用。
公司联合“光合组织”,促进国产化生态建设,布局长期发展。“光合组织” 全称为“海光产业生态合作组织”,是围绕国产通用计算平台,联合产业链上下游 企业、高校、科研院所、行业企业等相关创新力量,促进合作组织成员的共同发 展,共建包容、繁荣的信息技术生态系统。2020 年 4 月 28 日,公司发起成立“光 合组织”,截至 2022 年末,光合组织已有成员单位 1000+,适配认证厂商 500+, 产品适配认证 1000+,成立区域分会 10 个,适配中心 15 个。
3. GPGPU:AI 大模型催动算力需求提升,打开公司第二增 长曲线
3.1. GPU/GPGPU:不可或缺的 AI 算力芯片
GPGPU 将成为运算协处理器的主流。运算协处理器基于不同的设计思想存 在多条技术路线,包括 GPGPU、ASIC、FPGA 等。其中 GPGPU 的代表企业包 括 NVIDIA 和 AMD;利用 ASIC 技术,许多大公司都研发了协处理器产品,包括 Intel 的 Phi 和 NNP、Google 的 TPU、华为昇腾、寒武纪思元等;基于 Intel、Xilinx 的 FPGA,出现过很多专用协处理器产品。综合考虑性能、能效比和编程灵活性 等方面的因素,GPGPU 在协处理器应用领域具有非常明显的优势,目前广泛应 用于商业计算、人工智能和泛人工智能等领域。 GPU 最初是作为专门用于加速特定 3D 渲染任务的 ASIC 开发而成的。对 于图像处理而言,由于每个像素都需要被处理,所以数据量十分庞大,而 CPU 更 适合用其数量相对较少的内核集中处理单个对内核性能要求较高的工作负载任务, 这导致 CPU 在处理这类大量数据时无法做到高效,GPU 应运而生。随着时间的 推移,GPU 变得更加可编程化、更加灵活,当下而言图形处理仍是 GPU 的主要 功能之一,同时它也已经演化为用途更普遍的并行处理器,能够应对越来越多的 应用场景。
3.2. 全球 GPU 市场:AI 浪潮拉动算力需求,GPU 芯片前景广阔
3.2.1. AI 大模型拉动算力需求快速提升
当下时点 AI 大模型迭出,厚积薄发后百亿以上大模型数量快速增长。在经历 了浅层机器学习、深度机器学习等漫长的技术积累过程后,AI 新浪潮以 2017 年 基于 Transformer 的预训练模型为起点,并在 2020 年 GPT-3 大模型发布后突破 技术奇点。自 2022 年以来 AIGC(AI-Generated Content,人工智能生成内容) 实现技术和产业端的快速发展。以 OpenAI GPT 系列的版本演进为例,从 GPT-1 (2018.06)到 GPT-2(2019.02)、GPT-3(2020.05)、GPT-3.5(2022.03)、 GPT-4(2023.03),参数量和语料库持续升级,目前 AI 超大模型的参数已经达到 千亿、甚至万亿数量级。
AIGC 需求兴起,产业发展依赖高制程芯片的底层算力支持。目前 AIGC、高 端服务器、高性能计算、5G 等应用快速发展,这些应用离不开高制程算力芯片的 底层支撑。以 AIGC 大模型为例,根据海外科技网站 lambdalabs,GPT-3 的模型 规模达 1750 亿个参数,使用单块英伟达 V100GPU 进行训练需要 355 年,对算 力芯片提出了海量的需求。 而以 1024 块英伟达 A100 芯片测算,GPT-3 的训练时长为 25 天以上。根据 我们测算,在理想条件下通过租用线上算力完成一次参数量为 1750 亿的 GPT-3 模型训练需要 1024 块 A100 80G,时长约 25 天,训练成本约为 93 万美元。但实 际成本和时间往往会更长,比如模型几乎不可能一次顺利完成训练等等。在训练 算力需求之外,推理算力需求也会随着模型的商用流行度以及吸引的活跃用户数 持续增加。我们认为,数量快速提升的大模型训练需求和大模型推理需求有望大 幅推动以 GPU 为主的算力芯片市场规模提升。
AI 服务器发展迅速,AI 芯片市场主要为英伟达与 AMD 所占据。AIGC 的发 展带动 AI 服务器迅速增长,TrendForce 集邦咨询预计 23 年 AI 服务器出货量约 120 万台,同比+38.4%,占整体服务器出货量的比约为 9%,2022~2026 年 AI 服务器出货量 CAGR 将达 22%,而 AI 芯片 2023 年出货量将成长 46%。GPU 作 为数据并行处理的核心,是 AI 服务器的核心增量。全球 GPU 呈现“一超一强” 的竞争格局,根据 IDC 数据,2021 英伟达在企业级 GPU 市场中占比 91.4%,AMD 占比 8.5%。
中国智能算力规模亦快速增长,CAGR 达 48%。根据 IDC 预测,2022 年中 国智能算力规模将达到 268 EFLOPS,预计 2026 年将进入每秒十万亿亿次浮点 计算(ZFLOPS)级别,达到 1271 EFLOPS,2022-2026 年 CAGR48%。伴随 企业 AI 应用成熟度逐步递增,企业将把算力更多从训练端转移到推理端负载上, 这意味着 AI 模型将逐步进入广泛投产模式,据 IDC 数据,2021 年中国数据中心 用于推理的服务器的市场份额占比已经过半,达到 57.6%,预计到 2026 年,用 于推理的工作负载将达到 62.2%。
3.2.2. 中国算力需求持续增长,有望打开国产算力芯片成长空间
在 AI 的带动下中国加速计算服务器市场规模快速增长,有望推动中国服务器 GPU 市场规模快速提升。根据 IDC 数据,2022 年中国加速服务器市场规模达到 67 亿美元,同比增长 24%,其中 GPU 服务器依然是主导地位,占据 89%的市场 份额。在 AI 加速应用部署的背景下,2027 年中国加速服务器市场规模有望达到 164 亿美元,2022-2027 年 CAGR20%。且由于 GPU 仍为中国主流 AI 加速芯片, 服务器 GPU 市场规模同样有望在 AI 的推动下持续增长。
GPU 为产业链最大增量,AI 趋势下单服务器需求量大幅提升。一般的普通 服务器仅会配备单卡或双卡,而 AI 服务器由于需要承担大量的计算,一般配置四 块或以上的 GPU 或人工智能芯片。且 AI 大模型在训练与推理时的计算量巨大, 中低端的处理器无法满足其运算需求。如在英伟达 DGX H100 中,其配备 8 个 NVIDIA H100 GPU,总 GPU 显存高达 640GB;每个 GPU 配备 18 个 NVIDIA NVLink,GPU 之间的双向带宽高达 900GB/s。若以每个 NVIDIA H100 GPU 单价 4 万美元测算,DGX H100 的 GPU 价值量为 32 万美元,为 AI 服务器中的最大增 量。
3.3. 公司 GPGPU 产品性能优异,有望受益于国内算力硬件需求爆发
3.3.1. 公司 DCU 产品性能指标达到国际领先水平
公司深算一号指标达到国际上同类型高端产品的水平,可用于模型训练端和 推理端。公司 DCU 产品以 GPGPU 架构为基础,是国内少有的具有全精度浮点 数据和各种常见整型数据计算能力的 GPGPU 产品,可以应用于人工智能服务器 上并支持完整的大模型训练。深算一号在 2022 年就实现了在大数据处理、人工 智能、商业计算等领域的商业化应用,目前公司已与国内多家开发大模型的企业 和研究所达成认证。公司 DCU 未来将广泛应用于大数据处理、人工智能、商业计 算等领域。
3.3.2. 兼容“类 CUDA”环境,生态优势显著
NVIDIA CUDA (Compute Unified Device Architecture) 为当今主流 AI 编 译生态,海光 DCU 采用“类 CUDA”取得生态优势。CUDA 是一种由 NVIDIA 推出的通用并行计算架构,包含了应用于 NVIDIA GPU 的指令集(ISA)以及 GPU 内部并行计算引擎。海光 DCU 协处理器全面兼容 ROCm GPU 计算生态,由于 ROCm 和 CUDA 在生态、编程环境等方面具有高度的相似性,CUDA 用户可以 以较低代价快速迁移至 ROCm 平台,因此 ROCm 也被称为“类 CUDA”。因此, 海光 DCU 协处理器能够较好地适配、适应国际主流商业计算软件和人工智能软件, 软硬件生态丰富,可广泛应用于大数据处理、人工智能、商业计算等计算密集类 应用领域,主要部署在服务器集群或数据中心,为应用程序提供高性能、高能效 比的算力,支撑高复杂度和高吞吐量的数据处理任务。
3.3.3. 公司 DCU 产品有望与 CPU 产品协同实现共振增长
CPU 与 DCU 产品协同配合,公司可为客户提供成熟生态体系的配套式解决 方案。公司作为国内少数几家同时具备高端通用处理器和协处理器研发能力的集 成电路设计企业,可以提供海光 CPU 和海光 DCU 的硬件产品组合,在硬件之外, 公司在操作系统、云计算平台软件、人工智能技术框架和编程环境、核心行业应 用等方面进行研发、互相认证和持续优化,并主动融入国内外开源社区,初步形 成了基于海光 CPU 和海光 DCU 的完善的国产软硬件生态链,持续为智算中心等 “新基建”项目、行业用户、AI 厂商及互联网企业提供完整成熟的解决方案。 百度飞桨与海光 DCU 已经完成互证,海光产品能够完全支持训练和推理应 用。2021 年 9 月,百度飞桨深度学习框架与海光人工智能加速卡 DCU 系列进行 了安装部署测试、基本功能测试和稳定性兼容性测试,联合测试结果显示百度飞 桨深度学习框架在海光 DCU 系列以及海光 3000、5000、7000 系列 CPU 环境上 均能顺利安装,可以可靠、稳定、高性能地运行,满足用户的关键性应用需求。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
相关报告
海光信息研究报告:国产CPU+DCU龙头,信创+AI双轮驱动高速增长.pdf
海光信息研究报告:信创造就X86 CPU龙头,AI打开DCU广阔空间.pdf
海光信息研究报告:以CPU业务为基,横向拓展AI芯片业务,国产AI芯片迎历史机遇期.pdf
海光信息分析报告:拥抱算力之海,国产芯片之光.pdf
海光信息(688041)研究报告:国产CPU及DCU领军企业.pdf
海光信息(688041)研究报告:国产CPU+DCU领航者,AIGC时代迎新机遇.pdf
超威半导体研究报告:CPU攻城略地,GPU仍需磨炼.pdf
关于流水线CPU.pptx
龙芯中科研究报告:吹响CPU指令集自主可控号角,奋楫前行,踏浪而歌.pdf
国芯科技研究报告 :聚焦嵌入式CPU车载MCU助力成长.pdf
《微机与操作系统贯通教程》第4章:CPU与进程管理.pptx