1、 看点一: 超算云深厚积累,行业云+AI 云促营收持续高增
1.1、 发展:已接入超 8 万台服务器,超算云服务营收四年 CAGR 61%
并行科技成立于 2007 年,是国内领先的超算云服务和算力运营服务提供商,聚 焦应用真实运行性能,致力于为用户提供全面、安全、易用、高性价比的超算云服 务。公司主要服务包括并行通用超算云、并行行业云、并行 AI 云等。同时,公司 为用户提供超算软件及技术服务、超算云系统集成、超算会议及其他服务,打造超 算云服务生态闭环,全方位服务用户。
作为中国国家网格服务公司和双软企业,公司积极参与国家“算力网络”建设, 结合国内大批优质算力资源,共计接入超 80000 台服务器,总计算力超 1000PFlops, 存储资源超 800PB,为超过 20 个应用行业用户提供“多、快、好、省”的超算云服 务,推动算力资源从“可用”向“好用”发展。
2023 年实现营收 4.96 亿元(+58%),2018-2023 年 5 年营收 CAGR 达 41%。 从产品结构看,超算软件与技术服务销售收入占比有所下降,超算云服务销售收入占比提高,核心业务超算云服务营收增长迅速。公司以云服务的方式提供超算算力, 拥有灵活计价、弹性扩容、算力调配灵活、用户交互体验好等优势,可有效地满足 客户优化任务排期、缩短计算周期、随时扩充算力资源以及多样化资源配置的需求。
2023 年毛利率略微下降至 26%,其中核心业务超算云服务毛利率为 27%,2020 年-2023 年毛利率出现了一定程度下滑。受到市场活跃度暂时性下降等外部环境影响, 公司 2022 年度超算云服务自有算力利用率相对较低,进而拉低了各项细分业务的毛 利率。对于并行通用超算云,作为公司相对成熟的业务,未来随着公司自有算力资 源建设的逐渐完成,毛利率将逐渐保持稳定。对于并行行业云及并行 AI 云,是公 司大力开拓的新产品及服务,将从研发、销售、运营等方面积极发展,扩展各类行 业用户的超算云使用场景,结合历史数据及市场分析,并行行业云及并行 AI 云业 务的毛利率将在历史数据的基础上稳健提升。
2016 到 2023 年期间费用率呈现下降趋势,由 2016 年的 149.36%下降至 2023 年的 43%。整体费用率的下降主要由管理费用率的下降驱动,管理费用率由 2016 年的 116.79%下降至 2023 年的 9.66%;销售费用率整体保持稳定,2023 年也有较大 下降。研发费用率也同样发生了一定程度的下降。
2023 年净利率为-16%实现显著回升,归母净利润为-8050 万元(+29%)。超算 云服务市场目前处于成长期,超算云服务收入规模处于逐步攀升的过程中,公司收 入规模达到较高水平需要一定时间,因此在业务发展前期大力招聘销售人员,积极 开展市场培育、用户教育及营销推广活动,新用户数量快速增加,致使公司销售、 管理等费用持续较高,尚需一定过程实现扭亏。
1.2、 业务:AI 云引领增长,超算云整体收入 2023 年达 4.14 亿元
公司主营业务按产品或服务划分可主要划分为四类:超算云服务、超算云系统 集成、超算软件与技术服务、超算会议及其他服务。从产品收入结构来看,2022 年 超算云服务为主要创收模块,营收 2.67 亿元,2023 年进一步增长 55%至 4.14 亿元。
公司主要商业模式为通过 SaaS 系统向高等院校、科研院所、企业等出租高性能 CPU 及 GPU 服务,按照租用的 CPU 核数/GPU 卡数乘以租用时间进行收费。同时, 公司也通过提供超算云服务解决方案、提供分析软件、开办超算会议等方式延长其 超算云服务的营收链条。
超算云服务:并行超算云、并行行业云、并行 AI 云
并行超算云服务面向各应用领域、各行业的科研计算用户,以云计算的方式向 其提供高性能 CPU、GPU 算力资源和相关 IT 服务。根据使用算力资源的差异、 是否将计算任务接入用户的业务流程、是否有行业应用支持等方面,公司超算云服 务分为并行通用超算云、并行行业云、并行 AI 云三类业务。
超算云服务收入主要包括并行通用超算云、并行行业云、并行 AI 云,三类业 务覆盖了不同超算服务细分类别及面向客户群体的差异。
超算用户主要分为两类,第一类是科研和开发类的用户,以科研、教育、行业 用户为主,主要服务内容包括开发、调试、测试、调优、小规模计算和对应的数据 存储;第二类是工程模拟仿真类用户,主要服务内容以前处理、大型计算、后处理、 可视化、应用运行特征分析和优化为主。
公司以 PaaS 层为基础构建 SaaS 化平台,将超算应用实现服务化封装,进而 面向不同行业客户提供与其所在行业相匹配的超算应用。计算用户可通过公司提供 的 PaaS 层服务在云计算环境下使用算力资源,通过 API 端口或使用公司提供的并 行超算云桌面等上传下载自身作业,完成计算任务。公司支持独立软件开发商在 PaaS 层基础上构建 SaaS 化应用,并在标准应用基础上进行二次开发。通过该合作 模式,独立软件开发商可利用公司丰富的用户资源进行推广,培养用户使用习惯, 有力促进国产工业软件的发展,同时,公司可进一步丰富 SaaS 化应用矩阵,形成良 好的平台生态,增强未来面向更多行业输出超算解决方案的能力,实现互利共赢。
(1)并行通用超算云
并行通用超算云基于连接各大超算集群的“中国超算算力网络”和自主研发的服务平台,面向物理、化学、材料、航天、航空、力学、气象、海洋、能源、汽车、生物等各领域广大计算用户,通过自身具备的算力资源智能调度技术,向用户提供 CPU 算力资源。
并行通用超算云服务支持命令行操作,保持用户使用习惯。针对不擅长命令行 操作的用户,可通过应用中心集成的众多 SaaS 化超算应用软件进行提交。在使用 过程中,基于公司的应用全生命周期监控与分析技术,用户可在线查看作业运行状 态,优化应用使用,提高作业效率,并可通过移动端应用时刻了解作业状态。计算 完成后,用户可在线完成结果数据的二维/三维远程可视化处理。
(2)并行行业云
并行行业云在并行通用超算云的基础上增加了业务系统对接、提供专线链路等 物理层、系统层、应用层的专业化服务等以满足用户需求,提供整体解决方案。
面向在超算云上构建业务系统的行业客户,并行行业云服务可根据业务系统需 求,提供专线链路、安全的专有超算云基础设施,提供高性价比资源;提供多模式 API、 异步消息队列、智能区域调度等 PaaS 平台级开发接口,快速满足文件管理、数据传输、作业调度和作业监控等业务需求,确保业务高效开发移植上超算云;公司可 在业务开发、移植上超算云的过程中,为客户提供研发级支持;公司专有的研发资 源亦为客户提供业务组件开发技术服务,满足业务系统上超算云的定制需求。并行 行业云可针对不同行业客户痛点定制专门解决方案,如气象海洋超算云解决方案、 生命科学行业云解决方案、高端制造行业云解决方案、企业级 HPC 超算云解决方 案、院校级 HPC 超算云解决方案等。
(3)并行 AI 云
并行 AI 云面向高校、科研院所、行业用户等在 AI 深度学习和科学计算等方 向的 GPU 算力资源需求,提供高性能 GPU 算力资源及相关 PaaS 服务。并行 AI 云可应用到人工智能及高性能计算等场景, 可灵活地满足相关人工智能技术研究在训练和推理阶段对 GPU 算力资源复杂多样需求。并行 AI 超算云裸金属集群为 GPU 高性能计算场景锻造,提供最新架构 GPU 卡,以裸金属形态输出,消除虚拟 化性能损耗;提供高速互联、高性能并行存储,支持大规模并行;基于大规模集群 架构提供丰富的 GPU 队列资源池,可根据业务需要便捷弹性获取大规模资源,满 足大规模计算需求。
超算云系统集成
受益于公司在行业的长期积淀以及较好的上游硬件厂商资源,公司为存在自建 数据中心等需求的客户,提供基于高性能计算、人工智能计算的生命周期的软硬件 产品和服务,主要包括架构设计、设备选型、平台建设等整体解决方案。
超算软件及技术服务
(1)超算软件销售
并行科技超算软件开发主要涉及产品包括自研软件、定制软件及代理软件。公 司软件产品包括 Paramon、Paratune、ParaCloud 等,功能涵盖应用特征收集、应用 特征分析、应用特征优化、应用特征数据库应用、集群管理、资源调度等环节。
(2)技术服务
为客户提供高性能计算全栈式运维服务,针对不同用户不同层次的运维服务需 求,为用户提供开发运维、在线运维、巡检运维和驻场运维服务。方案集合了线上 和线下模式,可为用户提供切合高性能计算行业的 7×24 小时全时段的运维服务。
超算会议及其他服务
公司已连续协办多届全国高性能计算学术年会(HPC China)并承办全国并行 应用挑战赛(PAC)及各类国内超算领域竞赛、培训等。全国高性能计算学术年会 (HPC China)作为超算领域全球最具影响力的三大盛会之一,帮助公司在业内树立 品牌,各类竞赛及培训亦有助于培养中国超算人才,提高公司行业影响力。 公司超算会议收入主要来自于举办 HPC China、PAC 等会议、赛事、培训所收 取的会议注册费、企业赞助收入、展位费等;成本主要包括场地租赁费用、赛事宣 传及营销费用、赛事奖金以及支付给中国计算机学会的合作费用等。以 HPC China 2023 为例,参会费用根据参会者类别在 1000-3000 元不等。
1.3、 客户:主要面向高等院校及科研院所,积极拓展企业 AI 领域用户
公司整体客户集中度较低,2023H1 前五大客户营收占总营收的比例为 26.44%, 相比 2022 年的 16.7%有所上升。2020 年以来,清华大学持续作为公司前五大客户。
公司通过营销系统 CRM 管理模块进行客户信息录入及营销记录,以实现高效、 全面、完善的客户资源管理。超算云业务以预付费为主,针对部分优质企业客户, 公司存在后付费模式,即客户根据需求可在一定额度内消耗核/卡时,到达额度后, 由销售人员负责沟通回款工作。公司超算云业务的计费依赖于核心业务系统,超算 云用户可通过其账户自行登录查询消费情况,公司按月发送账单至用户。
服务群体主要为高等院校、科研院所、企业用户等。其中企业用户增长较快, 2023H1 占比达到 24%。公司个人客户数量较多,但营收占比较低,仅为 0.07%。
在算力分布上,高等院校为 CPU 算力资源的使用主力,2022 年度使用 CPU 算 力 150984 万核时,占总比重的 58.16%;在 GPU 算力资源方面,企业则为使用主力, 2022 年度使用 GPU 算力资源使用达 4476880 卡时,占总比重的 50.41%。
1.4、 技术:重点布局集群调度技术,获中国电子学会科技进步一等奖等荣誉
公司多年来专注于超算云领域,位于中国超算云行业的第一梯队,在行业服务 创新与技术应用等方面具有极高的美誉度。
专注研发,通过核心技术驱动营收增长
经过多年的行业探索,公司形成了大规模分布式超算集群运行数据采集与分析 技术、应用全生命周期监控与分析技术、多地域跨网络跨集群的云调度技术、集群 内智能调度技术、超算业务化计算支撑平台及其相关技术、应用软件 SaaS 化平台 技术、应用优化技术等核心技术。
公司科研声誉良好:获得多项奖项并参与国家重要研发
公司重视技术创新和人才引进,拥有行业领先的技术实力,截至 2023 年 6 月 30 日,公司及其子公司已拥有 25 项发明专利,2 项外观设计专利及 130 项已登 记的计算机软件著作权。自成立以来,公司凭借领先的行业地位和突出的技术优势 荣获诸多超算云领域的专业奖项和荣誉。
公司在加强自身研发实力的同时,与其他单位、有关高校开展合作,积极参与 多项国家级科研课题。公司自主研发大规模分布式超算集群运行数据采集与分析技 术,拥有提供公共服务的超算业务化计算支撑平台及其相关技术,并且建立了国内 领先的超算应用软件 SaaS 服务平台。算力资源调度及用户真实应用体验提升方面, 并行科技拥有包括多地域跨网络跨集群的算力资源智能调度技术、集群内算力资源智能调度技术、超算业务化计算支撑平台及其相关技术、应用全生命周期监控与分 析技术等在内的全部核心技术。上述技术优势有助于公司在市场竞争中抢占先机。
2、 看点二:发力 AI 智算大蓝海,外采+共建模式打造海量可用资源
2.1、 趋势:AI 大模型引领算力服务商发展,GPU 基建建设加速扩张
随着 AI 产业快速发展,2024 年全球 AI 发展步入深化新阶段,从上游芯片到下 游应用均持续进展,而近期 OpenAI 首次进军 AI 视频生成领域,推出文生视频产品 Sora 引发全球关注。据 OpenAI 介绍,Sora 使用 Transformer 架构,可根据文本指令 创建现实且富有想象力的场景,生成多种风格、不同画幅、最长为一分钟的高清视 频。Sora 还能够根据静态图像生成视频,扩展现有视频或填充缺失的帧。Sora 被认 为是 AGI(通用人工智能)的又一个里程碑时刻,并不只是因为 AI 生成的视频时间 更长、清晰度更高,而是 OpenAI 已经超越过去 AIGC 的能力,可以生成与真实物理 世界相关的视频内容。在 OpenAI 官方出具的技术报告中,对 Sora 的定位为“作为 世界模拟器的视频生成模型”,“扩展视频生成模型是构建物理世界通用模拟器的一 条可行之路。
随着文本生成大模型和图像生成大模型相继走向成熟,目前行业已经涌现了一 批日益成熟的应用模式,而 Sora 的发布意味着视频生成应用的成熟已经步入了一个 新的节点,AIGC 已经加速迈入视频生成阶段。据甲子光年预测,2024-2025 年各模 态的 AI 将在各赛道全面走向深化成熟阶段,因此 AI 模型训练、推理等算力需求也 将会随之得到进一步释放。
云计算行业作为最重要的基础设施产业之一对下游增长起到关键的促进作用, 据中国信息通信院发布的《中国算力发展指数白皮书(2022 年)》测算,算力每投入 1 元,将带动 3-4 元的经济产出;而随着人工智能、数字孪生、元宇宙等新兴领域的 崛起,各类算力需求规模正快速增长,其中 GPU 算力对应“智能算力”的主要部分, 将首先受益发展。
智能算力即人工智能算力,由 GPU(图形处理器)、ASIC(专用集成电路)、FPGA (现场可编程逻辑门阵列)、NPU(神经网络处理器)等各类专用芯片承担人工智能 场景应用的计算,在专门应用下具有性能更优、能耗更低等优点。
2023 年 10 月,工业和信息化部、中央网信办、教育部、国家卫生健康委、中国 人民银行、国务院国资委等六部门联合印发《算力基础设施高质量发展行动计划》, 提出到 2025 年实现国内算力规模超 300 EFLOPS,其中智能算力占比达到 35%(105 EFLOPS)。
当下全球智能算力快速增长,据中国信通院数据,2022 年底全球算力总规模达 到 650 EFLOPS,其中通用算力规模为 498 EFLOPS,智能算力规模为 142 EFLOPS, 超算算力规模为 10 EFLOPS;智能算力规模同比增长 25.7%,规模占比达 21.9%。国 内市场方面,2022 年算力总规模为 180 EFLOPS,排名全球第二,其中通用算力规 模为 137 EFLOPS,智能算力规模为 41 EFLOPS,超算算力规模为 2 EFLOPS。中国 智能算力同比增长 41.4%,规模占比达 22.8%。按照六部门联合印发《算力基础设施 高质量发展行动计划》对 2025 年智能算力建成 105 EFLOPS 的规划,预计 2022-2025 实现 36.8% CAGR。
智能算力在 AI 深度学习中的应用主要体现在以下几个方面:一是训练模型,深 度学习模型具有复杂的结构和大量的参数,需要大量的计算资源进行训练,智能算 力通过 GPU、TPU 等高性能的计算设备,加速深度学习模型的训练过程。二是推断 推理,智能算力通过高性能计算设备和专门的推理芯片加速深度学习模型的推断过 程,提高了模型的实时性和稳定性。三是模型优化,通过智能算力可以对模型进行 自动化的超参数调优、网络结构搜索、模型剪枝等操作,进一步提高模型的精度和 效率。
GPU 芯片多用于图形图像处理、复杂的数学计算等场景,可较好支持高度并行 的工作负载,常用于数据中心的模型训练,也可以用于边缘侧和端侧的推理工作负 载。2021 年中国仍以 GPU 为主实现数据中心计算加速,据 IDC 测算 GPU 市场占有 率近 90%,而 ASIC、FPGA、NPU 等非 GPU 芯片市场占有率超过 10%,其中 NPU 芯片设计逻辑更为简单,常用于边侧和端侧的模型推理,并生成结果,在处理推理 工作负载时,具有显著的能耗节约优势,因此增长较快。
从工作负载角度而言,据 IDC 数据,2021 年中国数据中心用于推理的 AI 服务 器占比已达 57.6%,预计 2026 年这一比例超过 6 成。伴随企业人工智能应用成熟度 逐步递增,企业将把精力更多从人工智能训练转移到人工智能推理工作负载上,这 意味着人工智能模型将逐步进入广泛投产模式,因此智算中心的基础设施规划和运 营支出规划更加需要追求服务器利用率提升和性能利用率的提升,以实现更好经济 性。
大模型的高效训练通常需要具备千卡以上高算力 AI 芯片(GPU 为主)构成的 AI 服务器集群支撑。在全球科技企业加大投入生成式 AI 研发和应用的大背景下, 配置高算力 AI 芯片的 AI 服务器需求也不断高涨。随着市场对 AI 计算力需求的不断 攀升,全球已有上百家公司投入新型 AI 加速芯片的开发,AI 计算芯片多元化趋势 愈发显著,但在推向产业落地的过程中,依然存在大量的定制化工作以及现有标准 未能完全覆盖的领域,包括多元 AI 芯片适配、AI 算力资源管理和调度、数据整合 及加速、深度学习开发环境部署等多个方面。
英伟达高性能 GPU 为代表的 AI 训练/推理硬件成为当下算力建设的核心资源, 随着大模型等场景对算力需求的高速增长,英伟达显卡以及网络通信硬件在各方向均快速迭代,显卡资源成为核心能力。
IDC 预测,全球 AI 计算市场规模将从 2022 年的 195.0 亿美元增长到 2026 年的 346.6 亿美元;其中生成式 AI(AIGC)计算市场增速遥遥领先,预计 2022-2026 年 实现 90%以上 CAGR。下游需求也将带动 AI 服务器增量,IDC 数据显示 2021 年全 球 AI 服务器市场同比增长 39.1%,其中中国市场增长至 59.22 亿美元。预计到 2026 年,全球人工智能服务器市场将达到 347 亿美元,将占整个服务器市场的 21.7%,较 2022 年的 16.6%占比持续提升,且中国市场预计将达 123.37 亿美元。据 IDC 数据, 2021 年浪潮信息、戴尔、HPE 分别以 20.9%、13.0%、9.2%的市占率位列全球前三, 三家厂商总市场份额占比达 43.1%。
国内外厂商布局加速了 AI 云市场增长。据 IDC 数据,2021 年国内专用于人工 智能的公有云服务市场规模达到 44.1 亿元人民币,占整体人工智能软件市场的 13.4%, 增速远超人工智能软件整体市场增速;2022 年在 AI 市场整体遇冷背景下,国内人 工智能公有云服务市场规模增长 80.6%至 79.7 亿元,计算机视觉占据约一半市场份 额。另一方面,IDC 也预计 AI 私有化部署仍是市场主流。
2.2、 增量:发力算力租赁服务,加大算力资源购置
区别于 CPU 算力,智算中心聚焦于 GPU 算力,用以支持广泛的计算密集型应 用场景,从单卡到万卡集群均可实现,核心价值在于提供高性能的、可扩展的算力 资源,以满足多样化的计算需求。不同于过去 CPU 场景较多自建,目前业内自建 GPU 算力资源厂商较少,需要第三方算力服务商为有高性能需求的客户提供算力云 租赁服务,帮助用户摆脱自建基础设施的负担,提供性价比优越的服务。具体业务 模式包括两类,一是云计算模式,应对推理需求为主;二是超算模式,应对大型模 型训练为主。
智算需求增长背景下,云计算服务厂商基于 AI 服务器等算力基建,能提供更丰 富的算力支持,如百度、腾讯、阿里等互联网巨头及各家专门服务商通过 aaS(as a Service)服务提供 AI 平台和 AI 服务,从而实现快速的产品迭代能力和丰富的场景 化人工智能能力;2023 年 3 月英伟达也亲自推出算力租赁服务方案“DGX 云”,与 微软云、谷歌云、甲骨文等全球顶级云服务商共同打造,企业可以直接线上按月租 用英伟达 DGX AI 超级集群,灵活租用算力服务。
按照英伟达官方对一个 1.6 万卡超大规模智算中心按照运营 4 年的计算: 成本端:需要投入 10 亿美元建设和运营成本,其中数据中心基建投资和运营维 护成本(约占一半)、GPU 购置成本(约占 40%)是关键。 收入端:按照每张 GPU 每小时定价 4 美元计算,4 年共可收入 25 亿美元,其中 提升算力利用率、实现集群性能调优是算力租赁厂商核心竞争力的体现。按照实现 15%算力利用率提升、实现 25%集群性能调优来预测,预计这两方面提升分别将在 收入中占到 3.5 亿美元、6 亿美元价值量。
云服务场景下的算力调优是应对客户不同需求场景下,实现性能调度极致优化 的能力,涉及到软件、网络架构等多元层面的调试、优化,考验综合服务能力和技 术积累。并行科技可向客户提供针对性优化措施,比如分析改进应用程序计算负载 设计,充分利用 GPU 资源;深度挖掘性能瓶颈点,提供针对性的优化解决方案。
算力租赁作为 AI 算力供不应求下涌现的市场新兴概念,广义上可以指所有提供 云租赁业务的算力服务和经营方式,即囊括了各类对算力用量或服务器租用时间等 要素进行计费的模式,如各类型的公有云、私有云;而从狭义上看,则特指面向确定性的客户需求采用类似“项目制”、“合同制”的方式进行算力建设和方案集成, 但最终不转让算力资源所有权而是对客户进行租赁计费的模式。从技术的实现角度 来看,算力租赁本身并没有什么特殊性,同样是经由云平台构建来向客户提供云上 的弹性算力服务,因此许多市场观点用广义的“租赁”概念对其进行泛化理解则显 得具有一定迷惑性,因为本质上绝大多数算力云的服务过程中都具备“租赁”的特 点,但并不都等同于算力租赁,因为后者更多体现为算力云的一种特殊商业模式。
并行 AI 云 GPU 收费上升,通用超算云与行业云收费稳定。基于 CPU 的服务, 如并行通用超算云及并行行业云整体收费稳定,而基于 GPU 的并行 AI 云收费逐渐 上升。
并行科技逐渐加大了对于算力资源的投入,2022 年,算力资源成为占全部采购 额度中占比最大的部分,约占 40.23%;2023H1 仍是最大采购项目。公司采购的主 要内容分为设备类采购、资源类采购及其他采购。设备类采购主要包括针对共建集 群和部分行业云项目所需的设备采购,包括服务器、存储、网络设备等;资源类采 购包括并行超算云服务开展所需的 CPU 算力资源、GPU 算力资源、互联网带宽等 相关资源;其他类采购主要包括技术服务、办公物资、超算云系统集成及超算软件 销售所需的软硬件设备等。
随着 AI 算力需求不断提升,公司加快了 GPU 算力布局。2023 年 11-12 月期间 即披露了 317 台 AI 服务器以及 4 套存储设备的采购,供应渠道丰富多元,包括联想、 坤前、神州数码、新华三旗下紫光华山等知名厂商。
2.3、 模式:共建+外采打造领先公有云,整合华为云等资源实现降本增效
在发展超算业务过程中,公司率先提出“互联网+HPC”概念,将云计算和互联 网领域的最新技术引入超算领域,建立其在超算公有云领域的“中国超算算力网络”, 这一领域的积累将持续助力 AI 智算业务发展。如 2024 年 2 月公司携手华为云共筑 智算产业创新生态,与华为云宣布正式达成框架合作协议,各方将在 AI 算力、AI 大模型及通用 HPC 算力等领域展开全面合作。 华为开发者大会 2023(Cloud)上,华为正式发布了盘古大模型 3.0 和昇腾 AI 云服务。华为昇腾 AI 云服务千卡训练 30 天长稳率达到 90%,为业界提供稳定可靠 的 AI 算力,依托贵安、乌兰察布、芜湖 3 大 AI 云算力中心,凭借其在高性能、高 效能、高性价比等方面的突出优势,为企业提供卓越的 AI 算力服务。本次合作,将 使并行科技现有算力资源池再度扩容,华为云全球化的云上算力资源,将通过并行 科技的算力资源网络服务更多用户,打造完善、高效、优质的云上科研环境,推动 国内 AI 发展提质增速,应对不断升级的行业竞争。
回顾发展超算业务的过程,公司将包括国家超级计算广州中心、无锡中心、济 南中心等多家超算中心的超算集群接入并行超算网格云平台,通过多地域跨网络跨 集群的算力资源智能调度技术,将传统的用户应用计算搬迁到云环境中,然后将任 务结果数据返回给用户。公司独创跨地域、跨分区的统一超算云算力网络平台,整 合不同类型、不同架构的算力资源,面向用户提供统一的使用界面,实现多超算应 用级统一智能调度。公司独创的在大规模异构超算集群系统内实现消息传递型作业 的容器化封装和智能调度技术,支持经典超算作业调度和容器化作业调度,同时支 持同步多线程、裸金属核心以及 GPU 资源调度模式。
同时,公司通过大规模分布式超算集群运行数据采集与分析技术,对集群的运 行情况进行实时监测与分析,根据算力资源的占用情况,对空闲资源进行实时优化调度,有效提高资源使用率,充分满足科研及企业用户需求。公司自 2015 年起与 国家超级计算广州中心合作开展超算云业务,保持了长期稳定的合作关系,近年来 内采购金额呈逐年下降趋势,主要原因系公司通过共建模式获取的自有算力资源逐 年增加,减少了对外采算力资源的依赖所致。
公司主要算力云服务提供模式为共建模式,2022 年共建模式服务能力按 CPU 核时占比为 91%。直接采购模式下,公司按照用户潜在算力需求向外部算力资源供 应商采购算力资源。共建集群模式下,公司租赁 IDC 机柜,自行购买交换机、服务 器等设备在 IDC 构建集群,充分利用公司在超算中心运营方面的优势,通过不同分 区、不同规格资源的调度和运营策略充分满足客户的各项需求,构建自有算力资源 池。超算集群相关设备所有权归属于公司所有,IDC 服务商仅提供机柜及相关运维 服务,保证超算集群运行物理环境稳定。
公司逐步加大了对专用设备的采购以丰富共建模式下自有算力资源池,至 2021 年,公司以共建模式提供的超算云服务收入占总体超算云服务收入的比例已超过 70%。共建模式的主要成本为固定资产折旧、IDC 租赁费等,与外购模式按实际消 耗外部算力结转算力成本相比,具有较为平稳的特点,由于公司超算云服务具有一 定季节性,第四季度普遍实现收入较多,2020-2022 年第四季度占超算云服务全年收 入的比例分别为 37.56%、35.96%和 31.89%,从而共建模式下毛利率偏高,进而影响 整体毛利率亦呈现该趋势。
公司 2022 年以来大力开展共建模式优化自有算力资源池,目前内实现了由外采 算力模式向共建模式的过渡,以并行通用超算云为例,2020-2022 年共建模式下形成 的收入分别为 4437.80 万元、10158.77 万元和 13166.95 万元,占比分别为 51.62%、 78.53% 和 81.27%,随着共建模式的逐步成型,公司超算云业务综合毛利率及细分 业务并行通用超算云和并行行业云毛利率均受一定影响,并行 AI 云由于涉及共建 模式较少,因此基本不受共建模式影响。
3、 看点三:第三方超算服务份额第一,异构超算、算网等趋势带动增量
3.1、 空间:2022 年超算云市场规模达 33.2 亿元,CAGR 为 52.4%
3.1.1、 尖端超算面向国家项目,业务超算、通用超算需求持续增长
超算云服务根据核心需求与经济性要求主要可以分为三类,包括尖端超算、通 用超算和业务超算。在超算云未来增长中,业务超算与人工智能超算将带来主要增 长。1)人工智能超算逐步兴起,指大数据学习、人工智能算法模拟与优化、多类型 数据分析与编解码场景下运用的超算服务。在人工智能的深度学习框架中,有着众 多图像、神经网络、NLP、富媒体识别等复杂运算场景,相比传统的 CPU,GPU 能 够提供更有效率的超算解决方案。2)业务超算主要应用于企业业务的可靠性优化和 成本优化,应用场景主要包括芯片仿真、汽车机械、金融经济、多媒体渲染等。业 务超算用户出于商业盈利的考虑,通常对超算服务的经济性及投入产出比的要求较 高,其中超算云服务凭借更加灵活的付费机制,对业务超算用户存在较大的吸引力。
随着超算服务的渗透率不断提高,其客户类型愈发丰富。随着超算服务市场的 不断下沉,下游客户对超算服务的性价比追求以及可用性要求不断提高,对厂商的 算力调度以及超算 SaaS 的可用性提出了新的要求。 据沙利文数据,2021 年超算服务市场规模约为 196.6 亿元,并预计在 2025 年达 到 466 亿元,2021 年-2025 年 CAGR 为 24.1%。其中,增长主要由业务超算与人工 智能超算带动。2021 年业务超算市场规模为 85.6 亿元,并预计在 2025 年达到 233.2 亿元,2021 年-2025 年 CAGR 为 28.5%;2022 年人工智能超算市场规模为 38.3 亿元, 并预计在 2025 年达到 121.1 亿元,2021 年-2025 年 CAGR 为 33.3%。
中国超算云服务市场目前仍然处于早期阶段,2021 年中国超算云服务市场规模 为 20.7 亿元,预计 2025 年将达到 111.9 亿元,2021 年-2025 年复合增长率达到 52.5%, 为中国整体超算服务的商业化和市场拓展提供较大动能。其中,业务超算云服务与 人工智能超算云的增长将引领超算云服务的增长。2021 年中国超算云服务市场渗透 率仅为 10.5%。纵观中国超算服务的整体行业发展,尖端超算主要由国家主导并投 资建设,为攻克各项行业技术难关提供性能极高的超算服务;超算云服务市场的核 心下游场景则需要兼顾服务质量和服务性价比的双重要求。
3.1.2、 超算异构架构发展促进超算云通用性与适用性,DPU 推动云服务发展加速
超算异构架构发展促进超算云通用性与适用性
超算系统可以分为软件系统和硬件系统两部分。超级计算机硬件系统主要由高 速运算系统、高速互连通信网络系统、存储系统(I/O 管理结点和 I/O 存储结点)、维 护监控系统、电源系统、冷却系统和结构组装设计等部分组成。
超级计算机的发展从串行到并行,从同构到异构,未来会发展到超异构。第一 阶段,串行计算。单核 CPU 和 ASIC 等都属于串行计算。第二阶段,同构并行计算。 CPU 多核并行和 GPU 数以千计众核并行均属于同构并行计算。第三阶段,异构并行 计算。CPU+GPU、CPU+FPGA、CPU+DSA 以及 SOC 都属于异构并行计算。随着未 来走向第四阶段,超异构并行架构将把众多的 CPU+xPU“有机”集成起来,形成超异 构。
历史上,超级计算机的计算节点只有 CPU,后来研究人员发现 GPU 在计算加速 上有天然优势,于是开始将 GPU 加入到超级计算机上,“CPU + GPU”和“CPU + 协 处理器”的组合被称为异构计算。随着各类芯片技术的成熟,未来更多专用芯片也 会被加入到超级计算机上。
超算通过异构多态复合的计算架构,可以促使传统架构中的资源、数据、应用 孤岛走向融合。即构建一个统一的异构融合体系,通过统一的业务调度平台,调度 CPU、GPU 及其他的专用算力;同时,通过统一的应用平台,来管理丰富的超算应 用;通过统一的数据基座,来承载数据资产,打破数据孤岛,实现“底座不动、数 据不迁”,优化 TCO 投入,提升投资回报。
系统越来越复杂,需要选择越来越灵活的处理器;而性能挑战越来越大,厂商 需要选择定制加速的处理器。这产生了一大矛盾:单一处理器无法兼顾性能和灵活 性。CPU 灵活性很好,在符合性能要求的情况下,在云计算、边缘计算等复杂计算 场景,CPU 是最优的处理器。但受限于 CPU 的性能瓶颈,以及对算力需求的持续不 断上升,CPU 逐渐成为了非主流的算力芯片。
CPU+xPU 的异构计算,由于主要算力是由 xPU 完成,因此,xPU 的性能/灵活 性特征,决定了整个异构计算的性能、灵活性特征:(1)CPU+GPU 的异构计算。 虽然在足够灵活的基础上,能够满足(相对 CPU 的)数量级的性能提升,但算力效 率仍然无法极致。(2)CPU+DSA 的异构计算。由于 DSA 的灵活性较低,因此不适 合应用层加速。典型案例是 AI,目前主要是由基于 CPU+GPU 完成训练和部分推理, DSA 架构的 AI 芯片目前还没有大范围落地。
HPC 芯片效能提高为超算云增长提供基础
基于云计算的 HPC 芯片将快速增长。尤其是在低端高性能计算市场,部分内部 部署 HPC 支出转移到云计算领域。云计算的增长速度为内部部署速度的三倍。云服 务 HPC 预计在 2026 年占去 HPC 市场规模的 22%。
除了传统的作为 HPC 芯片组成部分的 CPU 与 GPU 外,DPU 成为 HPC 芯片未 来重要增长点之一。由于 HPC 系统的动态性、数据流量的快速增长、数据处理的 快速性和数据传输的实时性等特点,要求网络基础的构建要具有更好的灵活性。也 就是说,数据中心架构将从此前以服务器 CPU 为中心向以 DPU 为中心转变。以 DPU 为中心的数据中心架构本质上是以数据为中心,根据数据中心的数据任务需要 情况,可动态地卸载网络、存储、计算等网络基础设施,以及一些高性能计算 (HPC) 和复杂的机器学习计算任务,从而提升数据中心的整体性能。DPU 驱动下的 HPC 或 将迎来新一轮的发展,使超算算力降本增效,带动对超算云的需求。
3.2、 格局:并行是第三方超算服务商份额第一,算网建设有利资源整合加快
3.2.1、 超算算力网络并网 ,推动超算平台型服务商地位上升
超级计算机是指能够执行一般个人电脑无法处理的大资料量与高速运算的电脑。 超级计算不能混同于超级计算机,其内涵除了属于最领先的计算硬件系统外,还应 包括着软件系统和测试工具、解决复杂计算的算法、应用软件与通用库等。
超算平台提供服务的主要渠道之一是算力网络。算力网络可被定义为融合算力 和网络资源的新型信息基础设施。算力网络产业由算力产业和通信产业融合衍生而 成。当前,算力产业主要包含云计算、IDC、人工智能等细分产业;通信产业主要包 括基站、接入网和核心网等细分产业。
2023 年 4 月,科技部启动国家超算互联网部署工作,构建一体化超算算力网络 和服务平台。超算互联网可将全国众多超算中心连接起来,并连接产业生态中的算 力供给、应用开发、运营服务、用户等各方能力和资源,构建一体化超算算力网络 和服务平台。其建设的重要目标就是紧密连接供需方,通过市场化的运营和服务体 系,实现算力资源统筹调度。
算网一体通过算力度量、算力标识、算力感知、算力路由和在网计算等技术实现算力和网络在协议和形态上的深度融合、一体共生。以算网一体为核心特征的算 力网络也是 6G 网络的关键技术,6G 网络对内实现计算内生,对外提供计算服务。 6G 中的算力网络通过实时准确的算力发现、灵活动态的服务调度、体验一致的用户 服务,实现计算和网络资源的智能调度和优化利用。
算力池将自身空闲的算力资源信息发送给网络控制面,然后通过网络控制面(集 中式控制器或分布式路由协议)分发算力信息。当收到用户的业务需求后,即可通 过分析路由表中记录的网络信息与算力信息来选择合适的算力池与网络路径。算力 网络需要先选定网络,再选择算力池(云计算服务节点或者边缘计算服务节点)。
3.2.2、 独立超算服务商性能领先,并行是 2021 年国内通用超算云第一大服务商
根据超算服务的业务策略,中国第三方超算服务商主要分为两类,第一类独立 超算服务商追求性能优先,能够最大化地满足尖端超算、通用超算等计算能力门槛 较高的超算任务,从业者主要包括并行科技等超算云服务商及国家超级计算广州中心、国家超级计算济南中心等超算中心,其中并行科技凭借出色的商业化能力,在 独立超算服务商中占据领先地位;第二类互联网超算服务商依托原有的互联网商业 服务矩阵,进行对超算领域的业务拓展,商业策略上追求服务性价比,并以业务超 算下的企业用户为核心服务对象,以云服务资源为载体提供高性能计算集群服务, 从业者主要包括阿里云、华为云、腾讯云、速石科技、北鲲云等。
从收入规模角度,2021 年公司通用超算云收入约 1.3 亿元,据沙利文测算,对 应市场份额为 20.3%,行业排名第一;并行科技拥有约 65 万个计算核心,除主要互 联网云服务商外,其他超算云服务企业拥有的计算核心数基本在 20 万个以下。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
相关报告
并行科技研究报告:超算云龙头布局AI算力第二曲线,技术与算力资源巩固领先壁垒.pdf
并行科技研究报告:国内超算云龙头,技术+服务驱动增长.pdf
并行科技研究报告:国内超算云龙头企业,研发+销售双轮驱动业绩转化.pdf
并行科技研究报告:超算云服务和算力运营服务龙头,下游需求驱动业绩稳增.pdf
中国生成式AI开发者洞察2024.pdf
AI人才粮仓白皮书.pdf
海光信息跟踪报告:CPU和DCU领军企业引领AI芯片国产浪潮.pdf
视觉中国研究报告:AI赋能主营平台效率,视觉素材价值重估指日可待.pdf
存储芯片行业专题研究:AI对存储晶圆产能消耗拉动显著.pdf