2024通信行业报告:AI驱动液冷技术革新与市场展望
1、趋势:AI行业发展带来高算力需求,有望带动服务器液冷快速发展
2024年2月15日,OpenAI发布人工智能文生视频大模型Sora,可以根据用户的文本提示创建最长60秒的逼真视频。模型效果远超所有此前文生视频模型。英伟达人工智能研究院首席科学家JimFan称“这是视频生成领域的GPT-3时刻”。2月16日,谷歌发布Gemini 1.5,支持100万token上下文窗口,并在长上下文理解方面取得突破,距去年12月Gemini 1.0发布时间间隔不到3个月。开年以来AI行业不断迎来催化,强化了市场对于实现通用人工智能的信心,预计全球科技领域的巨头将持续向AI投入资源,加速产业发展进程。2024年2月22日,英伟达发布Q4业绩情况。Q4实现营收211亿美元,高基数基础上环比增长22%,同比大幅增长265%,超越市场预期的204.1亿美元,单季收入即超2021年全年。
英伟达CFO表示,目前GPU的供应正在改善,且需求强劲。并预计下一代产品的市场需求将远远超过供给水平。2024年5月22日,英伟达发布2025财年第一财季业绩情况,Q1实现收入260亿美元,高于市场预期的246.9亿美元,其中数据中心收入226亿美元,高于市场预期的211.3亿美元。Q1毛利润率为78.9%,高于预期的77%。英伟达预计第二财季收入为280亿美元,将高于市场预期的268亿美元。英伟达业绩持续超市场预期,印证了AI行业发展的高持续性。AI行业的持续快速发展将带来高算力需求,进而带动机柜数量和单机柜功率双增长,数据中心正朝高密度方向发展。随着单机柜功率密度增大,传统风冷散热方式将逐渐无法满足散热需求,服务器液冷有望迎来加速发展。
3月19日在GTC大会上,英伟达重磅发布B200芯片与GB200芯片,与前代H100相比,B200的算力提升了6倍。GB200芯片则是基于B200 GPU打造的AI加速平台,由两个B200 GPU和一个Grace CPU组成。在具有1750亿个参数的GPT-3 LLM基准测试中,GB200的性能是H100的7倍,而训练速度是H100的4倍。随着GPU性能的提升,功耗也在不断增加,大会上英伟达还重点介绍了与B200芯片和GB200芯片配套的液冷技术。
通过液冷散热方式的改变,英伟达实现了高密度部署和提升散热效率的目标,使得单机柜的功率能够达到较高的水平。英伟达CEO黄仁勋曾提到,坚信浸没式液冷技术就是未来指标,将带动整片散热市场迎来全面革新。英伟达的选择在业内具有风向标意义,这次发布会或将成为液冷发展的重要推动力,将为整体AI服务器市场带来划时代的技术革新。工业富联旗下子公司鸿佰科技出席了英伟达2024 GTC AI大会,展出与英伟达合作开发的新一代AI服务器与液冷机柜等多项技术和解决方案。会上,鸿佰科技展出多种AI服务器产品,包括Ingrasys NVIDIA MGX服务器、搭配液冷解决方案的AI加速器GB6181、AI数据中心液冷解决方案GB200 NVL72、ES2100储存系统等。
在国内,液冷渗透率提升趋势在三大运营商AI服务器集采中亦得以彰显。2023年8月21日,中国电信发布AI算力服务器(2023-2024年)集中采购项目集中资格预审公告。集采的产品品类分别为训练型风冷服务器(I系列)、训练型液冷服务器(I系列)、训练型风冷服务器(G系列)、训练型液冷服务器(G系列),共计4175台,其中风冷型服务器3121台,液冷型服务器1054台,液冷服务器占比约25%。2024年1月17日,中国移动通信有限公司发布《中国移动2023年至2024年新型智算中心(试验网)采购(标包12)》招标公告。采购人工智能服务器1250 台及配套产品,其中风冷型服务器106台,液冷型服务器1144台,液冷服务器占比超90%。液冷服务器在运营商集采中占比提升。
2、动力:液冷显著降低数据中心PUE,政策端+需求端双重驱动
2.1.数据中心耗电量巨大,节能存在较大优化空间,政策端驱动推动行业发展
近年来随着5G、物联网、云计算、AI 等数字化技术的发展,数据计算量呈现井喷式增长,配套的数据中心与通信基站投资及建设力度也不断加大。随着数据中心规模不断增大,耗电量也随之剧增。根据国家能源局数据,2022 年我国数据中心耗电量达2700 亿千瓦时,能耗约占全国总用电量的3.1%,足以满足上海、深圳两座超大型城市的全年用电需求。IDC 预计到2024 年我国数据中心耗电量将占到全社会耗电量的5%以上。
中国能源报预计到2030年全国数据中心耗电量将接近4000亿千瓦时,数据中心减排迫在眉睫。中国电子学会副秘书长洪京一在“算力-电力联合调度促进数据中心绿色发展研讨会”上表示,“一方面,数据中心用电量大、用电负荷高,在‘双碳’目标下减排任务重;另一方面,新型电力系统建设需要云计算、5G等高科技支撑,算力调度在提高可再生能源电力应用比例、降低用能成本、增强电网安全等方面具有重要意义。”
全国PUE要求趋严,数据中心温控设备需求将不断提升。2022 年2 月,国家发展改革委、中央网信办、工业和信息化部、国家能源局联合印发通知,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等8 地启动建设国家算力枢纽节点,并规划了10 个国家数据中心集群。按照全国一体化数据中心建设要求,东部数据中心集群平均PUE值小于1.25,西部则小于1.2,同时数据中心平均上架率不低于65%。
2022年8月22日,工业和信息化部、国家发改委、财政部等7部门联合印发《信息通信行业绿色低碳发展行动计划(2022-2025年)》,要求到2025 年,全国新建大型、超大型数据中心电能利用效率(PUE)降到1.3 以下,改建核心机房PUE 降到1.5以下。2023年11月,北京市经济和信息化局发布关于征求《数据中心能源效率限额》北京市地方标准意见的通知。
要求已建成并稳定运行一个自然年以上以及改扩建的数据中心,其PUE值应符合1.3限定值的要求;新建的数据中心,其PUE值应符合1.2准入值的要求;数据中心管理者应通过节能技术改造和加强节能管理,使数据中心PUE值达到1.15先进值的要求(标准适用于数据中心中电子信息设备机房使用面积3000㎡及以上或电子信息设备装机总额定功率5000kW及以上的数据中心能源效率的计算、控制和考核)。数据中心耗电量的不断攀升使得节能降耗迫在眉睫,同时各省份低PUE政策也对数据中心制冷设备提出了更高的要求,推动了数据中心温控设备需求的提升和产品的不断进步。
2023年6月5日,国内三大运营商联合发布《电信运营商液冷技术白皮书》。白皮书提出,当前新型应用日新月异,AI、智算纷纷提前布局,高密、高算力等多样性算力基础设施持续发展。计算型节点、AI训练、超算等高算力业务需求持续推升芯片性能、功率与服务器功率不断提高,液冷技术利用液体较高的比热容和换热能力可以支撑更高功率散热,正在逐步成为新型制冷需求。根据《白皮书》规划,2023年三大运营商开展技术验证,充分验证液冷技术性能,降低PUE,储备规划、建设与维护等技术能力。2024年开展规模测试,推进产业生态成熟,降低全生命周期成本,新建项目10%规模试点液冷技术。2025年开展规模应用,共同推进形成标准统一、生态完善、成本最优、规模应用的高质量发展格局,2025年及以后50%以上项目规模应用液冷技术。
2.2.AI行业发展带来芯片功耗与机柜密度不断增加,液冷散热势在必行
AI行业快速发展加速液冷时代来临。从芯片端看,高算力应用场景不断涌现,AI芯片迭代加速,芯片功耗逐代提升。Intel、ADM等主要CPU芯片制造商持续提高芯片的散热设计功耗TDP,主流系列处理器功耗已达350-400 TDP/W。NVIDIA的H100 GPU最大功耗可达700W,B200性能升级算力较H100提升6倍,功耗亦有较大幅度提升。预计未来在后摩尔定律时代下,芯片算力与功耗仍将大幅提升。
从机柜端看,根据科智咨询《中国液冷数据中心市场深度研究报告》,数据中心单机柜功率密度将持续上升,6-8kW及8kW以上单机柜功率密度将成为目前新建数据中心的主流选择;存量数据中心为提升市场竞争力也会通过升级改造提高单机柜IT负载,预计到2025年单机柜功率密度将向20kW演进。AI行业快速发展有望加速这一演进进程。根据Uptime Institute发布的《2022年全球数据中心调查报告》,以英伟达DGX A100服务器为例,其额定功率为4KW,单机最大功率为6.5KW,一个标准的42U高度的机柜大约可以放置5个5U高度的AI服务器,单机柜总功率超过20KW。
目前数据中心基础设施的制冷方式主要有风冷和液冷两种方式。传统数据中心的散热方式为风冷,即使用空气作为冷媒,对服务器的发热部件进行换热,带走热量的技术。传统风冷技术散热的上限一般为单机柜20kw。伴随高密应用场景增加以及IT部署密度提升,数据中心需要采用更加高效的散热方式,液冷通过用高比热容的液体取代空气作为热量传输的媒介,直接或间接接触发热器件,散热效率高,能够最大程度满足数据中心高效散热需求。
3、技术:液冷可显著降低PUE,冷板式占比90%
液冷技术类型根据冷却液和发热设备接触换热方式的不同,可划分为冷板式液冷、浸没式液冷和喷淋式液冷。1)冷板式液冷通过把冷板与发热器件紧密固定,将发热器件的热量传导给冷板中的冷却液,并将冷却液中的热量运输至后端冷却。液冷数据中心应用场景中,冷板式液冷对于服务器芯片组件及附属部件改动较小,主要途径为加装液冷模块,采用集中式或分布式CDU供液Manifold分液,对芯片、内存等部件进行精准制冷。根据冷板的不同,非接触式液冷可分为局部冷板和全覆盖冷板。局部冷板仅支持核心部件散热,具有与传统机房兼容性好的特点,但需要风冷解决其他部件散热问题;全覆盖冷板覆盖所有部件,但由于部分部件可插拔、形态非标,存在技术难题,可进行一体化设计,所有元器件附着于主板,从而实现全覆盖冷板散热。
2)浸没式液冷是服务器完全浸入冷却液中,全部发热元件热量直接传递给冷却液,通过冷却液循环流动或蒸发冷凝相变进行散热的一种方式。其中,冷却液循环流动的方式为单相浸没式液冷,冷却液蒸发冷凝相变的方式为相变浸没式液冷,相变浸没式液冷控制更复杂、要求更高。
3)喷淋式液冷和发热器件直接接触,依靠泵压或重力驱动,向发热设备自上而下精准喷淋,吸收并带走热量,排走的热流体与外部环境冷源进行热交换,冷却液无相变。喷淋式液冷的冷却液需具备绝缘导热、抗氧化性等特点,不发生相变,但在喷淋过程中存在液体飘逸和挥发问题,应用成本较高,且不适合高密度服务器和超大规模数据中心。
风冷采用气体作为导热媒介,其导热能力远远弱于液体,降低ICT设备能耗的能力弱于液冷。另外由于侧重于对机房整体环境温度管理,为了保证不出现局部过热,风冷通常需要提供冗余制冷,导致风冷能耗较大。根据英特尔绿色数据中心项目负责人介绍,新建数据中心可以通过选择使用一系列先进的软硬件技术,或选址在高纬度地区,通过新风进行散热,风冷也可以使PUE值达到1.3。
但要进一步降低PUE,或是数据中心选址在南方等年平均气温较高的地方,液冷就可能从可选项变成必选项。液冷技术的高效制冷效果有效提升了服务器的使用效率和稳定性、延长服务器寿命,同时占地面积小、系统布置改造灵活,使数据中心在单位空间布置更多的服务器,提高数据中心运算效率。根据中国储能网数据,液冷技术相对于风冷而言约可节约20%的空调电能,同时因取消服务器内部风机,IT部分电能可节省13%~25%,总体的节能效果在40%以上。
液体比热容不受海拔与气压影响,可以保持较高的散热效率,保证数据中心在高海拔地区的运行效率和性能。以液体为载体,可以直接通过热交换接入楼宇采暖系统和供水系统,满足附近居民的供暖、温水供应等需求,为数据中心创造了附加价值。液冷技术可以满足2.7-30kW/机柜的数据中心散热需求,解决超高热流密度的散热问题,因此液冷数据中心基础设施的快速发展是必然趋势。液冷技术可使数据中心PUE 达到1.3 以下。其中浸没式液冷技术可以将PUE降到1.2以下,联合其他技术,可以趋近于1。
目前液冷方案中,冷板式是我国最早采用的液冷方式,成熟度较高,由于价格相对较低、可改装、对服务器自身要求较低等优势占据主导地位。IDC数据显示,2023上半年,中国液冷服务器市场中,冷板式占到了90%。整个冷板式液冷系统可分为一次侧循环和二次侧循环。其中,一次侧冷源可采用机械制冷系统和自然冷却系统。机械制冷系统包括风冷冷冻水系统和水冷冷冻水系统,可提供12C-18°C的中温冷冻水;自然冷却是在室外气象条件允许的情况下,利用室外空气的冷量而不需机械制冷的冷却过程,自然冷却系统可采用开式冷却塔、闭式冷却塔和干冷器等设备实现,可提供30°C以上的冷却水。二次侧液体回路是指从冷量分配单元到机架,通过供回冷却工质歧管和IT设备连接,然后再通过歧管返回冷量分配单元的设计。来自二次侧冷却回路的热量通过冷量分配单元的板式热交换器传递到一次侧冷却回路,最终排放到大气中或被热回收再利用。
4、规模:2027年中国液冷服务器市场规模预计将达到89亿美元
液冷产业生态涉及产业链上中下游,包括上游的产品零部件提供商、中游的液冷服务器提供商及下游的算力使用者。上游主要为产品零部件及液冷设备,包括快速接头、CDU、电磁阀、浸没液冷TANK、manifold、冷却液等组件或产品供应商。部分代表厂商有英维克、3M、云酷、竞鼎、诺亚、广东合一、绿色云图、同飞股份、高澜股份等。中游主要为液冷服务器、芯片厂商以及液冷集成设施、模块与机柜等。部分代表厂商有华为、中兴、浪潮、曙光、新华三、联想、超聚变、英特尔等。下游主要包括三家电信运营商,百度、阿里巴巴、腾讯、京东等互联网企业以及信息化行业应用客户,主要在电信信息、互联网、政府、金融、交通和能源等信息化应用。目前,阿里巴巴以单相浸没式液冷为主要发展方向,其他用户以冷板式液冷试点应用居多。
近年来,中国液冷数据中心市场快速发展,保持30%以上的市场增速。根据科智咨询,2022年,液冷需求迎来一波增长高潮,头部泛互联网企业出于降本增效考量,进行高密部署,同时通过应用液冷技术降低运营成本;基础电信运营商加大液冷技术试点力度,在全国范围内部署200+液冷数据中心试点项目,拉动液冷市场增速出现较大幅度提升。
根据科智咨询数据,2022年液冷数据中心市场规模达到100.5亿元,同比增长47.2%。当前AI行业发展如火如荼,产生大量智算需求,带动智算中心建设。智算中心GPU服务器单机柜功率密度超过30kW,传统风冷方案难以满足大规模散热需求,液冷需求将大幅提升。根据科智咨询,2023年中国液冷数据中心市场将实现53.2%的高速增长,市场规模将达到154亿元。预计到2027年,AI大模型商用落地,液冷生态趋于成熟,市场规模有望达到1020 亿元,2022-2027年CAGR达59%。
根据IDC发布的《中国半年度液冷服务器市场(2023上半年)跟踪》报告数据显示,2022年中国液冷服务器市场规模达到10.1亿美元,同比增长189.9%。2023上半年中国液冷服务器市场规模达到6.6亿美元,同比增长283.3%,预计2023年全年将达到15.1亿美元。IDC预计,2022-2027年,中国液冷服务器市场年复合增长率将达到54.7%,2027年市场规模将达到89亿美元。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)