1 内存接口芯片龙头,受益 DDR5 渗透与 AI 浪潮
1.1 积极拓展内存接口芯片,新产品稳步推进
1.1.1 JEDEC 董事会成员,由内存接口拓展多系列互连类芯片产品
以内存接口芯片为基,围绕互连类芯片拓展 PCIe-Retimer 5.0、MXC、CKD 及 MCR 接口芯片等多种新品。澜起科技自 2004 年成立以来,一直专注为数据中 心、云计算和人工智能领域提供基于芯片的解决方案,在内存接口芯片领域深耕十 多年,成为全球可提供从 DDR2 到 DDR5 内存全缓冲/半缓冲完整解决方案的主 要供应商之一,相关产品已成功进入如三星、海力士及美光等国际主流内存厂商, 并辐射下游服务器和云计算领域。公司在内存接口芯片领域占据全球市场的主要 份额,同时公司也是内存接口芯片的领导者和全球微电子行业标准制定机构的董 事会成员之一。 此外,澜起科技与清华大学合作研发的津逮®系列服务器 CPU 实现了芯片级 实时安全监控功能,可为大数据及人工智能时代提供更安全的数据处理平台。经过 多年的研发积累,公司产品性能在行业内赢得高度认可,满足了新一代服务器对高 性能、高可靠性和高安全性的需求。
随着 DDR5 的逐渐渗透,公司自 2021 年发布 DDR5 第一子代内存接口及模 组配套芯片后,又相继于 2022 年、2023 年成功发布了 DDR5 第二子代、第三子 代 RCD 芯片,并于 2024 年 1 月送样 DDR5 第四子代 RCD 芯片,传输数据速率 高达7200MT/s,足以应对新一代服务器平台对内存速率和带宽不断攀升的需求。 此外,公司还着力研发了 MRDIMM/MCR 内存接口芯片,采用 MRCD*1+MDB*10 架构,理论带宽为 DDR5 的两倍,大大提升了单模组价值量,并可用于下游对内存带宽需求高的场景,满足各种高性能计算。 除此之外,公司还开发 PCIe Retimer 5.0 芯片、CKD 及 MXC 等芯片,主要 用于 AI 服务器等需要高速传输的端口和高速 PC 内存模组,为公司长期业绩增长 铺平道路。
1.1.2 内存接口芯片龙头,技术持续引领
从消费电子芯片起步,成为互连类芯片龙头厂商。公司前身澜起有限成立于 2004 年 5 月,早期公司同时发力内存接口芯片与数字机顶盒芯片,用较为成熟的 数字机顶盒业务所贡献的现金流,来支持内存接口产品线的发展。公司于 2008、 2011、2013 年先后推出了 DDR2 高级内存缓冲器、DDR3 寄存缓冲器及内存缓 冲器、DDR4 寄存时钟驱动器及数据缓冲器等一系列内存接口芯片。 2016 年以来,澜起科技与英特尔及清华大学鼎力合作,研发出津逮®系列服 务器 CPU,为云计算数据中心提供更为安全、可靠的运算平台,同时扩展了混合 安全内存模组、PCIe Retimer 芯片和内存模组配套芯片等业务。在 2017 年,公 司剥离了消费电子芯片业务,而专注于服务器内存芯片领域,以云计算和人工智能 为核心,不断扩展产品线。 2022 年,公司启动了 CKD 芯片、MXC 芯片和 MRCD/MDB 芯片三大互连 类芯片的研发工作,逐步转型为平台型芯片设计公司。而随着 2023 年内存进入 DDR5 新世代,公司紧跟时代,DDR5 的第二子代 RCD 芯片率先出货,第三子代 RCD 芯片已送样客户,第四子代已于 2024 年 1 月推出。
1.1.3 股权结构分散,英特尔三星入股彰显质地
公司股权结构分散,截至 2023 年三季报,在剔除公募基金持股后,公司前 10 大股东持股合计 28.7%。我们认为:分散的股权架构避免了一股独大的局面,在 多数股东投票表决的情况下,公司决策更具客观性与独立性,能够避免潜在的利益 冲突。 此外,值得注意的是公司曾获三星及英特尔战略投资。2016 年 4 月,澜起科 技通过发行优先股的方式引入 Intel、三星成为新的战略投资人,2018 年 12 月 Intel、三星再次增资。在澜起科技上市前,英特尔(INTC.O)持有 10%的澜起科 技股份,三星持有的澜起科技股份合计约 1.11%。截至 2023 年三季报,Intel 仍 持有公司 6.65%股权。三星为全球内存模组及消费电子龙头厂商,而 Intel 则为 CPU 寡头之一。能够成为上述两家公司的战略投资标的,一方面强化了公司的客 户壁垒,另一方面也从侧面印证公司在内存接口芯片领先技术实力。
1.2 接口+互连新品驱动业绩,期待 DDR5 时代大放异彩
1.2.1 服务器、PC 迎去库尾声,新品放量在即
DDR4 时代营收利润双增,DDR5 时代或更上一层楼。公司营收自 2016 年 8.5 亿元增长到 2018 年 17.6 亿元,主要是受益于 DDR4 的快速渗透与市场份额 的大幅提升。2018 年至 2020 年期间,随着 DDR4 的渗透逐步完成,公司营收保 持相对稳定,维持在 17-18 亿元。净利润三年内从 7.4 亿元到 9.3 亿元,再攀升 至 11.0 亿元,其中 2019 年主要受益于期间费用下降和投资收益影响,2020 年 则主要是因为投资收益、公允价值变动收益和其他收益等非经影响。 2021 年之后,DDR5 渗透以及津逮服务器上量,公司营收大幅增长,2022 年 营业收入达 36.7 亿元,同比分别增长 43.3%,并实现归母净利润 13.0 亿元,同 比增长 56.7%。2023 年前三季度,由于前期备货导致库存积压,以及 2023 年以来下游市场的疲软,公司前三季度收入和归母净利润都出现了下滑,前三季度营收 15.3 亿元,同比下降 47.1%,归母净利 2.3 亿元,同比下降 76.6%。
从业务结构演变来看,2016 年与 2017 年,公司营收来自内存接口芯片和消 费电子芯片。其中消费电子业务收入在此两年稳定在 2.9 亿元左右,内存接口芯片 方面,随着 DDR4 渗透,以及公司市场份额的提升,其对应营收稳步提升,由 2016 的 5.6 亿元上升至 2018 年的 17.5 亿元。 2018 年开始,公司为了优化资源配置,提高运营效率,开始把资源集中在内 存接口芯片,并剥离消费电子业务。随后,为拓展产品线及整合客户资源,公司与 清华大学合作研发了津逮服务器,为下游服务器 OEM 或 ODM 厂商提供安全可 控的本土 CPU 产品。津逮产线于 2021 年开始放量,当年贡献营收 8.5 亿元。 2018 年,DDR4 基本完成渗透,且公司市场份额开始稳定,在 DDR4 产品价 格存在年降的背景下,公司通过迭代子代产品稳定了产品价格,因此 2018-2020 年内存接口芯片营收稳定在 17.5 亿元左右。2021 年起则由于更高价值量的 DDR5 接口芯片新品开始出货,维持了整体价格,因此内存接口芯片营业收入仍保持稳定, 2021 年贡献营收 17.2 亿元。
2022 年,受益于 DDR5 的渗透,内存接口芯片收入迅速上升至 27.4 亿元, 同时津逮服务器同样放量,实现营收 9.4 亿元。由于 2022 年行业预先采购备货, 2023 年行业下游库存较高,伴随 2023 年终端需求疲软,公司 2023 年 H1 内存 接口芯片营业收入同比下降明显。 当下行业库存调整结束,需求出现延续性回温。跟踪信骅月度数据来看,其单 月营收自 2023 年 1 月幅度下降后,在 2023 年上半年保持稳定,并在 6-11 月开 始持续环增,在 12 月环比略微下降后,2024 年 1 月继续环增 13.7%,2023 年 四季度营收 9.8 亿新台币,季度环比 23.54%,总体呈现出趋势回升的态势,信骅 也表示虽然 24 年一季度因 2 月工作天数较少,订单不确定性较高,但可以确定的 是 2024 年少了库存问题,营运将更轻盈,出货量将随市场需求复苏继续恢复。
随着下游库存逐步恢复正常,公司内存接口芯片与津逮服务器业绩有望恢复。 此外随着多类互连类芯片的验证完毕,公司成长天花板进一步开拓。
1.2.2 毛利率拐点将临,高研发投入转化收入可期
毛利率总体波动较大,但内存接口芯片毛利率较高且稳定。公司毛利率在 2016-2023H1 呈现出较大的波动性。其中 2016-2017 年由于毛利率较低的消费 电子业务占比较高,公司总体毛利率在 50%附近徘徊。2018 年,公司剥离消费电 子芯片业务,总毛利率显著上升至 70.54%,并在高位维持至 2020 年。2021-2022 年,随着毛利率较低的津逮服务器上量,公司整体毛利率再次下滑,2021 年和 2022 年毛利率分别为 48.1%和 46.4%。2023H1 受到行业去库存影响,津逮服务 器出货量减少,总体毛利率有所恢复,上升至 56.3%。 公司互连类芯片毛利率在 2016-2019 年呈上升趋势,主要因 DDR4 内存接口芯片的迭代及晶圆成本的下降。而迭代完成后,随着产品价格年降,以及低毛利 率的内存接口配套芯片开始并入互连类芯片,互连类芯片毛利率有一定下滑。2022 年进入 DDR5 时代,公司互联类芯片毛利率开始企稳,不过由于低毛利率的配套 芯片占比上升,其仍低于 DDR4 时代 2019 年的 74%。未来随着 DDR5 子代迭代 加快,内存接口芯片毛利率将维持在较高水平,毛利率同样较高的互连类芯片新品 也将逐渐上量,公司整体毛利率有望保持高位。(注:2020 年之前互连类芯片仅包 含内存接口芯片。)
研发费用方面,公司重视研发投入和技术革新,2016-2023 年前三季度始终 维持较大的研发投入水平。为研发 DDR4 接口芯片新品,2016 年公司研发费用率 高达 23.5%。随后两年受益 DDR4 内存接口芯片放量,营收规模效应带动研发费 用率下行。公司研发费用率在 2017-2022 年期间继续保持在 15%左右,随着公司 收入快速增长,研发费用绝对值同样由 2017 年 1.9 亿元增长到 2022 年的 5.6 亿 元。 2023 年公司同样保持了较高的研发投入,前三季度研发费用为 4.87 亿元, 但由于 2022 年以来行业景气度下行,公司营收下滑,导致 2023 年前三季度公司 研发费用率增长至 31.9%。展望未来,我们认为公司前期已在新品研发过程中预 先投入了较多研发费用,随着 DDR5 渗透节奏恢复正常及多新品上量,公司规模 效应再起,将带动整体费用率下行,公司有望享有利润弹性。
1.3 技术实力领先,DDR 时代持续引领
截至 2023 年 H1,公司研发人员占比高达 75%,部分管理人员具有深厚的研 发及产业经验。2020-2023H1,公司研发人数逐年增加,60%以上的至少拥有硕 士及以上学位,毕业于国内外著名高等院校。公司非常重视研发人才的培养,设立 “四位一体”培训体系,为各个研发项目提供了扎实的人才储备。为了吸引更多优 秀人才加盟,公司不断提升研发人员平均薪酬,并对有重要贡献的研发人员实行股权激励。主要研发部门在核心技术人员的带领下潜心研发,实现了在 DDR5 新世 代的技术领先。 公司核心研发人员皆毕业于国内外著名高等院校,担任过核心职位。董事长杨 崇和博士曾于 2010 年当选美国电气和电子工程师协会院士,还荣获多种奖项,其 中包括“IEEE CAS 产业先驱奖”和上海市政府授予的“白玉兰荣誉奖”。其他研发 人员也具备丰富多样的研发经历。
公司通过多年的自主创新和技术研发,目前拥有互联类芯片、津逮服务器和 AI 芯片专利。截至 2023H1,公司累计获得发明专利 151 项(包含 7 项专利合作协 定申请)、实用新型专利 2 项、软件著作权 11 项,其他专利 67 项,建立起了完整 的自主知识产权体系。
2 DDR5 加速渗透,内存接口芯片核心收益
2.1 低功耗、高性能新需求,DDR5 加速渗透
2.1.1 深析内存模组,多通道架构带来接口芯片需求
DDR SDRAM 全称为双数据率同步动态随机存储器,DDR 在原有的 SDRAM 的基础上改进而来,SDRAM 在一个时钟周期传输一次数据,而 DDR 在一个时钟 周期传输两次数据,因此传输带宽更大。随着技术的发展,DDR 经历了多轮技术 迭代,发展出了 DDR2、DDR3、DDR4 和 DDR5,其主要的区别是在于传输速率 的不同,此外,不同内存类型具有不同的技术规格和性能。DDR5 是目前最新的内 存类型,可以提供更高的传输速率和更高的带宽,并能够达到 8400MHz 的传输速 率,同时还支持更高的容量和数据完整性。 内存结构从底层 chip 到 channel,多通道传输对接口芯片提出较高需求。内 存底层结构为内存颗粒,也就是 chip,其中每 64bit 颗粒构成一个 rank 与 CPU 连接,而一个 DIMM 通常由很多 rank 组成。DIMM 继续往上则是 channel(通 道),通常一个通道上可能有多个 DIMM 插槽,用来插多根内存条,这些槽位分成 两组或多组,组内共享物理信号线。从理论上讲,多通道数据传输速率可以达到单 通道数据速率的数倍(多通道速率 = 单通道速率 × 通道数量),服务器主板通常 采用多通道架构,这种架构通常需要采用内存接口芯片进行信号协调。
2.1.2 DDR5 为最新一代内存规格,性能更优功耗更低
2020 年 7 月,JEDEC 固态技术协会发布了其第五代主流内存标准 DDR5 SDRAM 的最终规范,DDR5 再次拓展了 DDR 内存的性能,将峰值内存速度提高 一倍,同时大幅增加了内存容量。具体而言,DDR5 存在以下改进: 1)更高的速度和带宽:DDR5 内存相对于 DDR4 有更高的内部时钟速度和数 据传输速率,从而提供更高的带宽。DDR5 的传输速率可以达到 6400MT/s 以上,比 DDR4 的最高传输速率提高了一倍以上。因此对 AI 服务器等高带宽需求的应用 场景,DDR5 能够更优秀的胜任。 2)更高的密度和容量支持:DDR5 内存相对于 DDR4 可以支持更大的内存容 量和更高的密度。DDR5 内存模块的单个芯片容量更大,同时支持更多的通道和更 多的插槽配置,可以提供更大的存储空间。 3)更低的功耗:DDR5 内存相对于 DDR4 具有更低的工作电压和更高的能 效。DDR5 的工作电压通常为 1.1V,比 DDR4 的 1.2V 低一些。低功耗的特点有 助于减少能源消耗,并且产生较少的热量。 4)更严格的时序控制:DDR5 引入了更严格的时序控制,以确保数据的稳定 和可靠传输。通过更精细的时序控制,DDR5 可以提供更高的性能和更好的信号完 整性,因此其在多核服务器等对信号稳定性要求较高的应用场景中表现将更为出 色。 5)改进的错误修复和可靠性:DDR5 引入了新的错误修复和可靠性功能,包 括行级错误修复(RAS)和列级错误修复(CAS)。这些功能可以提供更好的数据 完整性和可靠性,减少因内存错误导致的系统崩溃和数据损坏的风险,更大程度保 证了系统的可靠性与数据的安全性。
2.1.3 内存接口芯片:内存信号的交通指示灯
内存接口芯片是服务器内存模组(又称“内存条”)的核心逻辑器件,作为服 务器 CPU 存取内存数据的必由通路,其主要作用是提升内存数据访问稳定性,满 足服务器 CPU 对内存模组日益增长的高性能及大容量需求。现阶段,DDR4 及 DDR5 内存接口芯片按功能可分为两类:一是寄存缓冲器(RCD),用来缓冲来自 内存控制器的地址、命令、时钟、控制信号;二是数据缓冲器(DB),用来缓冲来 自内存控制器或内存颗粒的数据信号。RCD 与 DB 组成套片,可实现对地址、命 令、时钟、控制信号和数据信号的全缓冲。 服务器 CPU 需要稳定的并行内存信号输入,不同内存模组采用不同方案以达 成目的。UDIMM 采取物理方式将线长做到一致,但此方案对工艺要求较高,不适 用于传输速率较高的场景;RDIMM 采用 RCD 芯片对内存信号进行缓冲驱动,从而保证了输入信号的一致性,被广泛应用在服务器中;而采用 RCD 和 DB*10 套 片对地址、命令、时钟、控制信号及数据信号进行缓冲的内存模组则被称为 LRDIMM,成本相对 RDIMM 较高,通常更用于内存容量更大的场景,2021 年渗 透率不足 10%。未来,随着 MCR 内存和 MRDIMM 的出现,内存模组速率将更 进一步,不再成为制约性能的瓶颈,高性能服务器或将受益,而公司所生产的 MRCD 和 MDB 也将崭露头角。
此外,根据 JEDEC 规范,DDR5 内存模组都需要配备一颗 SPD-TS 芯片与 PMIC 芯片,而服务器内存模组则需要单独另配一颗 TS 芯片。 SPD 芯片英文全称为 Serial Presence Detect,是一个 EEPROM,其内部记 录了内存工作的最基本的参数,主板启动对内存进行检查时可以根据其中的信息 调整内存的读写等待时间等工作状态,方便自动配置。目前澜起科技 SPD 与聚辰 股份合作。TS 用于检测温度,提高系统稳定性,PMIC 则用于电源管理,澜起科 技与 GMT 合作以供应此两款产品。
接口芯片竞争格局集中且稳定,澜起 2020 年市场占有率位于首位。内存接口 芯片行业相对封闭,前期需要与内存厂商、服务器厂商进行广泛的互操作测试,认 证壁垒高且周期较长,新进入难度较大。自 DDR4 时代开始,行业集中度进一步 提升,TI、Inphi 等厂商相继退出市场,自此内存接口芯片市场参与者仅剩澜起科 技,瑞萨(IDT)和 Rambus 三家。 澜起科技在 DDR4 迭代中期(2016 年)的市场占有率为 20%,并凭借其产 品的出色性能逐步赢得了市场的广泛认可,而同阶段 IDT 在被瑞萨收购过程中核 心研发团队发生一定程度流失,从而澜起科技市场占有率稳步提升。至 2020 年, 澜起科技市场占有率为 44%,拔得头筹。澜起科技作为 JEDEC 董事会成员之一, 保持较高市场敏感度,并不断推出契合市场需要的新品规格,未来有望继续保持较 高市场份额。
2.2 以史为鉴,D5 渗透有望复刻 D4 时代节奏
2.2.1 英特尔突破制程瓶颈,D5 渗透迭代或更为顺畅
DDR4 时代,三星在 2014 年 8 月宣批量投产全球第一款采用 3D TSV 立体 硅穿孔封装技术打造的 DDR4 内存条,单条容量高达 64GB,主要面向服务器 RDIMM,内存模组集成高达 36 颗 DDR4 DRAM 内存颗粒,每一个都封装了 4 个 4Gb(512MB) DDR4 DRAM 芯片,单颗容量 2GB,并采用三星先进的 2xnm 工艺制造。同时 Intel 也于 2014 年 8 月 29 日会发布 LGA2011 平台的新旗舰— —Haswell-E 处理器及 X99 平台,其中 Haswell-E 将在桌面级市场首次提供原生 8 核及 DDR4 内存支持,可支持四通道最高 2,133MHz DDR4 内存。 由此 DDR4 开始渗透,2015 年渗透率达 25%,2016 年达接近 60%,2017年达到 80%,基本完成渗透。
多家权威机构预期 2024 年 DDR5 将进入高速渗透期。目前 DDR5 内存最先 在 PC 市场推广开来,支持 DDR5 内存的服务器 CPU 亦在逐步推出。在下游 PC 与服务器对内存升级的需求拉动下,DDR5 的普及速度加快,全球三大 DRAM 厂 商纷纷布局推出 DDR5 产品,三大厂商的 DDR5 内存均已于 2021 年下半年量产 出货,英特尔也于 2021 年下半年发布首个支持 DDR5 的处理器平台。 截至目前,DDR5 产品已经在各大 PC 及服务器厂商中广泛运用,2023 年底 渗透率达 25%-30%,根据 TrendForce 预测,DDR5 渗透率将在 2024 年第三季 过半。另外,存储巨头美光也表示预期 2024 年初 DDR5 渗透率将超 DDR4。
Intel 采用 EUV 光刻突破制程瓶颈,CPU 升级受限不再成为内存迭代阻碍。 Intel 处理器支持频率升级滞后内存产品工作频率升级一年左右,通常内存厂商会根据 CPU 厂商的系统参考设计,并通过层层测试。CPU 升级也会反过来影响内存 产品的推出,CPU 厂商和内存厂商在合作中共同升级。 DDR4 时代内存产品升级受制于 CPU 制程瓶颈:Intel 在 2014 年 14nm 制 程实现量产后,自 2015 年开始,一再推迟新制程的发布,直到 2019 年年底才实 现 10nm 的量产,严重影响 CPU 性能升级迭代,CPU 频率和性能升级跟不上内 存产品升级,这也是 DDR4 子代仅有三代的原因之一。 随着 Intel 在 2021 年 7 月公开宣布采用 EUV,并公布未来 4 年五个节点的 制程技术路线,Intel 制程瓶颈有望被打破,DDR5 时代 CPU 平台和内存共同升级 将会更为顺畅。2023 年 10 月,英特尔宣布 Intel 4 正式量产,是英特尔首个完全 采用 EUV 技术的制程节点,CPU 迭代逐渐进入正轨,CPU 性能将不再是 DRAM 升级的瓶颈,内存行业深度受益—一是 DDR5 渗透速度加快,二是 DDR5 子代数 量变多。
2.2.2 DDR5 迭代周期明显缩短,价格与毛利率受益明显
DDR4在整个渗透周期内共有三个子代,速率由2400,2666上升至3200Mhz, 提升幅度为 33%。
DDR5 在整个渗透周期中则将会有 5-6 个子代,从澜起科技已量产和送样的 子代观察,接口芯片速率由第一子代的 4800MT/s 逐渐升级到第四子代的 7200MT/s,提升幅度为 50%。由于代际性能提升幅度更大,公司产品在单内存模 组的价值量有望提升。另一方面,未来 MRCD/MDB 等接口芯片将支持 MRDIMM DDR5,其采用 1MRCD+10MDB 的架构,单内存条价值量有望显著上升。
和 DDR4 相比,DDR5 时代内存接口芯片厂商有望维持更高的 ASP 和毛利 率。DDR5 子代数量更多,代际性能提升更多,迭代周期更快,DDR4 平均迭代时 间 18 个月,而从目前已送样子代来看,DDR5 迭代时间约为 12 个月,在行业具 有定期降价的惯例下,更快的迭代速度有利于维系公司相关产品毛利率与 ASP, 叠加 DDR5 的高速渗透,公司接口芯片有望量价齐升。 其次,公司目前已经完成第四代 DDR5 RCD 芯片的送样。未来尚需投入的流 片封装费用的产品为第五和第六子代(若有),封测成本增长有限,而晶圆厂产能 逐渐松动,代工成本同样有望下行,也有助于毛利率好转。
3 开拓 PCIe retimer、CKD 等多款新品,成长空 间广阔
3.1 AI 浪潮兴起,内存新技术方案涌现
3.1.1 AI 服务器要求大容量高速率存储
随着云计算、大数据、AI、物联网等技术应用,数据在近几年呈指数型增长, IDC 统计显示全球 90%数据均在近几年产生,这对 CPU 的处理能力提出考验,而 目前 CPU 的物理工艺、核心数已接近极限,数据量却不会停止,服务器的处理能 力必须提升。AI 服务器通常采用 GPU 进行并行计算,单卡核心数达到上千个,擅 长处理密集型运算应用,由于神经网络、机器学习及图像处理等算法涉及到大量矩 阵运算,使用并行数据处理的方式理论上能够极大提高计算效率,经过几年验证, 搭载 GPU 的服务器也被证实的确适用这个时代。 从硬件架构来看,AI 服务器主要采用异构形式,表现形态多为机架式。在异 构方式上,可以为 CPU+GPU、CPU+FPGA、CPU+TPU、CPU+ASIC 或 CPU +多种加速卡。AI 服务器在其他组成部件上,如内存模块、存储模块和网络模块 等方面与传统服务器差别不大,主要的提升便是支持更大容量的内存,能够满足当 下实时负载增加的需求,以浪潮 NF5688M6 服务器为例,其最多可支持支持 32 条 RDIMM/LRDIMM 内存。在互连方式方面,传统服务器通常采用 PCIe、以太 网等连接方式,而 AI 服务器则更多采用 NVlink 等高速互连方式。
乘 AI 服务器之风,内存行业顺势而起。随着大模型厂商产品发展如火如荼, AI 大模型正带动 AI 服务器算力需求持续扩张。根据 IDC 预测:2023 年中国人工 智能服务器市场规模将达到 91 亿美元,同比增长 82.5%;2027 年将达到 134 亿 美元,年均复合增长率为 21.8%。根据市场研究机构 TrendForce 公布的报告显示,预计 2023 年 AI 服务器(含搭载 GPU、FPGA、ASIC 等)出货量近 120 万 台,同比增长 38.4%,占整体服务器出货量近 9%,预计到 2026 年占比将提升至 15%,同时上调 2022~2026 年 AI 服务器出货量年复合成长率至 22%。内存作为 AI 服务器中重要的硬件之一,一方面受益 AI 服务器的快速增长,另外单 AI 服务 器采用的内存条数量也比普通服务器多,带来可观的内存增量。
3.1.2 存力升级大势所趋,澜起科技前瞻布局
从服务器内部来看,近几年,AI 训练集正以每年 10 倍左右的速度增长,即使 是在边缘设备中,对芯片算力的要求也在飞增,而目前芯片算力虽然变高了,内存 性能却逐渐拖了后腿,造成两者间的不匹配,在现有高算力的基础之上,很多的 GPU 资源其实并没有得到充分的占用和利用,更高带宽和更低延迟的内存就成为 关键。由此,接口行业新技术方案蓬勃发展,其中重点包括 HBM,GDDR,DDR5 及 MCR 内存等,此外,如 PCIe 等非内存技术等蓬勃发展也造就了 CXL 等内存方 案的兴起与发展。下述为与澜起科技相关的技术方案。
1)MCR/MDIMM(Multiplexer Combined Ranks)号称全球最快内存模 组,其核心技术是将多个 DRAM 内存模块组合在一起,通过将两个 Rank 形成伪 多内存通道(Pseudo Channel),并使用专门的控制器(接口芯片)来管理它们 之间的数据传输,大大提高了内存带宽,理论上 MCR/MRDIMM 内存的带宽是 DDR5 的两倍。AMD 已经在 MemCon 2023 上表达了它帮助推动 JEDEC 的 MRDIMM 开放标准的承诺,英特尔也与 SK hynix 和瑞萨合作,基于与 MRDIMM 类似的概念,开发了多路合并阵列(MCR)DIMM。
MCR 内存在接口芯片使用上发生了一些变化,一方面是由 LRDIMM 的 RCD 和 DB 芯片进行升级,使用 MRCD 和 MDB 芯片来专门适配,其设计更为复杂, 速率更高,因此具备更高价值量;另一方面,MCR 内存接口芯片用量结构为 MRCD*1+MDB*10,相对于传统 RDIMM 单 RCD 芯片用量的方案,不仅 MRCD 价值量提升,更多出 10 颗 MDB 芯片用量。综合量价关系,MCR 内存单内存条 价值量具有较大提升。
2)PCIe 5.0(Peripheral Component Interconnect Express 5.0)是新一 代总线技术标准,允许外围设备连接到主板并与中央处理单元(CPU)通信,PCIe5.0 在 4.0 的基础上构建了更加高速的串行通信系统标准,要求每通道的传输速度 达到 8GB/s,在采用 16 通道时,带宽最大可达到 128GB/s,可以同时接受 64GB/s 和发送 64GB/s。数据中心及云计算服务商等对传输带宽要求较高的应用场景将会 显著受益 PCIe 5.0。
PCIe Retimer 是为了解决 PCIe 总线的信号衰减问题而诞生的。由于 PCIe 传 输速率不断攀升,工作频率越来越高,不可避免的带来了信号衰减问题。Retimer 先恢复抖动的时钟信号,再生成新信号并重新发送,从而有效解决信号衰减问题, 保持信号稳定。因此,在服务器中 GPU 与 CPU 连接时至少需要一颗 Retimer 芯 片来保证信号质量。 据统计,一台 8 卡 GPU 的 Ai 服务器需要 8 颗 PCIe 4.0 Retimer 芯片。随着 AI 服务器出货量的增加,AI 服务器 retimer 市场规模不断扩大,单 AI 服务器 retimer 5.0 用量可高达 16 颗。在通用服务器领域,Retimer 芯片的市场规模的 增长则取决于 PCIe5.0 的渗透率,一台通用服务器配 1-2 颗 Retimer 芯片,一颗 Retimer 芯片市场价 20-40 美金不等。据 Businesse Research Insight 测算, 2022 年 PCIe Retimer 市场规模为 2.21 亿美元,预计 2032 年市场规模为 10.07 亿美元,预测期内 CAGR 达 16.38%。
PCIe Retimer 蓝海市场三足鼎立,潜在竞争者跃跃欲试。目前谱瑞-KY、 Astera labs、澜起科技是 PCIe Retimer 蓝海市场中的三家主要厂商,占据领先地 位。其中澜起科技布局 PCIe 较早,是全球可量产 PCIe 5.0 Retimer 的唯一中国 大陆供应商,且 2023 年持续导入客户,已经开始出货。此外,包括瑞萨,TI,微芯科技等在内的芯片厂商也在积极投入 PCIe Retimer 的产品研发中。根据官网信 息,瑞萨可提供包括 89HT0816AP 和 89HT0832P 在内的两款 PCIe 3.0 Retimer 产品;TI 可提供一款 16Gbps 8 通道 PCIe 4.0 Retimer——DS160PT801;同样 地,微芯科技于 2020 年 11 月发布 XpressConnect 系列 Retimer 芯片,可支持 PCIe 5.0 的 32GT/s 速率。 表8:PCIe Retimer 厂商及其
3)CXL (Compute Express Link) 技术是一种新型的高速互联技术,旨在提 供更高的数据吞吐量和更低的延迟,以满足现代计算和存储系统的需求。它最初由 英特尔、AMD 和其他公司联合推出,并得到了包括谷歌、微软等公司在内的大量 支持。CXL 的目标主要是为了解决 CPU 和设备、设备和设备之间的内存鸿沟,解 决内存分割造成的巨大浪费、不便和性能下降。 CXL 技术可以实现高达 25GB/s 的数据传输速度,比目前常用的 PCIe 4.0 技 术还要快。此外,CXL 技术可以将 CPU、GPU、FPGA 等计算设备与内存直接连 接,避免了传统的 I/O 总线带来的时延,从而实现更低的延迟,提高了计算效率。 从能效看,CXL 技术支持在多台计算设备之间共享内存,降低了内存冗余,提高了 能效。此外,CXL 技术还支持内存虚拟化,可以根据应用负载动态分配内存,进一 步提高系统能效。最后,CXL 技术支持内存扩展,允许在不停机的情况下添加更多 的内存容量,从而增加系统的可扩展性,为未来的应用需求做好准备,不仅适用于 数据中心等高性能计算领域,还可以应用于人工智能、区块链、物联网等多个领域。
澜起科技已于 2022 年 5 月发布全球首款 CXL 内存扩展控制器芯片(MXC 芯 片),其属于 CXL 协议所定义的第三种设备类型,支持 JEDEC DDR4 和 DDR5 标 准,同时也符合 CXL 2.0 规范,支持 PCIe 5.0 的速率。该芯片可为 CPU 及基于 CXL 协议的设备提供高带宽、低延迟的高速互连解决方案,从而实现 CPU 与各 CXL 设备之间的内存共享,在大幅提升系统性能的同时,能够显著降低软件堆栈 复杂性和数据中心总成本。 2023 年 5 月,三星电子推出其首款支持 CXL2.0 的 128GB DRAM,有望推 动下一代存储器解决方案的商用化。澜起的 MXC 芯片则被用于该解决方案,是其 中的核心控制芯片。目前公司正在推进量产前的相关准备工作,预计 2024 年开始 进入上量爬坡阶段,有望在未来的全球市场竞争中抢得先机。
3.2 端侧大模型呼唤大容量高带宽,持续加速 DDR5 迭代
大模型发展如火如荼,端侧运行大模型是发展的趋势,内存目前已成为其瓶颈。 根据已有数据显示:70 亿参数的 LLM 在 16 位的浮点数精度的情况下运行最低需 要 14GB 内存,以 Intel 最新一代 Meteor Lake 处理器为例,其最多能够支持 200 亿参数的大模型,即使简单线性估算至少需要 40GB 内存才能够运行,在目前 PC 主流内存配置还是 16GB 的情况下,内存容量大小已经成为了 AIPC 发展的限制因 素之一。相比 DDR4 的单颗粒最高密度 4GB,DDR5 最高可以达到 16GB,能够 在最大程度上支持端侧大模型与 AIPC 的发展。 推理性能受限于内存带宽。模型逐步输出整个生成词汇表的概率列表,然后解 码以选取下一 token。直接选择最高概率 token 是最迅速的解码方法,但其他更 慢的方法可能更精确。内存带宽的提升能加快生成速度和解码速度,从而优化整体 生成速度和用户体验。Intel 在工艺,架构方面的变化,将支持其提供更高性能的 计算能力,为 AIPC 的到来铺平道路。
综上,我们认为 AI PC 发展,有望驱动 DDR5 内存接口芯片量价齐升。 1)DDR5 提供更高的内存容量,在大模型端侧运行的趋势下,对内存容量提 出更高需求,DDR5 渗透率提升更具确定性。
2)更快的推理、生成和解码速度意味着更好的用户体验,结合内存厂商推出 内存数据速率和 CPU 支持内存数据速率的一致性来看,目前内存厂商已经推出了 带宽高达 7200Mps 的内存。 定性角度来讲,AIPC 和 CPU 升级将会带动 DDR5 渗透,提高内存数据速率。 另外,根据 JEDEC 给出的标准,当 DDR5 数据速率达到 6400MT/s 及以上 时,台式机及笔记本电脑的 UDIMM、SODIMM 内存模组须采用一颗专用的时钟 驱动芯片(CKD 芯片),以对时钟信号进行缓冲再驱动,从而提高时钟信号的完整 性与可靠性。 CKD 芯片对于行业来说是一个全新的增量,届时 CKD 芯片每年的行业需求 量将与当年所需的 UDIMM 和 SODIMM 数量(支持速率为 6400MT/s 及以上) 呈正相关。公司已于 2022 年 9 月发布了业界第一个 CKD 芯片工程样品,并送样 业界主流内存厂商。根据 Intel 预计发布的桌面端处理器型号观察,预计于 2024 年四季度发布的 Arrow Lake 将可能会是 Intel 第一个支持 DDR5-6400 及更快速 率的处理器,因此,公司 CKD 芯片有望于 2024 年下半年开始出货,带来全新业 绩增量。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
相关报告
澜起科技研究报告:DDR5加速渗透,新品驱动未来.pdf
澜起科技研究报告:Dram行业三点共振,新业务切入AI算力系统.pdf
澜起科技研究报告:DDR5升级驱动增长,扩品类建平台型企业.pdf
澜起科技专题报告:内存接口芯片领航者.pdf
澜起科技(688008)研究报告:DDR5世代渗透+大算力时代,互连芯片全球龙头乘风而上.pdf
澜起科技(688008)研究报告:DDR5升级驱动业绩,新品扩展描绘蓝图.pdf