【国盛证券】AI算力再起,开启全球共振.pdf

2023-09-24
18页
1MB

海外快速迭代,国内需求渐强

光模块数量和比例取决于不同组网方式和计算单元,差异较大,最终整体需求取决于不同组合的销售占比情况,总体仍然会有强有力的需求。


谷歌自研TPU系列作为训练芯片,其中其2023年6.17 ISCA的论文提到90%的训练在TPU上进行。2020年开始部署TPUv4,对应400G光模块,而我们预计当前已经开始部署TPUv5,对应800G光模块。一个TPUv4 Package有16个OSFP连接口,作为外部的IC1互联。每个TPUv4有6个ICI link,16个Package组成一个机柜(Rack),一共有64个机柜,按8*8去排列。


机柜与机柜间的连接要经过OCS,全称Optical Circuit Switch,是谷歌自研的光交换机。 谷歌OCS交换机成为Palomar,拥有136*136个端口交互能力,用MEMS阵列控制光路输入输出。 应用中,一般128个通道是工作通道,8个是测试通道。


AWS Trainium 是 AWS 专门为超过 1000 亿个参数模型的深度学习训练打造的第二代机器学习 (ML) 加速器。 每个加速器包括2个NeuronCore,具备32GB HBM内存,提供190TFLOPS的FP16/BF16,380 INT8 TOPS,47.5 FP32 TFLOPS 。卡间互联网络采用NeuronLink-v2,类似于NVLink,互联速率达到384GB,比A100 300GB要高。


EC2 UltraClusters是可以扩展到数千张GPU或者ML加速器,例如AWS Tranium、H100、A100的集群。 EC2 允许扩展到20000H100,A100则是仅扩展到4000张,Trainium可以扩展至30000张。


Meta自研的MTIA芯片当前仅使用100G总带宽,而卡间互联还是使用PCIE GEN4。也可以看到,在云厂商中8个A100的方案大部分采用400G的总带宽接入,而不是Nvidia的1.6T。


每个OAM非卡间互联带宽为300G RoCE,8张卡对应8*300G对应6个QSFP-DD1连接口,即每个QSFP-DD为400G。 如果构建成二层、三层400G网络集群则对应卡:400G光模块=1:4.5。


昇腾910B作为AI处理器,是构成Atlas 900 PoD集群的核心组件之一。 Atlas 900 PoD通过集成昇腾910B等AI处理器,构建出一个强大的AI 训练集群,提供高性能的AI计算能力。 Atlas 900 PoD(型号:9000)是基于华为鲲鹏+昇腾处理器的AI训 练集群基础单元,具有超强AI算力、更优AI能效、极佳AI拓展等特点。 该基础单元广泛应用于深度学习模型开发和训练,适用于智慧城市、 智慧医疗、天文探索、石油勘探等需要大AI算力的领域。


含光800是平头哥发布的首颗数据中心芯片。含光800是一颗高性能人工智能推理芯片,基于12nm工艺, 集成170亿 晶体管,性能峰值算力达820 TOPS,推理性能达到78563 IPS,能效比达500 IPS/W。 含光800采用平头哥自研架构,通过软硬件协同设计实现性能突破。平头哥自主研发的人工智能芯片软件开发包,让 含光800芯片在开发深度学习应用时可以获得高吞吐量和低延迟的高性能体验。含光800已成功应用在数据中心、边 缘服务器等场景。


技术推动需求/供给结构性变化

传统数通市场受益于交换机芯片3年一代的升级周期,速率端口基本上3年升级一倍;受益于AI芯片的快速迭代和上量,预计端口速率升级翻倍的时间将缩短至2年以内。


OFC 2024,Broadcom、Lumentum等大厂展出200G EML、DSP和配套激光芯片驱动器。国内众多厂商在2024年OFC上展出了1.6T光模块,头部厂商研发领先优势较为明显。


硅光技术是利用现有集成电路 CMOS 工艺在硅基材料上进行光电子器件的开发和集成。与分立器件方案不同,硅光技术的集成度更高,封装形态也更加简化。


硅光芯片晶圆利用率高,可以复用CMOS集成电路较为成熟的产业链,上量后边际成本低。硅光的应用取决于客户接受度,而我们认为AI驱动的光模块需求爆发供应紧缺下,客户对硅光的接受度有望提升。


Lightcounting预计使用基于SiP的光模块市场份额将从2022年的24%增加到2028年的44%。 此外Lightcounting认为SiP调制器相较GaAs、LnP材料而言是线性驱动设计的最佳选择,LPO有望加速硅光渗透率进一 步提升。


功耗和成本收益:一般光模块的功耗大约占整机功耗的40%以上,LPO模块主要将光模块DSP去掉,将功能和复杂度交给交换机芯 片ASIC,预计将降低设备整体功耗( 7nm DSP,功耗占到了整个模块功耗的50%左右),从而节省电费。DSP的BOM成本约占20-40%,Driver和TIA集成了EQ,成本略有增加,但整体还是下降的。 时延收益:单通道比DSP方案节约~100ns,比模拟CDR方案节约~10ns。


Marvell认为LPO适合Host side链路较短、损耗减小的场景,例如SR;而DSP则可以覆盖SR\DR\FR 。Marvell认为LPO方案有望与DSP方案共存,主要应用场景在距离较短的服务器到TOR交换机层级。


实际中,不同Vendor制造的交换机可能存在电性能的差异;同一个交换机不同端口插损也差异较大; 最终测试结果LPO光模块的BER误码率等参数数值也存在差异。 标准上,Asic-Module这一段电学性能仍需要进一步完善定义。


光模块是通信、网络设备端口实现光电信号转换与收发的分立器件,与交换机芯片分开。 CPO将光模块中的光学部分(光引擎)拉近,以解决高速电信号传输距离远带来的功耗更大、带宽较低的问题。


一是联合交换机芯片、高频基板做CPO整体封装,即PCB板上面高频载板的部分;二是不包括交换机芯片,仅做Optics、DSP、 TIA、Driver及光学部分的封装,地位、能力与光模块没有太大差异;三是仅做Optics代工封装,价值量预计是光模块的60%。


在400G DR4、800G DR8需求量比2023年有望翻1-2倍的情况下,高速光芯片100G EML将十分紧缺。 光芯片扩产需要核心设备MOCVD,到货到调试至少需要一年时间,我们预计至少到24H1行业光芯片将十分紧俏。1.6T需求或催生行业200G EML,国内厂商当前积极研发布局100G/200G EML。


CW DFB广泛应用于外耦合光源的硅光模块中,除了Intel,绝大部分光模块厂商采用外耦合方案。我们预计2024年硅光模块在800G占比有望提升,将带动CW大功率光源的需求量发展。 CW光源国内外光芯片厂商基本处于同一起跑线,我们认为国产突破的可能性更大。


薄膜铌酸锂是一种高带宽的材料,可以支持800G\1.6T等更高速率模块; 硅光的带宽到达单通道200G/lane难度大,传统方案带宽到单通道200G难度也接近极限(EML),TFLN的上限可以更高。 薄膜方案处于研发导入状态,2024年或见部分应用。


新的场景培育新的连接机会

微软星际之门的计划出炉,百万级GPU是部署在一个数据中心内部还是部署在多个数据中心,引发DCI需求的探讨。 东数西算、算力光网的大规模投入建设,带动国内骨干网升级的需求。 新时代光传输网络作为算力底座,根本是需要解决大容量和低时延的问题。大容量需以400G OTN为核心,低时延要求 围绕算力枢纽、省节点建设互联线路。算力时代将重塑我国干线光网架构,并带来400G技术代际投资机会。


传统地面通信可以解决移动用户、固定用户(有线用户)的通信问题。全球仍有27亿人口没有接入互联网,卫星通信目前看是解决更大量移动用户方面的通信问题的重要方法。 截止至2022年,全球按应用发射的卫星数量如下:通信80%、遥感10%、技术开发7%、科学1%、其他1%。


卫星互联网的标准化进程在加快,国际组织以3GPP为主, 国内以CCSA和TAF(电信终端产业协会)参与为主,2022 年R17冻结进一步增强了透明转发框架下的内容;R18将为 未来消费级的商用终端引入更多可用频段。 2024年从卫星资产运营模型维度有不同领域的催化。我国当前主要的两个低轨卫星星座运营主体。


星上处理是指基站部署于空间段,在卫星上进行数据调制解调以及数据处理,才能进行卫星组网,更有意义;透明转发 的意思是星上不做数据的处理,仅通过射频链路对数据进行转发。 T/R 芯片被集成在 T/R 组件中,负责信号的发射和接收并控制信号的幅度和相位。相控阵天线是通过控制阵列天线中辐 射单元的馈电相位来改变方向图形状的天线,可以方便某方向的信号增强,在卫星、雷达中广泛应用。 卫星通信需要地面接收站,其中核心网主要作为用户注册管理等的应用,未来卫星用户增加有望带动地面站点的建设。


5G-A(5.5G)是5G的增强版本,也是5G向6G发展的演进技术,5G-A具有毫秒级时延和厘米级定位精度,具 有更高速率、更大连接、更低时延、通感一体、智算一体。中国移动日前公布首批100个5G-A网络商用城市名单,并计划年内将商用范围扩展至全国300多个城市,并计 划年内推动产业链推出20多款5G-A终端,发展5G-A终端用户超2000万。 通感一体化技术是5G-A的新增能力,即将通信、感知、算力等能力融合管理的技术,让通信基站在提供蜂窝 宽带通信能力的同时,叠加了感知功能,可对周边的无人机、汽车或轮船等物体进行探测跟踪,对低空经济发 展有重要辅助。目前,各地已经在“水陆空”全场景开展5G-A“通感一体”关键技术的验证和规模试点。


报告节选:








(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)


相关报告

通信行业2024上市公司见面会暨春季策略会:全球算力共振,国内新连接开启.pdf

友讯达研究报告:智能电网通信头部企业,电表业务迎放量.pdf

浙江电信通信机房中大智能新风系统招标文件.docx

自考操作系统原理-进程同步与进程通信.pptx

现代通信系统.pptx

通信行业专题报告:通感一体化网络,护航低空经济腾飞.pdf

【国盛证券】AI算力再起,开启全球共振.pdf-第一页
联系烽火研报客服烽火研报客服头像
  • 服务热线
  • 4000832158
  • 客服微信
  • 烽火研报客服二维码
  • 客服咨询时间
  • 工作日8:30-18:00