计算机行业:DPU硬件标准化的思考与探索

DPU技术现状及挑战


lDPU是继CPU、GPU之后的数据中心第三颗大芯片,本质是围绕数据处理提供网络、存储、安全、管理等数据中心基础设施虚拟化能力的专用处理器


lDPU以数据为中心构建敏捷、灵活、高效的算力基础设施底座,实现极低损耗、极强性能、极高灵活、极致安全,支撑中国移动算力网络多样化业务需求


DPU技术现状及挑战


l各自为营、定向适配的商业模式限制了DPU的产业发展返需完善技术体系,构建统一软硬件标准,加强产业合作,推动DPU产业生态稳步健康发展


DPU硬件标准化思考


lDPU作为典型的软硬一体解决方案,驱需优先引导整机层及部件层标准化、通用化,为芯片与软件的深度整合及生态繁荣提供底层支撑


DPU硬件标准化思考


l服务器硬件标准化建议分两个阶段进行推进。于阶段一优先解决与硬件设计强相关的结构、供电、散热等需求,于阶段二迈入服务器与DPU卡紧密耦合的“深水区”,进一步收敛两者的在带外纳管、运维、底层固件的关系。通过生态标准进行前期引导,待生态成熟通过企标及采购进行落地


lDPU卡硬件标准化建议通过生态标准优先对卡硬件架构、带外纳管等达成方案级别一致,再通过企标进一步约束端口数量规格、功能性能等具体设计要求

计算机行业:DPU硬件标准化的思考与探索

通信世界网消息(CWW)产业数字化转型带动了数字经济飞速发展,算力正在逐步成为新时代的核心生产力,算力发展同步带动了网络变革,为了达到极致的数据处理效率,出现了多种以数据为中心的新型计算架构,其中DPU作为软硬融合的新型计算架构代表,成为行业主流发展方向。DPU是算力网络创新技术之一,统筹虚拟化、数据安全、运维管理等领域,是构建高性能、高可靠云化平台的关键技术,因此应大力推动DPU技术发展与生态成熟。


DPU技术概述


DPU概念存在多种解读方式,如数据处理器(DataProcessingUnit)、数据中心处理器(DatacenterProcessingUnit)以及以数据为中心的处理器(Data-centricProcessingUnit)。无论以何种维度解读,DPU从本质上来看,是一种围绕数据处理提供网络、存储、安全、管理等数据中心基础设施虚拟化服务的专用处理器,是由ARM/x86等架构的CPU与ASIC(ApplicationSpecificIntegratedCircuit)/FPGA(FieldProgrammableGateArray)等专用硬件加速引擎形成的提供虚拟化功能的实体。DPU的出现源于业务发展给云计算领域带来的诸多难题。


一是资源争抢限制。同一计算节点上的云主机实例与虚拟化软件共享计算资源,随着资源需求的提高,资源争抢容易造成服务质量不稳定,尤其在大负载、大流量时I/O性能容易出现严重抖动,无法保障稳定的SLA体验。


二是计算特性损失。云计算技术的核心是IntelVT等硬件辅助虚拟化技术和KVM等主流虚拟化系统软件,通过这些技术为用户提供类似物理服务器资源的虚拟机。但是,一方面,虚拟机相比物理机存在一定的性能损失;另一方面,用户无法在虚拟机中再次部署虚拟化系统,导致私有云无法更好地利用公有云弹性云主机资源,限制了云主机的使用场景。


三是裸金属管理问题。裸金属可以解决虚拟化带来的计算特性损失问题,但是裸金属CPU资源需要全部提供给用户,因此无法在主机CPU上运行云平台管理组件,需要通过带外管理流程完成裸金属实例的部署、交付和运维,整个流程与虚拟化场景差异较大,不符合云计算弹性、灵活的原则。此外,裸金属实例在对接远端分布式存储时,由于存储客户端需要运行在属于用户的CPU上,因此存储网络暴露存在安全风险。


四是随着人工智能的普及,越来越多的云上AI计算任务对网络和存储I/O的时延性能提出了更极致的需求;而RDMA(RemoteDirectMemoryAccess)和NVMe(NVMExpress)等高性能网络和存储协议在传统网卡架构下,难以满足云计算多租户场景的灵活需求。

计算机行业:DPU硬件标准化的思考与探索
上一篇

【奥维云网】2023年中国房地产行业精装修暨家装生态白皮书:精装破局,整装待发

2023-11-16
下一篇

【汽车之家】中国·纯电·新能源汽车行业:汽车行驶及充电行为篇,2023年·春季报

2023-11-16