《DPU发展分析报告(2022年)》重磅发布 DPU发展进入黄金时代

来源:云脉芯联 #云脉芯联#
1.3w

近日,中国信息通信研究院(以下简称“中国信通院”)主办的2023 ICT+深度观察报告会算网融合发展分论坛在线上举办,中国信通院云大所副所长李洁出席论坛并致辞,中国信通院云大所副总工程师郭亮对《DPU发展分析报告(2022年)》对报告进行权威解读,中国电信、云脉芯联、华为、浪潮、英伟达等企业代表线上分享了对于算网融合发展的新洞察、新思考,论坛由中国信通院云大所数据中心部副主任王少鹏主持。

论坛上,中国信通院联合开放数据中心委员会重磅发布《DPU发展分析报告(2022年)》(以下简称“报告”)。作为算力产业链上重要的基础部件,近年来DPU应用发展迅速,国内芯片研发突飞猛进。报告基于行业调研,从产业政策、产业规模、赋能经济三个方面,以数字基础设施建设发展需求为切入,重点梳理了DPU核心价值、关键推动技术,解读了RDMA高速网络、数据面转发、网络可编程、开放网络及DPU软件生态等DPU发展关键因素,并对未来发展前景进行了展望。报告内容深入浅出,全面、深刻反映了当下DPU行业的发展情况。

数字基建中心转向算力 “联接+计算”构建新型算力基础

当前,人工智能、大数据应用进入快速发展阶段,自动驾驶、机器人、AR/VR、元宇宙等应用加速落地,传统数字基础设施难以满足大模型、多模态等新型技术发展,拥有强大集群算力的新型数据中心成为突破人工智能发展瓶颈的重要基础。

近年来,我国高度重视算力基础设施发展,密集出台多项政策,引导产业健康快速发展。2020年国家发改委明确,在新基建的重点方向中,信息领域基础设施建设是基础。在《“十四五”规划和2035年远景目标纲要》中要求要聚焦高端芯片,强化算力统筹智能调度。2021年发布的《新型数据中心发展三年行动计划(2021-2023年)》,具体提出引导新型数据中心集约化、高密化、智能化建设,逐步提高自主研发算力的部署比例,推进新型数据中心算力供应多元化,支撑各类智能应用。2022年中央经济工作会议强调要加快人工智能、绿色低碳等前沿技术研发和应用推广。

从数据中心整体算力角度来看,算力由计算、存储和网络共同决定,任何一项能力不足,都可能导致“木桶效应”,制约整体算力服务能力。近年来我国存储和网络技术快速发展,随着摩尔定律放缓,数据中心计算瓶颈开始显现。在数据中心内部,业务多样性、复杂性的不断提升,流量爆发式增长,网络拥塞、高时延问题频发,CPU等待时间变长也制约着数据中心算力释放。

为了满足持续上涨的算力需求,将存储和网络传输等非计算环节从CPU卸载到DPU等专用芯片上进行,构建以“联接+计算”为中心的新型数据中心架构,可以全面提升数据中心计算能力和运行效率,真正实现以计算为中心去发展数字基础设施。

“东数西算”工程旨在充分发挥西部区域气候、能源、环境等优势,为东部用户提供更多计算资源,有效提升国家整体算力使用水平,同时实现高效低碳、绿色可持续发展。在论坛上,中国电信研究院云网所云计算研究中心总监赵继壮提到,“东数西算”工程需要运营商解决超大数据量远距离访问延迟高、带宽受限等难题,为东部用户提供透明的如局域网一般平滑的访问体验。解决这一难题的关键在于网络以及云网融合技术。在传统算力基础设施中,计算和网络通常是相互割裂的,而通过利用兼具数据传输和数据处理能力的数据处理芯片DPU,可实现计算和网络的融合,支撑算力基础设施向算网一体发展,推进“东数西算”加速落地。对于DPU的实际应用价值,赵继壮分享道,在东数西算的数据传输过程中,要对数据进行压缩和加密存储,而数据量特别庞大,就需要在配备DPU的设备上进行运算,实现更高的算效比。

DPU迎来黄金发展时代 四大关键因素助推技术发展

DPU作为突破数据流量指数级增长带来的性能瓶颈的关键技术,通过算力卸载、算力释放和算力拓展,释放CPU的计算资源,实现任务加速处理,提升整体计算效率,达到降本增效,产业赋能价值凸显。因此,也成为构建新型算力基础设施的重要基础部件和下一代芯片技术竞争的高地。

对于推动DPU发展的关键技术,报告指出,DPU研发需要具备丰富的网络研发及应用积累,RDMA高速网络技术、数据面转发技术、网络可编程技术、开放网络及DPU软件生态四大关键因素将影响DPU产品的未来发展。

RDMA高速网络技术:相比传统TCP传输方式,RDMA在提升吞吐,降低 CPU 占用、降低延时方面有明显的优势。在网络进入100G甚至200G以上的带宽情况下,传统 TCP 协议栈内核转发无法满足性能要求,高吞吐、低延时的 RDMA 技术将承担基础的网络传输功能,进一步提升数据中心整体算力。

数据面转发技术:随着网络流量的指数增长,基于硬件的数据面转发技术越来越重要。基于可编程 Pipeline 的硬件架构则更符合DPU 加速硬件报文转发的发展方向。

网络可编程技术:面对不断变化的业务需求和自定义网络扩展能力的需要,支持网络可编程技术成为 DPU 应用的关键技术因素。能够为DPU带来更出色的灵活性。其中,基于 P4 的协议无关的网络可编程技术逐渐成为DPU上网络可编程技术的发展方向。

开放网络及 DPU 软件生态:DPU 作为数据中心基础设施的一颗重要芯片,需要拥有一个社区驱动的、基于标准的开放生态系统,以开放的形式定义 DPU 可编程基础设施生态,对 DPU 的长期发展至关重要。

面对广阔的应用前景和巨大的市场空间,国际芯片巨头先后布局DPU产品,英伟达于2021年发布新一代DPU BlueField 3,英特尔发布基础设施处理器IPU,AMD收购DPU厂商Pensando。近两年,国内自研DPU芯片发展突飞猛进,头部企业云脉芯联推出国内首款自主研发支持2口100G RDMA智能网卡产品。在商业落地方面,国产自研DPU推进顺利,目前云脉芯联已与国内头部数据中心解决方案供应商合作推进无损网络端网融合解决方案并完成测试。

在此次算网融合发展分论坛上,作为报告的重要技术支持方,云脉芯联产品负责人孙伟分享了云脉芯联基于DPU芯片的TOP创新架构,即“融合互联-Converged Transport”、“开放平台-Open Platform”以及“极致能效-Hyper Performance”。基于该架构,云脉芯联通过自主创新的端网、算网、云网等端到端的高性能融合互联引擎,能够提供百G网络吞吐、微秒级网络延迟和百万级网络连接,支持东数西算及各类新型应用;通过开放的可编程的Pipeline、可编程的拥塞控制算法平台,云脉芯联DPU产品能够给予用户高度灵活性,适配不同应用场景;通过异构算力实现加速、存储/网络卸载,实现极致能效,推进算力基础设施向高效低碳发展。

在产品研发与技术创新攻关上,国内DPU厂商也取得了一定成绩,云脉芯联在创立近2年的时间里完成了DPU核心技术RDMA技术和可编程的底层网络接口技术的研发,在RDMA高性能网络传输,基础设施服务卸载和IO虚拟化三大关键技术上实现了突破,让国产DPU产品能够更好的满足数据中心云计算、高性能计算、AI、云存储等核心场景集群互联和算力扩展业务诉求。

2022政府工作报告提出,未来政府需发挥好在关键核心技术攻关中的组织作用,突出企业科技创新主体地位,中国信通院作为专注科研的事业单位,在DPU快速发展初期,由中国信通院云大所数据中心团队发布调研报告,为行业健康稳定发展提供重要参考和借鉴。随着国内DPU企业及全产业链的不断努力,相信DPU很快将迎来黄金发展期,为我国数字基础设施建设贡献力量。

目前《DPU发展分析报告(2022年)》报告已可从“中国信通院”官网下载。

责编: 爱集微
来源:云脉芯联 #云脉芯联#
THE END
关闭
加载

PDF 加载中...