云豹智能与燧原科技联合开发大规模高性能AI算力平台

来源:爱集微 #燧原科技#
2.3w

集微网消息,近日,云豹智能与燧原科技达成战略合作,依托双方各自在DPU (Data Processing Unit) 和AI计算领域的软硬件优势,联合开发大规模高性能AI算力平台,为云端AI计算提供更高效的解决方案。

算力作为人工智能产业发展的三大要素之一,AI芯片是其载体。AI芯片作为人工智能产业的关键硬件,是AI加速服务器中用于AI训练与推理的核心计算引擎,被广泛应用于人工智能、云计算、数据中心、边缘计算、移动终端等领域。当前,我国的AI芯片行业仍处于起步阶段,市场空间有待探索与开拓。据艾瑞统计与预测,2020年我国AI芯片市场规模为197亿元,到2025年,我国AI芯片市场规模将达到1385亿元,2021-2025年的相关CAGR达47%,市场整体增速较快。

但对于很多企业来说,独立建设自己的AI硬件集群一次性投入和后续运维的成本非常高,建设周期长且利用率低。而AI算力云化,以按需分配的方式提供AI算力,提高效能的同时,也可以降低成本。因此,AI算力云化是未来AI发展的趋势之一。

AI算力云化不仅需要高性能的AI计算能力,也需要高性能的数据处理能力,包括AI芯片之间的数据通信,AI芯片获取存储数据等。随着AI数据爆发式增长,模型迭代速度更快,模型规模越来越大,数据处理能力的要求也越来越高。

AI芯片厂商、GPU厂商、AI算法开发商都在不断探索硬件和软件的解决方案。主流的GPU或AI芯片厂商提供自己私有的解决方案,比如NVIDIA的NVLink、GPUDirect和相应NCCL软件,但AI市场和用户期待着一个开放的技术和相应高性能解决方案。

目前,云豹智能与燧原科技达成战略合作,共同研发和提供大规模高性能AI算力平台解决方案。双方创新性地提出了DataDirectPath技术:该技术用于高性能分布式数据通信,基于DPU的高灵活性和高性能的特点,实现与云燧T20之间以及与存储之间的高性能直接通信,提升AI训练效率的同时,也降低了训练成本。DataDirectPath包括:DataDirectPath RDMA和DataDirectPath Storage。DataDirectPath RDMA用于AI加速芯片之间的数据通信,而DataDirectPath Storage用于AI加速芯片与存储器之间的高速数据读写。

云豹智能与燧原科技合作,基于云豹云霄DPU和燧原科技云燧T20率先推出了DataDirectPath Storage解决方案,为AI训练储存访问提供更高效的解决方案。在传统解决方案中,云燧T20访问存储时,需要将数据先搬移到系统内存,再由系统内存搬移到目标设备。在创新的DataDirectPath Storage解决方案中,基于DataDirectPath Storage技术,云燧T20通过DPU直接获得数据,从而绕过系统内存和CPU,让数据访问速度更快,访问延迟更短,系统开销更小。DataDirectPath Storage不仅支持数据通道的Bypass CPU, 也支持控制通道的Bypass CPU,让控制路径也更高效,大大降低CPU的开销。

(校对/Andy)

责编: 黄仁贵
来源:爱集微 #燧原科技#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...