英伟达DGX SuperPOD“最强”AI超算:搭载GB200,算力达11.5EFLOPS

来源:爱集微 #英伟达# #超算#
3.9w

英伟达3月18日发布最新人工智能(AI)超级芯片GB200,采用全新Blackwell架构。当日,英伟达推出搭载GB200或B200的人工智能超级计算机——DGX SuperPOD,可用于处理万亿参数大模型,为超大规模生成式人工智能训练和推理工作负载提供稳定支持。

全新的DGX SuperPOD采用高效液冷机架式服务器架构,可以在FP4精度下提供11.5exaflops(EFLOPS,每秒百亿亿次)的人工智能超级计算能力和240TB的高速内存,并可通过增加机架扩展至更多。

英伟达DGX GB200系统

作为超级计算机的一个计算单元,每个DGX GB200系统包含36个英伟达GB200超级芯片,因此总计拥有36个Grace CPU、72个Blackwell B200 GPU、13.3TB的HBM3e显存、30.2TB的高速内存,通过第五代英伟达NVLink互联。与此前的H100平台相比,全新的GB200超级芯片在大语言模型推理工作负载方面的性能最多可提升30倍,FP4算力达1440PFLOPS。

而DGX SuperPOD超级计算机,可以集成至少8个或更多DGX GB200系统,并可以通过扩展集成数万个GB200超级芯片,组成巨大的共享内存来为下一代AI大模型提供支持。客户可以将8个DGX GB200系统组合,将其中的576个Blackwell GPU通过NVLink互联。

集微网了解到,英伟达这一超级计算机架构还囊括BlueField -3 DPU,并将支持当日同时发布的NVIDIA Quantum-X800 InfiniBand网络,该平台可以为每个GPU提供高达1800GB/s的大带宽。此外,英伟达第四代可扩展分级聚合与还原协议(SHARP技术),可以提供14.4TFLOPS的网络内计算能力,与上一代相比提升4倍。

以下为DGX GB200部分参数:

英伟达DGX B200系统

除了由两颗GPU、一颗CPU整合的GB200超级芯片,英伟达同时推出单纯由B200 GPU构建的DGX B200系统。该系统使用第六代风冷散热,DGX传统机架式设计,每个服务器包含8个B200 GPU以及2个英特尔第五代Xeon至强处理器。客户还可以使用多个DGX B200系统构建DGX SuperPOD超级计算机,为AI开发提供支持。

英伟达表示,每个DGX B200系统提供144petaflops(PFLOPS,每秒千万亿次)的FP4浮点运算性能,1.4TB海量显存和64TB/s显存带宽。与上一代产品相比,万亿参数AI大模型的实时推理速度提高了15倍。

以下为DGX B200参数:

据悉,所有英伟达DGX平台均包含用于企业级开发和部署的NVIDIA AI Enterprise软件,客户可以利用英伟达提供的工具来提高工作效率。

英伟达表示,配备DGX GB200和DGX B200系统的NVIDIA DGX SuperPOD超级计算机,预计将于今年晚些时候从英伟达的全球合作伙伴处发售。

(校对/孙乐)

责编: 张杰
来源:爱集微 #英伟达# #超算#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...