英伟达于8月9日发布了全新的NVIDIA L40S GPU,以及搭载这款加速卡的NVIDIA OVX服务器系统。这款GPU以及OVX服务器,适用于人工智能大模型训练和推理、三维设计和可视化、视频处理、工业数字化等用途,能够帮助机构企业和数据中心增强生成式AI、图形和视频处理能力,满足不断增长的算力需求。
英伟达全新的L40S GPU加速卡是L40的升级版,同样配备48GB GDDR6 ECC显存。这款GPU基于Ada Lovelace架构,包含第四代Tensor Core以及FP8转换引擎,运算速度可达1.45 PFlops。L40S GPU内置142个第三代RT核心,能够实现212 TFLOPS光追性能。此外,L40S GPU包含18176个CUDA核心,可提供近5倍的单精度浮点运算(FP32)性能(91.6 TFlops),几乎是英伟达A100 GPU的5倍。需要注意的是,L40S与上一代一样不支持NVLink。
官方表示,对于具有数十亿个参数和多种数据模式(文本、视频)的复杂AI工作负载,L40S的生成式AI推理性能是A100的1.2倍,训练性能是A100的1.7倍。
英伟达OVX服务器系统中的每台服务器,最多可搭载8个L40S加速卡。CoreWeave是首批提供L40S计算平台的云服务商之一,英伟达同时提供了多种软件,来帮助AI模型训练、数据分析、生成式人工智能等应用。
英伟达同时宣布对其Omniverse元宇宙平台进行更新和增强,将搭载L40S GPU,为人工智能和生成式AI提供动力。
英伟达L40S GPU将在今年秋季上市,包括华硕、戴尔、技嘉、HPE、联想、QCT、美超微在内的厂商,将很快提供搭载英伟达L40S GPU的OVX系统。这些服务器将帮助业界推动人工智能的发展和应用。
(校对/赵月)