英特尔Gaudi2在华发布3个月即被禁,下一代Gaudi3恐受影响

来源:爱集微 #Gaudi2# #英特尔#
2.3w

英特尔于2022年5月10日正式推出由Habana Labs团队开发的AI深度学习加速器Hanaba Gaudi2以及AI推理芯片Hanaba Greco。2023年7月11日,Gaudi2正式在中国大陆市场发布,同时搭载这款加速器的AI服务器也正式推出,每台服务器包含8颗Gaudi2加速卡HL-225B,以及双路第四代英特尔至强可扩展处理器。

然而10月17日美国政府颁布的限制令,使得英特尔Gaudi2连同英伟达A800、H800、L40S、RTX 4090等产品暂时无法在中国大陆销售,结束了短短3个多月的上市时间。中国台湾地区产业消息称,英特尔的Gaudi2是与中国台湾IC设计服务厂商世芯电子合作开发的,美国的新禁令可能连带使得美国、中国台湾的半导体生态系统受到冲击。预计英特尔下一代AI深度学习训练芯片Gaudi3、AI推理芯片Goya的出货量恐受到影响。

关于英特尔Hanaba Gaudi2加速器,这款产品使用台积电7nm制程工艺制造,该产品采用Chiplet封装架构,集成了高达96GB HBM2E内存,实现2.4TB/s的总内存带宽。Gaudi2拥有24个可编程Tensor处理器核心(TPCs)、48MB片上SRAM、集成多媒体处理引擎、21个100Gbps(RoCEv2)以太网接口。

性能方面,英特尔表示Gaudi2在多种大语言模型、计算机视觉模型的训练表现,优于英伟达A100 80GB方案,能够显著缩短训练时间,但落后于英伟达H100方案。官方表示,与市场上其他面向大规模生成式AI和大语言模型的产品相比,Gaudi2拥有卓越的性能与领先的性价比优势,能够帮助用户提升运营效率的同时,降低运营成本。

关于下一代Gaudi3加速器,英特尔的路线图中显示,其将采用5nm制程工艺,芯片总面积将会更大,预计将集成双处理器芯片,配备更大容量的HBM内存(144GB)。此外,加速器将提供4倍BFloat16性能、2倍计算性能、1.5倍网络带宽。

图片来自网络

Gaudi3的后续产品将会是Falcon Shores,后者将结合Gaudi AI以及英特尔GPU的技术,整合到同一个封装内,产品预计将在2025年发布。

(校对/孙乐)

责编: 李梅
来源:爱集微 #Gaudi2# #英特尔#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...