AIGC应用的持续落地和商业化,如呼啸而来的浪潮,引发了各行业对人工智能赛道的关注,也给高性能计算带来了巨大的算力、模型挑战。谈及AIGC时代的算力,GPU是绝对的焦点,却也并非唯一的解决方案。
大模型的部署,需要大量高性能服务器组成的算力集群提供强大算力。多个服务器通过网络相互连接,形成一个统一的计算资源池。服务器之间,需要低功耗、高效存储访问和极高的互联密度来实现海量的数据交换。据悉,算力集群每次计算背后,服务器间的同步通信量会高达百GB。如果网络性能不足,数据传输速度慢或通信延迟较高,会导致计算节点之间的协同工作受到阻碍,从而降低整个算力集群的计算能力。
而如今,以同构和板卡级互联为特点的数据中心架构已无法支撑未来超大规模计算的需求。行业迫切需要一种变革,从传统的数据中心转向智算网络,通过更先进的架构,与高带宽、低延时的互联技术,满足数据中心日益增长的算力需求同时,最大化数据中心的算力资源。
为了应对数据中心与日俱增的算力需求,全球巨头如Intel、AMD、Nividia都在不约而同的走向计算+互联的道路。从Intel 的 GPGPU Ponte Vecchio、Sapphire Rapids,AMD 首款3D APU MI300,到Nvidia 的DGX GH200 AI 超算,都是超大规模异构计算平台的典型案例。
作为后摩尔时代最关键的技术之一,Chiplet基于SoC架构,将主要功能单元(IP)转变为独立芯粒(Dielet),并通过先进封装和die-to-die内部互连接口,将芯粒连接到Chiplet互联网络(OCI)中,组成系统级宏芯片(MSoC)。在当前技术进展下,Chiplet方案可实现芯片设计复杂度及设计成本降低,且有利于后续产品迭代,加速产品上市周期。
在显著的技术方案优势下,Chiplet已成为全球大厂布局超大规模异构计算平台的关键。
在即将到来的开放计算领域的年度盛会 OCP China Day 2023上,奇异摩尔将与您进一步探讨“面向大模型的下一代数据中心:基于Chiplet的超大规模异构计算平台”这一议题,并分享Chiplet、服务器领域的创新技术、思考视角以及发展趋势。8月10日,北京香格里拉酒店,OCP China Day 2023--开放创新论坛奇异摩尔诚邀您共聚。