埃隆·马斯克(Elon Musk)和xAI背后的团队创造了一个工程奇迹,在19天的时间里建立了一个由10万个英伟达H200 Blackwell GPU组成的超级集群。英伟达CEO黄仁勋在X平台上与特斯拉车主硅谷的成员们讲述了埃隆·马斯克令人难以置信的安装能力。
黄仁勋以敬畏和尊重的口吻描述了马斯克19天的冒险之旅,称其为“超人”。据称,xAI团队从“概念”阶段到完全兼容英伟达的“装备”,只用了不到三周的时间。这其中还包括在新建的超级集群上进行xAI的首次人工智能(AI)训练运行。
从开始到结束,整个过程包括建造GPU所在的大型X工厂,并为整个工厂配备液冷和电源,使所有20万个GPU都能正常运行。更不用说英伟达和马斯克的工程团队之间的所有协调工作,以确保所有硬件和基础设施以协调的方式精确运输和安装。
从这个角度来看,黄仁勋表示,一个普通的数据中心需要四年的时间才能完成马斯克和他的团队在19天内完成的工作。其中三年的时间将用于规划,而最后一年将用于运输设备、安装设备并使其全部投入使用。
黄仁勋还详细介绍了英伟达硬件联网的复杂程度。他解释说,英伟达设备的联网与传统数据中心服务器的联网不同。
马斯克整合10万个H200 GPU的做法可谓是“前无古人”,可能不会再有其他公司复制,至少在很长一段时间内不会。(校对/张杰)