Arm CEO:AI基础设施市场供给严重不足 AGI CPU是应客户需求而生

来源:爱集微 #arm# #rene#
816

3月24日,Arm在美国举行的“Arm Everywhere”活动上,正式发布了首款自研芯片,面向数据中心的服务器处理器Arm AGI CPU。

在会后的媒体采访中,Arm首席执行官Rene Haas与执行副总裁Mohamed Awad就新发布的Arm AGI CPU、AI基础设施市场策略等核心议题,回答了媒体的提问。

谈市场竞争:中国市场巨大,不担心与客户竞争

Q:过去Arm只做IP,而现在在做芯片产品,怎么看待与原有客户的竞争?能否对中国市场进行预测?

Rene Haas:我们认为有空间容纳很多不同的参与者,所以我们并不太担心这个问题。亚马逊、谷歌、微软,都有自研项目,所以我们只是认为这个市场机会非常非常大,而且目前供给和服务都严重不足。中国是一个巨大的市场,对我们来说是将会是一个非常好的市场。

谈商业模式:自研芯片是业务自然延伸

Q:Arm 推出首款自研芯片,是对计算基础设施商业模式的颠覆,还是垂直领域的创新延伸?

Mohamed:这是 Arm 既有商业模式的自然延伸,我们始终坚持贴近客户需求,通过技术研发让成果在众多客户间实现价值分摊,此次推出自研芯片,正是响应了多个客户的深度需求。

Rene:参考 CSS 技术的落地历程,两年半前我们将 CSS 从 Neoverse 拓展至汽车、移动领域时,也曾被质疑与客户竞争,但如今各领域均有大量 CSS 客户,核心原因是产品能为客户创造更大价值。AGI CPU 并非要求所有客户购买,客户可自主选择 IP、CSS 或 AGI CPU,这只是我们产品体系的补充。

谈产品策略:AGI CPU是应客户需求而生,命名寓意AI无处不在

Q:Arm AGI CPU项目开发了多长时间,是如何提出这个方案的?

Rene Haas: CSS对我们来说有点像魔法,因为CSS所做的就是大大加快了制造这些复杂芯片的能力。所以我们一直在与客户进行大量关于CSS的讨论,而且这很快就转变成了,“嘿,你们能不能拿一个CSS为我们做点什么?”所以我认为首先要说的是,我们是被要求做这件事的。这算是第零步。但现在我们看到的,基于巨大的客户吸引力,我们认为这个机会相当大。

品牌和命名显然是一个非常令人有激情的话题,对此有很多不同的意见。当我们思考技术发展的轨迹时,有两件事浮现在脑海中,第一是CPU将无处不在,无论是非常小的用例还是非常大的、高功率的用例;第二,它将会有一个AI的组成部分。所以我们觉得AI无处不在和CPU作为基本标配的这个交叉点,在命名方面感觉恰到好处。

谈客户合作:提供全系列选择,增强Arm生态系统

Q:能否谈谈这将如何与你们的客户合作?能否再多解释一下这种互动关系?

Mohamed Awad: 这实际上算是Arm的一种独特优势,即我们可以走进这些客户的公司然后说,“嘿,这里有一个产品组合。我们可以给你IP,给你CSS,给你AGI CPU,提供全系列的选择。”所以这些客户中的某一个可能会决定在某些用例中使用IP,在其他情况下想要一个CSS,或者直接拿一个AGI CPU成品芯片。归根结底,这给了他们的是选择权。我们认为这是一种优势,它增强了整个Arm生态系统,从长远来看增强了我们在这些客户中的地位。

Rene Haas: 该模式实际会扩大市场机会,例如 SAP 基于 AGI CPU 构建系统后,若本地部署无法承载全部工作负载,会转向 AWS 等云平台,这将为云服务商创造新的业务机会。核心在于Arm软件生态的丰富度,生态越完善,对所有基于Arm架构的参与者越有利。

谈技术细节:NVLink是未来选项 未采用SMT有原因

Q:Arm此次瞄准了AI应用和加速器,你们能谈谈你们选择PCIe Gen 6的决定吗,你们是否考虑过授权NVLink?

Mohamed Awad: 两件事,我们选择PCI Gen 6是因为就标准IP实现而言,它在速度等方面是最先进的。关于NVLink以及我们展望未来,我们绝对在关注的一件事是整个系统的性能以及如何优化它在系统中的运作方式。所以NVLink显然是选项之一,NVIDIA对我们来说是一个很好的合作伙伴,所以我们肯定在为未来的版本考虑这个。事实上,我们已经宣布我们将在CSS的未来版本中支持NVLink。正如我之前所说,AGI CPU是基于CSS的,所以如果我们决定要往那个方向发展,这是一个自然的延伸。

Q:AGI CPU 机架与 GPU 机架如何协同工作,在 AI 数据中心中承担哪些角色?

Mohamed:二者有三大核心协同场景:一是 AGI CPU 作为头节点,与加速器部署在同一服务器,SK 电讯与 Rebellions 的合作就是典型案例;二是高密度 AGI CPU 机架紧邻 GPU 机架部署,负责编排和管理 agentic 计算流程,快速分发任务,实现低延迟协同;三是 AGI CPU 承担数据中心控制平面角色,agentic 计算的 7×24 小时运行会产生大量流量,AGI CPU 可高效处理流量调度带来的算力需求,提升数据中心整体运营效率。

Q:AGI CPU为何未采用 SMT(同步多线程)技术,设计过程中如何权衡其利弊?

Mohamed:SMT 的优势在于低带宽场景下,可通过资源共享提升CPU利用率,让等待的进程将资源让渡给其他进程。但AGI CPU面向的智能体计算场景需要支持大量线程,且配套的加速器、基础设施成本高昂,最核心的需求是保障 IO 和内存带宽的专属化,4-6GB/s 是该场景下的带宽最优区间,采用SMT会分割带宽,降低整体效率,因此目前暂无加入 SMT 技术的计划。

谈市场落地:外界对Arm存误解

Q:Arm 在机架层面有何布局,AGI CPU 的市场落地策略是什么?

Mohamed:Arm 并不直接销售机架,而是与广达、联想、超微等生态伙伴合作,由合作伙伴打造基于 AGI CPU 的机架产品。看待 AGI CPU 不能孤立聚焦芯片本身,需置于 AI 数据中心的大规模系统中,性能、规模、效率是核心评价指标,客户最终关注的是芯片在数据中心的实际价值。目前基于 OCP 标准机架的测试已实现突破性的性能与效率,液冷机架等优化方案还能进一步释放潜力,当前仅为技术落地的起点。

Rene:外界对Arm存在误解,认为我们仅做IP授权后便与客户脱节,实际上我们与芯片、系统、参考板厂商深度合作,对算力产品的市场落地全链路有清晰认知。AGI CPU的落地离不开ODM生态,虽然我们可提供专业的设计服务,但目前暂不对外披露相关规划,仍会与ODM伙伴紧密协同。

谈市场机遇:万亿美元市场,Arm有机会去争取

Q:Arm谈到了一个万亿美元的市场机会,如何开拓这个市场?

Rene Haas: 半导体市场到2030年,1万亿美元不是什么夸张的说法,我们认为我们有去争取的机会。

责编: 姜羽桐
来源:爱集微 #arm# #rene#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...