(文/张轶群)昨日,行业传出消息称AMD、英伟达中国区收到总部要求,将对中国客户断供部分型号的高端GPU芯片。
集微网向AMD、英伟达方面求证,双方均表示不予置评。但后续有产业链消息显示,互联网厂商已收到相关通知,但目前属于预沟通阶段,AMD、英伟达总部仍在分析美国政府的政策要求,预计2-3天后会有明确消息放出。
考虑到一直以来美国对中国在超算等高性能计算领域的限制,此次传闻并非空穴来风。据集微网了解,美国对于禁售中国高端GPU的计划已酝酿半年时间。
此次禁售,与之前美国将中国超算机构、相关芯片企业拉入实体清单不同,而是通过禁售具备双精度计算能力的高端GPU产品,与前不久针对中国14nm以下设备禁售、3nm GAA工艺EDA工具限制方式类似,意在某个技术节点或关键技术指标上做出封锁,限制程度进一步升级,打压范围更加广泛。
互联网企业成为此次制裁波及的主要对象。行业人士指出,互联网厂商出于对性能等因素考虑,对国产CPU、GPU普遍接纳度不高,此次事件应为互联网厂商预警,加速CPU、GPU等核心芯片的国产替代应受到重视,希望有助于互联网厂商加速推进服务器核心芯片国产替代的导入和验证,提升自主可控能力。
围堵超算制裁收紧
近年来,因超算在气象、军事等方面体现出的战略价值,以及中国在该领域能力的不断提升,美国一直保持着对中国的限制和制裁。
2015年,鉴于天河一号、天河二号的出色表现,美国将中国国家超级计算长沙中心、广州中心、天津中心和国防科技大学列入实体名单,开始实施对中国超算芯片的禁售;2019年,美国将海光、中科曙光等5家超算和芯片企业拉入实体清单;2021年年初,美国又将飞腾、申威等7家超算相关机构列入实体名单,年底则在实体名单中首次加入国产GPU企业景嘉微。
行业分析人士指出,此次两家企业高端GPU产品禁售中国的可能性较大。美国发起的禁售通常会包括某些特定型号,从目前的消息看符合这一特征,而且之前已有部分特定型号的产品有所限制,而在过去几年美国也一直试图阻止中国高性能计算领域(服务器CPU/GPU)的发展。
一位超算行业人士向集微网介绍,从2019年开始,应用于超算领域高端GPU售至中国就受到严格管制,但当时只是AMD产品受限,英伟达的产品并未受到影响。获得销往中国的许可需要通过美国白宫、商务部、国防部、能源部的共同批准,这一过程中,AMD曾经试图通过软件方面限制等方式获得美国方面的许可,但一直未获成功。
“前一阵的消息是美国方面松口,而且据了解AMD已经开始准备相关产品在中国的推广,但现在看美国的限制政策似乎又突然收紧。”该人士表示。
互联网企业受波及
在北京半导体行业协会副秘书长朱晶看来,从美国对我国超算的打击和围堵历程可以看出,打击方式和范围来看都在逐步升级。
朱晶认为,此次打击的方式是从“超算相关单位进入实体清单”升级为“可为超算提供服务的相关产品直接禁售”,导致受影响的范围从超算领域扩大到互联网领域。
传闻中涉及的AMD的MI100和MI200,英伟达的A100和H100都属于高端GPU产品,针对企业客户,数据中心应用,同性能目前并无国产替代产品。
一位行业人士指出,目前业界用于衡量超级计算的Linpack测试,主要指标为“双精度浮点运算能力”,即64位浮点数字的计算(FP64),而此次从传言的禁售对象上看,都是具备双精度(FP64)能力的高性能显卡产品,对于半精度,单精度的GPU不受影响。
“此前,具备FP64能力的相关产品不被允许直接卖给中国的超算中心,但有规避途径,以其他机构和实体的名义换个马甲也能购买到,但此次更像是美国担心中国互联网企业买了之后用于超算服务,于是互联网企业也不被允许。”该人士表示。
在朱晶看来,此次针对双精度计算能力的高端GPU芯片禁售,并非针对GPU和企业,而是类似数日前美国针对中国14nm以下设备,3nm GAA工艺的EDA工具软件的类似限制,在某个技术节点上采取封杀策略,而这样带来的影响面更广。
“看似依然是对我国超算的进一步封锁,但波及范围已经远远放大,并且技术点的断供还要考虑对上下游的牵连,会让行业的痛感更强烈。”朱晶表示。
影响与应对
从目前AMD和英伟达两家企业看,如上所述,AMD的相关产品正处于准备中国市场推广的当口,英伟达的A100系列产品在中国拥有非常大的出货以及众多客户,如果禁令施行,无论是对两家企业还是中国的互联网厂商都会产生较大影响。
朱晶分析称,如果禁售传言成真,未来英伟达和AMD可能会把不带FP64的中国定制版(简化版)产品卖给中国互联网厂商,这相当于为中国市场定制产品,涉及重新流片,同时也面临库存清出所带来的成本挑战。
在排除定制版的极端情况下,对于中国的互联网厂商,可以通过购买两家企业的中低端卡做组合,实现性能最优的方式解决问题。尽管通常情况下,成本并非互联网厂商首要考虑目标,但对于成本超支仍有忍耐阈值,同时还要考虑在节能减排的背景之下能耗所带来的影响。而这种情况,本身对AMD和英伟达的营收损伤也较大。
一位GPU行业人士告诉集微网,互联网企业在计算数据中心整体成本支出时,在高端产品上,一次性购买成本、机架占位/人工服务费(运维)、电费三者所占比重大约为3:3:4,如果按照传闻所言,英伟达今年发布的最先进的4nm工艺的H100被禁,只能采用12nm的V100产品,考虑到增加的机架费用、功耗增加所带来的电费,整体而言将超过3倍的支出,如果再考虑到3-5年的运营周期,成本上将高出许多。
“而如果在超算领域,电费约占运营费用的七成以上,整体成本支出也会变得更加昂贵。”该人士表示。
集微咨询认为,美国针对华禁售英伟达和AMD某些系列高端GPU产品,不仅会影响我国超算等特定对双精度计算有需求的场景,也可能会对中国自动驾驶产业生态环境产生连锁反应。
虽然自动驾驶芯片暂时没有受到禁售风波的影响,但自动驾驶算法的训练还是需要在云端进行,也就无法绕开英伟达的高端训练GPU产品。无论是提供自动驾驶芯片的国内公司还是中国品牌的车企,无法拿到英伟达训练芯片和其后续迭代产品,必然会降低训练效率。虽然可以通过租赁服务器的方式进行算法训练从而绕开GPU自采,但禁售风波必然会导致训练服务器租赁的增长,训练成本很可能会增加。
总之,美国对华禁售高端GPU训练芯片,对中国数字经济产业的影响,是短期内无法依靠国产替代来快速弥补的。
GPU国产替代加速
近几年,国内GPU企业受到空前关注。老牌CPU厂商如龙芯、海光等均实现上市,且在GPU领域寻求突破,龙芯中科自研GPU已首度亮相,海光的DCU(GPGPU)也逐渐打出知名度,此外,也涌现出一批颇具知名度的初创GPU企业。
行业人士看来,尽管目前,国内芯片公司并不具备实现FP64的技术能力,但如果美国断供,将会利好国内GPU企业。
云岫资本合伙人兼首席技术官赵占祥就认为这是对国产数据中心GPU的重大利好。
“计算芯片最大的门槛是软件门槛,软件用的人越多越稳定,芯片越好卖。美国倒逼中国客户用国产GPU,国产生态一旦建立起来,即使美国再放开,也很难限制国产厂商。”赵占祥说。
此外,百度等互联网企业已经发布自研AI超算芯片产品,但存在与原CUDA生态的兼容问题,需要投入较长时间完善。海光DCU8系列Z100产品数据接近AMD的MI100产品,同时兼容AMD的ROCM生态,被一定程度看好。
但有行业分析人士指出,目前海光DCU产品被互联网公司实际采购较少,一方面此前市场上有性能更优的英伟达和AMD新款产品可用,互联网企业购买国产芯片意愿较低,另一方面海光DCU推出的时间较短,且大部分自供曙光的智算中心项目。
“无论传言是否属实,加速GPU的国产替代都是大趋势,目前国产CPU、GPU主要应用于党政信创市场,互联网厂商出于对性能、功耗等因素考虑,对国产CPU和GPU接纳度不高,此次事件有望为互联网厂商敲响警钟,希望能够加速推进服务器国产核心芯片的导入和验证,提升国产化和自主可控的能力。”该人士表示。(校对/李映)