(文/李映)近期关于GPU的“非渲染”消息接踵而来,引发的风云之变让“国产GPU”也被推到了聚光灯下。
伴随着国内政策、资本、人才以及应用的红利,一大批国内GPU企业已然崭露头角。但GPU作为复杂的高端芯片,不止要面临国外巨头的高壁垒,还要在硬件、生态、应用层面做大量的研发和优化,国产化之路注定是一场马拉松式的赛跑。
国产化之路急不得
作为高端芯片代表,研发GPU是一项系统性工程,涉及硬件架构、驱动开发、软件生态、销售应用等,研发壁垒高,产业链长。从国产GPU发展来看,需要软硬件的协同优化和生态的持续构建,显然这不是一蹴而就的。
摩尔线程创始人兼CEO张建中直言,“GPU硬件和软件是互相迭代、不停优化的一个过程。光有一个好的硬件还不够,需要好的软件去驱动硬件的能力,优化软件后,真正运行起来,又会发现硬件的一些缺点或是需要改进的地方,因而要不停加速硬件和软件的互相迭代过程。这需要长时间的积累。”
从硬件架构来说,究竟是采购第三方IP还是自研也是国产GPU厂商必须要做的选题题。摩尔线程CTO张钰勃认为,走到顶峰的一定是采取自研架构的路线,如果采取第三方的IP,就会受限于他们的节奏,这样是跟不上时代的,尤其跟不上像英伟达这样的领跑者。只有能够把整个架构掌握实现自研,才能够追赶头部玩家,才有可能在未来进行超越。
实现GPU量产还需要代工厂的支持。针对最近国内关于GPU的热点事件,张建中分析说,GPU并非必须采用最先进工艺不可。除了GPU硬件本身体系结构之外,软件的功能非常大,与其在硬件本身去追赶或者是采用最先进的制程,不如花更多的时间将软件实力充分发挥出来。因而,摩尔线程会注重将软实力做到更好,让GPU在真正的应用当中发挥GPU的综合算力。
要指出的是,在评价国产GPU的好坏优劣时,更应关注在特定应用环境下的性能和体验,这也意味着新的机会。“在整个新的应用行业当中,元宇宙应用是赋能下一代互联网的起点,如果国产GPU能够抓住这些机遇,在新的应用场景当中打造一个别人还没有的新的计算平台,将会极大地促进国产GPU的发展。”张建中建议道。据悉,摩尔线程将着重打造赋能下一代互联网的多元化元宇宙计算平台,满足“AI+图形+编解码+物理仿真”多功能的应用场景。
此外,要在GPU领域通关,生态至关重要。对于国产GPU的生态是走兼容CUDA还是自建生态之路,张钰勃分享说,这需要两条腿走路。摩尔线程一方面是兼容业界标准的生态,比如Windows、DX、OpenGL、OpenCL以及常用的CUDA AI开发平台。另一方面,在兼容国际化通用开发平台基础之上,摩尔线程也在打造自主的MUSA平台。
综上,可以说GPU国产化之路仍面临巨大的挑战。张建中提到,数字化经济是全球化的产业,如果GPU没有相当的竞争力,那么国产GPU的替代之路将难以持续。“如果GPU研发能力不够强,不能够参与国际竞争,其实这样的国产化并不能够真正的帮助国内GPU迅速追赶甚至超越世界的先进水平。不论是国产化还是全球化,要打磨的是GPU企业本身的技术实力,包括硬件和生态等等。”张建中总结道。
多功能GPU及软硬件产品构建全栈能力
国内众多的GPU近两年均在量产及应用层面发力,在这方面,摩尔线程也走出了自己的“加速度”。
距摩尔线程在春季发布会展示全新MUSA架构及系列重磅新品GPU芯片苏堤、面向PC和工作站的桌面级显卡MTT S60等之后,摩尔线程的秋季发布会迎来了丰硕的果实,包括全新多功能GPU芯片“春晓”、基于MUSA架构打造的业内首款国潮显卡MTT S80和面向服务器应用的MTT S3000,以及元计算一体机MCCX等。
显然,摩尔线程多功能GPU产品迭代创新实现的又一次跨越。
据悉,摩尔线程正式发布第二颗多功能GPU芯片“春晓”,集成220亿个晶体管,内置MUSA架构通用计算核心以及张量计算核心,可以支持FP32、FP16和INT8等计算精度。相较于之前发布的“苏堤”芯片,“春晓”内置的四大计算引擎全面升级,带来了显著的性能提升:图形渲染能力方面平均提升3倍;编码能力提升4倍,解码能力提升2倍;;AI计算加速平均提升4倍,物理仿真计算性能提升2.5倍。同时,引入了新技术支持窄带高清,节约带宽30%以上。
对此张建中还强调,第一颗苏堤全功能GPU是中低端的处理器,可满足部分国产化应用的需求,但大部分的主流用户希望有更高性能的GPU。因而春晓GPU将致力于满足高端游戏玩家、以及更高图形和计算能力的需求,以全面覆盖高中低端应用。
面向游戏玩家打造的国潮显卡MTT S80基于“春晓”GPU芯片打造,拥有4096个可编程MUSA核心,在1.8GHz的主频下,能够提供14.4TFLOPS的单精度浮点算力。同时MTT S80还是业内首款配备PCIe Gen5接口的显卡产品,配合16GB GDDR6大容量高速显存,再辅以8K超高清与1080P 360Hz高刷新率显示输出能力,可为游戏玩家带来极致游戏视觉和操作体验。
值得一提的是,MTT S80的成功推出使得摩尔线程成为国内率先支持Windows环境和DirectX图形接口的GPU公司。其强大的3D图形渲染能力将能够在Windows DirectX游戏中,为用户带来4K分辨率下的流畅操作体验。
而全新发布的MTT S3000作为一款基于“春晓”的多功能服务器GPU产品,通过提供多样化的算力,借助覆盖图形渲染、视频处理、深度学习的完整MUSA软件栈,可为AI推理和训练、云游戏、云渲染、视频云等场景提供高算力支持。
意识到生态协作对于AI应用的推进至关重要,摩尔线程的MTT S3000也全成升级兼容PyTorch、TensorFlow、百度飞桨、计图等多种主流深度学习框架,并实现了对Transformer、CNN、RNN等数十类AI模型的加速。
GPU是当前数据中心需要的关键算力,云原生技术应用在云计算、云桌面、云游戏等领域也越来越普遍。为此,摩尔线程发布一系列基于摩尔线程创新性MT Mesh 2.0的GPU云原生方案。面向元宇宙应用的风生水起,摩尔线程还发布了专为元宇宙应用构建的MTVERSE元宇宙平台及众多软硬件产品,包括基于MTT S3000打造的MCCX元计算一体机等,可实现数字人、语音识别、视觉识别、自然语义理解等一系列功能,进一步简化应用和解决方案的开发周期和难度。
MUSA不只是架构,而是一个生态
当前GPU生态历经几十年的更迭,变得庞大且复杂。而国科GPU要完成从研发到市场的商业化应用,既离不开软硬件方面的持续投入,也离不开生态的有力支持。
基于对生态的重视,摩尔线程步步为营。今年3月,摩尔线程正式发布第一颗多功能GPU芯片“苏堤”已获得众多市场和生态的认可。如今摩尔线程PES完美体验系统联盟合作伙伴数量不断增长,覆盖CPU、操作系统、OEM厂商、软件服务厂商、云服务厂商以及系统软件开发商。
而且,摩尔线程更进一步,以MUSA架构为核心还发布了系列GPU软件栈与应用工具,包括MUSA开发者套件、云原生sGPU技术及元宇宙平台MTVERSE等,旨在构建从底层芯片到上层开发和应用的整体解决方案,实现摩尔线程多功能GPU软硬件一体化创新模式的全面升维。
张建中表示:“GPU创业是一个长期事业,充满了挑战,摩尔线程深知生态的重要性。摩尔线程多功能GPU基于先进MUSA架构,持续构建完备的软件栈及应用生态,旨在为开放生态系统创造友好的支持和体验。只有与生态伙伴、行业用户凝聚在一起,才能将摩尔线程的算力真正发挥出来,为元宇宙和数字经济提供核心动力。”
此外,为了使开发者更方便获取摩尔线程系列软件栈、应用解决方案及技术支持,摩尔线程开发者网站正式上线,该网站将是MUSA软件产品发布、下载站点,同时也是MUSA技术交流社区,摩尔线程将围绕MUSA平台构建开放的应用及开发者生态,推动GPU生态繁荣发展。
在发布会现场,摩尔线程还演示了40多个基于其多功能GPU的丰富应用,覆盖PC游戏、AI、数字人、数字孪生、物理仿真、8K多媒体显示、云游戏等场景,众多合作伙伴为应用展示提供了设备支持,充分展示了摩尔线程强大的产品应用和生态聚合力。
对于国产GPU发展之路,张建中最后建议,IT市场是一个全球化的产业,GPU如果没有竞争力,国产的GPU就很难去替代国外的GPU。因而不论是国产化还是全球化,首先要锻炼的就是GPU企业本身的技术实力。如果GPU研发能力不够强,不能够参与国际竞争,那这样的国产化并不能够真正的助力国产GPU追赶甚至超越世界的先进水平。因而,要真正国产化就必须要持续打磨自身的能力,国内目前还处于初级阶段,还需要久久为功。