• 收藏

  • 点赞

  • 评论

  • 微信扫一扫分享

芯动科技首款国产4K级高性能GPU发布!“风华1号”多项核心技术全球先进

来源:爱集微

#GPU#

# 芯动科技#

2021-11-29

集微网消息,随着计算处理需求急速攀升,GPU除了原本的视频加速、2D/3D游戏应用之外,越来越多地用于服务器、人工智能、边缘计算、矿机、汽车等领域的衍生需求。在“云化”计算加速的现在,GPU成为了专用计算时代的刚需,在算力经济、AI、中美博弈等因素的推波助澜下,国内GPU创业融资领域正呈现出前所未有的光景。

11月26日,芯动科技发布首款国产高性能4K级显卡GPU芯片“风华1号”,并通过现场多项4K级重度渲染演示,揭开了这款集众多自主技术创新、备受瞩目的国产GPU芯片的神秘面纱。

芯动云计算总裁敖海介绍,“风华1号”单芯片A卡渲染能力达到160GPixel/秒,FP32浮点性能达到5T FLOPS;3D图形渲染处理管线定制优化,支持Linux/龙芯/Windows/安卓操作系统图形框架,同时支持4路4K@60、16路1080P@60fps或32路720P@30fps,集渲染+低延迟编解码+AI计算于一体;AI性能为25TOPS(INT8);芯片支持32路SRIOV虚拟化,内置中国专利的物理不可克隆PUF技术,保护信息安全;显存技术采用全球领先的GDDR6/GDDR6X Combo自研技术,单比特最大传输速率达到19Gbps;显存带宽最高可达304GB/s,显存容量最大可扩展至16GB;主机接口支持PCIe4.0X16,且向下兼容PCIe3.0/2.0X8;视频输出接口方面,“风华1号”配置自研HDMI2.1/DP1.4/VGA等超高清接口,支持多路独立输出。

芯动云计算总裁敖海

“风华1号”还首次成功实施了中国自主标准的Innolink Chiplet多晶粒技术, 通过Innolink chiplet扩展,“风华1号”GPU显卡服务器用B卡,在A卡基础上直接性能翻倍, 渲染能力达到320GPixel/秒,FP32浮点性能达到10T FLOPS;同时支持32路1080P@60fps和64路720P@30fps强渲染+低延迟编解码+AI计算,显存达到32GB。

芯动科技在发布会现场进行了“风华1号”A卡的渲染演示,在国产CPU和操作系统桌面上办公上网、CAD设计、图形工作站、EDA设计、GIS实景地图、重度游戏benchmark、OpenGL4.0 Heaven、Vulkan框架下运行Windows游戏、多路云游戏等多种高清渲染场景下的流畅表现,实测功耗表现非常优秀,桌面4K重度渲染典型芯片功耗在20W左右,多路重度云渲染典型功耗在50W左右。

与会者参观“风华1号”演示

“风华1号”显卡实现了多个第一,如第一款渲染能力达到5T-10T FLOPS的国产GPU显卡,第一款图形API达到OpenGL4.0以上,并能实际演示4.0 benchmark的GPU,还是第一款支持多路渲染+编解码+AI服务,硬件虚拟化和chiplet可延展的国产GPU等。“风华1号”大幅提升了国产GPU的渲染能力,在5G数据中心渲染性能对标国外服务器级别显卡,效果惊艳全场。

芯动科技SoC体系架构师何颖指出,现代GPU架构已经被成千上万专利所保护,没有哪个初创公司的GPU架构是自己完全从无到有开发出来的,大家无一例外都是在一定授权基础上的开发,“那些宣称架构完全自研的初创公司,都是经不起深究的。”他强调,“我们获得授权的架构和苹果M1的GPU一样,并针对未来国产GPU生态建设和国内使用环境进一步深度定制,加上我们自研的核心技术和大量创新,确保了国产GPU持续演进和自主可控。”

厚积薄发,“风华1号”实现从0到1的突破

“风华1号”的正式发布意义重大,技术含金量高,一改过去国产显卡不好用的体验,实现了国产5G数据中心服务器GPU和4K桌面GPU这两大应用场景从0到1的突破。

芯动科技工程副总毛鸣明指出,“风华1号”大型芯片的诞生,绝非偶然,是芯动科技15年如一日,长期深耕核心技术厚积薄发的必然。“15年来芯动科技低调务实,敢为人先,攻关克难,团队十年坐得板凳冷,付出的努力和心血是难以想象的。光是行业创纪录的200多次先进工艺流片,就可见一斑。芯动连续11年细分市场遥遥领先,在重大开发投入的情况下,还能持续盈利,为各国产半导体代工厂和300家全球知名客户提供顶尖IP和芯片定制,包括中兴通讯、华为海思、瑞芯微、君正、微软、AMD、亚马逊等知名公司逾50亿颗先进SoC芯片背后,都有用到芯动技术。芯动以前是幕后英雄,在to B的圈子非常有名, 为众多客户一次流片成功并做到自主可控,成就客户,也成就了自己,芯动在长期研发中积累了GPU所需要的全套高端IP、图形芯片内核定制技术和先进工艺经验, 所以‘风华1号’能够一炮打响、性能超群。”

据悉,“风华1号”上搭载的GDDR6X顶级难度的显存技术,目前全球只有英伟达和芯动科技两家拥有。“核心技术是买不来的,英伟达的高带宽显存技术一直自研,是其保持其竞争优势和70%利润率的一大利器,芯动科技在这方面能与其并驾齐驱,确保了GPU性能和工艺量产的灵活性和性价比。”芯动科技GDDR6X研发负责人高专感慨道。

高专解释,GDDR6X的PAM4并行技术超级难做,英伟达与美光在一栋楼里共同研发两年才研发出来。而芯动团队是全球唯一一家,仅凭有限的远程技术支持,只用一年时间就做出来了。“连AMD都没有做到,所以美光的架构师都不禁感叹我们的研发实力之强,令他们印象深刻。”他强调,“事实上, 如果没有我们团队十多年的技术基础积累和200次流片打磨的经验,这个成果是无法实现的,芯动科技绝对是国内硬科技企业的代表。”

世界知名GPU图形学专家杨喜乐博士分享GPU的前世今生

全球GPU芯片领域从几何物理渲染到计算引擎领域的知名专家、芯动首席算法科学家杨喜乐博士指出,GPU研发绝不像互联网的同质化竞争,现代GPU的理论基础太深、开发应用坑太多了,技术发展日新月异,竞争极其激烈。要拿出一款对标行业先进水平的图形GPU,且流畅兼容各种应用,绝不是一朝一夕的事,对团队紧密协作能力要求很高,必须踏踏实实地长期市场化打磨,靠PPT烧钱只会是死路一条。没有一个跨多领域和有大量流片交付经验的复合型技术团队,不懂GPU底层算法架构和软硬件创新,不能根据实际情况和自身实力长期潜心持续演进架构和开发,不可能在这个领域成功。

“风华1号的诞生,倾注了数百名芯动GPU工程师的心血,其中凝聚了芯动自有的众多技术积累和来自世界著名GPU公司的顶尖人才的联合参与,风华1号仅仅是个开始,风华2号和3号已经在路上了”。杨喜乐表示。

前AMD图形框架开发领军人物、芯动DX团队负责人张涛表示,明年就会发布风华显卡Windows操作系统的DX框架。

敖海表示,芯动科技的使命是让风华GPU走进千家万户,让大家习惯用国产的GPU办公和娱乐。“‘风华1号’是芯动人努力和成果的结晶,这只是风华系列GPU赋能国产生态的开始。芯动正在加紧与合作伙伴进行‘风华1号’适配调优,在向数据中心和国产桌面GPU 等合作伙伴送样的同时,新一代GPU芯片已经在路上了。”

先进工艺的强悍迭代能力是芯动的固有优势,芯动科技将依靠自有IP和定制能力以及代工厂合作伙伴的支持,不断演进先进技术,确保性能持续领先、供应链安全和优势性价比。“我们计划在未来三年里持续每年量产两颗以上、性能不断大幅度提升的GPU芯片, 并满足用户的定制需求。明年初‘风华2号’和‘风华3号’将接踵而至, 2022年我们计划投片5纳米加光追技术,赋能国产GPU产业链我们志在必得,请大家拭目以待”。”敖海宣布。

结语

“风华1号”的诞生正当其时, 填补了国产4K级桌面显卡和服务器显卡两大空白,支持国产新基建5G数据中心、桌面、元宇宙、云游戏、云桌面等千亿级产业。“风华1号”是芯动赋能国产GPU生态链的开始,期待在不就的将来,国产高性能GPU能走进千家万户,使全球用户都能在办公、娱乐中体验科技带来的流畅和快乐!

责编: Aki

乐川

作者

微信:AileenZhu

邮箱:zhuzl@lunion.com.cn

作者简介

读了这篇文章的人还读了...

关闭
加载

PDF 加载中...