大算力时代芯动力走出可重构架构创新“芯”路径

作者：李映 2023-07-14

来源：爱集微 #芯动力# #GPU# #世界人工智能大会#

3.7w

“未来可能不是百模大战，而是万模群舞。”自ChatGPT掀起大模型的发展热潮之后，层出不穷的大模型已然蜂拥而入，风雷激荡。但在经历了最初的惊艳之后，行业已转移到对商业化落地的冷静观察，一方面业界认可垂直类应用模型有望率先实现落地应用，另一方面AI大模型的压缩和优化发展，使得向边缘端渗透的步伐也在加快，边缘算力的重要性正加速凸显。

以更直观的数据来看，有预测到2030年，边缘计算潜在市场将在10年内以48%的复合年增长率从2020年的90亿美元增长到2030年的4450亿美元。而且，中国是边缘算力的主战场，预估到2026年全球26%的网络边缘站点将位于中国。

通用GPU这一算力主流芯片在经过AI的淬炼之后，如何更进一步，承接AI大模型下沉至边缘端的新机遇？无疑，这将更是一场实打实的硬仗。

可重构架构打造算力第三极

在日前举办的第六届世界人工智能大会（WAIC）上，珠海芯动力、天数智芯、燧原科技、登临科技、爱芯元智、沐曦等企业展出的芯片、加速卡、软硬件解决方案和广泛的行业应用，成为WAIC不容错过的“风景”。

在WAIC舞台同场竞技的背后，暗藏的逻辑是通用GPU厂商比拼的赛点，已经从单纯的性能指标转向进入真实应用场景落地的较量，边缘侧的竞夺也走向白热化。

“随着AIGC兴起，算力将成为重要的生产力。相比云端，边缘侧应用场景更广泛，也更能促进生产力的提升创造价值，将对通用GPU产生巨大的市场机会。”芯动力CEO李原乐观表示。

显然这涉及通用GPU的算力、扩展性和编程性、生态等多维度的比拼。在这一市场，英伟达、AMD、英特尔等占据强势地位，且在当下国内半导体制造面临全面打压的情形下，我国通用GPU企业想要撕开一道口子，有专家建议不能按“常理”出牌，需要从架构、材料、封装等层面进行创新。

不走寻常路，发布首款基于可重构架构的GPGPU芯片RPP-R8的珠海芯动力可谓独辟蹊径。该公司在2017年成功研发出可重构并行处理器（RPP）架构，借助于独有的底层硬件架构，自带高性能、原生支持CUDA语言和低功耗等“光芒”，可对AI推理的性能进行深度优化。

（RPP-六边形战士）

芯动力创始人李原分析，在可重构芯片面世之前，AI算力芯片主要有专用和通用GPU两大类，专用芯片性能虽强但编程能力差，有的通用GPU可编程性高但算力不强，要从激烈的竞争中脱颖而出，必须建立强大的优势，而第三类可重构芯片则将两类产品的优势“合二为一”，将跻身成为通用GPU的新一极。

据悉，RPP-R8作为一款通用GPU，每颗芯片内含有1024个计算核，相比传统GPU架构在同样的算力占用更小的芯片面积，实现了低功耗和高能效的有效平衡。此外，面积效率比可达到同类产品的7～10倍，能效比也超过3倍。而且，除原生支持CUDA之外，芯动力还拥有自主开发的工具链，使得其能够在cuDNN和TensorRT上实现API的兼容，同时也支持广泛的人工智能框架，如TensorFlow和Pytorch等，可全面满足高效并行计算及AI算力应用。

凭借高能效、高算力、低功耗、编程灵活等功力的“加持”，芯动力的RPP-R8在边缘侧的落地也在快马加鞭。

解决客户痛点打开落地之旅

触及落地，尽管RPP-R8的性能和生态独树一帜，但作为一个新生“物种”，仍要面临逐级解锁的过程。

对此李原认为，边缘侧的市场巨大，传统市场的AI加速是刚需，通用GPU可替代专用芯片打入供应链；而新兴市场的需求如智能安防、机器视觉等市场也在持续扩容。但落地最重要的是要解决客户的痛点，要厘清市场的规律。

李原进一步剖析，芯片公司容易陷入提倡软硬件一体化的“怪圈”，但边缘侧终端客户对成本并非那么敏感，从产业链来看，芯片公司的客户大都为设备厂商，处于终端客户的下游，一方面芯片公司要学会将更多利润留给设备厂商，让他们有动力合作切入市场，另一方面芯片公司的客户大都有实力进行软件自主开发，因而要顺应软硬件分离的需求。

“因而，芯动力提供的是一个过硬的纯硬件，加上底层兼容x86、Arm、Windows等软件系统，与其他家的软件结合在一起可快速应用，让客户可顺畅地进行开发，有效帮助企业降低开发成本和产品周期，加速产品迭代与扩展，这是共赢之道和长久之道。”李原分析说。

基于这样的深刻洞察，加上直击痛点以及秉承让利的“哲学”，让芯动力的产品在落地之旅行进在“坦途”之上。李原提到，芯动力产品在智能安防、工业自动化等一些行业因可切实解决设备厂商的痛点，具有不可替代性，起量非常快，基本已处于拐点，更大规模的出货将顺利推进。

而这只是芯动力的“一小步”，未来还有更辽阔的征程。

李原介绍，芯动力已推出了基于可重构架构RPP-R8系列三种不同封装形式的GPGPU芯片，分别是AE8100、AE7100和AE6100；每一款芯片能够满足相对的应用场景需求。

“AE8100芯片面向边缘服务器等领域，对体积、功耗要求较高；AE7100芯片着力面向低功耗、小体积的应用场景；AE6100则聚焦于更小体积上承载更大的性能，正在与客户一起定义，针对机器视觉的Camera，融合信号采集、图像处理和GPU加速等功能，以代替前端的ISP，下半年将着重在工业视觉领域实现新的突破。”李原踌躇满志表示。

不再跟随？创新当道

在AIGC热潮掀起通用GPU的算力革命之际，一个更值得业界深思的问题也浮出水面。

“业界均认为AIGC大模型是一大风口，一大史诗级机遇。但值得深思的是，中国这么多AI公司和GPU公司，为什么美国开大模型之先河？如果不深刻反省，下次再有风口出现时我们还是被动跟随的境况。”李原的表述中藏着一些深层的内省。

李原进一步提议，对国内高科技界来说，最重要的是要思考未来十年会向什么方向演变？如果只是一味地跟随或Repeating，实际上没有太大价值，也走不出这一循环。

着眼于通用GPU发展，李原高瞻远瞩地表示，下一个十年比拼的是它的效率，而不仅是性能。为持续降低时延和提高带宽，将衍生出众多新技术，业界应着力解决芯片外部互联挑战，并尝试采用光电子技术，突破原有的方式才有可能实现超越。

此外，chiplet成为未来算力芯片“扩张”的必然之路，也将产生更多Cost Effective的效果。李原提到，芯动力也将在这一方向持续耕耘，加强与FPGA厂商合作共赢，切入更多场景，为客户带来更具想象力的价值。

对于CUDA兼容的走向，李原也洞察道，客户不在意底层是用CUDA或别的语言，最重要的是能够快速迭代、快速开发。在已经选用了CUDA语言的领域里，我们会尊重客户的选择，但在新的领域里，完全可以有自由的选择。

伴随生成式AI带动下的这场新兴科技革命，边缘计算的价值将被如芯动力这批“抢滩登陆”的企业率先释放，而芯动力的未来之路，也将成为国内众多行业的数字化、智能化转型升级的动力之源。（校对/萨米）