6月15日,算苗科技正式官宣,旗下全国产自研3D TokenPU芯片顺利完成流片,标志国内基于3D混合堆叠工艺的AI推理芯片实现国产化关键突破,为大模型算力高效供给提供全新本土硬件方案。
这款芯片核心采用前沿3D混合堆叠架构,区别于传统2D平面算力芯片,通过多层晶圆垂直堆叠大幅缩短存储与计算单元的数据传输路径,搭载16TB/s超大带宽,从底层解决大模型推理过程中带宽不足、数据交互延迟高的行业痛点,专项面向海量大模型线上推理场景优化性能。
当前国内大模型产业快速扩张,云端、端侧推理算力需求持续激增,传统算力芯片存在带宽瓶颈,导致大模型运行功耗高、推理速度受限。3D TokenPU依托超高带宽优势,能够显著降低数据搬运损耗,大幅提升大模型推理运行效率,适配通用大模型、多模态生成、实时对话等各类高负载推理任务。
值得关注的是,该芯片实现全流程国产化落地,从架构设计到流片制造均依托国内产业链完成,打破海外高端3D算力芯片技术与工艺壁垒。此前3D堆叠算力方案长期由海外厂商主导,本土同类产品稀缺,本次流片落地补齐国内高端AI算力硬件布局短板。
(校对/李正操)