【阶段】原粒半导体：半导体行业进入Chiplet（芯粒）新阶段

作者：爱集微 3小时前

相关舆情 AI解读生成海报

来源：爱集微 #半导体#

1037

1. 原粒半导体：半导体行业进入Chiplet（芯粒）新阶段

2. 微软警告 ClaudeCode 存在漏洞，或致 GitHub 账号凭证泄露

3. 全球首个预制算力中心底座启用

1. 原粒半导体：半导体行业进入Chiplet（芯粒）新阶段

在半导体产业的发展历史里，硬件架构从来不是凭空演化的。PC 时代定义了 CPU，移动互联网定义了 SoC，而云计算与深度学习，则定义了 GPU。几乎每一次计算范式的变化，背后都会对应一次底层硬件逻辑的重构。

今天，类似的事情可能又一次发生了。

过去几年，大模型的主战场始终在云端。行业比拼的是更大的训练集群、更强的 GPU、更高的参数规模。所有人都默认，AI 的终点应该是超级数据中心。

但进入 2026 年后，一个很有意思的现象开始出现。

越来越多开发者和企业，重新开始购买 Mac Mini、小型工作站以及低功耗桌面主机。这些机器被安静地放在办公室或书桌角落，24 小时不间断运行。它们不再只是给人使用，而是在后台长期供养 AI Agent：写代码、做自动化流程、清洗数据、审核财税文档、调用各种工具链。

AI 开始像一种长期在线的“数字员工”存在。而当 AI 从“偶尔调用”变成“持续驻留”，整个计算架构的问题就会被重新暴露出来。因为这时候真正的瓶颈，很多时候已经不再是“算不动”，而是“数据搬不动”。

过去 GPU 最擅长的事情，其实是集中式爆发计算。比如大模型训练，本质上是在短时间内调动海量算力，进行高度规则化的大规模矩阵运算。这种模式非常适合云数据中心，也极其适合英伟达过去十几年建立起来的 GPU 帝国。

但 Agent 的工作负载完全不同。 它不是一次性推理，而是长时间运行；它需要长期保存上下文；需要频繁调用工具；需要处理文本、图像、语音等多模态输入；甚至还需要持续响应外部环境变化。

这意味着，AI 系统内部会产生大量的数据流动。数据在显存之间搬运，在缓存和主存之间搬运，在不同计算单元之间来回交换。真正消耗功耗和时间的，很多时候不是核心计算，而是这些“运输过程”。

行业里有一句越来越被频繁提起的话：未来 AI 最大的成本，不一定是计算，而是数据移动。尤其在边缘端、小型设备、本地 Agent 场景下，这个问题会被进一步放大。

因为没有数据中心级别的供电，没有超大规模散热，也没有无限堆叠的 GPU 集群。你必须在很小的体积里，同时解决功耗、带宽、散热、成本以及长期稳定运行的问题。

这也是为什么，越来越多 AI 芯片公司开始放弃过去“大单片芯片”的思路。传统芯片的发展逻辑其实很简单：想提升性能，就在一块硅片上塞进更多计算核心、更大缓存、更高带宽。

但这种模式正在越来越接近物理极限。芯片越大，良率越低；功耗越高，发热越严重；制造成本也会迅速膨胀。于是，半导体行业这几年开始进入一个非常关键的新阶段——Chiplet（芯粒）时代。

简单来说，就是不再强行制造“一整块超级芯片”，而是把芯片拆成很多功能模块。有人负责计算，有人负责存储，有人负责互联，有人负责 AI 加速。最后再通过高速互联网络，把这些模块重新组织成一个整体。

很多人把这种方式称为“硅基乐高”。它最大的意义，其实不只是降低成本，而是让芯片第一次真正具备了“可组合性”。算法变了，不需要整块芯片重做；需求变了，可以增加对应模块；不同场景，也可以灵活切换不同组合。

过去做芯片，更像是在盖一栋无法修改的定制大楼；现在越来越像是在搭积木。

而这种变化，恰恰非常适合 AI Agent 时代。因为 Agent 最大的问题，就是变化太快。模型结构在变，工作流在变，多模态系统在变，工具调用方式也在快速变化。传统芯片两三年的研发周期，已经越来越难追上 AI 的演化速度。

于是，整个行业开始从“追算法”，转向“适应算法”。但很多人会误以为，Chiplet 的核心只是“把芯片切小”。

其实真正困难的问题并不在这里。真正难的是：拆开之后，怎么还能像“一颗芯片”一样协同工作。 因为多个芯粒之间会产生海量通信。数据怎么走？任务怎么分？显存怎么调度？上下文如何同步？如果这些问题处理不好，多芯粒系统甚至可能比传统单片芯片效率更低。

所以今天很多端侧 AI 公司真正竞争的重点，其实已经不只是算力，而是调度能力。换句话说，未来 AI 芯片的核心，不只是计算单元，而是“交通系统”。

因为 AI Agent 的运行，本质上越来越像一个实时城市交通网络。哪里堵了，任务如何绕路；哪些数据应该优先缓存；哪些任务应该动态分流。这些都会直接决定最终的性能与能耗表现。

很多时候，真正决定系统体验的，已经不是峰值算力，而是调度效率。这也是为什么，现在越来越多芯片公司开始强调互联网络、动态路由、拓扑调度以及软件工具链。

因为未来的 AI，不再只是一次性跑分，而是长期稳定运行。而在这一轮端侧 AI 架构重构中，原粒半导体这样的公司开始受到行业关注，本质上也并不只是因为“国产 AI 芯片”这个标签。

更重要的是，它们试图从一开始，就按照 Agent 的运行逻辑重新定义硬件。包括 Chiplet 模块化架构、高带宽互联、动态任务调度、软硬件协同工具链以及多模态融合能力。

这些技术单独拆开看，其实都不算新鲜。真正困难的是，如何把它们组合成一个适合长期运行 AI Agent 的完整系统。因为未来真正重要的，已经不只是“能不能跑通大模型”。

而是能不能长期稳定运行，能不能低功耗持续驻留，能不能适应快速变化的 Agent 工作流，能不能真正进入现实产业环境。

这其实是两个完全不同的问题。今天很多 AI Demo 都很惊艳，但距离真正进入生产系统，还有很长一段路。

而端侧 AI 真正需要解决的，恰恰是那些最枯燥、最底层、最工程化的问题。很多时候，技术革命真正开始成熟的标志，并不是模型参数突破多少，而是基础设施开始发生变化。

从大型机到 PC，人类用了几十年。而从云端 AI 到长期驻留的本地 Agent，也许才刚刚开始。

而这一轮变化背后，本质上并不只是一次简单的芯片升级。

它更像是：AI 正在重新发明“计算机”。

2. 微软警告 ClaudeCode 存在漏洞，或致 GitHub 账号凭证泄露

AI解读生成海报

微软研究人员发现，Anthropic 旗下 Claude Code 的 GitHub 自动化流程存在一处漏洞，该漏洞可能导致持续集成/持续部署（CI/CD）工作流中的机密信息泄露，攻击者或可通过提示词注入攻击窃取敏感凭证。

微软威胁情报团队在监测到公开代码库中出现针对人工智能辅助型 GitHub 工作流的提示词注入尝试后，启动了本次研究。

据了解，提示词注入是一类人工智能安全漏洞。攻击者会在大模型处理的内容中嵌入误导性指令，以此操控模型行为。大型语言模型的常规设计逻辑是遵循开发者指令、响应用户提问，而攻击者会设法诱骗模型，使其无视预设指令。

研究人员举例说明，有攻击者将注入指令藏在 HTML 注释中。这类内容在 GitHub 展示界面中不可见，但读取原始 Markdown 源码的人工智能模型却能识别。涉事代码库当时借助 GitHub 自动化流程来自动处理工单问题。

攻击者可将恶意指令伪装成普通的功能需求，无需获得项目修改权限，仅需提交一条 GitHub 工单，就能诱骗人工智能机器人代为执行修改操作。

微软证实，同类提示词注入手段同样可针对 Anthropic 的 Claude Code GitHub 自动化流程发起攻击。此前 Anthropic 已为部分工具（例如可让 Claude 在系统中执行命令的 Bash 工具）设置了沙箱防护。

但微软发现，Claude 用于读取文件的读取工具并未受到同等安全限制。

研究人员制作了提示词注入攻击载荷，对该漏洞进行验证测试。测试中，恶意提示词成功绕过两层防护，诱导这款人工智能助手读取了存放着应用程序接口密钥及其他凭证的系统文件。

微软于 4 月 29 日向 Anthropic 上报了该漏洞。Anthropic 已于 5 月 5 日发布 Claude Code 2.1.128 版本完成修复，通过限制程序对/proc/目录下敏感文件的访问，防止相关信息被非法窃取。

3. 全球首个预制算力中心底座启用

6 月 6 日，全球首个预制算力中心底座在山东青岛正式启用。该底座相较于传统算力中心节约施工周期近 70%，为当前算力基础设施建设提供了更高效、更低碳的新方案。该设备不仅可以绿电直连，实现 100%绿电消纳，让 Token 的用电成本也可以降低大约 30%，还配合储能设备的调控，打造了专属的算电协同智能体系，让电力和算力同频联动、精准适配，有望带动算力价格降低。

此外，该底座设计了多个冗余电路，保障算力中心的用电可靠率可达近 100%。目前，该预制算力中心底座已经正式接入企业自建数据中心，预计今年下半年将应用于国家级数据中心集群以及多个地方级算力中心，为各级算力枢纽提供稳定高效、低碳集约、可快速复制的新模式。

随着全国算力基建规模化、标准化不断提速，多家算力价格也迎来持续普惠。前不久，多家模型厂商宣布永久下调算力价格，其中 DeepSeek 与小米 MiMo 降价尤为显著，最高降幅接近 99%。极大降低了用户日常高频问答、网页设计、代码编程等多场景 AI 使用成本，让各类轻量化、常态化 AI 应用告别高门槛、高成本的制约。

与此同时，三大运营商也在推出价格亲民的“算力订阅包”的同时，相关“词元产品”服务也已正式登陆中国算力平台。其中，中国电信产品主打开发者、中小企业版和个人、家庭版；中国移动则是为开发者打造 AI 编码订阅相关服务，为用户提供代码编写、代码审核、架构设计等应用场景；中国联通则采用积分模式弹性计费，更适用于企业办公、智能体调用等场景。