AMD董事长兼首席执行官苏姿丰(Lisa Su)于2026年5月19日在上海AMD AI开发者日上明确指出,AI产业正经历从大语言模型(LLM)的单向问答,向多智能体(Multi-Agent)协同工作流的根本性转变。她预测,未来五年内全球每日活跃AI用户将从当前的10亿量级跃升至50亿,这一用户基数的指数级扩张将直接驱动算力需求的结构性变革。
为何说单一模型交互时代正在终结?
苏姿丰在主题演讲中强调,过去几个月内,AI应用范式发生了关键转折。传统的“用户提问-模型回答”模式正迅速被智能体AI(Agentic AI)取代。她描绘了一个场景:未来每个用户可能同时调度5个、10个甚至100个专属AI智能体来处理不同的工作任务。这种转变意味着计算负载从集中的、批处理式的模型推理,分散为大量并发的、持续学习的智能体进程。
AMD高级副总裁、计算与图形总经理Jack Huynh援引小米MiMo大模型负责人罗福莉的观点指出:“智能体(Agent)时代的赢家,不属于烧掉最多算力的人,而属于将算力用得最聪明的人。”这揭示了效率与成本控制将成为下一阶段AI部署的核心竞争维度。
CPU为何在AI新时代重获战略地位?
苏姿丰断言,智能体经济的有效运行,依赖的并非单一的GPU算力,而是一套能够协同工作的“全栈计算方案”。她解释,智能体需要持续的推理能力、长期的学习记忆以及复杂的数据流处理,这些任务对处理器的通用计算能力、内存带宽和能效提出了综合要求。
| 计算任务类型 | 传统LLM范式 | 多智能体范式 | 对算力架构的核心影响 |
|---|---|---|---|
| 工作负载特征 | 集中式、高吞吐 | 分布式、高并发、长周期 | 从追求峰值算力转向平衡算力与内存子系统 |
| 核心资源需求 | GPU浮点运算能力 | CPU多线程调度、大容量统一内存、高带宽互联 | CPU与GPU的协同设计变得至关重要 |
| 成本结构 | 训练成本为主,推理成本相对线性 | 推理成本占比激增,且呈非线性累积 | 总体拥有成本(TCO)优化成为系统工程 |
AMD人工智能事业部高级总监Nick Ni提供了一项具体数据:中国头部AI开发者每年仅在复杂编码和日常智能体任务的API调用上,花费就高达数百万元人民币。他指出,若能在本地工作站上运行数据中心级模型,将能实现显著的成本节约和数据隐私保障。
中国市场如何成为算力架构变革的“压力测试场”?
苏姿丰将中国定位为“全球最具活力的AI生态系统”。她透露,AMD在中国市场已深耕超过30年,在北京、上海、深圳及台北设有研发中心,拥有超过4000名工程师。其EPYC(霄龙)处理器已支持中国头部云服务商的超过700个云实例。
这种深度参与使AMD能够近距离观察并响应中国市场的独特需求:
1. 应用场景极度碎片化:从消费电子到工业制造,AI落地场景多样,催生了对异构算力的旺盛需求。
2. 对成本极度敏感:庞大的开发者基数和企业用户要求算力解决方案必须具备极致的性价比。
3. 数据安全与隐私法规严格:推动了对本地化、私有化AI部署方案(如一体机)的强烈需求。
AMD与零一万物(01.AI)联合打造的企业智能体一体机,正是针对上述需求的产物。该设备基于Ryzen AI Max+ 395平台,采用统一内存架构,旨在让企业能够在本地安全、高效地部署和运行多个AI智能体。
全栈算力体系将如何重构产业链价值?
苏姿丰提出的“AI无处不在”(AI Everywhere)愿景,意味着算力部署将从云端数据中心,延伸至边缘设备、个人电脑乃至嵌入式终端。这种扩散对产业链提出了新的要求:
- 芯片设计:需要更注重CPU与GPU、乃至其他加速器(如NPU)的协同设计与内存一致性,而非单一单元的峰值性能。
- 软件生态:开发工具链必须简化跨平台(云、边、端)的智能体部署、管理和调度复杂度。AMD宣布推出面向中国开发者的公共AI开发者云(搭载Radeon GPU),并与魔搭(ModelScope)、阿里云合作,正是为了降低开发门槛。
- 系统集成:面向垂直行业的“算力+算法+应用”一体化解决方案能力变得至关重要,这为具备软硬件整合能力的厂商创造了新机遇。
图灵奖得主、Google杰出工程师David Patterson在2026年初曾警告,AI大规模落地正面临一场“成本危机”。苏姿丰的论述表明,应对这场危机的答案,可能在于从追求单一硬件指标的“军备竞赛”,转向构建以应用效率为核心的、开放的全栈算力体系。这场由多智能体范式驱动的架构变革,正在重新定义从芯片到软件,再到终端应用的每一个环节。
