AI Agent时代,CPU何以在算力战中突围?
英伟达计划在其下一代Rubin架构中大幅提升CPU核心数量。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
长期以来,市场总是将GPU与AI算力划上等号,然而随着AI行业步入由智能体驱动的强化学习时代,CPU正逐渐演变为算力“木桶效应”下的新短板。
最新研究显示,在完整的智能体执行链路中,工具处理相关环节在CPU上消耗的时间占端到端延迟的比例最高可达90.6%。在高并发场景下,CPU端到端延迟从2.9秒跃升至6.3秒以上。其结果表明,在大规模智能体场景中,系统吞吐受限的并非GPU计算能力,而是CPU的核心数与并发调度问题。
就在日前,GPU领域的超级玩家英伟达主动斥资20亿美元追加认购CoreWeave股票,并声言后者将在其平台上部署Vera CPU——一款专为“代理式推理(Agentic Reasoning)”设计,且在大规模AI工厂最具能效优势的处理器。据悉,因ARM CPU遭遇瓶颈,英伟达已计划在下一代Rubin架构中大幅提升CPU核心数,并开放NVL72机柜对x86 CPU的支持。
东吴证券指出,英伟达主动提升CPU权重,等同于在系统层面确认:在长上下文与高并发智能体场景中,大内存CPU是承载海量KV缓存的最优容器。
与此同时,由于超大规模云服务商“扫货”,英特尔与AMD在2026全年的服务器CPU产能已基本售罄。为了应对供需极端失衡并确保后续供应稳定,两家公司均计划将服务器CPU价格上调10-15%。其中,英特尔甚至紧急将产能转向服务器端,一度导致消费电子端交付受阻。
在英特尔2025年第四季度财报电话会上,CEO陈立武表示,尽管AI时代带来了前所未有的半导体需求,但短期内,“我对未能完全满足市场需求感到遗憾”。
对话靠GPU,执行靠CPU
是什么让CPU从AI算力界的“冷板凳”上站起,成为需要被单独规划的核心资源池?国金证券等多个机构总结道,智能体对CPU需求提升主要来自三方面,即应用调度压力、高并发工具调用成为瓶颈,以及沙箱隔离提升刚性开销。
应用调度压力较好理解,当AI智能体层出不穷,服务器端整体调用频率与覆盖面显著升高,便会带来更多系统请求、数据搬运与控制流开销。
至于为何CPU负载高于GPU,在东吴证券看来,智能体时代的AI由“纯对话”转向了“执行任务”,因此产生大量if/else判断,这种“分支类任务”倘若由GPU执行,会因控制流发散导致算力利用率急剧下降。与之相比,CPU的微架构却能够适应此类任务。
另据广发证券,智能体时代下,大语言模型叠加了决策编排器与多类外部工具,整体计算流程演化为“感知-规划-工具调用-再推理”的闭环结构。由于工具调用、任务调度、信息检索等关键环节均依赖CPU完成,随着智能体渗透率与工具调用密度提升,CPU作为中间调度枢纽的占用线性放大。
此外,在智能体场景下,长上下文推理会快速耗尽GPU的高速显存容量。为了解决这一问题,业界采用KV缓存卸载技术将数据迁移至CPU内存。如此一来,CPU搭配大容量DDR5/LPDDR5承担KV缓存与部分参数,便成为了兼顾吞吐、扩展性与成本效率的主流架构选择。
从投资层面来看,招商证券表示,海外CPU巨头在国内的合作商将从这一轮CPU涨价行情中直接受益。此外,国内AI全产业链自主可控仍在不断推进,硬件端与软件端的生态适配正同步跟进,生态架构的升级将会对其中的各个环节提供性能上和产量上的双重要求,并带来明显的边际变化。
国海证券指出,超大规模数据中心已进入“升级周期”,CPU架构有较大替换需求,预计2026年服务器CPU出货量有望增长25%。服务器CPU是AI算力与数据中心升级的核心受益环节,正进入存量升级+国产替代+模型迭代三重共振周期,或将迎来价值重估机会。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
钱江赛600上市售2.99万起,2026款配置抢先看
汽车3月29日消息,今日,QJMOTOR发布2026款全新赛600,新车售价29999元起。新车换装了全新的680cc直列四缸发动机,发动机最大功率74 5kW(最大马力101 3匹),最大扭矩68
华为畅享90 Pro Max红外传感器详解:影像设计与对称美学融合
IT之家 3 月 29 日消息,在 3 月 23 日的华为春季全场景新品发布会上,华为畅享 90 系列手机正式发布。而随着畅享系列的回归,华为终端 BG 首席执行官何刚宣布,华为手机实现全面回归。华
蔚来萤火虫11个月交付5万辆,刷新里程碑
IT之家 3 月 29 日消息,蔚来 firefly 萤火虫品牌最新微博今日宣布里程碑再度刷新:自 2025 年 4 月 29 日开启首批交付以来,历时 11 个月,正式达成 5 万台交付。IT之家
2026中关村论坛年会:摩尔线程携全栈自研算力方案亮相AI展区
北京商报讯(记者 王蔓蕾)2026中关村论坛年会期间,北京商报记者在现场了解到,国产全功能GPU企业摩尔线程携全栈自主算力解决方案亮相 "人工智能+ "展区。在 "人工智能+ "展区,摩尔线程集中展示了全栈
灵伴科技周军:AI眼镜如何赋能残障群体平等生活
本报(chinatimes net cn)记者石文君 北京报道3月27日,由中国残联、北京市政府主办,北京市残联承办的2026中关村论坛年会科技助残论坛在北京举行。此次论坛以“科技有爱共创美好世界”
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

