当前位置: 首页
AI资讯
不加GPU提升15%算力:大模型优化网络架构新趋势

不加GPU提升15%算力:大模型优化网络架构新趋势

热心网友 时间:2026-05-26
转载

过去两年,整个行业的算力军备竞赛似乎只有一个标准答案:采购更多GPU,建设更大规模的集群,不断堆高算力峰值。

不加一块GPU,多榨出15%算力:大模型圈开始对网络“动刀”

然而,这条看似唯一的路径,如今正被重新审视。

近日,智谱首次公开了一项已在生产集群中得到验证的架构创新——ZCube组网架构。其中一组数据颇为引人注目:在GPU数量未增、服务器未换、甚至应用代码一行未改的情况下,集群的推理吞吐量直接提升了15%,而TTFT(首Token响应时间)的P99尾延迟则下降了40.6%。关键在于,这些数字并非实验室仿真推演的结果,而是来自真实生产流量的考验。

对于一家服务上百万开发者的大模型API平台而言,这意味着同一套硬件基础设施,每秒能够多承载15%的并发请求,流量洪峰下的排队等待时间将大幅缩短。而P99尾延迟近40%的降幅,直接关系到终端用户感知到的“卡顿感”能减少多少,体验提升立竿见影。

更让行业内部关注的,是成本结构的变化。据披露,ZCube架构所需的交换机和光模块数量,比原有方案减少了约三分之一。集群规模越大,这笔节省的绝对值就越可观。在当前推理需求持续高增长、算力供给整体偏紧的市场环境下,这种“不动硬件、只动组网”的效率挖潜,无异于对存量算力资产进行了一次极低成本的价值重估。

不是只有智谱一家在抠算力

虽然智谱此次公开的技术细节有限,但其核心逻辑已足够清晰:当集群中数千甚至数万张GPU同时处理推理请求时,每一次KV Cache的跨卡传输、每一次数据同步,都需要穿越GPU之间的互联网络。这张“路网”的效率上限,直接决定了GPU本身的真实算力能发挥出几成。ZCube的思路,正是从拓扑设计的源头重新规划这张网络,旨在从根源上消除拥塞,而非等到拥堵发生后再去疏导。

几乎在同一时间,另一件事的发生,为这个技术方向的判断增添了更重的砝码。

OpenAI联合NVIDIA、AMD、Intel、Microsoft、Broadcom五大巨头,正式发布了MRC(多路径可靠连接)网络协议。这是一套面向超大规模AI集群的开放网络协议,目前已经部署在OpenAI所有最大规模的超算集群中,包括位于德克萨斯州Abilene的Oracle超算和微软Fairwater超算,用于训练ChatGPT等前沿模型。

将这两件事放在一起观察,指向的判断是一致的:当GPU集群的规模从万卡级向十万卡级跃进时,网络早已不再是那个被动的“连接件”,而是制约整体系统效率的核心变量。

不过,它们的技术路径却截然不同。MRC侧重于在协议层优化“交通规则”;而ZCube则是在架构层重构“路网”本身,从拓扑设计上消除产生拥塞的结构性根源。一软一硬,可谓殊途同归。

如果把视野拉开,会发现“不依赖堆叠硬件,转而从基础设施和系统架构中挖掘效率”这件事,正在成为行业一个微妙的转向。

从硬件侧看,NVIDIA最新一代Blackwell Ultra架构,通过NVFP4精度格式和注意力层加速,在DeepSeek-R1推理任务上,其吞吐量达到基础版GB200的数倍。Google推出的第七代TPU Ironwood,其单芯片的训练推理性能也比前代Trillium提升了超过4倍。

从芯片创业公司看,一批专门为推理设计的非GPU架构也在加速渗透。主攻超低延迟的Groq,其LPU在Llama 2 70B模型上跑出了每秒300个token的速度,据称比H100集群快10倍。晶圆级芯片公司Cerebras则声称,其推理速度在多项测试中超越了NVIDIA Blackwell。

从模型架构本身看,通义千问的Qwen3-Next通过混合注意力机制和高稀疏MoE设计,将训练成本压缩到此前的十分之一以下,推理上下文吞吐量提升超10倍。DeepSeek推出的稀疏注意力技术,使得新版模型的长文本推理速度比前代快2到3倍,API调用成本几乎砍半。

这些探索呈现出一个共同特征:它们都不再仅仅依赖“购买更多计算卡”这一单一杠杆,而是致力于在现有算力存量和有限的新增投入中,寻找更大的产出倍数。

当“买卡”不再是唯一答案

这场从“堆硬件”向“挖效率”的转向,正在对上游供应链产生实质性影响。

最直接的变量来自网络设备端。ZCube方案实现了交换机与光模块用量减少三分之一,而MRC协议则推动两层交换机组网替代传统的三到四层架构——两者叠加,意味着AI集群的采购逻辑将发生结构性调整:对高端交换机的需求,将从追求“更多层级”转向“更少层级、更大端口密度”;同时,光模块则加速向800G及以上速率集中。

事实上,市场数据已经在验证这个趋势。据LightCounting统计,2025年800G光模块出货量同比翻倍,1.6T光模块开始出货;预计2026年800G出货量将继续翻倍,1.6T产品将从2025年的较小基数跃升至数千万端口量级。

从资本市场的视角看,AI网络基础设施正在从万卡集群的“配套工程”,升级为产业链的核心价值环节。有机构预测,2026年数据中心交换机总销售额将同比增长86%。谷歌、亚马逊、微软和Meta四大云厂商2026年合计资本支出计划高达数千亿美元。叠加MRC协议推动以太网在超算集群中加速替代InfiniBand的长期趋势,800G/1.6T光模块产业链、高密度以太网交换机及相关芯片、连接器环节,正进入一个需求结构重塑的关键窗口期。

北京计算机学会AI专委会秘书长、北京大学特聘研究员张有鱼指出,将时间轴拉长来看,智谱此次公开的ZCube实践,在行业大背景中具有两层含义。

第一层是技术层面的,它用真实生产数据验证了一个事实——在千卡乃至万卡规模的集群中,网络架构本身可以成为一个独立的效率杠杆,且边际改造成本极低。当全行业都在GPU采购上投入巨资时,这种“四两拨千斤”的效率挖潜,显然比再下一笔芯片订单更具性价比。

第二层是商业层面的,对于手握大量GPU存量的平台型公司而言,硬件折旧是固定成本,谁能从既有资产中榨取出更多的Token产出,谁就能在API价格持续下探的市场竞争中拉开成本优势。智谱实现的15%吞吐提升和三分之一的网络硬件节省,放在百万级并发请求的规模下,对应的是一笔相当可观的运营成本优化。

来源:https://www.cls.cn/detail/2378597

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
市场研究方法与步骤详解从定义到实践案例

市场研究方法与步骤详解从定义到实践案例

市场研究是通过科学方法系统收集、分析市场信息,以把握现状与趋势,为决策提供依据的过程。其核心在于评估可行性、优化运营并理解客户需求,综合运用定性与定量方法,最终形成涵盖行业、产品及用户等多维度的准确报告,支持有效决策。

时间:2026-05-26 16:02
Scrum敏捷项目管理全流程指南:从理论到实践高效落地

Scrum敏捷项目管理全流程指南:从理论到实践高效落地

Scrum敏捷框架以轻量级结构应对市场变化,其核心包括三个角色、四个会议和三个工件。通过短周期迭代提升响应速度与透明度,强调团队协作与持续反馈,能有效降低风险、控制成本,适用于软件开发等复杂领域。成功实施需明确角色职责、用好管理工具并严格执行关键活动。

时间:2026-05-26 16:01
OpenAI每年因礼貌用语多支出数千万美元

OpenAI每年因礼貌用语多支出数千万美元

极客网·人工智能4月24日 最近,OpenAI首席执行官萨姆·奥特曼在社交平台上透露了一个令人意外的现象:用户在与ChatGPT互动时频繁使用“请”“谢谢”等礼貌用语,这一行为竟然导致公司每年需额外承担数千万美元的运营成本。 这一消息引发了广泛讨论,人们不禁好奇,为何简单的礼貌寒暄会带来如此高昂的成

时间:2026-05-26 16:00
TailwindCSS样式补全工具QClaw的实用类名推荐功能评测

TailwindCSS样式补全工具QClaw的实用类名推荐功能评测

TailwindCSS开发中若样式补全不理想,常因编辑器插件或配置问题。官方推荐使用TailwindCSSIntelliSense插件以获得深度集成与智能提示,而非第三方工具如QClaw。需确保项目根目录存在正确的tailwind config js配置文件,并检查其导出结构。补全功能应在HTML或模板的class属性内触发,可测试响应式与状态类名。同时需验

时间:2026-05-26 15:59
三年级思维导图制作指南 轻松备考期末提升成绩

三年级思维导图制作指南 轻松备考期末提升成绩

三年级是小学关键阶段,思维导图通过图形化方式提升学习效率。它能帮助孩子系统梳理语文课文结构、数学运算规则及英语词根词缀,使知识更清晰、记忆更牢固。这一可视化工具让学习目标明确、过程有趣,适合亲子协作,激发孩子主动探索的兴趣。

时间:2026-05-26 15:59
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程