智谱清华联合推出ZCube架构 大模型推理吞吐提升15% 网络成本降三分之一
大模型推理的浪潮正全面推动AI基础设施栈的革新。其中,网络架构的创新已成为释放昂贵硬件算力、提升系统整体经济性的核心路径。近期,一项由智谱AI、驭驯网络与清华大学合作的研究,实现了从理论到生产应用的重要突破。

2025年9月,其关于ZCube网络架构的研究成果已在网络领域顶级会议ACM SIGCOMM 2025上发表。更值得关注的是,2026年5月21日,智谱AI宣布该架构已在GLM-5.1coding的生产环境中成功部署,并实现了显著的性能优化。
基准测试结果令人瞩目:在保持GPU硬件、软件栈及上层应用完全不变的前提下,仅通过网络架构的革新,就实现了交换机与光模块的资本支出降低33%,GPU平均推理吞吐量提升15%,首Token时延(TTFT P99)更是大幅降低了40.6%。这无疑是一次兼顾高经济性与高性能的系统级突破,为大模型推理效率提升提供了关键解决方案。
传统架构的痛点与ZCube的破局思路
传统网络架构的瓶颈究竟在哪里?大规模GPU集群通常采用Clos或Fat-Tree等层次化架构,数据包需要经过接入层和汇聚层的多跳转发。随着集群规模扩大,不仅网络设备成本线性增长,跨汇聚层的流量拥塞和路径非最优问题也日益突出,直接制约了GPU间的通信效率,成为大模型训练与推理的性能瓶颈。
ZCube架构的破局之道,在于其根本性的设计哲学转变。它彻底摒弃了传统Clos架构的层次化堆叠思路,取消了汇聚层交换机,转而采用一种完全扁平化的两组交换机进行二部图互联。这种设计,结合双端口网卡的单轨与多轨混合接入机制,以及专门优化的路由算法,确保了任意两个GPU之间都拥有一条独享且最优的通信路径。
这意味着,从网络结构层面就天然实现了流量的完美负载均衡,避免了热点拥塞。更重要的是,这种架构具备极佳的扩展性,能够轻松支持数万乃至数十万张GPU的超大规模互联,为未来AI算力集群的持续扩展铺平了道路,是构建高效能AI计算网络的关键技术。
从论文到生产:平稳落地的挑战与实现
然而,任何创新的网络架构从论文走向大规模生产环境,都面临巨大挑战。布线复杂度的指数级增长、路由策略的重构、以及升级过程中如何保证业务零中断,都是必须解决的难题。
在这次生产环境改造中,驭驯网络团队发挥了关键作用。他们利用自研的自动化控制与校验工具,成功克服了高密度布线和管理复杂性的挑战,高效完成了路由策略的重构与部署,最终保障了千卡集群的快速且平稳升级。目前,基于ZCube架构的集群已稳定运行超过两周,充分验证了其可靠性与成熟度,为大模型推理服务提供了稳定的网络基础。
ZCube的成功落地,标志着一个清晰的趋势:智算基础设施正从追求通用互联,走向以模型流量特征为核心的、系统级的协同设计。未来,网络拓扑、通信库、作业调度策略三者的深度耦合与联合优化,将成为进一步提升Token生产效率、降低MaaS(模型即服务)综合运营成本的核心驱动力。这场由上层AI应用驱动的底层基础设施革命,才刚刚拉开序幕。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
可灵AI制作气泡上升破裂特效详细教程
在可灵AI中生成气泡从液体底部升起到水面破裂的特写镜头时,若效果不佳,可尝试:将过程拆解为三个物理阶段并用精确参数描述;利用首尾帧控制并配合光学破裂指令;启用视频3 0模型并注入液体粘度、表面张力等物理参数;上传真实液体基底图并开启表面法线重建功能,以引导模型模拟真。
AI模特换装视频效果真实自然吗服装电商实测解析
使用可灵AI制作服装电商换装视频时,需提供高清、姿态标准且背景简洁的原图。调整参数时应强化物理模拟与运动平滑,关闭风格化增强。复杂服装可采用分层替换与局部重绘处理。最后,引入真实动作参考视频进行微观校准,可显著提升动作自然度与布料动态真实感。
QoderWake数字分身动作捕捉与还原技术详解
QoderWake数字分身通过五大核心技术实现动作精准捕捉与还原。基于Session账本三维锚定行为轨迹,确保可追溯与复现。Harness-First架构隔离意图与执行,保障操作安全。Critic-Refiner机制自动验证动作质量并闭环纠偏。防腐治理动态评估动作有效性,防止模板老化。Connector生态建立跨工具动作映射,确保异构系统间操作一致。这些技术
简历工作经历优化技巧 AI助你告别流水账式写法
简历应避免流水账式经历和空洞评价。工作经历需用“动词+成果+数据”结构突出价值,如具体增长或性能提升数据。自我评价应基于事实,清晰展示核心优势与证明。AI工具可辅助优化结构,但关键数据、业务背景及岗位匹配逻辑需自行把控,核心在于用结果和证据展现个人价值。
阿里云发布全栈芯片路线图 平头哥真武M890性能提升三倍
阿里云推出平头哥新一代AI芯片真武M890,配备144GB显存,算力性能达上一代3倍,支撑智能体高频模型调用。该芯片已实战验证,未来将推出后续型号。平头哥坚持软硬一体策略,通义千问大模型在其上自主运行并实现性能提升,阿里云目标以此扩大AI市场份额。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

