清华腾讯混元获MLSys2026MoE推理冠军 NPU推理速度提升4.1倍
近日,国际机器学习系统顶级会议MLSys 2026公布了其MoE模型推理优化挑战赛的最终结果。由清华大学存储实验室与腾讯混元AI Infra团队共同提交的联合优化方案,凭借卓越的系统性能与创新性,在包括Stanford、MIT等全球顶尖团队的激烈角逐中拔得头筹,荣获全球冠军。

上图直观呈现了该冠军方案的核心优化架构,其关键技术模块包括E-Shard专家分片策略、连续DMA数据传输、PSUM与GEMV计算并发执行、冷启动流水线化以及智能预取控制等,共同构成了高效推理的基石。
本次夺冠的核心优势,不仅源于上述精密的系统层设计,更得益于一个关键的创新工具——团队联合研发的、基于智能体(Agent)的推理算子自动化优化器“Knight”。该工具实现了从优化策略自动生成、代码高效落地到效果复盘迭代的全流程闭环,极大地扩展了高性能优化方案的搜索空间,使得许多以往依赖人工经验难以触及的深度优化点得以自动发掘与实践。
优化成效极为显著。最终,该联合方案将MoE模型的端到端推理耗时从基准的14.91秒大幅降低至3.56秒,整体性能加速比达到4.1倍。尤为关键的是单步解码延迟的优化,从12.63毫秒降至5.45毫秒,这对提升大模型实时交互体验至关重要。此外,在模型权重加载阶段,DMA引擎的利用率提升至约80%,标志着硬件计算资源的利用效率获得了实质性优化。
能够在全球顶尖学府与研究机构的竞争中脱颖而出,充分证明了该方案的技术领先性与工程实用性。这份成绩不仅是一项荣誉,更清晰地表明我国在面向大语言模型的底层系统适配与核心算子深度优化领域,已构建起扎实的工程能力与技术壁垒。此项成果为未来在超大规模算力平台上,高效部署与推理万亿参数级别的混合专家大模型,提供了一个极具参考价值的高性能实现范本与工程路径。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
AI将引发企业裁员潮 高管预测未来两年影响显著
最新调查显示,99%的企业高管预计未来两年内将因推进AI项目而裁员。多数高管视自动化流程为高回报投资,但仅少数对现有人机协同能力有信心。岗位削减可能首先影响处理基础性工作的年轻员工,员工普遍对AI替代岗位感到担忧,“AI替代失调”心态蔓延,已成为管理与社会的重要议题。
东方基金重仓富创精密浮盈近5900万元 股价上涨3.07%
5月25日,A股半导体设备核心零部件龙头富创精密股价表现强势,收盘上涨3 07%,报收于172 20元。当日成交额达6 27亿元,换手率为1 24%,公司总市值也随之增长至527 29亿元,显示出市场对其的高度关注。 作为国内半导体设备精密零部件的领军企业,富创精密自2022年上市以来,始终是半导体
AI浪潮来袭如何把握时代机遇与挑战
初夏时节,运城经济技术开发区内一片生机勃勃。百度智能云(运城)数字经济产业基地里,繁忙景象随处可见。在基地展厅中央,AI数字人“王维”正与来访者吟诗互动,展现古典风雅;培训教室内,本地实体店主们齐聚一堂,认真学习如何运用AI工具进行视频剪辑、海报设计与文案创作;不远处的办公区,电商团队紧盯屏幕,来自
人形机器人数字身份证正式发布
湖北为人形机器人设立“数字身份证”,以29位字符记录其全生命周期数据,旨在解决身份不明、责任不清、数据不通等痛点,实现故障溯源、提升流转效率、保障二手交易可靠,并为国家标准推行探路,促进产业数据合规与生态健康发展。
华海清科股价下跌3.38%致东方基金浮亏超5500万元
华海清科股价下跌3 38%,收于266 94元。东方基金旗下五只产品合计持有该公司593 87万股,因股价下跌单日估算浮亏约5546 74万元。其中,东方人工智能主题混合A持股最多,浮亏约5341 76万元。该公司主营半导体设备,去年装备业务贡献超87%营收。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

