当前位置: 首页
AI
腾讯混元AI开源Infra核心技术,推理吞吐提升30%实战解析

腾讯混元AI开源Infra核心技术,推理吞吐提升30%实战解析

热心网友 时间:2026-02-04
转载

2月4日,业界领先的科技媒体IT之家发布重要消息:腾讯混元AI基础设施团队正式宣布,开源一款面向生产环境的高性能大语言模型推理核心算子库——HPC-Ops。

该算子库致力于解决实际生产中的性能瓶颈,其底层完全基于CUDA和CuTe从零构建。通过引入抽象的工程架构设计、深度适配的微架构以及指令级极致优化等技术手段,它不仅显著降低了底层算子开发的难度,更将核心算子的性能推向硬件极限,实现了在推理效率上的实质性突破。

腾讯混元AI Infra核心技术开源,推理吞吐提升30%

上图展示了HPC-Ops算子库的整体架构设计。

在真实业务场景的测试中,HPC-Ops展现出了卓越的性能提升。基于该库,混元大模型的查询吞吐率提升了高达30%,而DeepSeek模型的查询吞吐率也获得了17%的显著增长。在单一算子性能对比上,HPC-Ops更是优势明显:其Attention算子相比FlashInfer / FlashAttention,最高实现了2.22倍的性能提升;GroupGEMM算子相较于DeepGEMM,最高提升达1.88倍;FusedMoE算子对比TensorRT-LLM,最高也有1.49倍的性能飞跃。

面向未来,HPC-Ops团队的开发规划将继续专注于突破大模型推理的性能边界:

一方面,团队将重点研发稀疏Attention算子,旨在针对性解决长上下文大模型面临的内存与算力瓶颈,让模型能够更高效地处理更长的序列。

另一方面,HPC-Ops将持续拓展更丰富的量化策略支持,计划覆盖包括4比特/8比特混合精度在内的更多量化方案,以进一步平衡推理速度与模型精度之间的关系,为用户提供更多样化的性能与精度取舍选择。

此外,该算子库还将布局计算-通信协同优化的核心内核。通过深度融合多GPU间的计算逻辑与通信流程,预期将大幅降低分布式推理场景下的通信开销,从而为超大规模模型的高效部署与推理提供坚实的底层系统支撑。

HPC-Ops项目已在GitHub平台开源。

来源:https://tech.ifeng.com/c/8qTWr6Z36j8

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
DeepSeek V4代码能力全球第一成本仅为Claude的二十一分之一

DeepSeek V4代码能力全球第一成本仅为Claude的二十一分之一

2026年4月24日,DeepSeek正式发布了其新一代旗舰大语言模型V4系列,包含两个版本:性能旗舰V4-Pro(总参数1 6万亿,每个token激活约490亿)和性价比之选V4-Flash(总参数2840亿,激活约130亿)。 模型一经发布,我们立即将其接入实际工程环境进行深度评测。其表现令人惊

时间:2026-05-18 06:51
MIT新架构实现成本降九成准确率百分百挑战硅谷传统

MIT新架构实现成本降九成准确率百分百挑战硅谷传统

当顶尖大语言模型智能体在企业数据环境中举步维艰,正确率甚至降至0%时,一项名为RUBICON的创新架构,通过引入一套简洁直观的查询语言,成功将任务准确率提升至100%。尤为关键的是,这一成就仅使用了规模更小、成本更低的模型。 当前AI应用领域存在一个显著的矛盾现象。一方面,科技巨头们致力于开发能够操

时间:2026-05-18 06:51
顺丰投资2亿美元布局机器人分拣技术将如何改变物流行业

顺丰投资2亿美元布局机器人分拣技术将如何改变物流行业

2026年4月27日,具身智能赛道在同一天内迎来了两则重磅消息。星动纪元宣布完成超2亿美元新一轮融资,几乎同时,无界动力也官宣其天使轮累计融资额突破2亿美元。 其中,星动纪元的融资细节尤为引人注目。本轮融资由物流巨头顺丰集团领投,红杉中国、IDG资本等一线财务投资机构,以及科捷智能、东风产投等产业资

时间:2026-05-18 06:51
GPT Image 2 屠榜反超谷歌 奥特曼红色警戒五个月后

GPT Image 2 屠榜反超谷歌 奥特曼红色警戒五个月后

被Google压着打了半年,OpenAI这次的反击,终于打出了声响。GPT Image 2上线仅仅12小时,就强势登顶Arena文生图排行榜,并且以领先第二名Nano Banana 2多达241分的巨大优势,创造了该榜单有史以来的最大分差。用Arena官方的话说,这是一次“干净利落的横扫”。 具体来

时间:2026-05-18 06:51
AI四小龙市值缩水 大模型新贵崛起重塑行业格局

AI四小龙市值缩水 大模型新贵崛起重塑行业格局

旧AI的故事,似乎已经写到了烂尾的章节。而新AI的传奇,才刚刚翻开序篇。那些曾经抢跑的四小龙,在时代的岔路口走偏了方向,如今已被远远甩开。 时间拉回到2024年12月30日的香港中环。 商汤科技创始人汤晓鸥站在港交所的铜锣前,举起了手中的木槌。那绝非一场普通的IPO,在场者无不将其视为中国AI产业的

时间:2026-05-18 06:50
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程