数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

科技数码

腾讯混元开源HPC-Ops：打造高性能LLM推理核心算力库

腾讯混元开源HPC-Ops：打造高性能LLM推理核心算力库

热心网友时间：2026-01-27

转载

腾讯混元 AI Infra 团队正式开源面向生产环境的高性能大语言模型（LLM）推理核心算子库 HPC-Ops。该库直击工业级部署中的实际瓶颈，完全基于 CUDA 与 CuTe 从

腾讯混元 AI Infra 团队正式开源了适用于生产环境的高性能大语言模型（LLM）推理核心算子库 HPC-Ops。该库直接瞄准工业级部署中的实际瓶颈，从底层着手，基于 CUDA 和 CuTe 进行完全重构，融合了工程架构抽象化设计、GPU 微架构深度适配以及指令级精细化调优等多重技术手段。在显著降低底层算子开发复杂度的同时，推动关键算子性能逼近硬件理论极限，实现实质性的性能跃升。

根据最新介绍，HPC-Ops 是一套轻量、高吞吐、低延迟的 LLM 推理算子集合，专为大规模型服务场景优化。其核心模块覆盖：FusedMoE（融合专家混合）、Attention（注意力机制）、设备内/跨设备通信（Intra-/Inter-node Communication）、Norm（归一化）、Sampler（采样器），以及对多种高频小算子的深度融合实现。团队通过深入剖析典型推理任务的数据流特征与 GPU 硬件微架构特性，精确匹配计算划分子策略与底层指令执行模型，从而释放更高并行效率；同时对工程代码层进行合理抽象，使算法工程师可更专注于模型逻辑与算子语义设计，大幅缩减后续迭代与维护成本。

HPC-Ops 算子库整体架构如下：

腾讯混元 AI Infra 团队开源 HPC-Ops，高性能 LLM 推理核心算子库

腾讯混元 AI Infra 团队披露的实际测试数据显示：在真实业务负载下，搭载 HPC-Ops 后，混元系列模型推理 QPM（每分钟查询数）提升达 30%，DeepSeek 系列模型 QPM 提升 17%。单算子维度表现尤为突出——Attention 算子相比 FlashInfer / FlashAttention 最高提速 2.22 倍；GroupGEMM 相比 DeepGEMM 最高提速 1.88 倍；FusedMoE 相比 TensorRT-LLM 最高提速 1.49 倍。

开源地址：

来源:https://www.php.cn/faq/2038357.html?uid=1246273

上一篇： X.Org库更新：多个版本发布与性能优化详解

下一篇： Docker 29.2.0发布：新版本核心功能详解

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

小米回应新车未上市被曝起火实为SkyNomad遭AI污染

小米回应新车未上市被曝起火实为SkyNomad遭AI污染

小米新系列尚未正式发布，搜索“SkyNomad”即出现“起火”“事故”等联想词及疑似AI生成的“车祸”视频。小米官方紧急辟谣，已收集相关证据并与平台沟通，指出这是利用AI技术批量造谣的有组织的舆论攻击行为。

时间：2026-07-11 12:56

沃尔玛沃集鲜推出药食同源系列新品

沃尔玛沃集鲜推出药食同源系列新品

沃尔玛自有品牌沃集鲜推出“药食同源”系列，覆盖饮品、烘焙、零食等品类，分日常与衍生两大产品梯队，联合老字号拓展消费场景，同时加速全国门店升级，以商品力与门店网络推动全渠道增长。

时间：2026-07-11 12:55

聆思科技获近5亿元B轮融资

聆思科技获近5亿元B轮融资

聆思科技完成近5亿元B轮融资，由安徽与合肥国资领投。资金将用于新一代端侧大模型AI推理芯片研发，从感知模型升级至认知大模型。首颗Nebula系列预计2026年底推出。公司已推出23款芯片，累计出货超1 5亿片，广泛用于家居家电、教育办公等领域。

时间：2026-07-11 12:55

北通鲲鹏70异环联名手柄上市安魂曲薄荷双色699元

北通鲲鹏70异环联名手柄上市安魂曲薄荷双色699元

北通鲲鹏70《异环》联名款手柄上市，售价699元，提供安魂曲与薄荷双色。礼盒内含定制手柄及周边，前12000套赠游戏道具兑换卡。手柄搭载AI触觉反馈肩键、双切扳机、阻尼可调摇杆，支持星闪2000Hz回报率，兼容PC、NS、手机和车机。

时间：2026-07-11 12:54

全球电动汽车需求持续增长趋势研究机构报告

全球电动汽车需求持续增长趋势研究机构报告

6月全球电动汽车注册量连续第四个月增长，达200万辆，同比增7%。欧洲市场表现抢眼，注册量飙升31%，北美受税收政策影响下滑13%。德国车企面临挑战，保时捷上半年销量降16%，大众营业利润跌54%。

时间：2026-07-11 12:54

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

热门数据榜

Quickie AI 智能快捷方式，快速完成任务

快手开源模型可图Kolors 支持图像内生成文字

Hebbia AI智能搜索引擎金融法律政府制药行业知识工作助手

Penf1 AI驱动的博客写作工具

HIX.AI一体化人工智能写作助手打造最佳文案

人工智能内容生成平台与自动化培训项目

基于GPT从文本选择生成Anki卡片的浏览器插件

Chrome浏览器必应AI全新体验智能搜索与聊天助手

ReelGen AI 智能 Chrome 插件

免费智能AI绘画软件NVIDIA Canvas

Quickie AI 智能快捷方式，快速完成任务

快手开源模型可图Kolors 支持图像内生成文字

Hebbia AI智能搜索引擎金融法律政府制药行业知识工作助手

Penf1 AI驱动的博客写作工具

HIX.AI一体化人工智能写作助手打造最佳文案

人工智能内容生成平台与自动化培训项目

基于GPT从文本选择生成Anki卡片的浏览器插件

Chrome浏览器必应AI全新体验智能搜索与聊天助手

ReelGen AI 智能 Chrome 插件

免费智能AI绘画软件NVIDIA Canvas

Quickie AI 智能快捷方式，快速完成任务

快手开源模型可图Kolors 支持图像内生成文字

Hebbia AI智能搜索引擎金融法律政府制药行业知识工作助手

Penf1 AI驱动的博客写作工具

HIX.AI一体化人工智能写作助手打造最佳文案

人工智能内容生成平台与自动化培训项目

基于GPT从文本选择生成Anki卡片的浏览器插件

Chrome浏览器必应AI全新体验智能搜索与聊天助手

ReelGen AI 智能 Chrome 插件

免费智能AI绘画软件NVIDIA Canvas

相关攻略

相关攻略

小米回应新车未上市被曝起火实为SkyNomad遭AI污染

2026-07-11 12:56

小米回应新车未上市被曝起火实为SkyNomad遭AI污染

沃尔玛沃集鲜推出药食同源系列新品

2026-07-11 12:55

沃尔玛沃集鲜推出药食同源系列新品

聆思科技获近5亿元B轮融资

2026-07-11 12:55

聆思科技获近5亿元B轮融资

北通鲲鹏70异环联名手柄上市安魂曲薄荷双色699元

2026-07-11 12:54

北通鲲鹏70异环联名手柄上市安魂曲薄荷双色699元

全球电动汽车需求持续增长趋势研究机构报告

2026-07-11 12:54

全球电动汽车需求持续增长趋势研究机构报告

AI看懂地图却误解双方心意

2026-07-11 12:54

AI看懂地图却误解双方心意

比亚迪腾势N8官图发布大五座纯电SUV搭载第二代刀片电池

2026-07-11 12:54

比亚迪腾势N8官图发布大五座纯电SUV搭载第二代刀片电池

小米澎程N90官方图片正式亮相

2026-07-11 12:53

小米澎程N90官方图片正式亮相

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

三角洲行动2026年7月10日最新每日密码

三角洲行动2026年7月10日最新每日密码发布于 2026-07-11

我的世界灵感模组合成表大全

我的世界灵感模组合成表大全发布于 2026-07-11

花神祈愿活动正式上线时序轮转群芳齐聚

花神祈愿活动正式上线时序轮转群芳齐聚发布于 2026-07-11

代号撤离正式服上线评测与玩法体验全面分析

代号撤离正式服上线评测与玩法体验全面分析发布于 2026-07-11

年反应力训练游戏推荐：提升手眼协调与专注力

年反应力训练游戏推荐：提升手眼协调与专注力发布于 2026-07-11

宣行琮机制拆解与实战配队完整攻略

宣行琮机制拆解与实战配队完整攻略发布于 2026-07-11

五星大饭店的实用忠告

五星大饭店的实用忠告发布于 2026-07-11

暗区突围账号估价平台推荐与交易价格参考

暗区突围账号估价平台推荐与交易价格参考发布于 2026-07-11

Win11系统截图自动备份到OneDrive的完整关闭方法教程

Win11系统截图自动备份到OneDrive的完整关闭方法教程发布于 2026-07-11

Win11关闭文件资源管理器多标签页分组功能

Win11关闭文件资源管理器多标签页分组功能发布于 2026-07-11

Win11蓝牙开关消失驱动重装无效的解决方法

Win11蓝牙开关消失驱动重装无效的解决方法发布于 2026-07-11

Win11鼠标移到右下角不显示桌面的设置方法

Win11鼠标移到右下角不显示桌面的设置方法发布于 2026-07-11

美的洗衣机烘干功能滤网清洁方法

美的洗衣机烘干功能滤网清洁方法发布于 2026-07-11

万级奔驰纯电GLC高端家用SUV值得入手

万级奔驰纯电GLC高端家用SUV值得入手发布于 2026-07-11

移动硬盘供电不足导致无法识别的解决方法

移动硬盘供电不足导致无法识别的解决方法发布于 2026-07-11

漫步者蓝牙耳机需不需要下载专用APP

漫步者蓝牙耳机需不需要下载专用APP 发布于 2026-07-11

热门话题

可灵AI使用教程_可灵视频生成指南_AI短片创作技巧

可灵AI使用教程_可灵视频生成指南_AI短片创作技巧

海螺AI使用教程_MiniMax视频音乐生成指南_海螺AI实战技巧

海螺AI使用教程_MiniMax视频音乐生成指南_海螺AI实战技巧

讯飞星火使用教程_星火大模型功能解析_办公写作学习指南

讯飞星火使用教程_星火大模型功能解析_办公写作学习指南

文小言使用教程_百度AI助手功能解析_文心智能体使用指南

文小言使用教程_百度AI助手功能解析_文心智能体使用指南

智谱清言使用教程_GLM大模型能力解析_清言AI实用指南

智谱清言使用教程_GLM大模型能力解析_清言AI实用指南

天工AI使用教程_天工搜索写作指南_昆仑万维AI助手解析

天工AI使用教程_天工搜索写作指南_昆仑万维AI助手解析

腾讯元宝使用教程_腾讯元宝AI功能解析_搜索写作智能体指南

腾讯元宝使用教程_腾讯元宝AI功能解析_搜索写作智能体指南

即梦AI使用教程_即梦图片视频生成指南_提示词与创作技巧

即梦AI使用教程_即梦图片视频生成指南_提示词与创作技巧

Microsoft Copilot使用教程_Copilot办公与编程指南_微软AI助手实战

Microsoft Copilot使用教程_Copilot办公与编程指南_微软AI助手实战