首页
AI
华为盘古Ultra-MoE-718B V1.1开源:模型权重与技术细节公开下载

华为盘古Ultra-MoE-718B V1.1开源:模型权重与技术细节公开下载

热心网友
转载
2025-10-18
来源:https://www.ithome.com/0/889/991.htm

10月16日最新消息显示,今年9月,华为盘古718B大模型凭借其不堆数据、专注深度思考的训练策略,在SuperCLUE榜单上一路跃升至开源模型第三位,成为业界广泛关注的焦点。

华为方面近期正式宣布,openPangu-Ultra-MoE-718B-V1.1 模型已在GitCode平台全面开源,相关模型权重与技术细节悉数公开。

硬件部署要求为:Atlas 800T A2(64GB,≥32卡),支持裸机或Docker两种部署方式。

该模型的特色功能之一是支持通过 /no_think 标记在快慢思考模式间自由切换,并能高效支持多轮工具调用。

华为盘古 Ultra-MoE-718B-V1.1 正式开源并开放下载,模型权重与技术细节全面公开

据华为官方介绍,openPangu-Ultra-MoE-718B-V1.1 是基于昇腾NPU训练的大规模混合专家(MoE)语言模型,总参数量达到718B,激活参数量为39B。该架构创新性地融合了“快思考”与“慢思考”两种能力模式,从而实现更高效、更智能的推理与决策过程。

在9月最新发布的SuperCLUE榜单中,openPangu-718B 稳居开源模型总榜第三位,在数学推理、科学推理、代码生成六大核心维度均取得了优异成绩。特别值得关注的是,其在幻觉控制项上得分高达81.28,甚至超越了部分闭源头部模型,展现出其在输出可靠性方面的技术优势。

与上一版本 openPangu-Ultra-MoE-718B-V1.0 相比,V1.1在Agent工具调用能力方面有了显著提升,幻觉率进一步降低,模型的整体表现与稳定性也得到了全面提升。

华为此次采用了业界领先的Multi-head Latent Attention(MLA)、Multi-Token Prediction (MTP) 以及高稀疏比混合专家架构,并在此基础上引入多项创新设计,以实现更优的性能与训练效率:

Depth-Scaled Sandwich-Norm 与 TinyInit:通过改进层归一化结构和参数初始化方式,显著提升了模型训练的稳定性与收敛速度。

基于EP-Group的负载均衡策略:优化负载均衡损失函数,有效增强专家路由的分布平衡性,提升专家专业化与协同能力。

华为盘古 Ultra-MoE-718B-V1.1 正式开源并开放下载,模型权重与技术细节全面公开

华为盘古 Ultra-MoE-718B-V1.1 正式开源并开放下载,模型权重与技术细节全面公开

华为盘古 Ultra-MoE-718B-V1.1 正式开源并开放下载,模型权重与技术细节全面公开

本次开源的V1.1版本在多个关键维度上实现了显著提升:

综合能力优化:在MMLU-Pro、GPQA等高难度测评中,快慢思考双模式成绩全面超越V1.0;

幻觉率大幅降低:通过“批判内化”机制,幻觉率从V1.0的10.11%降至3.85%(快思考模式);

工具调用能力增强:升级ToolACE框架,在Tau-Bench等多工具协同任务中表现亮眼;

推荐Int8量化版本:显存占用减少约一半,吞吐提升达20%,精度损失不足1%。

附最新地址:

模型地址:
https://ai.gitcode.com/ascend-tribe/openPangu-Ultra-MoE-718B-V1.1

Int8量化版本:
https://gitcode.com/ascend-tribe/openPangu-Ultra-MoE-718B-V1.1-Int8

免责声明

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章

国产AI用户半年增2.66亿达5.15亿,超九成用户青睐大模型

在2025(第六届)中国互联网基础资源大会上,中国互联网络信息中心正式发布《生成式人工智能应用发展报告(2025)》。数据显示,截至2025年6月,我国生成式人工智能用户规模已突破5 15亿人,较2

2025-10-18.

国产GPU瞬曦1.0发布:全流程自研类脑大模型实现突破

中国科学院自动化研究所近日宣布,在国产GPU算力平台上成功完成全球首款原生类脑脉冲大模型 "瞬悉 "1 0的全流程训练与推理,并同步开源70亿参数版本模型,开放760亿参数版本测试通道。该成果标志着我国

2025-10-18.

霄彻智能获阿里投资:加速具身智能多场景落地应用

近日,具身智能领域新锐企业穹彻智能宣布完成新一轮战略融资,投资方为阿里巴巴集团,同时多位原有股东选择追加投资。本轮融资资金将重点投入技术研发升级、应用场景落地及产业生态建设,为企业在具身智能赛道上的

2025-10-18.

欧洲采购商探访里工实业:机器人制造现场如何重塑未来工业

第138届广交会机器人展区迎来了一位特殊的访客——来自欧洲的采购商Jamie。在《我带外商进工厂》栏目的邀请下,他走进广州里工实业先进制造基地,开启了一场颠覆认知的智能制造探访之旅。当Jamie踏入

2025-10-18.

2025生成式AI报告:国产大模型覆盖超九成用户,半年增2.66亿

在2025(第六届)中国互联网基础资源大会上,中国互联网络信息中心正式对外发布了《生成式人工智能应用发展报告(2025)》。这份报告聚焦于我国生成式人工智能领域的发展现状,呈现了诸多关键数据与趋势。

2025-10-18.

热门教程

更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程

最新下载

更多
王者荣耀国际服正
王者荣耀国际服正 角色扮演 2025-10-18更新
查看
三国谋定天下正
三国谋定天下正 棋牌策略 2025-10-18更新
查看
最强祖师
最强祖师 角色扮演 2025-10-18更新
查看
蛋仔派对九游
蛋仔派对九游 休闲益智 2025-10-18更新
查看
以闪亮之名正
以闪亮之名正 角色扮演 2025-10-18更新
查看
最强祖师小米
最强祖师小米 角色扮演 2025-10-18更新
查看
蛋仔派对b服
蛋仔派对b服 休闲益智 2025-10-18更新
查看
最强祖师九游
最强祖师九游 角色扮演 2025-10-18更新
查看
最强祖师手游
最强祖师手游 角色扮演 2025-10-18更新
查看
最强祖师华为渠道服
最强祖师华为渠道服 角色扮演 2025-10-18更新
查看