数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI

摩尔线程大模型对齐研究获国际认可：URPO框架入选AAAI 2026

摩尔线程大模型对齐研究获国际认可：URPO框架入选AAAI 2026

热心网友时间：2025-11-14

转载

11月13日消息，摩尔线程推出的新一代大语言模型对齐框架——URPO统一奖励与策略优化框架，相关研究论文近日被人工智能领域的国际顶级学术会议AAAI 2026收录，为简化大模型训练流程、突破模型性能上限提供了全新的技术路径。

摩尔线程大模型对齐研究获国际顶级学术会议认可：URPO 框架入选 AAAI 2026

▲ 图源：摩尔线程最新公众号 | URPO统一奖励与策略优化框架

据介绍，在题为《URPO:A Unified Reward & Policy Optimization Framework for Large Language Models》的论文中，摩尔线程AI研究团队提出了URPO统一奖励与策略优化框架，将“指令遵循”（选手）和“奖励评判”（裁判）两大角色融合于单一模型中，并在统一训练阶段实现同步优化。URPO主要从以下三个方面攻克技术挑战：

数据格式统一：将异构的偏好数据、可验证推理数据和开放式指令数据，统一重构为适用于GRPO训练的信号格式。
自我奖励循环：针对开放式指令，模型生成多个候选回答后，自主调用其“裁判”角色进行评分，并将结果作为GRPO训练中的奖励信号，形成一个高效的自我改进循环。
协同进化机制：通过在同一批次中混合处理三类数据，模型的生成能力与评判能力得以协同进化。生成能力提升带动评判更精准，而精准评判进一步引导生成质量跃升，从而突破静态奖励模型的性能瓶颈。

实验结果显示，基于Qwen2.5-7B模型，URPO框架超越了依赖独立奖励模型的传统基线：在AlpacaEval指令跟随榜单上，得分从42.24提升至44.84；在综合推理能力测试中，平均分从32.66提升至35.66。作为训练过程中自然产生的“副产品”，该模型内部涌现出的评判能力在RewardBench奖励模型评测中取得了85.15的高分，表现优于其替代的专用奖励模型（83.55分）。

从摩尔线程最新获悉，目前URPO已在摩尔线程自研计算卡上实现稳定高效运行。同时，摩尔线程已完成VERL等主流强化学习框架的深度适配。

来源:https://www.ithome.com/0/897/315.htm

上一篇： Tachyum公布2nm Prodigy处理器设计，推理性能超英伟达Rubin 20倍

下一篇：小米米家iOS版升级11.0.200：新增动态看板，界面焕新

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

安卓Gemini AI硬件需求公布旗舰芯片与12GB内存成门槛

安卓Gemini AI硬件需求公布旗舰芯片与12GB内存成门槛

谷歌安卓AI助手GeminiIntelligence的硬件要求细节曝光。设备需搭载旗舰芯片、至少12GB内存，并支持GeminiNanov3端侧AI模型。同时，设备还需承诺至少5次系统升级和6年安全更新。目前兼容机型主要集中在2026年发布的新款手机，如Pixel10系列和三星Galaxy

时间：2026-05-17 14:23

安卓苹果跨平台互通升级多款旗舰手机支持隔空投送功能

安卓苹果跨平台互通升级多款旗舰手机支持隔空投送功能

谷歌正积极推进安卓与苹果生态系统间的文件互通。继首批机型后，第二波更新将让三星GalaxyS25系列、一加15、荣耀MagicV6等多款安卓旗舰手机支持与iPhone的隔空投送功能。谷歌旨在解决多设备家庭中文件分享的难题，并计划在2026年将该功能覆盖至更多主流品牌。用户通过安卓的“快速分享”生

时间：2026-05-17 14:22

小米400升法式冰箱新品上市支持60分钟快速自动制冰

小米400升法式冰箱新品上市支持60分钟快速自动制冰

小米米家近日推出了法式400L自动制冰冰箱新品，主打快速制冰与健康保鲜功能。该冰箱配备60分钟自动制冰系统，拥有99 9%抗菌率、全域离子净化和独立变温区。采用超薄平嵌设计，机身宽度65 4厘米，拥有400升总容积。产品首发价2999元，叠加国家家电补贴后到手价可至2549 15元，并提供了压缩机1

时间：2026-05-17 14:22

小米17 Max核心体验今晚直播揭晓，卢伟冰户外爆料六款新品

小米17 Max核心体验今晚直播揭晓，卢伟冰户外爆料六款新品

小米总裁卢伟冰于5月16日17点进行户外露营主题直播，集中爆料多款新品。直播重头戏是旗舰手机小米17Max，将完整展示其四大核心体验。同时，小米首款耳夹式耳机真机首次亮相，小米龙虾miclaw将演示手机跨设备操控电脑与智能家居。直播还包含618好物推荐、福利抽奖，并设置露营互动环节，卢伟冰也将探讨

时间：2026-05-17 14:22

小米SU7 GT车厘子红实车到店月底发布性能参数抢先看

小米SU7 GT车厘子红实车到店月底发布性能参数抢先看

小米汽车旗下高性能SUV车型YU7GT已开始向全国门店铺货，实车主打车厘子红配色。该车定位跑车级SUV，拥有1003匹马力、2 95秒破百的强劲性能，同时续航达705公里。车辆由小米欧洲研发中心参与调校，外观采用专属GT设计语言，轴距3000mm，预计将于5月底正式发布。

时间：2026-05-17 14:22

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

日榜
周榜
月榜

日本宝可梦卡牌遭恶意破坏抵制黄牛行为引关注

三国志将星闪耀零氪能玩吗微氪玩家体验与氪金程度解析

少女前线2追放维尔德强度评测技能解析与培养攻略

客官里面请手游氪金指南与零氪金新手攻略

东离剑游纪手游抽卡机制与角色获取攻略详解

客官里面请手游深山探险全流程攻略与资源获取详解

镭明闪击手游哨所掩体高效布局与实战部署攻略

宝可梦冠军手游Mega进化种族值与能力数值全解析

地下城之光手游装备搭配与职业流派加点全攻略

归环噩兆之群高效打法攻略速通技巧与实战要点详解

inZOI职场丽人捏脸数据分享打造专属美女角色攻略

洛克王国实验工坊通关攻略与玩法详解

洛克王国暗黑岭位置与前往路线详细攻略

洛克王国角色肤色修改方法与步骤详解

洛克王国队员休息室进入方法详解

部落守卫战12关猎场攻略三星通关技巧详解

洛克王国虚空磁谷怎么进入详细步骤攻略

洛克号储物仓位置与前往方法详细攻略

部落守卫战21关5个猎场关卡通关攻略详解

洛克王国同心树屋位置详解与寻找攻略

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

极狐S3预告发布：三电可选、宽体运动设计，2026北京车展亮相

相关攻略

相关攻略

《炎龙骑士团2》详细全攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

《东吴霸王传2013》详细全关攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

《臭作》之100%全完整攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

《兰斯8》剧情攻略详细篇

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

《英雄坛说》详细全攻略

2015-03-10 12:39

《英雄坛说》详细全攻略

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

偷窃少女的教育方法全攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

无法抵挡小恶魔的诱惑攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

植物大战僵尸2未来世界通关攻略与技巧详解

植物大战僵尸2未来世界通关攻略与技巧详解发布于 2026-05-17

植物大战僵尸2埃及坚不可摧第一天通关攻略

植物大战僵尸2埃及坚不可摧第一天通关攻略发布于 2026-05-17

源能行动破棘新生赛季玩法攻略与技巧详解

源能行动破棘新生赛季玩法攻略与技巧详解发布于 2026-05-17

洛克王国世界动力猿配队攻略与技能搭配推荐

洛克王国世界动力猿配队攻略与技能搭配推荐发布于 2026-05-17

深海迷航2维修工具获取指南异星水域快速解锁方法

深海迷航2维修工具获取指南异星水域快速解锁方法发布于 2026-05-17

深海迷航2便携式氧气发生器获取方法及解锁位置详解

深海迷航2便携式氧气发生器获取方法及解锁位置详解发布于 2026-05-17

梦幻西游回首复前行活动玩法与奖励全解析

梦幻西游回首复前行活动玩法与奖励全解析发布于 2026-05-17

神都奇缘游戏介绍：玩法特色与新手入门指南

神都奇缘游戏介绍：玩法特色与新手入门指南发布于 2026-05-17

天穗之咲稻姬手游7月27日停运热度收益不及预期

天穗之咲稻姬手游7月27日停运热度收益不及预期发布于 2026-05-17

穿越火线CF账号交易平台哪个好？安全买号APP推荐

穿越火线CF账号交易平台哪个好？安全买号APP推荐发布于 2026-05-17

无主之地2联机超时问题解决方法大全

无主之地2联机超时问题解决方法大全发布于 2026-05-17

男生必玩十大热门游戏单机与网游人气排行榜

男生必玩十大热门游戏单机与网游人气排行榜发布于 2026-05-17

国产仙侠横版动作游戏绝尘Steam上线体验快节奏拼刀战斗

国产仙侠横版动作游戏绝尘Steam上线体验快节奏拼刀战斗发布于 2026-05-17

千机阵最强统帅选择攻略与培养指南

千机阵最强统帅选择攻略与培养指南发布于 2026-05-17

最终幻想7重生试玩版上线Switch2与Xbox平台可继承进度至第二章

最终幻想7重生试玩版上线Switch2与Xbox平台可继承进度至第二章发布于 2026-05-17

明末渊虚之羽销量破百万收购后市场表现强劲

明末渊虚之羽销量破百万收购后市场表现强劲发布于 2026-05-17

统信UOS多桌面设置教程工作区切换与管理技巧

统信UOS多桌面设置教程工作区切换与管理技巧发布于 2026-05-17

统信UOS系统内置邮箱客户端配置与使用教程

统信UOS系统内置邮箱客户端配置与使用教程发布于 2026-05-17

Mac开启Apache服务器教程苹果电脑内置Web服务配置指南

Mac开启Apache服务器教程苹果电脑内置Web服务配置指南发布于 2026-05-17

银河麒麟系统查看无线网卡型号与驱动兼容性排查指南

银河麒麟系统查看无线网卡型号与驱动兼容性排查指南发布于 2026-05-17

银河麒麟系统开启SSH服务与远程连接配置教程

银河麒麟系统开启SSH服务与远程连接配置教程发布于 2026-05-17

麒麟OS思维导图软件安装使用教程

麒麟OS思维导图软件安装使用教程发布于 2026-05-17

银河麒麟系统安装国产化Rider IDE教程

银河麒麟系统安装国产化Rider IDE教程发布于 2026-05-17

Win11如何打开DirectX诊断工具DxDiag查看显卡信息

Win11如何打开DirectX诊断工具DxDiag查看显卡信息发布于 2026-05-17

国产内存新架构突破30TB带宽实现自主供应链

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集