腾讯开源强化学习框架WorldCompass,面向世界模型后训练
3月10日,据IT之家消息,腾讯混元3D团队今日宣布开源业界首个面向世界模型的强化学习后训练框架WorldCompass。该框架是此前发布的混元世界模型1.5的最新强化学习扩展模块,旨在显著提升世界模型交互的准确性与体验流畅度。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

WorldCompass是一个专为长时序、交互式世界模型设计的强化学习后训练框架。若将世界模型比作引擎,那么WorldCompass便是“指南针” —— 它通过引入强化学习机制,直接引导模型更精准地遵循用户指令探索世界,并确保长时序下的视觉一致性。
实验数据表明,WorldCompass能够有效提升SOTA开源世界模型的交互准确率和视觉保真度。特别是在复杂的组合动作场景下,交互准确率提升近35%。
团队在最新的开源SOTA模型WorldPlay上进行了验证。结果显示,经过WorldCompass的后训练,模型能力实现了显著提升。

在最困难的复合动作场景下:基座模型对于复杂组合式动作序列执行的准确率仅为20%左右。使用WorldCompass训练后,准确率提升至55%左右,提升幅度超过35%。对于基础动作,准确率也提升了约10%。
同时,在斯坦福大学世界模型Benchmark WorldScore上,WorldCompass取得了更好的评分:

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
华为AI深度布局:如何引领科技变革新格局
新智元报道编辑:艾伦【新智元导读】华为诺亚方舟实验室主任王云鹤官宣离职。我们梳理了王云鹤的经历。王云鹤今日在朋友圈官宣,将辞去华为诺亚方舟实验室主任职位,告别华为。从 2025 年 3 月到今天,王
Claude限流,Altman紧急叫停Sora:AI竞争格局改变
新智元报道编辑:元宇【新智元导读】Sora应用关停,Claude却因太火而被限流:一个烧不起,一个供不上,算力墙面前,AI竞赛的胜负手突然变了。一夜之间,打工人突然发现:Claude开始限流了。An
谷歌内存论文疑被抄袭,华人学者控诉业内学术不公
新智元报道编辑:好困 Aeneas【新智元导读】把闪存股一夜干崩的谷歌顶会论文,出大事了。TurboQuant的核心方法,两年前就被一位华人学者做完、发完顶会、代码全部开源了。谷歌不仅没正面提及,而
OpenClaw漏洞威胁:智能家居被反锁与隐私泄露风险
新智元报道编辑:倾倾【新智元导读】2025年底,极客圈发生了一场数字哗变,Anthropic的遮羞布被Peter Steinberger撕了个精光。从OpenClaw开源到Claude被扒出80页「
华为大模型负责人离职,重大人事变动引发行业关注
智东西作者|江宇编辑|冰倩智东西3月28日报道,今日,华为诺亚方舟实验室主任、华为盘古大模型负责人王云鹤在朋友圈发文,确认离职。王云鹤于2017年以华为北京部门首位实习生身份加入,至今已接近9年。在
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

