当前位置: 首页
AI
LeCun与清华联手解读:世界模型是否需要做减法?

LeCun与清华联手解读:世界模型是否需要做减法?

热心网友 时间:2026-03-26
转载



免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

机器之心编辑部

近期,围绕「世界模型」这一方向,有两项工作受到较多关注。

一篇是来自 Yann LeCun 团队的LeWorldModel,尝试以更简洁的 JEPA 实现从像素端到端训练的世界模型,在降低训练复杂度的同时,验证了潜在空间中对物理结构的刻画能力。



另一篇是清华大学团队的Fast-WAM,则从应用角度出发,重新审视当前主流 World Action Model(WAM)的设计范式,探讨「是否真的需要在推理阶段显式生成未来」这一关键问题,并给出了一种更高效的替代路径。



两项工作分别从「如何更简洁地学习世界」与「是否需要在推理中反复想象世界」两个维度,对当前世界模型的主流思路进行了补充与修正,也为理解这一方向的技术演进提供了不同切入点。

谢赛宁也建议将这两篇论文结合起来阅读。



让我们一起看看这两项工作的具体内容。

世界模型在「做减法」:

从复杂系统到最小闭环



论文标题:LeWorldModel: Stable End-to-End JEPA from Pixels论文地址:https://le-wm.github.io/项目地址:https://arxiv.org/pdf/2603.19312v1

联合嵌入预测架构(JEPA)为在紧凑的潜在空间中学习世界模型提供了一种颇具吸引力的框架。然而,现有方法仍然较为脆弱,往往依赖复杂的多项损失函数、指数滑动平均(EMA)、预训练编码器或额外的辅助监督,才能避免表征坍塌。

在本工作中,研究团队提出了 LeWorldModel(LeWM),这是首个能够从原始像素端到端稳定训练的 JEPA 模型,仅使用两个损失项:下一步嵌入预测损失,以及用于约束潜在嵌入服从高斯分布的正则项。相比目前唯一的端到端替代方案,该方法将可调的损失超参数数量从六个减少到一个。



LeWM 仅约 1500 万参数,可在单张 GPU 上数小时内完成训练;在规划速度上,相比基于基础模型的世界模型最高可提升约 48 倍,同时在多样的 2D 与 3D 控制任务中仍保持具有竞争力的表现。除了控制任务之外,我们还通过对物理量的探测实验表明,LeWM 的潜在空间能够编码有意义的物理结构。进一步的「惊讶度」评估显示,该模型能够可靠地检测出物理上不合理的事件。



方法

这篇论文的方法可以概括为一个在潜在空间中完成建模与决策的端到端世界模型框架。

具体而言,LeWM 由两个模块组成:视觉编码器和动力学预测器。编码器将原始像素观测映射为低维潜在表示;预测器则基于当前表示和动作,预测下一时刻的潜在状态,从而刻画环境的演化过程。整个模型从原始像素出发联合训练,不依赖预训练特征或额外组件。

训练采用离线、无奖励的设置,仅使用观测序列与动作。目标函数包括两部分:一是相邻时间步之间的嵌入预测损失,用于学习可预测的表示;二是分布正则项,通过约束潜在表示在随机方向上的投影接近高斯分布,避免表征坍塌。这一设计在不引入额外稳定技巧的情况下,实现了端到端训练。

在获得潜在动态模型后,决策阶段直接在潜在空间中进行。给定当前观测和目标观测,模型将其编码为潜在表示,并通过预测器对候选动作序列进行前向展开(rollout),选择最终状态最接近目标的序列(通过交叉熵方法优化)。实际执行中采用模型预测控制(MPC),每次仅执行部分动作,再基于新观测重新规划,以减少误差累积。



整体来看,LeWM 将表示学习、动态建模与规划统一在同一潜在空间中,形成从像素输入到动作输出的闭环过程。

还需要「想象未来」吗:

WAM 范式的再审视



论文标题:Fast-WAM: Do World Action Models Need Test-time Future Imagination?论文地址:https://yuantianyuan01.github.io/FastWAM/项目地址:https://arxiv.org/abs/2603.16666

世界动作模型(World Action Models, WAMs)因能够显式建模视觉观测在动作作用下的演化过程,被认为是具身控制中替代 VLA 模型的一种有前景的方案。

现有大多数 WAM 采用「先想象、再执行」的范式,但由于需要进行迭代式的视频去噪,这在测试阶段会带来较高的延迟。同时,一个关键问题仍未被回答:显式的未来想象,是否真的是实现强动作性能所必需的?

来源:https://www.163.com/dy/article/KOQ7A2MR0511AQHO.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
华为AI深度布局:如何引领科技变革新格局

华为AI深度布局:如何引领科技变革新格局

新智元报道编辑:艾伦【新智元导读】华为诺亚方舟实验室主任王云鹤官宣离职。我们梳理了王云鹤的经历。王云鹤今日在朋友圈官宣,将辞去华为诺亚方舟实验室主任职位,告别华为。从 2025 年 3 月到今天,王

时间:2026-03-28 18:52
Claude限流,Altman紧急叫停Sora:AI竞争格局改变

Claude限流,Altman紧急叫停Sora:AI竞争格局改变

新智元报道编辑:元宇【新智元导读】Sora应用关停,Claude却因太火而被限流:一个烧不起,一个供不上,算力墙面前,AI竞赛的胜负手突然变了。一夜之间,打工人突然发现:Claude开始限流了。An

时间:2026-03-28 18:46
谷歌内存论文疑被抄袭,华人学者控诉业内学术不公

谷歌内存论文疑被抄袭,华人学者控诉业内学术不公

新智元报道编辑:好困 Aeneas【新智元导读】把闪存股一夜干崩的谷歌顶会论文,出大事了。TurboQuant的核心方法,两年前就被一位华人学者做完、发完顶会、代码全部开源了。谷歌不仅没正面提及,而

时间:2026-03-28 16:58
OpenClaw漏洞威胁:智能家居被反锁与隐私泄露风险

OpenClaw漏洞威胁:智能家居被反锁与隐私泄露风险

新智元报道编辑:倾倾【新智元导读】2025年底,极客圈发生了一场数字哗变,Anthropic的遮羞布被Peter Steinberger撕了个精光。从OpenClaw开源到Claude被扒出80页「

时间:2026-03-28 16:52
华为大模型负责人离职,重大人事变动引发行业关注

华为大模型负责人离职,重大人事变动引发行业关注

智东西作者|江宇编辑|冰倩智东西3月28日报道,今日,华为诺亚方舟实验室主任、华为盘古大模型负责人王云鹤在朋友圈发文,确认离职。王云鹤于2017年以华为北京部门首位实习生身份加入,至今已接近9年。在

时间:2026-03-28 16:46
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程