LeCun用1500万参数小模型证明世界模型理解物理世界

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI教程

LeCun用1500万参数小模型证明世界模型理解物理世界

热心网友时间：2026-06-01

转载

大模型不是唯一答案：LeCun用1500万参数证明，小而美的世界模型同样能理解物理世界

世界模型面临的最大难题：表达崩塌

近年来，LeCun 始终坚持一个主张：别再固守生成式模型，世界模型才是通往 AGI 的正确路径。

他所提出的 JEPA（联合嵌入预测架构）设计理念相当清晰——不在像素层面重构世界，而是将画面压缩至低维潜在空间，并在此空间内预测未来状态。这样既能节省算力，又能学到真正有价值的特征。

然而 JEPA 存在一个致命缺陷：表达崩塌。

模型在训练过程中很容易发现一条“捷径”——将所有输入映射到同一个向量，使得预测损失瞬间降至零。表面上看模型收敛了，实际上已经失去作用。就像一个学生发现所有题都写同一个答案也能得分，便不再思考。

此前学界尝试过哪些应对方法呢？

要么治标不治本，要么引入新的不稳定性，要么直接限制了模型的上限。

PLDM 是目前唯一尝试端到端从像素训练的 JEPA 方法，但训练过程极度不稳定，需要同时调节 7 个损失函数，如同走钢丝般困难。

因此当 LeWorldModel 这篇论文问世时，大家的第一反应是：他们是如何做到的？

精简至仅两个损失函数

答案出乎意料地简洁。

LeWM 的整个训练目标如下所示：

L_LeWM = L_pred + λ × SIGReg(Z)

仅包含两个项：一个预测损失，一个正则化。

预测损失

采用普通的均方误差（MSE），让模型学会“执行动作 a 之后世界会变成什么样子”，无需赘述。

SIGReg：强制嵌入服从高斯分布

这才是核心创新。

SIGReg 的作用用一句话概括：强制潜在空间的嵌入服从标准高斯分布。

其原理基于 Cramér-Wold 定理——你无法直接在高维空间中检验“一组向量是否服从高斯分布”，但如果将它们投影到足够多的一维方向上，每个投影都是高斯分布，那么整体就是高斯分布。

SIGReg 的实现步骤如下：

随机生成 M=1024 个方向
将嵌入投影到这些方向上
在每个投影上计算 Epps-Pulley 正态性检验统计量
优化这些统计量，迫使分布逼近高斯分布

为何能有效防止表达崩塌？

试想——如果编码器偷懒，将所有画面映射到同一点，嵌入就会形成退化分布，根本不符合高斯分布。如果编码器仅用少数几个维度编码信息，分布就会严重偏离各向同性。

SIGReg 同时封堵了这两条退路，编码器只能老老实实地学习信息丰富、分布均匀的表示。

可调节的超参数从 PLDM 的 6 个减少到 1 个（即 λ），甚至可以用二分搜索自动寻优。

模型架构

仅包含两个组件，总参数量 1500 万：

编码器：ViT-tiny，patch size=14，12 层，3 个注意力头，隐藏维度 192（约 5M 参数）
预测器：6 层 Transformer，通过 AdaLN 注入动作信息（约 10M 参数）

一张 L40S 显卡，运行数小时即可完成训练。

规划仅需 1 秒，实现 48 倍加速

不过真正让人觉得“这东西能打”的，不是训练的简便，而是规划速度。

LeWM 在进行规划时，先将起始画面和目标画面分别编码为一个 192 维的向量，然后使用交叉熵方法（CEM）在潜在空间中搜索最优动作序列。

关键数据：每帧仅编码为 1 个 192 维 token，而 DINO-WM 需要编码数万个 token。信息压缩比相差约 200 倍。

直接看对比结果：

模型	参数量	规划时间	训练资源	防崩塌方式
LeWM	约 15M	约 1 秒	单 GPU	SIGReg
DINO-WM	亿级+	约 47 秒	多 GPU 集群	冻结 DINOv2
PLDM	约 15M	约 1 秒	单 GPU	VICReg（不稳定）

在 Push-T（2D 推箱子）任务上，LeWM 仅使用像素输入，竟然胜过了 DINO-WM——即便后者额外使用了本体感受输入（如关节角度等内部状态信息）。

换句话说，LeWM 单从画面中便学到了足够的信息来做决策，无需额外“作弊”。

当然也存在短板。在视觉复杂的 3D OGBench-Cube 任务上，DINO-WM 仍具优势——DINOv2 毕竟在 1.24 亿张图片上预训练过，视觉先验更为丰富。在维度很低的 Two-Room 导航任务上，LeWM 反而表现不佳，作者推测是高斯先验在低维任务上“过度约束”了表示空间。

令人惊讶：模型具备“意外感知”能力

这篇论文中有一组实验与规划性能无关，而是关于物理理解，非常值得关注。

从潜在空间解构物理量

团队训练了一些轻量级的探针网络，尝试从 LeWM 的嵌入中预测智能体位置、方块位置及方块角度。

结果如下：

物理量	LeWM	PLDM	DINO-WM
智能体位置	r=0.998	r=0.993	r=0.999
方块位置	r=0.999	r=0.994	r=0.999
方块角度	r=0.990	r=0.972	r=0.995

仅 1500 万参数，未经过任何预训练，直接从像素学习，对物理量的预测精度与使用上亿参数 DINOv2 的方案几乎持平。

模型能够区分“合理”与“不可能”

更有趣的实验是违背期望检测。

给模型看三段视频，并观察“惊讶值”的变化：

正常轨迹 → 惊讶值很低（符合预期）
物体变色 → 惊讶值略高（画面改变，但物理上合理）
物体瞬移 → 惊讶值直接飙升（违反物理定律）

可见它并非在记忆视觉模式，而是能区分“看起来不同但物理上合理”与“看起来正常但物理上不可能”的场景。

JEPA 技术发展路径一览

顺便梳理一下 LeCun 这条技术线：

2023 · I-JEPA → 图像自监督学习 2024 · V-JEPA → 扩展至视频领域 2025 · V-JEPA 2 → 百万小时视频预训练 2025 · LeJEPA → SIGReg 理论框架 2026 · LeWorldModel → 首个稳定端到端 JEPA 世界模型

此前的 JEPA 方法要么冻结编码器（放弃端到端），要么依靠大量技巧勉强维持稳定（如 PLDM）。LeWM 是第一个真正实现“从像素开始、端到端训练、稳定收敛、无需任何技巧”的方案。

为何这项研究意义重大

世界模型不再是“大厂专属”了。

之前从事世界模型研究，要么依赖 DINOv2 这样的基础模型（需要算力进行预训练），要么在训练稳定性上苦苦挣扎。LeWM 将门槛降低到了“一张 GPU、数小时、调节一个参数”。

“小而美”的思路得到了验证。

行业趋势往往是一切往大做——更多参数、更多数据、更多算力。LeWM 提供了一个反例：1500 万参数，无需预训练，从像素直接学习，物理理解能力与亿级模型相差无几。模型大小并非瓶颈，至少在特定场景下不是。

SIGReg 可能比 LeWM 本身更具价值。

SIGReg 是一个通用的正则化方法，理论上可应用于任何需要学习嵌入的任务。如果它确实如论文所述稳定有效，其影响力将远不止于世界模型。

论文与代码均已开源：

论文：arxiv.org/abs/2603.19…
代码：github.com/lucas-maes/…
模型权重：hf.co/collections…
SIGReg 理论基础（LeJEPA）：arxiv.org/abs/2511.08…

来源:https://juejin.cn/post/7624378354167808051

上一篇： OpenClaw架构原理与设计浅析

下一篇： Gifts Genie AI生活助手怎么样

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

热门专题

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

日榜
周榜
月榜

双点博物馆沙盒模式选项作用详解

Salesforce财报指引逊预期，AI颠覆软件担忧加剧

我的世界传送到村庄的指令完整详解教程

天涯重启者数字徽章上线，持有者可参与规则制定

我的世界钻石剑锋利10000附魔指令获取方法

BLAST Slam S7小组赛 LGD头名晋级 XG与GLYPH出局

蔚来携三品牌11款车型亮相大湾区车展，技术升级开启智能出行新体验

钓鱼佬险钓大蟒蛇原来是废轮胎虚惊一场

我的世界末地传送门正确摆放与激活方法

上汽大众粤港澳车展携新能源与明星车型展示油电同进

异环1.1版本前瞻直播兑换码大全与领取指南

异环1.1前瞻直播兑换码领取攻略与最新大全

方舟生存进化2上线时间确定公测日期正式公布

异环1.1前瞻直播兑换码领取与使用指南

异环1.1版本前瞻直播内容汇总与更新详解

烟雨江湖最新兑换码大全免费福利领取攻略

熊猫村官网下载地址在哪最新官方安装包获取方法

极乐谷镇派前置任务全流程详解与速通技巧

方舟进化2官网下载地址安卓iOS正版安装包获取

彩色水杯怎么玩？超全玩法教程与创意指南

漫蛙漫画防走失网页链接

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

相关攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

2015-03-10 12:39

《英雄坛说》详细全攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

D&D 5.5e Ravenloft更新揭示挑战等级系统为何依然失效发布于 2026-06-01

崩坏星穹铁道千冶刃全方位培养攻略发布于 2026-06-01

007初露锋芒配置一览发布于 2026-06-01

篮球少女飞跃巅峰属性培养攻略球员定位与主属性详解发布于 2026-06-01

《城门血战》肉鸽塔防新游抢先试玩深度评测发布于 2026-06-01

晃晃人生手游公测时间正式确定发布于 2026-06-01

小花仙拉贝尔之约开荒攻略新手入门指南发布于 2026-06-01

明日方舟终末地1.2版本更新内容汇总发布于 2026-06-01

三角洲行动S5索取与给予通关步骤详解发布于 2026-06-01

Bungie前总裁盛赞《巫师3》新DLC 称十年前玩家未到年龄发布于 2026-06-01

猫和老鼠奶酪日火热进行中发布于 2026-06-01

深海迷航坐标查看方法发布于 2026-06-01

图形塔防官方最新下载地址与详细安装步骤发布于 2026-06-01

洛克王国世界针叶巡林图鉴完整版详细介绍发布于 2026-06-01

洛克王国世界完美果冻获取方法发布于 2026-06-01

七大罪起源伊莱恩角色玩法攻略发布于 2026-06-01

Windows 11 任务管理器查看 NPU 频率与 AI 硬件占用率教程发布于 2026-05-25

Linux系统修改默认网关命令与永久生效配置教程发布于 2026-05-25

麒麟系统开机自启动脚本设置方法详解发布于 2026-05-25

麒麟系统安装IntelliJ IDEA插件扩展开发功能发布于 2026-05-25

Windows 11 RP预览版25145发布及KB5089573更新日志详解发布于 2026-05-25

Windows 11 26H1预览版28000.2173更新日志KB5089570详解发布于 2026-05-25

Win11预览版26300.8493更新本地文件搜索排序优先发布于 2026-05-25

Win11预览版8521修复音频与通知问题发布于 2026-05-25

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

LeCun用1500万参数小模型证明世界模型理解物理世界

世界模型面临的最大难题：表达崩塌

精简至仅两个损失函数

预测损失

SIGReg：强制嵌入服从高斯分布

模型架构

规划仅需 1 秒，实现 48 倍加速

令人惊讶：模型具备“意外感知”能力

从潜在空间解构物理量

模型能够区分“合理”与“不可能”

JEPA 技术发展路径一览

为何这项研究意义重大

用AI轻松制作大班拍手歌互动PPT课件

大班眼睛PPT教学秘籍用AI工具轻松制作生动有趣PPT

字体设计AI生成如何提升品牌识别度与创意效率

AI如何快速制作PPT 轻松提升办公效率

从风控转行养虾十年经验开启养虾日记第一篇

LeCun用1500万参数小模型证明世界模型理解物理世界

世界模型面临的最大难题：表达崩塌

精简至仅两个损失函数

预测损失

SIGReg：强制嵌入服从高斯分布

模型架构

规划仅需 1 秒，实现 48 倍加速

令人惊讶：模型具备“意外感知”能力

从潜在空间解构物理量

模型能够区分“合理”与“不可能”

JEPA 技术发展路径一览

为何这项研究意义重大

用AI轻松制作大班拍手歌互动PPT课件

大班眼睛PPT教学秘籍 用AI工具轻松制作生动有趣PPT

字体设计AI生成如何提升品牌识别度与创意效率

AI如何快速制作PPT 轻松提升办公效率

从风控转行养虾十年经验开启养虾日记第一篇

大班眼睛PPT教学秘籍用AI工具轻松制作生动有趣PPT