数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

热点详情

全球首个隐空间世界模型打通长时序双向物理因果链

AI热点日报时间：2026-07-01

热点解读

你从桌上端起一杯水，大脑在不到一秒钟的时间里，同时完成了三项任务：估算杯子的重量，预判水面晃动的幅度，并顺势绕开了旁边的玻璃杯。在这个动作中，大脑不会关注杯子上的花纹，或是杯壁折射出的复杂光影，而是能瞬间抓住本质：手该用多大的力，水才不会洒出来。正是这种忽略无关环境细节、直接洞察事物本质的“物理直觉

你从桌上端起一杯水，大脑在不到一秒钟的时间里，同时完成了三项任务：

估算杯子的重量，预判水面晃动的幅度，并顺势绕开了旁边的玻璃杯。

在这个动作中，大脑不会关注杯子上的花纹，或是杯壁折射出的复杂光影，而是能瞬间抓住本质：手该用多大的力，水才不会洒出来。

正是这种忽略无关环境细节、直接洞察事物本质的“物理直觉”，让我们在处理精细操作时如行云流水。

然而，对机器人而言，要掌握这种对物理世界的因果直觉，堪称具身智能领域的高难度挑战。

如今，一家成立仅一年的具身智能新锐——无界动力，带着全新的解决方案正式交卷。

其发布了全球首个“长时序双向物理因果链”隐空间世界模型MWA™，大幅拓展了具身智能在多场景下的泛化能力，直击机器人长期以来面临的长周期、高精度执行难题。

在由斯坦福大学等顶尖机构联合发起的RoboCasa GR1 TableTop榜单中，无界动力MWA™以75.2%的平均任务成功率荣登全球第一，超越了英伟达GR00T-N1.6等一众行业主流模型。

作为赛道里的新晋选手，无界动力是行业内少数坚持“隐空间世界模型 + 强化学习”技术路线的公司。

这条略显独特的硬核路线，不仅在技术实测上验证了闭环，在资本市场也展现出极强的吸引力：

公司此前已宣布完成了超2亿美元的天使轮融资，而紧随其后的Pre-A轮近2亿美元融资也已接近尾声，背后站着红杉中国、线性资本、京东关联基金等一众头部投资机构。

这只既能打、又吸金的行业黑马，究竟是如何帮助机器人理解物理因果、打破多场景泛化瓶颈的？

我们来详细解读。

通往终局的路径：隐空间世界模型与强化学习的融合

掌握了语言和逻辑，机器人就能在现实世界中听懂指令、顺利执行任务了吗？

答案是：并非如此。

过去几年，VLA（视觉-语言-动作）具身智能路线，虽然让机器人能够理解人类的文本指令。

但一旦进入真实环境，只要光照稍微变化、桌上的杯子移动几厘米，机器人就会瞬间“卡壳”甚至动作失控。

根本原因在于，传统VLA模型让机器人执行任务，更像是一场“刻板的开卷考试”。

它们极度依赖人类演示的模仿学习，仅仅是死记硬背人类演示的动作轨迹，并不理解物理世界的因果关系，泛化能力自然断崖式下跌。

人类能够处理各种非标准任务，依赖的是大脑天生具备对物理世界的“直觉推理”。如果机器人缺乏对现实的基本常识认知，其能力上限就会被锁定在旧有范式之中。

无界动力选择了另一条路径：隐空间世界模型结合强化学习。

其中，隐空间世界模型负责建立“世界观”，让机器人认知物理规律和因果关系，构筑起对物理世界的理解和未来状态预测的核心能力。

强化学习则塑造“价值观”，通过高频试错和奖励反馈，将物理世界的理解转化为精准的执行策略。

先理解因果，再学会行动。只有让机器人看清物理世界的因果边界，它才能真正走出实验室Demo，在多场景中投入实际应用。

机器人如何理解物理？不要紧盯像素，去捕捉环境变化的“潜动作”

要构建这个世界模型，首先要面对的问题是：模型到底应该关注什么？

传统方法在预测未来时，通常是在像素空间中进行。

机器人观看一段视频，不仅要学习手如何抓取杯子，还要顺带计算背景中光线的细微变化、无意义的像素噪声甚至地板的纹理。

大量算力被浪费在与任务无关的冗余信息上。

无界动力的MWA™全程在统一共享的隐空间（Latent Space）内进行推演，跳过了像素层的冗余计算。

更关键的是，它提炼出了“潜动作（Latent Action）”，作为场景交互变化的底层表征。

什么是“潜动作”？

传统具身智能依赖显式的动作空间，需要人类事先标注机械臂末端的位置、关节的转动轨迹，标注成本极高。

而“潜动作”绕开了这一步，直接在特征高维空间内，将视频中“物体因交互而产生的位置、状态变化”抽象为一组高维表征。

不依赖任何人工动作标注，模型可以自行从画面变化中归纳出动作的本质。

有了“潜动作”，MWA™就能摆脱对传统“动作标签（Action Label）”的依赖。

这样一来，面对互联网上数以亿计、毫无人类动作标注的原始海量视频，MWA™可以直接用来进行训练。

它能自动穿透那些无关紧要的背景噪点，利用潜动作由果推因，理解视频中物体受力与变化的本质物理规律。

这相当于直接盘活了互联网上无标签数据这座宝藏，让多源数据的利用效率大幅提升。

告别“单步死磕”，“长时序双向物理因果链”革新世界模型核心范式

针对“动作卡顿与连贯性不足”的问题，MWA™在底层设计上采用了“隐空间双向动力学架构”。

这套架构在隐空间内构建了一套“正逆双向逻辑协同”机制。

简单来说，模型内部同时运行着两条推理路径：

一条是逆动力学，负责“由果推因”的特征提取，看到结果反推是什么动作导致的；

另一条是正动力学，负责“由因及果”，根据给定动作推演环境将如何变化。

这两条路径并非独立运行，架构中引入了“正逆互审机制”。

逆向模型推演出的动作，必须交给正向模型在脑海中进行沙盘推演和虚拟验证；正向模型推演出的环境变化，也必须实时返回，与逆向模型预训练中沉淀的物理因果认知进行对齐。

正反互审、反复校验，从而赋予模型极高的因果推理精度。

然而，传统的双向动力学架构在走向复杂现实时，仍然存在一个致命盲区：即使进入了隐空间，它们也普遍受限于“单步瞬时潜动作推理”的时序局限。

在这种单步推理机制下，模型缺乏对长时序因果的宏观归纳能力，导致机器人只能“走一步、看一步、猜一步”。

这也意味着，在面临长周期的连续作业时，任何微小的单步预测偏差，都会在连续时序中像滚雪球一样迅速放大，最终引发动作不连贯甚至系统全面崩溃。

正是洞察了这一局限，无界动力在双向动力学的基础上进行了核心范式创新，推出了全球首个“长时序双向物理因果链”隐空间世界模型。

MWA™首创了时序Chunk级逆向动力学建模机制，重构了逆向动力学模型的输出范式，打破了传统单步推理的限制。

这也直接将过去那种“走一步看一步”的瞬时操作，带入了长时序动作的连续推演。

在面对复杂的连续任务时，MWA™在生成动作序列的全过程中，完成了动作执行与环境变化的长周期博弈推演，直接从10秒以上的视觉序列中，批量、一次性推理并输出连续多步的Latent Action Chunk动作组。

这从底层大幅减弱了误差放大的“雪球效应”，让机器人具备了真正完成复杂长时序任务的能力。

不妨用一个具体场景，来理解这套机制是如何工作的。

这套机制中有三个角色协同工作。

策略网络（Policy Head）是直觉，负责第一时间给出动作方案；
正向动力学模型（FDM）是推演者，负责在脑海中模拟“这样做的结果”；
逆向动力学模型（IDM）是复盘者，负责从结果反推“究竟是哪个动作导致的”。

假设机器人正在擦拭桌子。桌上有水渍，水渍旁边放着一个易碎的玻璃杯。

Policy Head基于直觉快速输出一个原始动作：用抹布从右向左擦拭。

此时，FDM接手，基于当前图像的隐特征和这个动作，在“脑内沙盘”中提前推演出下一帧的隐空间变化，结果发现杯子将被无意打翻。

这一不可接受的后果，随即与当前特征一同输入给IDM，由IDM反向精确锁定导致杯子被打翻的那部分动作分量。

Policy Head随即做出价值判断，在梯度回传更新时，强制策略远离该危险动作区域，通过物理因果链提前规避了现实中的碰撞和打滑。

反过来，如果Policy Head输出的动作经过FDM推演后，得出的下一帧特征是水渍被成功擦除，IDM会进一步通过前后时序的结构变化由果推因，推理出若要完美擦除水渍，最优的动作特征应该是幅度更契合、能效更高的潜动作表征。

策略系统随即进行对齐，主动拉近差距，强制控制序列向这个更优的幅度和轨迹靠拢。

在隐空间内的一拉一推，FDM推演后果，IDM追溯原因，MWA™在机器人真正触碰物理世界之前，就为其划定了高确定性的动作禁区与推荐区间，从而让泛化动作的输出更加连贯、高精密，跑通了从数据到确定性执行力的闭环。

机器人也需要一本错题集

如果说隐空间世界模型为机器人树立了看清因果的“世界观”，那么如何将这种脑海里的常识，转化为真实场景中抗干扰、不掉链子的“价值观”与执行力？

无界动力的做法是从底层架构上让隐空间世界模型原生适配强化学习（RL）机制。

通过“物理因果建模 + 强化学习试错 + 边界认知进化”的闭环，让机器人在虚拟演练场中高频自我进化。

但要练出真正抗干扰的能力，全行业目前都卡在了同一个瓶颈上——数据集普遍“重正轻负”。

翻开现在的行业数据集，几乎清一色全是“完美正样本”，极少有颗粒度够细的各类失败教训。

这就像一个学生只做满分范文的阅读理解，从来没见过扣分点在哪里。

考试时他知道好作文是什么样子，但不知道自己写的哪里会丢分，改都不知道往哪里改。

强化学习的道理也一样，如果数据集里只有“做对了”，没有“做错了”和“差一点做对”，模型就没有参照物来判断自己的动作到底偏了多少、往哪个方向偏的，奖励信号模糊，策略优化就难以推进。

也正是因为这种数据结构，导致强化学习因缺乏多维度的样本对照，行业里根本拿不到高频、稠密的奖励反馈来调优策略。

针对这一行业痛点，无界动力首创了AnyPhys负样本核心数据体系。

他们不再只给机器人喂标准答案，取而代之的是将深层负样本、细粒度边界失稳样本、甚至是“差一点就成功”的次优样本，与基准正样本交织在一起。

目前，AnyPhys已经累计沉淀了几万条专属的失败、失稳和临界边界样本，几乎涵盖了工业、商业和日常生活中机器人可能遇到的各种“翻车现场”，构筑起一个极其罕见的失败知识库。

团队摒弃了传统单一最大化成功奖励的模式，建立了一套自动区分正、负、次优、边界样本的方法论，实现了强化学习的复杂稠密奖励设计。

这套方法论无需额外人工标注，就能充分复用带有瑕疵的演示数据，显著增强了机器人的实操精度与泛化能力。

例如，在精密接插类任务中，基于机器人位姿搭建全局空间图，以末端三维距离为运动代价，求解抵达目标的最短路径，借助剩余路径距离量化动作进度，清晰辨别前进、倒退、停滞状态，实现了对样本的自动打分和分类。

算法兼容离线模仿加权、在线稠密奖励两类训练场景，在高精密插接任务实测中，噪声数据下的任务成功率最高提升了5倍。

非共识路线斩获第一名，超越英伟达

回到开头提到的那个榜单。

近日，在具身智能领域的权威评测基准RoboCasa中，无界动力与中科院自动化所-深度强化学习团队联合发布的隐空间世界模型MWA™ – WALA，以75.2%的平均任务成功率刷新了行业纪录、夺得全球第一，超越了英伟达GR00T-N1.6等一众行业主流模型。

这个榜单的含金量值得展开说明，RoboCasa由斯坦福大学等顶尖机构联合发起，是业界公认的具身操作核心评测赛场之一。

它不是让机器人在理想环境中完成几个标准动作就算过关。

测试场景涵盖了多种非标厨房环境及交互物件，包括长时序复合流程、受限空间物件拿取等24项高难度任务，并搭配了全域随机化光影、杂物干扰、物体规格变动等严苛的测试条件，专门考验的是模型在不确定环境中的泛化能力。

实测数据显示，MWA™ – WALA相比第二名模型，任务成功率提升了2.4%，同时在多步骤连贯操作、受限空间物件拿取、零散物件精准拾取等高频难点任务中表现尤为突出。

这个成绩背后有一个细节值得关注。

MWA™ – WALA能在强不确定性中稳定作业，核心得益于其对互联网上无标签原始数据的深度激活。

对比测试表明，大规模无标签数据训练带来的全场景泛化能力提升是显著的，这也是MWA™ – WALA能在强不确定性环境中保持稳定作业的核心原因。

不仅押注技术，更看重团队

具身智能赛道上融资并不稀奇，但无界动力的节奏多少有些不同寻常。

成立一年，天使轮超2亿美元，Pre-A轮近2亿美元接近关闭，2026年上半年累计融资数亿美元。

红杉中国、线性资本、京东关联基金等机构都在投资方名单中。

资本愿意在天使轮就押注这个体量，看的不只是技术路线，更关键的是这支团队过去已经完整跑通过一遍“从算法到量产”的全周期。

无界动力CEO张玉峰此前在地平线担任智驾一号位。

他带领过千人团队，将地平线的智能驾驶软件算法产品从研发推向了规模化交付，最终把地平线智驾业务从0做到了中国市场份额第一。

更被行业记住的一笔，是他主导的与大众集团24亿欧元业务合作，这是中国智驾方案首次向全球顶级车企的技术输出，也是那个阶段中国智驾产业最大的一笔出海订单之一。

无界动力联合创始人兼CTO夏中谱的履历则偏向技术纵深。

他是中国智能驾驶产业中研发并量产端到端模型的关键人物之一，曾带领不到40人的团队，在一个半月内拿出了首版Demo。

在无界动力，他主导的是最核心的技术栈：隐空间世界模型+强化学习的研发，以及底层技术基础设施的构建。

有投资人评价，张玉峰和夏中谱的组合，是从理想与地平线体系里走出的创业者中战绩最扎实的两人。

一个知道如何将技术推向产线，一个知道如何将算法逼到极限。

这种“兼具技术与商业化落地”的基因，也直接反映在了无界动力的商业化节奏上。

成立仅一年，无界动力签下了总额近1亿美元的全球订单。

合作方的名单覆盖了几条差异很大的产业链：

汽车领域，与ZF LIFETEC、欧摩威集团等全球头部供应商达成了战略合作；

能源领域，与远景科技签署了超5亿元rmb的订单，涵盖海外市场的规模化部署与联合研发。这笔订单也是国内具身操作智能赛道上首个亿元级别的海外大单。

在消费端，无界动力与国内外知名连锁咖啡品牌合作，将机器人推进了开放、动态的商业服务场景。

从汽车产线到咖啡门店，场景跨度如此之大，对技术的要求截然不同。无界动力的做法是自研一套通用的硬件底座来打通。

而在环境更复杂的家庭场景中，机器人同样展现了细腻的物理常识。面对各种动态多任务，它能依靠自主决策和长周期推演，实现极强的自适应泛化能力。

目前公司已经全栈自研了1200 TOPS（INT8）的大小脑一体大算力计算平台，并在机器人上实现了标配部署。

不同场景跑出来的实操数据，持续回流到核心模型的训练管线中，形成了数据反哺技术的正向循环。

具身智能赛道的淘汰赛已经开始。Demo阶段已经过去，行业开始关注一个更硬的指标——你的机器人，能不能真干活、真交付？

无界动力的回答指向了一个更底层的命题。

比起教机器人学会更多任务，更关键的是让它理解物理世界本身的规律。

一个真正理解重力、碰撞、摩擦的具身大脑，不需要逐个场景去训练，它会自行学习。

这可能是通往通用具身智能最难的一条路，但也是最根本的一条。

一群从产业深处走出来的较真工程师，正在一步步把它走通。

— 完 —

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：全球首个隐空间世界模型打通长时序双向物理因果链要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://www.qbitai.com/2026/06/439891.html

世界模型

上一篇：人工智能武器化不可避免治理路径探讨

下一篇：AI驱动的Spareroom消息生成器扩展

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。