蚂蚁灵波因果世界模型论文入选RSS 2026 机器人边想边做新突破
近日,机器人领域传来一项重要进展:蚂蚁灵波科技联合香港科技大学等高校共同完成的学术论文《Causal World Modeling for Robot Control》,正式被国际机器人顶级会议 Robotics: Science and Systems(RSS)2026 接收。

RSS 在全球机器人学术界的地位举足轻重,长期聚焦于机器人学习、控制与感知等前沿方向,其录用标准极为严格。论文获此会议接收,不仅代表研究具备显著的学术创新性,也意味着其获得了国际同行的高度认可。
这项研究究竟解决了什么问题?其核心在于让机器人具备更高级的智能——不仅能够执行动作,更能预先“思考”动作将引发环境发生何种变化。研究团队提出了一套面向机器人控制的因果世界建模框架,并基于此构建了全球首个开源的自回归视频-动作世界模型 LingBot-VA。
LingBot-VA 的突破性在于,它使机器人能够在任务执行过程中持续预测环境状态的变化,并依据预测结果生成后续动作指令。这相当于赋予机器人一种类似人类的“观察-判断-行动”的连贯认知与决策能力。
对蚂蚁灵波科技而言,此次论文入选顶会,是对其“以世界模型驱动机器人控制”技术路线的有力验证。它进一步彰显了 LingBot-VA 作为具身智能基础模型的技术潜力。从长远看,该技术路径有望推动机器人从依赖精确编程的“执行器”,向能够理解环境、泛化任务并自主决策的“智能体”演进。
从“执行动作”到“预见变化”
对机器人而言,真正的挑战往往不在于执行某个动作,而在于理解该动作将引发的连锁反应。例如,拿起水杯后桌面空间的变化,或推开抽屉后内部物品位置的改变。若机器人仅能“机械执行”,则难以应对复杂动态的真实场景。
LingBot-VA 的核心创新,正是将这种“预见未来”的能力嵌入控制闭环。它使机器人能够先在内部模型中“模拟”世界状态的演变,再基于模拟结果决定当前动作。这是一种根本性的范式转变。
这也正是研究强调“因果”建模的关键所在。真实物理世界的发展遵循时间箭头与因果律。因此,机器人在预测未来时,也必须严格遵循时间上的因果关系进行逐步推演。LingBot-VA 将这种因果约束固化于模型结构之中:每一步预测仅依赖于历史观测与已执行动作,确保推演严格按时序展开。
由此,模型输出的不再仅是展示未来的“视频片段”,而是蕴含因果逻辑、可直接用于控制决策的“状态-动作轨迹”。这一设计还带来了额外优势:模型具备了更强的长时序记忆能力,这对于步骤复杂、耗时较长的实际任务至关重要。
技术实现与性能表现
在技术架构上,LingBot-VA 采用混合专家 Transformer(Mixture-of-Transformers, MoT)架构,将视频预测与动作生成统一于同一个自回归扩散框架。此外,模型引入了闭环推演机制:在任务执行中持续接收真实环境反馈,并据此修正预测,从而有效缓解长时推演中的误差累积问题。
理论需经实践检验。研究团队在仿真与真实机器人任务上对 LingBot-VA 进行了系统评估。
在仿真基准测试中,模型表现突出:在 RoboTwin 2.0 的 50 项双臂操作任务上,LingBot-VA 在 Easy 与 Hard 设置下的平均成功率分别达到 92.0% 与 91.1%;在 LIBERO 基准上,成功率高达 98.5%。
更值得关注的是其在真实场景中的性能。面对长时序任务、高精度操作以及柔性与关节物体操控三大类共 6 项高难度挑战,LingBot-VA 仅需 50 条真实示范数据即可完成适配学习。最终,其整体成功率较业界主流基线方法 π0.5 提升超过 20 个百分点,充分证明了其高效的数据利用能力与强大的任务泛化性能。
目前,LingBot-VA 的模型权重、训练与推理代码均已开源。研究人员与开发者可通过 Model Scope、Hugging Face 及 GitHub 平台获取相关资源,进行进一步研究或应用开发。
论文链接:https://arxiv.org/abs/2601.21998
项目主页:https://technology.robbyant.com/lingbot-va
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
Vidu如何制作操场儿童追逐嬉戏的高速摄影阳光感画面
使用Vidu生成儿童操场追逐嬉戏的高速摄影画面时,需启用高速摄影模式,设置动态模糊强度为25%-35%,并在提示词中添加相应后缀。通过明确光源、选择正午光照预设并调整阴影锐度,构建硬朗阳光感。提示词需注入真实动态行为序列,避免静态词汇,同时调用操场材质增强器以提升跑道等表面纹理的。
工信部推动汽车人工智能与新形态汽车标准前瞻突破
工信部发布《2026年汽车标准化工作要点》,将启动“标准前瞻突破行动”,重点面向汽车人工智能、新形态汽车等未来产业方向。此举旨在提前布局前沿领域,强化技术预见能力,构建创新标准生态,并通过监测评估与成果转化,为产业发展提前规划技术标准与规则。
ClawBot订单号自动查询物流状态操作指南
当ClawBot未响应订单号查询时,可依次排查。启用快递100Skill可快速覆盖主流快递。对接自有ERP系统能直接获取权威数据。部署本地爬虫节点适用于无标准API或需抓取非结构化信息的场景。启用多源比对模式可同时查询多个数据源,智能选择最优结果并自动降级,确保可靠性。
QoderWake跨平台安装指南 Windows Mac Linux详细教程
QoderWake是Qoder平台的核心本地唤醒服务。安装前需确认系统版本、CPU架构及Node js与npm版本。可通过npm全局安装、curl脚本(Linux macOS)或独立二进制文件(Windows)三种方式部署。安装后需执行登录授权,并注册为系统服务以启动守护进程。完成这些步骤即可确保服务稳定运行。
海螺AI内容被指抄袭如何解决 原创提升与改写技巧
海螺AI生成内容若被判定抄袭,通常源于与现有文本相似度高。提升原创性需系统优化:精细设计提示词,引导差异化输出;对初稿进行人工深度改写,重构逻辑并融入细节;嵌入小众专业知识与权威数据;最后以查重反馈驱动迭代,针对性重构高重复段落。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

