当前位置: 首页
科技数码
VLA与世界模型:互补共存,赋能通用人工智能

VLA与世界模型:互补共存,赋能通用人工智能

热心网友 时间:2026-03-26
转载

一段时间以来,围绕VLA(Vision-Language-Action,视觉-语言-行动)模型、WMA(World-Model–Action,“世界模型+动作策略”)模型两条路线的讨论,是具身智能领域里的热点话题。现在,大家似乎不约而同地决定放下争议,协同前行。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

日前,智元机器人启动了一项机器人赛事AGIBOT WORLD CHALLENGE @ ICRA 2026(以下简称 ICRA 2026),两大核心赛道即为Reasoning to Action(推理-操作)和World Model(世界模型)。前者包括线上仿真与线下真机两个阶段,后者则聚焦具身智能中的生成与预测能力,采用线上竞赛方式。

3月25日,智元Genie业务部生态及解决方案总监沈咏剑在接受包括澎湃科技(www.thepaper.cn)在内的媒体采访时表示,从长期趋势看,世界模型与VLA并不一定是替代关系,未来存在结合的可能。“从解决问题的层面上来说,有可能会有一些融合或者说合作的状态,二者不算是替代和被替代的关系。”

VLA曾一度被视为具身智能的重要主流路径,即让机器人基于视觉输入和语言指令,直接完成动作生成与执行。但随着机器人开始进入更复杂、更长链条的任务场景,仅仅“看懂指令并做出动作”已不够。机器人还需要理解任务目标、拆解步骤、推演环境变化,并在执行过程中持续调整策略。

沈咏剑介绍,此次赛事中设置的世界模型赛道考察的是模型根据机器人动作建模物理环境动态的能力。参赛者需要基于真实机器人观测与动作信号,训练视频生成模型,生成机器人在多个真实任务场景中的交互视频。


推理-操作赛道。来源:智元

另一条“推理-操作”赛道,同样考核的是机器人去理解-执行任务这一具体过程。沈咏剑提到,去年的比赛更多是“叠衣服”这类相对明确、固定的任务,机器人基本是“让它做什么,它就做什么”;而今年则加入了更多需要机器人先理解任务、再进行拆解和执行的场景,例如“整理桌面”这类任务,机器人不仅要完成动作,还要先理解什么算整洁、先做什么后做什么,再完成整套流程。


世界模型赛道。 来源:智元

沈咏剑认为,当前世界模型的定义还未收敛,其核心可以概括为一种对未来状态的预测与推演能力:系统基于当前可见的多模态信息,判断下一时刻可能发生什么,或者在接收到任务指令后,推演机器人自身及周围环境接下来会发生怎样的变化。在他看来,这与当前VLA的范式并不完全相同,是相对独立的一条技术路线。

从智元近一年的公开布局看,该公司本身也并未只围绕单一路线推进。智元在2024年底推出了AgiBot World,包含超过100万条轨迹、涵盖217个任务、涉及五大场景的大规模高质量真机数据集。2025年3月,智元发布首个通用具身基座模型——智元启元大模型(Genie Operator-1)。今年1月,智元又发布了Genie Sim 3.0仿真平台,该平台基于NVIDIA Isaac Sim构建,融合三维重建与视觉生成技术,可实现数字孪生级高保真环境。与此同时,围绕推理与操作融合、全身控制等方向,2026年1月,智元具身研究中心宣布推出第二代一体化具身大小脑系统GenieReasoner。

沈咏剑表示,当前整个具身智能行业的人才仍处于稀缺状态,特别是高素质、顶尖的算法人才,他们希望通过赛事吸引更多优秀人才进入这一领域。

来源:https://www.163.com/dy/article/KOUVUE6U0514R9P4.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
小米SU7深度试驾体验:专业媒体评测与日常驾驶焦点

小米SU7深度试驾体验:专业媒体评测与日常驾驶焦点

当专业媒体试驾团队将方向盘交给小米新一代SU7时,这款运动型轿车的真实面貌逐渐清晰。不同于传统性能车对速度的单一追求,试驾报告不约而同指向一个核心结论:这是一款重新定义日常驾驶体验的智能座驾。在舒适

时间:2026-03-28 19:40
五菱缤果Pro升级登场:空间更大配前备箱,35分钟快充更贴心

五菱缤果Pro升级登场:空间更大配前备箱,35分钟快充更贴心

五菱在纯电小型车领域再度发力,全新车型缤果Pro正式登场,为这一细分市场注入新的活力。这款车精准定位在老款缤果与缤果S之间,旨在满足消费者对空间与配置的更高需求。从车身尺寸来看,缤果Pro长4050

时间:2026-03-28 19:40
特斯拉全美投用55座高速超充站

特斯拉全美投用55座高速超充站

格隆汇3月28日|特斯拉重庆高速服务区超级充电站项目今日正式上线,首批启用55座。这是特斯拉在国内一次性投建数量最多、规模最大的高速服务区超级充电站项目。此次上线的高速服务区特斯拉V4超充站涵盖了1

时间:2026-03-28 19:40
永艺股份亮相第57届中国家博会:坐具专家新亮点

永艺股份亮相第57届中国家博会:坐具专家新亮点

2026年3月28日,第57届中国国际家具博览会第二期办公商用展在广州琶洲举行。作为中国家具行业的重要年度展会,本届家博会分两期举行。永艺股份作为中国椅业领域代表企业之一参展亮相,围绕“坐健康”系统

时间:2026-03-28 19:40
存储板块调整:错杀还是理性回调?深度解析后市走向

存储板块调整:错杀还是理性回调?深度解析后市走向

这周谷歌的一个新技术发布,直接把存储板块砸懵了。以美光科技为例,直接来了个五连阴,A股相关标的也同样出现调整。TurboQuant,这个号称能把长文本KV Cache存储需求砍6倍、推理速度提8倍的

时间:2026-03-28 19:40
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程