VLA:世界模型的具身智能新范式,技术路径解析
面对机器人不够聪明的现实窘况,不少创业公司开始押注世界模型这条技术路线。宇树科技创始人王兴兴在3月中旬的英伟达GTC大会上判断,在通往具身智能ChatGPT时刻的路径中,世界模型几乎“看不到天花板”,是更主流的技术方向。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
有了世界模型充当“大脑”,机器人可以在“脑海”中的模拟和推演不同行动可能带来的后果,提升了决策性能。商汤科技联合创始人、执行董事、大晓机器人董事长王晓刚近日接受南都记者采访时形容,世界模型能让机器人了解外部世界的物理规律,并像人类一样进行思考判断。
需要厘清的是,具身智能领域的世界模型,与学者李飞飞等探索的世界模型产品并不相同。王晓刚解释称,李飞飞所做的世界模型更偏视频生成,可构建供用户访问的3D世界,应用于游戏或虚拟现实场景。具身智能语境下的世界模型,则用来指导机器人与物理世界交互。

商汤科技联合创始人、执行董事、大晓机器人董事长王晓刚参加博鳌亚洲论坛2026年年会。
过去一年中,在具身智能领域“唱主角”的方案是VLA(视觉-语言-行动)模型。VLA集成了视觉感知、语言理解和动作生成,将感知输入直接映射为控制动作,类似于模仿人类将看到的事物、所理解的语言指令转化为行动的过程,但被认为缺少对物理世界的结构化理解。
一些业界知名人士已公开表达VLA的局限性。王兴兴说,VLA模型面临泛化能力受限等瓶颈,天花板更低。英伟达机器人主管Jim Fan也在2月初发文称,2025年,具身智能行业由VLA模型主导,但2026年将成为世界模型首次为机器人领域典型基础的一年。
目前,包括宇树科技、大晓机器人在内的企业已推出各自的世界模型。3月中旬,大晓机器人将旗下40亿参数的世界模型“开悟世界模型3.0”开源。公司方面介绍,这款世界模型并非像VLA那样在大语言或视觉模型后简单附加运动接口,而是以自然界基本物理规律与因果规律为认知根基,打破传统具身智能“行为模仿”的技术局限。
王晓刚告诉记者,训练VLA模型主要依赖昂贵且稀缺的真机数据,这类数据由人工操作机器完成采集。而世界模型更多转向互联网上的图像和文字数据,这些数据记录了大量的物理规律,“相当于你在互联网上看了很多课本,教你物理定律是什么,人的行为逻辑是什么”。
“但光读书还是不够。”王晓刚进一步介绍,机器人世界模型还需要获取人类在真实环境中如何工作、生活,以及如何与物理环境交互的数据。在此基础上,即使理解了物理世界的规律、知晓了人类的操作方式,最终仍需将这些行为映射到机器的参数上,因此需要少量的真机数据。
不过,世界模型的顺利落地并非易事。王兴兴说,视频生成模型可以在虚拟空间中可实现近乎零误差、极高保真的模拟效果。然而,把这一模型部署到机器人上时,即使只有一毫米的偏差,也可能导致与实际效果的巨大差异。要实现视频生成世界模型和真机操作之间的对齐,依然极具挑战。
随着越来越多机器人厂商拥抱世界模型,VLA模型将何去何从?一位头部具身智能数据服务商的联合创始人向南都记者表示,二者可能会融合,VLA要依托世界模型对世界的理解能力。
王晓刚同样认为,短期内,二者是相互协作的关系。世界模型先在“脑海”中预演未来可能发生的各种情景,而具体的执行交由VLA模型完成。从长期来看,世界模型很可能将VLA的能力全部吸收整合。
2025年6月,阿里巴巴达摩院、湖畔实验室和浙江大学研究团队发布一项研究,将VLA模型和世界模型集成在一个框架中:世界模型通过结合动作与视觉信息理解来预测未来状态,这对于成功执行诸如抓取等灵巧操作任务至关重要。由于世界模型能预判潜在动作的后果,这有助于做出更明智的决策,从而优化动作选择,最大限度地提高任务成功的概率。同时,框架中的动作模型基于输入的图像生成后续动作,动作生成过程增强了对潜在行为模式的理解,从而反向促进了世界模型的视觉生成能力。实验结果表明,融合之后的模型性能优于独立的动作模型和世界模型。
由于当下行业内尚未形成统一且成熟的技术范式,宇树科技在招股书中称公司采取世界模型与VLA并行推行的策略。推出过VLA模型的智元机器人,也在布局世界模型。智元Genie业务部生态及解决方案总监沈咏剑在3月25日接受南都等媒体采访时透露,目前智元内部有很多科学家和工程师在世界模型方向上做技术探索。
“从重要程度来讲,我觉得它的重要性不逊于VLA或相关路线。”沈咏剑说。
采写:南都N视频记者 杨柳 樊文扬 蒋小天 发自北京、海南博鳌
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
小米耳夹式耳机本月发布 首款外观设计正式亮相
小米音频生态迎来重要新成员!5月14日,小米官方正式宣布,旗下首款耳夹式耳机将于本月发布。这款名为“小米耳夹式耳机”的新品,主打开放式佩戴体验,标志着小米在入耳式、半入耳式及挂耳式耳机产品线之外,正式进军耳夹式耳机这一热门细分市场。 小米 从官方预热海报可以看出,这款耳夹式耳机在设计上颇具匠心。其采
四大品牌扫地机器人推荐 帮你轻松打造洁净舒适家居环境
忙碌一天回到家,看到地板上散落的灰尘、宠物毛发,是不是感觉疲惫感瞬间加倍?传统清洁方式费时费力,床底、墙角等卫生死角更是难以彻底清理。如今,智能扫地机器人凭借其自动化与高效能,已成为现代家庭解放双手的必备清洁家电。然而,面对市面上琳琅满目的品牌和型号,如何挑选一款真正适合自己家庭需求的扫地机器人呢?
PCIe 5.0固态硬盘性能提升有限 游戏体验无明显差别
PCIe5 0固态硬盘虽拥有极高顺序读写速度,但对游戏加载和帧率提升有限,因其优势在于顺序传输而非随机读写。真正受益者是专业领域用户,如处理8K视频、3D渲染或AI训练等需持续高速读写大文件的任务,以及频繁传输数百GB数据的场景。对日常使用和游戏而言,现有高速固态硬盘已足够。
韩国4月半导体出口额连续两月超300亿美元 SSD涨价带动电脑设备出口激增430%
5月14日,韩国官方发布的最新贸易数据,为全球科技产业的强劲复苏提供了有力佐证。根据韩国科学技术信息通信部与产业通商资源部的统计,今年4月,韩国信息通信技术(ICT)产品出口额飙升至427 1亿美元,同比大幅增长125 9%。这一数据不仅创下历史新高,更标志着韩国ICT出口额首次实现连续两个月突破4
北证50指数下跌超2% 市场行情分析
北证50指数午后持续走低,盘中最大跌幅超过2%。成分股方面,戈碧迦、则成电子跌幅居前,双双下挫逾5%;星图测控、吉林碳谷紧随其后,跌幅也均超过4%。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

