当前位置: 首页
AI
蚂蚁灵波开源具身世界模型LingBot-VA,复杂任务成功率超Pi0.5两成

蚂蚁灵波开源具身世界模型LingBot-VA,复杂任务成功率超Pi0.5两成

热心网友 时间:2026-01-30
转载

1月30日,蚂蚁灵波科技在接连开源空间感知模型、具身大模型与世界模型三大核心成果后,再次宣布开源全新的具身世界模型 LingBot-VA。

这一模型首次提出了自回归视频-动作世界建模框架,巧妙地将大规模视频生成模型与机器人控制技术深度融合。模型在预测“下一步世界状态”的同时,能直接推演并输出相应的动作序列,使机器人能够像人类一样实现“边推演、边行动”的智能行为模式。

在真机测评中,LingBot-VA展现出了对复杂物理交互的出色适应能力。面对长时序任务、高精度操作以及柔性与关节物体操控这三大类共六项高难度挑战,模型仅需30至50条真机演示数据即可快速完成适配,其任务成功率相比业界强基线Pi0.5平均提升了20%。

真机测评数据显示,LingBot-VA在多项高难度操作任务上的性能已超越行业标杆Pi0.5。

在仿真测评中,LingBot-VA同样表现卓越。在高难度双臂协同操作基准RoboTwin 2.0上,它首次将任务成功率提升至超过90%;在长时序终身学习基准LIBERO上,其平均成功率达到了98.5%,双双刷新了行业纪录。

LingBot-VA在LIBERO与RoboTwin 2.0仿真基准测试中均刷新了现有最佳性能。

据悉,LingBot-VA采用了混合专家(MoT)架构,实现了视觉处理与动作控制的跨模态高效融合。通过其独特的闭环推演机制,模型在每一步生成时都会纳入真实世界的实时反馈,确保持续生成的画面与动作始终贴合物理现实,从而精确控制机器人完成各类高难度复杂任务。

为了突破大规模视频世界模型在机器人端侧部署的计算瓶颈,LingBot-VA设计了异步推理流水线,将动作预测与电机执行并行化处理;同时引入了基于记忆缓存的持久化机制与噪声历史增强策略,使得推理时只需更少的生成步骤即可输出稳定、精准的动作指令。这一系列优化让LingBot-VA在兼备大模型深度理解能力的同时,也具备了真机端低延迟控制所需的快速响应速度。

蚂蚁灵波表示,LingBot-VA与此前开源发布的模拟环境、智能基座和空间感知模型一脉相承,共同探索出一条“世界模型赋能具身操作”的全新路径。蚂蚁集团将持续依托InclusionAI社区进行开源开放,携手行业共建具身智能基础能力,加速构建一个深度融合开源开放技术、并服务于真实产业场景的通用人工智能生态。

目前,LingBot-VA的模型权重与推理代码已面向社区全面开源。

来源:https://www.51cto.com/article/835431.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
阿里成立ATH并连发三款模型实现技术整合

阿里成立ATH并连发三款模型实现技术整合

全球AI竞赛如火如荼,所有技术投入的最终目标都高度一致:那就是切实提升社会生产力与商业效率。 直面竞争现实,不容丝毫松懈 2026年清明节期间,阿里通义千问Qwen3 6-Plus模型登顶全球AI平台OpenRouter日榜榜首并刷新调用记录的消息,引发了行业广泛关注。 如果将时间线拉长,观察阿里近

时间:2026-05-20 07:42
犹他州试点AI开具精神类药物处方流程详解

犹他州试点AI开具精神类药物处方流程详解

美国医疗行业正迎来一项突破性尝试。据权威科技媒体PC Mag报道,犹他州监管部门正式批准了一项创新试点:允许人工智能系统为患者开具精神类药物处方。这标志着AI在临床医疗中的角色发生了关键转变,从辅助诊断工具迈入了拥有实际处方权的全新阶段。 当然,这项由Legion Health医疗机构主导、采用Do

时间:2026-05-20 07:41
通义万象如何生成角色一致的多角度图片

通义万象如何生成角色一致的多角度图片

通义万相生成多角度角色图像时,常因角色锚点不稳或姿态与外观未解耦导致不一致。为此提供五种方案:单图扩展通过视频生成提取多角度帧;精准控制结合ControlNet与IP-Adapter分离姿态与身份;渐进演化利用图生图逐步调整重绘幅度;训练专属LoRA模型实现长期一致输出;轻量迭代通过固定种子并仅修改提。

时间:2026-05-20 07:41
Trae配置ESLint与Prettier联动提升代码质量

Trae配置ESLint与Prettier联动提升代码质量

ESLint与Prettier在Vue项目中常因规则冲突导致协同失效。解决方案包括:通过安装eslint-plugin-prettier等依赖,在ESLint配置中集成Prettier规则;或创建独立Prettier配置文件并禁用ESLint格式规则。还可在VSCode工作区设置中绑定保存时自动修复与格式化,或利用husky与lint-staged在提交代码

时间:2026-05-20 07:41
AI视频生成新纪元 Seedance 2.0迎来最强竞争对手

AI视频生成新纪元 Seedance 2.0迎来最强竞争对手

Gemini Omni的正式亮相,证实了此前业内的广泛预测。然而,它远不止是一个视频生成模型。根据谷歌的官方定义,这是一个能够处理任意模态输入、并生成任意模态输出的“全能型”基础模型,视频创作仅仅是其当前能力版图中的一个重要组成部分。 在发布会上,DeepMind首席执行官Demis Hassabi

时间:2026-05-20 07:41
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程