蚂蚁开源世界模型Genie:10分钟用单图生成长视频
智东西
作者 王涵
编辑 云鹏
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
智东西1月29日报道,今日,蚂蚁灵波科技正式发布并开源了其世界模型LingBot-World。该模型是一个专为交互式世界模拟设计的开源框架。其核心基础组件LingBot-World-Base能够提供高保真度、可控且逻辑一致的模拟环境。
LingBot-World由一个可扩展的数据引擎驱动,通过从大规模游戏环境中学习物理规律与因果关系,可以实现与生成世界进行实时交互。
该模型在视频质量、动态范围、长时一致性、交互能力等关键指标上均接近于谷歌Genie 3模型。
▲ LingBot-World能力表
体验地址:
technology.robbyant.com/lingbot-worldModel
开源地址:
Hugging Face:
huggingface.co/collections/robbyant/lingbot-world
魔搭社区:
www.modelscope.cn/collections/Robbyant/LingBot-world
Github:
github.com/Robbyant/lingbot-worldTech
技术报告:
github.com/robbyant/lingbot-world/blob/main/LingBot_World_paper.pdf
一、近十分钟稳定生成,镜头移动60秒还能保持一致
针对视频生成中最常见的“长时漂移”问题——即生成时间一长就可能出现物体变形、细节塌陷、主体消失或场景结构崩溃等现象,LingBot-World通过多阶段训练以及并行化加速,实现了近10分钟的连续稳定无损生成,为长序列、多步骤的复杂任务训练提供支撑。
▲ 一致性压力测试,镜头最长移动60秒后返回,目标物体仍存在且结构一致
▲ 高动态环境下,镜头长时间移开后返回,车辆形态外观仍保持一致
▲ 镜头长时间移开后返回,房屋仍存在且结构一致
交互性能上,LingBot-World可实现约16 FPS的生成吞吐,并将端到端交互延迟控制在1秒以内。用户可通过键盘或鼠标实时控制角色与相机视角,画面随指令即时反馈。
用户可以通过文本指令触发环境变化与世界事件,例如调整天气、切换画面风格或生成特定事件等,且所有变化均可在保持场景几何关系相对稳定的前提下完成。
二、支持长程任务训练,与场景多样化生成
为解决世界模型训练中高质量交互数据匮乏的问题,LingBot-World采用了混合采集策略:一方面通过清洗大规模的网络视频以覆盖多样化的场景,另一方面结合游戏采集与虚幻引擎(UE)合成管线,从渲染层直接提取无UI干扰的纯净画面,并同步记录操作指令与相机位姿,为模型学习“动作如何改变环境”提供对齐的训练信号。
得益于此,LingBot-World具备了良好的Zero-shot泛化能力。仅需输入一张真实的城市街景照片或游戏截图,模型即可生成对应的可交互视频流,无需针对单一场景进行额外训练,降低了在不同场景中的部署与使用成本。
▲ 机器人穿梭在城市之间
具身智能的规模化落地还面临一个核心挑战,那就是复杂长程任务的真实机训练数据极度稀缺。
LingBot-World凭借长时序一致性、实时交互响应,以及对“动作-环境变化”因果关系的理解,能够在数字世界中“想象”物理世界,为智能体的场景理解和长程任务执行提供了一个低成本、高保真的试错空间。
同时,LingBot-World还支持场景多样化生成,可以改变光照、摆放位置变化等,此功能也有助于提升具身智能算法在真实场景中的泛化能力。
结语:蚂蚁补充物理感知拼图
蚂蚁连续发布三款“灵波”系列具身领域大模型,其通用人工智能(AGI)战略由此完成从数字世界向物理感知层面的关键延伸,也令其“基础模型 – 通用应用 – 实体交互” 的全栈技术路径进一步清晰。
从行业视角看,世界模型正成为连接生成式AI与具身智能的关键桥梁。LingBot-World在长序列生成与零样本泛化方面的能力,若能在实际应用中验证,或可推动相关领域从有限场景训练向开放场景适应的演进。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
OpenClaw飞书文件传输Skill
OpenClaw飞书文件传输Skill:彻底解决文件发送失败问题 一、功能概述与痛点分析 您是否经常遇到在飞书中要求OpenClaw发送文件时,频繁遭遇操作失败,而AI助手却反复绕圈子,始终无法提供有效的解决方案?这一常见难题的核心原因在于OpenClaw的权限限制,但其解决路径却非常清晰:通过创建
OpenClaw 切换channe为钉钉
1、获取并安装国内频道插件 要解锁OpenClaw在中国的主流消息推送能力,首先需要安装官方提供的国内频道插件。只需在系统终端中输入并执行以下指令即可完成安装: openclaw plugins install @openclaw-china channels 2、重启网关服务以加载新插件 插件安装
OpenClaw 千问大模型配置
一、 OpenClaw 安装部署指南 想在Windows 11系统上顺利运行OpenClaw吗?目前最稳定高效的方案,是借助WSL 2(Windows Subsystem for Linux)搭建Ubuntu-24 04环境。我们已为你准备了一份超详细的“手把手”教程。请直接参考这篇实战指南《Win
openclaw尝鲜遇见的坑 no output
对话功能无响应时的界面显示示例 、 系统控制台提示(no output)。执行对话命令openclaw tui后,控制台状态如下。 核心问题在于大模型API地址配置错误。请根据您的系统环境,找到对应的配置文件进行修改。 配置文件路径为:C: Users Administrator openclaw
openclaw安装使用
文章目录 1 OpenClaw 是什么?功能与官网介绍 2 详细安装教程:环境准备与安装步骤 3 OpenClaw配置与启动:新手引导及常见问题解决 1 OpenClaw 是什么?功能与官网介绍 在部署OpenClaw之前,了解这款工具的核心价值至关重要。OpenClaw是一个面向开发者的强
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

