蚂蚁灵波开源全球模型竞赛神器,谷歌开放模型体验平台
来源:环球网
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
【环球网科技报道 记者 李文瑶】近日,全球人工智能领域接连迎来重磅消息。1月27日至30日,蚂蚁集团旗下灵波科技连续四天密集开源发布四大核心模型——空间感知模型LingBot-Depth、具身大模型LingBot-VLA、世界模型LingBot-World、具身世界模型LingBot-VA,构建了一套完整的开源具身智能开发套件。尤为引人注目的是,就在蚂蚁灵波宣布其世界模型开源的次日,全球科技巨头谷歌紧随其后,宣布面向美国特定用户开放其世界模型项目Project Genie的体验平台。
这一前一后的动作,标志着长期以来由少数巨头把持的世界模型壁垒,首次被中国科技企业以开源方式撕开关键缺口,世界模型竞赛正从封闭研发加速转向开放生态的协同演进。
对此,德国财经媒体AdHocNews评论称,蚂蚁集团发布了名为 LingBot-World 的高质量机器人 AI 模拟环境。这家中国金融科技公司完善了一套完整的开源工具包,用于物理 AI 系统的开发。这也是在全球机器人领域话语权争夺战中的一项战略性举措。
蚂蚁灵波“四连发”,开源构建具身智能基座
自1月27日起,蚂蚁灵波开启了一场具身智能领域的模型开源周。1月27日,其率先开源LingBot-Depth空间感知模型,该模型专为提升机器人等智能终端的三维视觉精度与可靠性而设计,在多项国际基准测试中达到领先水平。
1月28日,灵波科技开源具身大模型LingBot-VLA。该模型基于超过2万小时的真实机器人数据预训练,覆盖9种主流双臂机器人构型,旨在解决具身智能落地中因本体、任务、环境差异导致的泛化性挑战和成本高企问题。仅需少量演示数据,该模型即可实现高质量任务迁移,大幅降低了下游应用的适配门槛与成本。

1月29日,世界模型LingBot-World正式亮相。该模型旨在为具身智能、自动驾驶及游戏开发提供高保真、可实时操控的虚拟环境。最新资料显示,其在视频生成质量、动态程度、长时一致性等关键指标上均媲美谷歌同期发布的Genie 3模型。更突出的是,LingBot-World成功攻克了视频生成中常见的“长时漂移”难题,实现了近10分钟的连续稳定生成,并将端到端交互延迟控制在1秒以内,支持用户通过文本或操作实时改变环境。
1 月 30 日,继空间感知模型、具身大模型与世界模型“三连发”后,蚂蚁灵波科技今日宣布开源具身世界模型 LingBot-VA。LingBot-VA 首次提出自回归视频-动作世界建模框架,将大规模视频生成模型与机器人控制深度融合,模型在生成“下一步世界状态”的同时,直接推演并输出对应的动作序列,使机器人能够像人一样“边推演、边行动”。承接前几日开源发布的 LingBot-World(模拟环境)、LingBot-VLA(智能基座)与 LingBot-Depth(空间感知),LingBot-VA 探索出一条“世界模型赋能具身操作”的全新路径。
通过这连续四天的开源动作,蚂蚁灵波不仅提供了模型权重,更开放了包含数据处理、高效微调、自动化评估在内的全套工具链,旨在为全球开发者提供一个低成本、高性能的“具身数字演练场”。随着“灵波”系列连续发布四款具身领域大模型,蚂蚁的AGI战略实现了从数字世界到物理感知的关键延伸。
谷歌火速跟进,开放体验平台应对开源浪潮
就在蚂蚁灵波宣布世界模型开源后不到24小时,北京时间1月30日凌晨,谷歌DeepMind正式宣布,开始面向美国地区18岁以上的Google AI Ultra订阅用户,逐步开放其世界模型研究原型“Project Genie”的体验。

根据谷歌游戏信息,Project Genie基于其先前展示的Genie 3模型构建,是一款网页应用原型,允许用户通过文本提示或上传图像来创建、探索和混合生成交互式世界。该原型聚焦“世界草图绘制”“世界探索”和“世界混创”三大功能。
谷歌同时坦承,该原型尚处于早期阶段,存在生成效果不够逼真、操作延迟较高、单次生成时长限制为60秒等局限,且此前演示的部分高级能力尚未纳入。
尽管谷歌此次开放的是受限的体验平台而非完全开源,但其在蚂蚁灵波开源动作后迅速作出反应,凸显了世界模型“开源”这一趋势的高度敏感与紧迫感。
开源 vs. 体验:两条路径背后的生态战略
蚂蚁灵波与谷歌的先后动作,也展现了当前AI顶尖竞争中的两种不同路径。
蚂蚁灵波选择了彻底的开源策略,将包括世界模型在内的全套核心技术代码与模型权重向社区免费开放。德国最大财经 之一AdHocNews评论称“LingBot-World 作为一个生成式环境,能创建用于训练 AI 智能体的真实数字孪生环境。开发者借此获得一个高品质、可实时控制的平台,其性能与谷歌领先模型的性能相当。亮点在于:机器人可以在模拟中成千上万次地演练复杂场景——安全、可扩展且经济。”同时,这也意味着“蚂蚁集团正在成为不断增长的人形机器人和物理AI市场中的核心推动者”。

法国科技媒体PauseHardware也认为,LingBot-World若在长时序一致性和控制能力上得到验证,将极大加速实时智能体的发展。这些智能体将在生成式世界中训练,而不需要局限于固定不变的沙盒环境。

相比之下,谷歌目前采取的是一种更为谨慎的“可控开放”策略,通过订阅制面向高端用户开放体验入口,旨在收集用户反馈并控制风险,其核心模型代码并未开源。AI技术评测 Gaga.art直接对比指出:“LingBot-World在质量上与Google Genie 3相当,同时完全面向开发者开放。”

这一差异背后,反映的是两者不同的生态构建思路。蚂蚁灵波通过开源,快速吸引开发者构建应用生态,意在具身智能等新兴领域确立事实标准,并反哺其技术迭代。而谷歌凭借其强大的现有平台和品牌优势,更倾向于在保持核心技术控制力的前提下,逐步探索商业化与普及路径。
从AlphaGo到GPT,过去几年AI领域的突破性进展往往伴随着技术壁垒的抬高。此次蚂蚁灵波在核心模型上主动选择开源,如同在厚厚的壁垒上打开了一扇窗。正如AdHocNews援引行业专家观点称:“此前这类训练环境通常是专有的,成本昂贵。现在,每位开发者都能接触到工业标准技术。”
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
端侧AI的密度法则与昇腾算力协同实践
过去几年,大模型行业的注意力更多集中在云端,关注参数规模、推理速度或者能力榜单,而如今,客户关心的不是模型能不能更“强”,而是能不能在真实算力条件下跑起来,能不能稳定服务用户,能不能把成本压到一个可
Ant Design AI设计工具正式发布:高效体验与核心功能详解
Ant-design cli 到底能做什么?简单说:把 Ant Design 的整个文档库,装进你的命令行,完全离线使用。 你还在为查文档疯狂切屏?AI 时代,这种方式太落后了!想象一下这个场景:你
ES2026原生模式匹配:更优雅的JavaScript逻辑判断新选择
模式匹配不是简单的语法糖,它是 JavaScript 语言从“过程式”向“声明式”进化的核心标志。它让逻辑判断回归到数据本身的结构,而不是散落在各处的条件表达式。 在 JavaScript 诞生的三
突遭区块链蠕虫攻击,npm超140个毒包肆虐分析与防范
这是继 2025 年的 Shai-Hulud 蠕虫之后,第二起确认的自我传播 npm 攻击。说明这种玩法已经被黑客摸透了,以后只会更多。 npm 生态系统正遭遇一场前所未有的供应链灾难!一个名为Ca
华硕Intel 800系主板开售指南:200系搭配与性能解析
2026年3月26日,Intel酷睿Ultra 200S Plus系列处理器正式开售。首批推出酷睿Ultra 7 270K Plus和酷睿Ultra 5 250K Plus两款,售价分别为2499元
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

