当前位置: 首页
AI
蚂蚁灵波开源LingBot-VLA具身大模型 跨任务泛化能力创新高

蚂蚁灵波开源LingBot-VLA具身大模型 跨任务泛化能力创新高

热心网友 时间:2026-05-16
转载

具身智能领域迎来里程碑式开源突破。继昨日发布高精度空间感知模型LingBot-Depth后,蚂蚁集团旗下灵波科技今日正式宣布,全面开源其核心具身大模型LingBot-VLA。该模型定位为“智能基座”,专注于真实机器人操作场景,致力于突破跨本体与跨任务的泛化瓶颈,显著降低后训练成本,从而推动“一脑多机”从技术概念迈向工程化与规模化落地。

这款新开源的“机器人大脑”实际性能究竟如何?权威真机测试提供了有力证明。在上海交通大学发布的具身评测基准GM-100(涵盖100项真实操作任务)中,LingBot-VLA在三个不同的真实机器人平台上进行了全面验证。测试数据显示,其跨本体泛化的平均成功率,在未引入深度信息的情况下,已达到15.7%,显著超越了此前表现优异的Pi0.5模型(13.0%)。而当模型结合深度信息(w/Depth)后,其空间感知与理解能力得到强化,平均成功率进一步提升至17.3%,刷新了该真机评测的成功率纪录。这一结果充分验证了LingBot-VLA在复杂、动态的真实世界场景中的卓越性能与稳定性。

(图说:在 GM-100 真机评测中,LingBot-VLA 跨本体泛化性能超越 Pi0.5)

在虚拟仿真环境的严苛考验中,LingBot-VLA同样表现领先。在RoboTwin 2.0仿真基准(包含50项任务)的评测中,面对高强度环境随机化干扰(如光照突变、杂物遮挡、高度扰动等),模型凭借其独特的可学习查询对齐机制,实现了深度信息的深度融合,最终操作成功率较Pi0.5模型提升了9.92%。这不仅证明了其在仿真环境中的强大泛化能力,也为其从虚拟训练到现实部署的全链路可靠性提供了坚实保障。

(图说:在 RoboTwin 2.0 仿真评测中,LingBot-VLA 跨任务泛化性能超越 Pi0.5)

破解泛化难题,降低落地门槛

泛化能力不足一直是制约具身智能规模化落地的核心瓶颈。机器人本体形态多样,任务场景千变万化,环境条件复杂不一,导致针对特定硬件或任务训练的模型难以迁移,往往需要耗费巨量数据与算力进行重复后训练。这种高成本、低效率的模式,严重阻碍了技术的商业化进程与规模化复制。

LingBot-VLA的研发正是为了攻克这一难题。其强大的泛化能力源于超过20000小时的大规模真机数据预训练,数据覆盖了包括AgileX、Galaxea R1Pro/R1Lite、AgiBot G1在内的9种主流双臂机器人构型。广泛的“实践经验”使得同一个“大脑”能够高效适配不同机械结构的机器人,并在任务或环境发生变化时,依然保持高成功率与强鲁棒性。特别是当它与高精度空间感知模型LingBot-Depth协同工作时,能获得更优质的深度信息表征,相当于为机器人装备了更敏锐的“视觉系统”,实现“感知更精准,操作更智能”。

强大的基座能力直接带来了极低的下游应用门槛。据官方信息,仅需约80条演示数据,LingBot-VLA即可完成高质量的任务迁移与适配。同时,得益于底层代码库的深度优化,其训练效率达到了StarVLA、OpenPI等主流框架的1.5至2.8倍。这意味着开发者和企业能够以更少的数据标注量、更短的训练周期和更低的算力投入,快速实现模型在特定场景的部署,真正实现了数据成本与算力成本的双重降低。

开源全套工具链,加速生态构建

此次开源并非仅释放模型权重,而是同步开放了包含数据处理、高效微调及自动化评估在内的完整工具链与代码库。这一举措的战略价值在于,它极大地缩短了模型从获取到实际应用之间的工程化路径,降低了商业化落地的综合门槛。开发者可以基于这套成熟工具,快速针对自身业务场景进行定制化微调与验证,大幅提升了模型的实用性与易用性。

蚂蚁灵波科技CEO朱兴对此解读道:“具身智能要实现大规模应用,一个高效、通用的基座模型是关键基础。它直接决定了技术是否‘真正可用’以及是否‘经济可用’。我们开源LingBot-VLA,旨在与产业界共同探索具身智能的性能边界,推动整个领域进入一个可复用、可验证、可规模化落地的新阶段,加速人工智能在物理世界的深度融合与普及。”

值得关注的是,LingBot-VLA是蚂蚁集团开源的首款具身智能基座模型,也是其在AGI(通用人工智能)前沿方向上的重要探索成果。朱兴介绍,蚂蚁集团正持续以开源开放模式推进AGI研究,并构建了“InclusionAI”技术体系,形成了覆盖基础模型、多模态、推理、新型架构及具身智能的完整技术栈与开源生态。LingBot-VLA的开源正是这一战略的关键实践。“我们期待与全球开发者及产业伙伴携手,共同加速具身智能技术的迭代创新与产业应用。”朱兴表示。

据悉,在模型研发的数据采集与预训练阶段,星海图、松灵、乐聚、库帕思、国家地方共建人形机器人创新中心、北京人形机器人创新中心有限公司、博登智能、睿尔曼等多家产业伙伴提供了关键的硬件平台与高质量数据支持。目前,LingBot-VLA已成功与星海图、松灵、乐聚等厂商的机器人完成适配,初步验证了其在不同机器人构型上的跨本体迁移能力,为后续更广泛的产业协作与生态共建奠定了坚实基础。

来源:https://www.leiphone.com/category/ai/deykYBXwVJwzOQxI.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
商汤科技SenseCore获工信部软件供应链安全优秀级认证

商汤科技SenseCore获工信部软件供应链安全优秀级认证

商汤大装置SenseCore平台获工信部软件供应链安全能力最高等级认证,成为全国首批达标企业。该评估依据国家标准,旨在应对软件供应链安全风险。作为新一代AI基础设施,商汤大装置构建了从算力到服务的端到端能力,其上海临港智算中心算力规模领先。此次认证标志其安全可信的算力底座达到。

时间:2026-05-16 17:40
腾讯混元与MBZUAI新研究 Search-R2如何优化搜索增强推理

腾讯混元与MBZUAI新研究 Search-R2如何优化搜索增强推理

针对搜索增强推理中的错误传播与信用分配难题,本研究提出Search-R2框架,将纠错机制融入强化学习策略空间。通过轨迹判断、错误定位与联合优化,模型能够识别并修正推理链中的早期偏差。实验表明,该方法在多跳推理任务中显著提升准确性,有效抑制长链错误传播,推动搜索型智能体更稳健地。

时间:2026-05-16 17:40
北大团队ICLR论文:自适应时序预测损失函数学习新方法

北大团队ICLR论文:自适应时序预测损失函数学习新方法

本研究针对多步时序预测中误差累积问题,提出可学习权重矩阵的QDF方法。该方法通过元学习自适应建模预测步间相关性及不确定性差异,突破了传统均方误差损失的独立性假设限制。实验证明,QDF能有效提升长期预测精度并更好保留序列结构,为时序预测优化提供了新思路。

时间:2026-05-16 17:39
多模态记忆湖MemoryLake发布:AI基础设施迎来记忆驱动新纪元

多模态记忆湖MemoryLake发布:AI基础设施迎来记忆驱动新纪元

质变科技发布MemoryLake多模态记忆平台,推动AI基础设施进入记忆驱动时代。该平台整合大模型、记忆引擎与多模态数据,解决企业信息融合难、数据碎片化等痛点,具备深度理解多模态记忆、模拟人脑记忆演进及海量记忆持久化存储等核心能力,已在金融、制造、游戏等行业应用,提升复杂决策水平。

时间:2026-05-16 17:39
清华刘知远团队ICLR 2026论文:短文本如何丝滑升级为长文本

清华刘知远团队ICLR 2026论文:短文本如何丝滑升级为长文本

清华大学刘知远团队提出稠密-稀疏可切换注意力框架,以解决大语言模型扩展上下文时的计算与结构适配问题。该方法保持原参数与输出形式,实现从短序列到长序列的高效平滑过渡。实验显示,其在多项长上下文任务中性能接近全注意力基线,且不损害原有短序列能力,推理时显著加速。

时间:2026-05-16 17:39
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程