当前位置: 首页
AI
蚂蚁灵波开源LingBot-Depth模型:让机器人精准感知三维世界

蚂蚁灵波开源LingBot-Depth模型:让机器人精准感知三维世界

热心网友 时间:2026-01-28
转载

空间智能领域迎来一项重要开源进展。1月27日,蚂蚁集团旗下具身智能公司灵波科技宣布开源高精度空间感知模型LingBot-Depth。

该模型基于奥比中光Gemini 330系列双目3D相机提供的芯片级原始数据,专注于提升环境深度感知与三维空间理解能力,旨在为机器人、自动驾驶汽车等智能终端赋予更精准、更可靠的三维视觉,在“看清楚”三维世界这一行业关键难题上取得重要突破。这也是蚂蚁灵波科技在2025外滩大会后首次亮相互隔半年,在具身智能技术基座方向公布重要成果。

在NYUv2、ETH3D等权威基准评测中,LingBot-Depth展现出代际级优势:相比业界主流的PromptDA与PriorDA,其在室内场景的相对误差(REL)降低超过70%,在挑战性的稀疏SfM任务中RMSE误差降低约47%,确立了新的行业精度标杆。



(图说:在最具挑战的稀疏深度补全任务中,LingBot-Depth性能整体优于现有多种主流模型。图中数值越低代表性能越好。)

在家庭和工业环境中,玻璃器皿、镜面、不锈钢设备等透明和反光物体十分常见,但却是机器空间感知的难点。传统深度相机受制于光学物理特性,在面对透明或高反光材质时,往往无法接收有效回波,导致深度图出现数据丢失或产生噪声。

针对这一行业共性难题,蚂蚁灵波科技研发了“掩码深度建模”(Masked Depth Modeling,MDM)技术,并依托奥比中光Gemini 330系列双目3D相机进行RGB-Depth数据采集与效果验证。当深度数据出现缺失或异常时,LingBot-Depth模型能够融合彩色图像(RGB)中的纹理、轮廓及环境上下文信息,对缺失区域进行推断与补全,输出完整、致密、边缘更清晰的三维深度图。值得一提的是,LingBot-Depth模型已通过奥比中光深度视觉实验室的专业认证,在精度、稳定性及复杂场景适应性方面均达到行业领先水平。

实验中,奥比中光Gemini 330系列在应用LingBot-Depth后,面对透明玻璃、高反光镜面、强逆光及复杂曲面等极具挑战的光学场景时,输出的深度图依然平滑、完整,且物体的轮廓边缘非常锐利,其效果显著优于业内领先的3D视觉公司Stereolabs推出的ZED Stereo Depth深度相机。这意味着在不更换传感器硬件的前提下,LingBot-Depth可显著提升消费级深度相机对高难物体的处理效果。





(图说:[上图]搭载LingBot-Depth后,奥比中光Gemini 330系列在透明及反光场景下深度图的完整性和边缘清晰度明显提升,[下图]其效果优于业界领先的ZED深度相机)

LingBot-Depth的优越性来源于海量真实场景数据。灵波科技采集约1000万份原始样本,提炼出200万组高价值深度配对数据用于训练,支撑模型在极端环境下的泛化能力。这一核心数据资产(包括2M真实世界深度数据和1M仿真数据)将于近期开源,推动社区更快攻克复杂场景空间感知难题。

据了解,蚂蚁灵波科技已与奥比中光达成战略合作意向。奥比中光计划基于LingBot-Depth的能力推出新一代深度相机。

本周蚂蚁灵波将陆续开源多款具身智能方向模型。

来源:https://www.163.com/dy/article/KKA9GCGF0511DSSR.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
Harness Engineering 团队的核心职责与工作重点解析

Harness Engineering 团队的核心职责与工作重点解析

在开发AI智能体或进行AI编程时,许多开发者都遇到过类似的困境:当你为大语言模型设计了一个包含多步骤的复杂任务链时,前期进展可能非常顺利,让你感觉胜券在握。 然而现实往往充满挑战。随着任务推进到中后期,模型的输出行为可能逐渐偏离预期——生成内容开始出现事实性错误,返回的数据结构悄然发生格式偏移,最终

时间:2026-05-18 21:41
Kimi 2.6 发布 性能对标Opus 4.6 刷新开源编程模型上限

Kimi 2.6 发布 性能对标Opus 4.6 刷新开源编程模型上限

月之暗面正式上线并开源了新一代模型 Kimi K2 6。从最新公布的基准测试成绩来看,其代码能力已经追平甚至超越了GPT-5 4和Opus-4 6,表现相当亮眼。当然,与A厂最新发布的Mythos和Opus-4 7相比,仍存在一定差距。我们先来看一张开源与闭源模型的整体对比图,以便有个直观的印象。

时间:2026-05-18 21:41
爱奇艺AI艺人库功能详解与最新回应

爱奇艺AI艺人库功能详解与最新回应

2026年4月21日 今天这张工业机器人概念图,信息量极为丰富。画面中,形态各异的机器人主体与背景的工业设施、管线共同构成了一幅“技术交汇快照”,精准反映了当前工业自动化与智能制造领域的核心发展趋势。 位于视觉中心的机械臂,其精密的关节构造与独特的末端执行器设计,明确指向高精度装配与柔性抓取应用。这

时间:2026-05-18 21:41
CodeBuddy前端Tree Shaking优化指南:精准分析import打包体积膨胀

CodeBuddy前端Tree Shaking优化指南:精准分析import打包体积膨胀

前端项目打包体积膨胀常因不当的import语句导致TreeShaking失效。CodeBuddy工具通过解析源码,能识别高风险导入模式,如全量导入或动态访问。它可生成依赖引用图谱,评估模块引用饱和度,并自动推荐ES模块替代方案。此外,该工具会检查sideEffects字段的合规性,并审计构建配置,确保TreeShaking优化条件完备,从而精准定位并解决打包

时间:2026-05-18 21:39
奥迪与上汽深化合作 L3自动驾驶将首搭E7X车型

奥迪与上汽深化合作 L3自动驾驶将首搭E7X车型

在备受瞩目的大众集团之夜活动上,奥迪全球CEO高德诺(Gernot Döllner)正式宣布了一项战略级规划:奥迪将在全新纯电车型E7X上,全球首搭L3级高阶自动驾驶系统。此举不仅是奥迪在智能驾驶领域的一次重磅技术落地,更标志着其正将深厚的豪华造车底蕴,与中国本土领先的智能科技力量深度融合,从而为豪

时间:2026-05-18 21:26
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程