蚂蚁灵波开源LingBot-Depth模型:让机器人精准感知三维世界
空间智能领域迎来一项重要开源进展。1月27日,蚂蚁集团旗下具身智能公司灵波科技宣布开源高精度空间感知模型LingBot-Depth。
该模型基于奥比中光Gemini 330系列双目3D相机提供的芯片级原始数据,专注于提升环境深度感知与三维空间理解能力,旨在为机器人、自动驾驶汽车等智能终端赋予更精准、更可靠的三维视觉,在“看清楚”三维世界这一行业关键难题上取得重要突破。这也是蚂蚁灵波科技在2025外滩大会后首次亮相互隔半年,在具身智能技术基座方向公布重要成果。
在NYUv2、ETH3D等权威基准评测中,LingBot-Depth展现出代际级优势:相比业界主流的PromptDA与PriorDA,其在室内场景的相对误差(REL)降低超过70%,在挑战性的稀疏SfM任务中RMSE误差降低约47%,确立了新的行业精度标杆。
(图说:在最具挑战的稀疏深度补全任务中,LingBot-Depth性能整体优于现有多种主流模型。图中数值越低代表性能越好。)
在家庭和工业环境中,玻璃器皿、镜面、不锈钢设备等透明和反光物体十分常见,但却是机器空间感知的难点。传统深度相机受制于光学物理特性,在面对透明或高反光材质时,往往无法接收有效回波,导致深度图出现数据丢失或产生噪声。
针对这一行业共性难题,蚂蚁灵波科技研发了“掩码深度建模”(Masked Depth Modeling,MDM)技术,并依托奥比中光Gemini 330系列双目3D相机进行RGB-Depth数据采集与效果验证。当深度数据出现缺失或异常时,LingBot-Depth模型能够融合彩色图像(RGB)中的纹理、轮廓及环境上下文信息,对缺失区域进行推断与补全,输出完整、致密、边缘更清晰的三维深度图。值得一提的是,LingBot-Depth模型已通过奥比中光深度视觉实验室的专业认证,在精度、稳定性及复杂场景适应性方面均达到行业领先水平。
实验中,奥比中光Gemini 330系列在应用LingBot-Depth后,面对透明玻璃、高反光镜面、强逆光及复杂曲面等极具挑战的光学场景时,输出的深度图依然平滑、完整,且物体的轮廓边缘非常锐利,其效果显著优于业内领先的3D视觉公司Stereolabs推出的ZED Stereo Depth深度相机。这意味着在不更换传感器硬件的前提下,LingBot-Depth可显著提升消费级深度相机对高难物体的处理效果。
(图说:[上图]搭载LingBot-Depth后,奥比中光Gemini 330系列在透明及反光场景下深度图的完整性和边缘清晰度明显提升,[下图]其效果优于业界领先的ZED深度相机)
LingBot-Depth的优越性来源于海量真实场景数据。灵波科技采集约1000万份原始样本,提炼出200万组高价值深度配对数据用于训练,支撑模型在极端环境下的泛化能力。这一核心数据资产(包括2M真实世界深度数据和1M仿真数据)将于近期开源,推动社区更快攻克复杂场景空间感知难题。
据了解,蚂蚁灵波科技已与奥比中光达成战略合作意向。奥比中光计划基于LingBot-Depth的能力推出新一代深度相机。
本周蚂蚁灵波将陆续开源多款具身智能方向模型。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
Harness Engineering 团队的核心职责与工作重点解析
在开发AI智能体或进行AI编程时,许多开发者都遇到过类似的困境:当你为大语言模型设计了一个包含多步骤的复杂任务链时,前期进展可能非常顺利,让你感觉胜券在握。 然而现实往往充满挑战。随着任务推进到中后期,模型的输出行为可能逐渐偏离预期——生成内容开始出现事实性错误,返回的数据结构悄然发生格式偏移,最终
Kimi 2.6 发布 性能对标Opus 4.6 刷新开源编程模型上限
月之暗面正式上线并开源了新一代模型 Kimi K2 6。从最新公布的基准测试成绩来看,其代码能力已经追平甚至超越了GPT-5 4和Opus-4 6,表现相当亮眼。当然,与A厂最新发布的Mythos和Opus-4 7相比,仍存在一定差距。我们先来看一张开源与闭源模型的整体对比图,以便有个直观的印象。
爱奇艺AI艺人库功能详解与最新回应
2026年4月21日 今天这张工业机器人概念图,信息量极为丰富。画面中,形态各异的机器人主体与背景的工业设施、管线共同构成了一幅“技术交汇快照”,精准反映了当前工业自动化与智能制造领域的核心发展趋势。 位于视觉中心的机械臂,其精密的关节构造与独特的末端执行器设计,明确指向高精度装配与柔性抓取应用。这
CodeBuddy前端Tree Shaking优化指南:精准分析import打包体积膨胀
前端项目打包体积膨胀常因不当的import语句导致TreeShaking失效。CodeBuddy工具通过解析源码,能识别高风险导入模式,如全量导入或动态访问。它可生成依赖引用图谱,评估模块引用饱和度,并自动推荐ES模块替代方案。此外,该工具会检查sideEffects字段的合规性,并审计构建配置,确保TreeShaking优化条件完备,从而精准定位并解决打包
奥迪与上汽深化合作 L3自动驾驶将首搭E7X车型
在备受瞩目的大众集团之夜活动上,奥迪全球CEO高德诺(Gernot Döllner)正式宣布了一项战略级规划:奥迪将在全新纯电车型E7X上,全球首搭L3级高阶自动驾驶系统。此举不仅是奥迪在智能驾驶领域的一次重磅技术落地,更标志着其正将深厚的豪华造车底蕴,与中国本土领先的智能科技力量深度融合,从而为豪
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

