当前位置: 首页
AI
华沙大学推出OpenGVL:用时间筛选提升机器人数据质量

华沙大学推出OpenGVL:用时间筛选提升机器人数据质量

热心网友 时间:2025-10-15
转载

在机器人技术迅猛发展的当下,训练数据的规模与品质正日益成为制约行业发展的核心瓶颈。华沙大学帕维尔·布齐亚诺夫斯基教授团队携手IDEAS研究所、Simple Automation公司及波兹南理工大学的专家,共同研发了全球首个开源机器人数据质量评估系统OpenGVL。这项重要成果已发表于2025年机器人学习会议(CoRL 2025),论文编号arXiv:2509.17321v2,为破解"数据荒"困局提供了创新性的解决方案。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

研究团队深入分析了Hugging Face平台上超过1.3万个机器人数据集,发现当前数据普遍存在三大问题:32%的数据集存在任务定义模糊的情况,例如"将物品放入容器"的指令未明确容器的具体类型与放置标准;27%的数据标注存在歧义,如"移动物体至指定位置"的任务未明确定义"指定位置"的判定标准;还有15%的数据集中混杂了失败的操作样本。这些低质量数据严重影响了模型训练效果。传统的人工筛选方法效率低下,单个数据集审核往往需要专业人员花费40小时以上。

OpenGVL系统的核心创新在于其突破性地运用了视觉语言模型的"时间感知"能力。该系统通过分析机器人操作视频的帧序列,无需针对特定任务进行专门训练,即可准确判断任务完成度。实验结果显示,在"开门"任务中,系统能够精准识别手臂伸展(25%完成度)、抓握把手(50%)、转动门锁(75%)等关键动作节点。研究团队采用帧序乱序测试法验证模型的理解能力,当视频帧顺序被打乱后,系统仍然能够通过动作逻辑推断出正确的时间顺序,准确率达到92%。

在模型性能对比测试中,研究团队发现开源模型与商业模型之间存在显著差距。参数量达到270亿的Gemma-3模型在时间预测任务中的得分仅为GPT-4o的63%,而Qwen2.5-VL-32B模型的表现相当于Gemini-2.5-Pro的71%。不过,经过专项优化的模型表现突出,GLM-4.1V-9B-Thinking在精密装配任务中的预测准确率达到81%,超越了大多数通用商业模型。这表明通过架构优化和训练策略的改进,开源模型完全有潜力实现性能的跨越式提升。

为验证系统的实际应用价值,研究团队对Hugging Face平台上的260万个操作片段进行了全面检测。在Rorschach2153/so101_60_new数据集的分析中,系统精准识别出第93帧存在的异常操作——机械臂在抓取过程中意外碰撞工作台,这一异常导致后续12帧数据失效。这种强大的异常检测能力使数据清洗效率提升了15倍,单个数据集的处理时间从40小时大幅缩短至2.5小时。

研究特别设计了两个保密测试任务来验证模型的泛化能力:一个是人类专家完成的电子元件亚毫米级装配任务,另一个是双7自由度机械臂协同执行的精密操作任务。在零样本测试中,大多数模型的预测准确率接近随机水平(25%);在提供两个示范样本后,仅GLM-4.1V-9B-Thinking和MiMo-VL-7B-RL-2508两款模型的准确率突破60%。这一结果揭示了当前模型在复杂时空推理方面存在显著不足。

为推动行业标准化进程,研究团队创建了开放式评估平台,提供了包含52种机器人任务的基准测试集。该平台支持研究者上传自定义数据集,自动生成质量报告并进行模型性能对比。平台上线三个月以来,已有来自23个国家的87个研究团队使用该服务,累计完成1200次模型测试,有效促进了国际通用的数据质量评估标准的形成。

在精密装配任务的测试中,系统展现出了独特的三维缺陷检测能力。当分析某数据集的"芯片插入插座"操作时,系统不仅识别出第17帧存在的角度偏差(超出允许范围3.2度),还发现了第24帧的插入深度不足(仅达到标准值的78%)。这种多维度质量评估能力帮助研究者精确识别数据缺陷的具体类型,为实现针对性改进提供了科学依据。

研究揭示了模型规模与性能之间的非线性关系:在Gemma-3系列模型中,270亿参数模型的预测误差比40亿参数模型降低了41%,但当参数规模增加到540亿时,性能提升幅度仅为7%。这一发现表明单纯扩大模型规模的效益正在递减,必须结合架构创新才能实现突破。专项优化模型如MiMo-VL-7B-RL-2508通过引入时空注意力机制,在同等参数量下实现了比基础模型高出23%的预测准确率。

这项研究对机器人产业发展具有双重价值:一方面为数据采集方提供了质量自检工具,某工业机器人企业应用该系统后,训练数据可用率从68%显著提升至91%;另一方面为模型开发者指明了改进方向,开源社区已根据研究结论启动了"时空推理增强计划",预计在未来两年内,开源模型与商业模型的性能差距将缩小至15%以内。

来源:https://www.itbear.com.cn/html/2025-10/986895.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
Luxi AI

Luxi AI

Luxi Ai是什么 在时尚与科技加速融合的今天,一款名为Luxi Ai的产品正悄然改变着人们的购物方式。它本质上是一个由创新科技公司打造的AI时尚助手,但别被“助手”二字限制想象——它的核心本事,在于用图像识别技术帮你“看图找物”。你只需随手拍下或上传一张心仪单品的照片,它就能在茫茫商品海洋中,为

时间:2026-04-17 11:55
v0 APP 提供无代码工具,帮助用户快速构建创意项目

v0 APP 提供无代码工具,帮助用户快速构建创意项目

v0 APP产品介绍 想快速把创意变成看得见、摸得着的网页或项目,又不想面对密密麻麻的代码?这事儿现在简单多了。v0 APP正是为此而生的一款在线工具,它主打无代码开发,让用户通过最简单的操作,就能启动并构建各类创意项目。说白了,它的设计哲学就一条:极致简化,让每个人都能成为“建造者”。 那么,这个

时间:2026-04-17 11:54
AI不背锅!全国首例AI幻觉侵权案宣判:AI不具备民事主体资格,用户索赔10万被驳回

AI不背锅!全国首例AI幻觉侵权案宣判:AI不具备民事主体资格,用户索赔10万被驳回

全国首例生成式AI“幻觉”侵权案宣判:用户维权为何败诉? 最近一则新闻在科技和法律圈引发了广泛讨论:杭州互联网法院审结了全国首例因生成式人工智能“幻觉”引发的侵权纠纷。最终,法院驳回了用户的诉讼请求。这起案件,可以说给所有AI使用者都上了一堂生动的“普法课”。 事情要从2025年6月说起。当时,原告

时间:2026-04-17 11:54
LovOn

LovOn

LovOn是什么 说到用科技为爱情保鲜,最近有一款产品在年轻情侣圈里讨论度颇高——LovOn。它由BABAYAGA Inc 开发,是一款专门为情侣关系量身定制的AI工具。其目标非常明确:瞄准那些渴望通过智能、有趣的方式让关系升温的用户,尤其是成长于数字时代的GenZ一代。 那么,它的底层逻辑是什么?

时间:2026-04-17 11:43
hyper.online

hyper.online

Hyper Online是什么 想在移动端打造一个专属的3D虚拟形象,进行直播或者视频创作?Hyper Online正是为此而生。这款由Hyper Online公司开发的iOS应用,专门服务于VTubers和各类头像内容创作者。它的核心任务很明确:帮助用户从零开始构建一个独特的3D虚拟化身,并将其流

时间:2026-04-17 10:19
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程