当前位置: 首页
科技数码
AlphaGo作者领衔,8个机械臂协同干活0碰撞,DeepMind新作登Science子刊

AlphaGo作者领衔,8个机械臂协同干活0碰撞,DeepMind新作登Science子刊

热心网友 时间:2025-09-10
转载

一群机械臂手忙脚乱地自己干活,彼此配合、互不碰撞。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

科幻大片场景真的走入现实了。优雅,实在是优雅。

视频中为4个机械臂,在仿真环境下4个安装在桌子上,另外4个安装在天花板上。

这就是发表在Science子刊Science Robotics上,由DeepMind、Intrinsic AI和UCL等研究机构共同提出的最新成果——RoboBallet(机器芭蕾)。

RoboBallet创新性地将图神经网络(GNN)用于强化学习,作为其策略网络和状态-动作价值估计,以解决多机器人(机械臂)协作运动规划中的复杂问题。

这一方法最多可以同时控制8个机械臂,协调多达56个自由度的配置空间,并处理多达40个共享任务, 每一步规划仅需0.3毫秒,且任务分配和调度完全不受约束。

值得一提的是,这篇论文的通讯作者——Matthew Lai,可谓是谷歌DeepMind的资深研究员。自2016年加入谷歌DeepMind以来,他曾参与过AlphaGo、AlphaZero等明星项目。

利用图神经网络与强化学习

总的来说,RoboBallet的核心是把图神经网络与强化学习结合起来,采用图神经网络(GNN)作为策略网络和状态-动作价值估计,解决了大规模多机器人任务分配、调度和运动规划的联合问题,实现了在计算上高效、可扩展且能零样本泛化的高质量轨迹规划。

具体来说,在现代自动化制造中,核心挑战在于如何让多个机器人在共享的、充满障碍物的空间中无碰撞地高效协作,以完成大量任务(如焊接、装配等)。

这涉及到三个高度复杂的子问题:

任务分配(Task Allocation):决定哪个机器人执行哪个任务,以最小化总执行时间。 任务调度(Task Scheduling):决定任务的执行顺序。 运动规划(Motion Planning):在关节空间中寻找一条无碰撞路径,使机器人末端执行器移动到目标姿态。

这三个子问题一组合,复杂度急剧增加,传统算法在真实场景中往往难以计算可行解,工业界目前主要依赖耗时且劳动密集的人工规划。

因此,为了应对这种高维复杂性,RoboBallet就被用来在随机生成的环境中进行任务和运动规划,其能够为与训练期间所见环境不同的环境(具有任意障碍物几何形状、任务姿态和机器人位置)规划多臂抓取轨迹。

为了实现这一点,RoboBallet在数据表示层面,创新性地将整个场景建模为图结构。

其中,图中的节点代表场景中的核心实体,包括机器人、任务和障碍物,而边(Edge)则表示这些实体之间的关系(例如,相对姿态)。

机器人节点之间存在双向边,以支持相互协调和避碰。而任务节点和障碍物节点到机器人节点则存在单向边,用于向机器人传递规划所需的环境信息(如图c)

接下来,RoboBallet使用图神经网络(GNN)作为策略网络,通过权重共享来处理不断变化的图大小。其以观测图作为输入,并在每个时间步为所有机器人生成指令关节速度。这使得机械臂能够在只接收原始状态作为输入的情况下,进行关系和组合推理。

而在具体的策略学习和评估阶段,RoboBallet通过微调TD3(Twin-Delayed Deep Deterministic Policy Gradient)算法来训练策略网络,使模型能够生成多机械臂轨迹,同时解决任务分配、调度和运动规划等子问题,使得昂贵的在线计算转移到了离线训练阶段。

(注:在此任务中,机械臂因成功解决任务和避免碰撞而获得奖励)

同时,为了解决稀疏奖励的问题,RoboBallet还采用了Hindsight Experience Replay方法,使模型能够在没有人工设计的奖励函数的情况下高效学习。

在具体的部署方面,RoboBallet使用Franka Panda的七自由度机械臂、在随机障碍物和任务的模拟环境进行训练。

为了验证性能,研究团队在一个包含4(8)个机器人、40个任务和30个障碍物的模拟工作单元中进行测试,并与RRT-Connect方法进行比较。值得一提的是,这一切都只需在一块 GPU(图形处理单元)上完成,无论是真实的还是模拟的多臂工作单元。

实验表明,RoboBallet在多个关键指标上表现出色:

在训练时间的扩展性方面,即使任务数量增加四倍,RoboBallet收敛所需的训练步数也只是略有增加。

在规划速度方面。实验表明,在推理阶段,即便是包含8个机器人和40个任务的最大场景,每个规划步在NVIDIA A100上只需约0.3毫秒,能够实现10 Hz时间步下超过300倍的实时规划速度。

在单个Intel Cascade Lake CPU核心上,每个步长大约需要30毫秒,在10Hz时间步下仍比实时快约3倍。每个规划步骤包括对整个场景进行一次推理和一次碰撞检测。

在多智能体协同方面,随着机器人数量从4个增加到8个 ,平均执行时间减少了约60%。

而在泛化性方面,模型在随机生成的环境中训练后,无需额外训练即可零样本迁移(zero-shot)到具有不同机器人位置、障碍物几何形状和任务姿态的新环境中。

最后,RoboBallet 的高速和可扩展性使其能够应用于工作单元布局优化(将任务执行时间缩短了33%)、容错规划和基于在线感知的重新规划等新能力。

参考链接

[1]https://x.com/GoogleDeepMind/status/1965040645103407572

来源:https://36kr.com/p/3460279847229065

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
兰博基尼Temerario:以混动之名,续写超跑激情与机械灵魂新章

兰博基尼Temerario:以混动之名,续写超跑激情与机械灵魂新章

当全球超豪华汽车品牌纷纷加速向纯电动转型时,兰博基尼却以一款名为Temerario的混合动力超级跑车,在天津国际赛车场掀起了一场关于性能与灵魂的深度对话。这款搭载全球首款量产10000转 分V8发动机的HPEV高性能车型,以920马力的综合功率和独特的机械哲学,向中国市场展示了超豪华品牌在电动化浪潮

时间:2026-04-30 07:59
无糖狂飙、AI 节流,“肥宅快乐水” 赢麻了!

无糖狂飙、AI 节流,“肥宅快乐水” 赢麻了!

“宇宙第一消费股”的开门红:拆解可口可乐2026年一季报 北京时间2026年4月28日晚,饮料巨头可口可乐(KO)交出了新财年的首份成绩单。这份财报,可以说是给市场注入了一剂强心针。 一、核心业绩速览:强劲增长背后的驱动力 先看整体表现:一季度,公司实现表观营收124 7亿美元,同比增长12%。更值

时间:2026-04-30 07:27
前米哈游高管创业,AI 原生增长 Agent LeapMind Growth 获CMC资本领投 | 融资速递

前米哈游高管创业,AI 原生增长 Agent LeapMind Growth 获CMC资本领投 | 融资速递

AI 原生增长 Agent LeapMind Growth 完成天使+轮融资,CMC资本领投 AI 原生增长领域的创新者 LeapMind Growth,今日正式宣布完成天使+轮融资,本轮由 CMC 资本领投。这笔资金将主要投向何方?答案很明确:用于核心产品 GrowthGPT 的研发迭代、扩充产研

时间:2026-04-30 07:27
大厂存在研发“真空”,小型企业运转灵活,美科企AI人才纷纷离职创业

大厂存在研发“真空”,小型企业运转灵活,美科企AI人才纷纷离职创业

来源:环球时报 【环球时报报道 记者 陈子帅】最近,美国科技圈出现了一个显著趋势:越来越多顶尖研究人员选择从科技巨头离职,自己创办人工智能(AI)公司。分析人士认为,这种趋势的出现,一方面是科技巨头公司内部的管理原因,另一方面也受到投资者愿意押注初创企业的影响。 “一个稍纵即逝的获利窗口期” 据美国

时间:2026-04-30 06:56
苹果(AAPL.US)拟深化iPhone人工智能体验 iOS 27推出“Siri相机模式”并升级视觉智能功能

苹果(AAPL.US)拟深化iPhone人工智能体验 iOS 27推出“Siri相机模式”并升级视觉智能功能

苹果(AAPL US)拟深化iPhone人工智能体验 iOS 27推出“Siri相机模式”并升级视觉智能功能 智通财经APP获悉,苹果(AAPL US)正计划将人工智能更深地融入iPhone的核心体验。据知情人士透露,在即将到来的iOS 27操作系统中,一项重大变化正在酝酿:相机应用将新增一个“Si

时间:2026-04-30 06:56
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程