智元Act2Goal方案:机器人如何从单张图像学会执行任务

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
在机器人领域,一个看似简单的任务往往需要复杂的指令和反复调试。但智元具身研究中心给出了一种颠覆性的答案:给机器人一张"目标照片",它就能自己想办法把面前的场景变成照片里的样子。

智元于近日正式发布Act2Goal方案,这不仅是一个新的操作算法,更是一种让机器人"以终为始"的全新思维方式。与传统机器人机械地执行死板指令不同,Act2Goal引入了"目标条件世界模型",使机器人不再只是"看一步走一步",而是拥有了预见未来的能力——在真正动手之前,它已经在大脑中构建了从现状通往目标的完整因果链条。
从"看一步走一步"到"以终为始"
在传统机器人操作中,系统通常只关注当前状态与目标状态,而缺乏对两者之间任务过程的显式建模。主流方法多采用直接映射的范式,将当前观测与目标状态输入策略网络以预测动作,这使得机器人难以判断执行进度,也容易在任务延长或环境变化时出现误差累积。

Act2Goal则通过在动作生成之前引入目标条件世界模型,对从当前状态到目标状态的演化过程进行建模,并生成一系列中间视觉状态作为任务进程的结构化表征,为机器人动作提供明确操作锚点。
"我们相信,这种‘先理解世界如何变化,再决定如何行动’的思路,将为更通用、更可靠的机器人系统提供重要支撑。"智元技术团队解释道。
零样本泛化与自我进化能力
Act2Goal最令人惊叹的特性在于其"零样本泛化能力"和"自我进化"本能。系统能够在从未见过的环境和物体面前,展现出惊人的零样本泛化能力,无需人类手把手教(无奖励信号),就能在真实世界的交互中快速"复盘"自己的行为轨迹。


实验数据显示,面对高难度的陌生任务,Act2Goal仅需数分钟的在线自我磨练,成功率就能从30%提升至90%。这一性能提升速度,远超传统机器人学习模式。
"这不仅仅是技术的进步,更是机器人认知方式的革命。"一位具身智能行业专家表示,"它让机器人从'执行者'转变为'思考者'。"
Act2Goal的训练过程分为两个阶段:首先通过大规模离线模仿学习进行训练,系统微调预训练的世界模型,使其能够生成从当前状态到目标状态的多视角、多尺度视觉轨迹;随后引入在线自我提升机制,利用回顾性经验重放(HER)实现自主性能优化。
在执行过程中,机器人会自动收集每一步的状态、动作及执行结果,并将轨迹重新标注为新的目标示例,存入回放缓冲区。无论任务是否成功完成,系统都能利用这些数据进行端到端微调,仅更新新增的LoRA层参数,基础模型保持冻结。
"部署Act2Goal模型的机器人在多个域外任务上展现出色性能,甚至能在线练习绘制未见过的图案,持续提升性能。"智元技术团队表示。
从实验室到真实世界的跨越
Act2Goal的核心贡献在于重新审视了目标条件操作中的一个基本问题:从当前状态到目标状态之间,机器人是否真正理解过程?通过在策略中显式引入目标条件世界模型,并结合多尺度时间建模与深度融合机制,Act2Goal为目标条件机器人操作提供了一种新的建模范式。

"我们相信,这种'先理解世界如何变化,再决定如何行动'的思路,将为更通用、更可靠的机器人系统提供重要支撑。"智元研究团队表示。
随着智能制造、服务机器人和家庭自动化需求的不断增长,Act2Goal所代表的技术路线有望成为下一代机器人系统的标准配置,推动机器人从"工具"向"伙伴"的转变,让机器真正"懂"得如何达成目标。
从工业端来看,装配、分拣等长时序任务中,机器人无需反复调试程序就能适配不同批次产品,可大幅提升生产效率;从消费端而言,服务机器人能快速理解用户的模糊需求(如“把桌子摆成照片里的样子”),无需用户学习复杂指令,加速走进家庭和门店。
当前,具身智能赛道正处于“技术比拼转向商用落地”的关键阶段,Act2Goal的推出,不仅强化了智元的技术壁垒,更可能推动行业从“单一任务机器人”向“通用智能机器人”跨越。随着方案在智元现有机器人产品线的适配,其商业化效果或将在2026年逐步显现,进一步改写全球具身智能的竞争格局。
采写:南都·湾财社记者 胡雯雯
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
荣耀MagicOS四月升级:自定义锁屏小组件与指纹样式,新增 Mac 跨设备文件管理功能
荣耀MagicOS四月体验升级:流畅革新,从系统细节到全场景生态的全面进化 日前,荣耀产品经理通过官方渠道正式发布了四月份MagicOS体验升级的详细内容。此次更新并非简单的功能修补,而是从个性化、智慧交互、跨设备协同到生态服务进行全方位优化,为用户带来由内而外的流畅新体验。 核心升级亮点全解析 那
外卖员给AI打工?从送餐到「喂」数据,800万骑手成AI训练师
外卖员成为AI训练数据采集的关键力量?幕后真相揭秘 近期一则行业动态,引发了广泛关注。美国外卖巨头DoorDash悄然上线了一款名为“Tasks”的应用程序。简而言之,该平台的外卖员在完成送餐后,可通过额外拍摄街景视频、记录送餐过程或上传店铺照片等任务,获取附加报酬。DoorDash官方解释称,此举
杜比第四度入选《Fast Company》“全球最具创新力公司”年度榜单
杜比实验室荣获《Fast Company》“2026全球最具创新力公司”认可 在全球消费电子市场,定义未来的往往是那些敢于引领趋势的革新者。今日,杜比实验室郑重宣布,其凭借突破性的技术创新,成功入选《Fast Company》杂志2026年度“全球最具创新力公司”权威榜单。该榜单素来以甄选各行业中通
全渠道第一,高端称王!追觅扫地机AWE实力霸榜
作为全球高端扫地机器人市场领导者,追觅扫地机凭借卓越产品力与创新技术,在AWE2026期间斩获全渠道销量与销售额双冠,市场占有率突破49%,领军地位显著。 近日,上海举办的中国家电及消费电子博览会(AWE 2026)圆满落幕,这场盛会被视为年度智能家居行业发展的风向标。在全球知名品牌同台竞技的舞台上
嵌入式厨电的新变量:小米搅局后,微蒸烤一体机走向“高低分化”
米家智能微蒸烤一体机 Pro 嵌入式 52L 全新上市:AI智能烹饪结合 TFT 大彩屏,售价4699元 最近,小米有品平台正式推出了新款厨电——米家智能微蒸烤一体机 Pro 嵌入式 52L,定价4699元。这款产品主打 AI 精准算法,能够智能控制烹饪过程,有效降低操作失误率,同时配备高清TFT大
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

