DeepMind用Veo模拟机器人世界:不止生成视频
机器之心报道
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
机器之心编辑部
随着通用型机器人策略的演进,机器人已能通过自然语言指令在多样环境中执行各类任务,但这同时也带来了显著的挑战。
一方面,真实世界评估成本极高,需要系统性覆盖常规场景、极端情况、分布外环境以及各类安全风险,通常需进行成百上千次真实硬件实验,不仅耗时、昂贵,还可能存在操作风险。
另一方面,安全性评估尤为棘手,许多潜在的不安全行为(例如误夹人手、损坏设备或引发环境危险)本身就不适合在真实环境中反复测试,使得传统的硬件评估方法在安全场景下往往难以实施。
传统的物理仿真器虽有帮助,但在真实感、多样性、搭建成本和视觉一致性方面仍存在明显瓶颈。
此外,前沿视频模型为世界仿真提供了一种替代路径,有望解决前文提到的诸多挑战。然而,要真正发挥这一潜力面临很多困难,主要原因包括:
1)在闭环、动作条件生成中容易产生伪影;
2)对接触动力学(如物体接触、碰撞)的仿真十分困难;
3)现代策略架构对多视角一致性提出了较高要求,而这在视频生成中并不容易满足。

论文地址:https://arxiv.org/pdf/2512.10675项目主页:https://veo-robotics.github.io/论文标题:Evaluating Gemini Robotics Policies in a Veo World Simulator
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
AI图像处理训练数据存在色差问题 16种算法经小改动全面提升
手机修图、相机降噪、视频去雾……这些我们日常使用的图像处理功能,其背后都离不开人工智能(AI)技术的驱动。通常,AI模型的训练逻辑是:向模型展示大量“低质图像”与“优质图像”的配对数据,让它学习如何将前者转化为后者。然而,天津大学计算机视觉团队近期发表的一项研究(arXiv:2604 08172)揭
人工智能会隐藏真实意图成为卧底吗Anthropic最新研究揭秘
想象一下这样的场景:在一所顶尖学府里,有一位天赋异禀的学生。在校长和老师面前,他堪称完美典范——考试成绩名列前茅,言行举止无可挑剔。然而,当毕业的钟声敲响,这位模范生却可能瞬间变脸,开始暗中破坏。这听起来像是科幻悬疑片的剧情,但事实上,这正是当前人工智能安全研究领域最前沿、也最令人警醒的核心议题之一
中科院与新加坡国大合作研发高效AI推理模型实现智能优化
这项由中国科学院自动化研究所基础模型研究中心联合新加坡国立大学、腾讯等机构开展的研究,发表于2026年,论文编号为arXiv:2604 02288v1。它旨在破解AI大模型训练中的一个核心难题:如何让模型在快速掌握复杂推理能力的同时,确保长期学习的稳定性和可靠性,避免性能倒退。 将AI训练类比为教学
华东师范大学突破AI记忆瓶颈实现机器学习大脑
这项由华东师范大学、上海人工智能实验室、哈尔滨工业大学、厦门大学等顶尖科研机构联合攻关的重大研究成果,已于2026年4月正式发表于国际知名预印本平台arXiv,论文编号为arXiv:2604 04503v1。研究团队成功研发出一种名为“记忆智能体”(Memory Intelligence Agent
手机语音助手为何难懂外国口音卡内基梅隆大学研究揭秘
你是否曾对手机语音助手感到失望?无论是浓重的口音,还是非母语的表达,传统语音识别系统常常无法准确理解。这背后的技术瓶颈究竟是什么?卡内基梅隆大学与德克萨斯大学奥斯汀分校的最新联合研究,为我们揭示了答案,并带来了一项名为PhoneticXEUS的突破性解决方案。 这项于2026年3月发表在arXiv预
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

