NVIDIA推出Omniverse库与Cosmos AI模型助力机器人技术革新
在SIGGRAPH 2025大会上,英伟达的一系列发布,为机器人技术领域投下了一枚重磅冲击波。这不仅仅是几款新工具的推出,更像是一次对机器人开发范式的系统性升级。通过将尖端的计算机图形学与人工智能深度融合,英伟达正试图为开发者构建一个从感知、理解到决策的完整“数字练兵场”。
全新 NVIDIA Omniverse 库助力世界构建应用
构建一个高保真的虚拟世界,是训练出可靠机器人的第一步。为此,英伟达对其Omniverse平台进行了关键性增强,推出了一系列新的软件开发套件和库,目标直指工业AI与机器人开发的仿真应用瓶颈。
首先,全新的Omniverse SDK实现了MuJoCo物理引擎与OpenUSD场景描述之间的数据互操作性。这意味着什么?简单来说,超过25万名使用MJCF格式的机器人学习开发者,现在可以无缝地将他们的模型迁移到基于OpenUSD的Omniverse生态中,打破了平台之间的壁垒。
更具突破性的是全新Omniverse NuRec库及其AI模型。它引入了基于RTX光线追踪的3D高斯泼溅(3DGS)技术。这项技术能让开发者利用普通的传感器数据,在三维空间中快速、精准地捕捉和重建现实世界场景。这不再是简单的点云或网格,而是带有逼真光照和材质的沉浸式数字孪生。
与此同时,开源机器人仿真框架NVIDIA Isaac Sim 5.0和专注于强化学习的Isaac Lab 2.2也已上线。新版本集成了上述的NuRec神经渲染技术,并提供了基于OpenUSD的全新机器人及传感器模型。这一切的核心目的只有一个:最大限度地缩小仿真与现实之间的“鸿沟”。
市场的反应是最直接的证明。智能汽车仿真工具链的领导者Foretellix正在集成NuRec和相关的传感器技术,以增强其合成数据生成能力。而像Boston Dynamics、Figure AI这样的机器人领域先锋,以及Hexagon这样的工业巨头,都已开始采用Omniverse库和Isaac平台来加速其AI机器人的开发进程。
Cosmos 推动机器人世界生成进步
有了构建世界的能力,下一步就是填充这个世界。训练机器人需要海量、多样且标注精准的数据,而这在现实世界中收集成本极高。英伟达的Cosmos世界基础模型(WFM)正是为此而生,其下载量已超过200万次,允许开发者通过简单的文本、图像或视频提示,大规模生成用于训练的合成数据。
在本次大会上,Cosmos模型在速度、精度和控制力上迎来了显著进化。即将发布的Cosmos Transfer-2模型简化了提示过程,并能根据真实的3D仿真场景或深度图、分割图等空间控制输入,快速生成高度逼真的数据。
更值得一提的是其“蒸馏”版本。该版本将原本需要70个步骤的生成过程压缩至一步,使得开发者能够在全新的NVIDIA RTX PRO Blackwell服务器上,以前所未有的速度运行模型。对于Lightwheel、Skild AI等正在利用合成数据加速物理AI训练的公司而言,这无疑将大幅提升其迭代效率。
Cosmos Reason 突破对世界的理解
然而,能“看”到世界和能“理解”世界,是两回事。传统的视觉语言模型(VLM)在物体识别上表现出色,但在处理需要多步骤推理、应对模糊信息或全新场景的复杂任务时,往往力不从心。
英伟达此次开源的Cosmos Reason模型,旨在攻克这一难题。作为一个拥有70亿参数的可定制推理VLM,它试图让机器人和AI智能体具备类似人类的推理能力——利用先验知识、物理常识和逻辑理解,对环境进行解读并规划行动。
它的应用场景非常广泛:可以自动管理和注释海量的训练数据集,将开发者从繁重的数据清洗工作中解放出来;可以作为机器人“大脑”,在收到“清理餐桌”这类复杂指令时,将其分解为识别碗碟、规划抓取路径、避开障碍物等一系列子任务并执行;甚至可以构建视频分析智能体,从监控录像中自动总结事件或进行根因分析。
目前,英伟达自身的机器人和自动驾驶团队已在用它进行数据管理和模型训练。Uber用它为辅助驾驶数据添加注释,汽车零部件巨头Magna则在其城市自动驾驶配送平台中,利用Cosmos Reason来增强车辆对复杂城市场景的理解与长期规划能力。
全新 NVIDIA AI 基础设施为任何地方的机器人开发工作负载提供支持
如此强大的软件工具,需要同样强大的硬件基石来承载。为此,英伟达同步更新了其AI基础设施产品线。
全新的NVIDIA RTX PRO Blackwell服务器提供了一个统一架构,能够胜任从模型训练、合成数据生成到实时仿真在内的所有机器人开发工作负载。而NVIDIA DGX Cloud现已登陆Microsoft Azure Marketplace,为Omniverse开发者提供了一个完全托管的云平台。开发者可以轻松地从云端大规模流式传输基于OpenUSD和RTX的应用,无需操心底层的基础设施运维。埃森哲和Hexagon已成为该平台的首批企业用户。
加速开发者生态系统
技术的普及离不开生态的繁荣。英伟达深谙此道,因此也宣布了多项培育生态的举措。包括联合Adobe、Autodesk、西门子等行业巨头推出OpenUSD课程与认证,以解决相关人才短缺的问题;以及与Lightwheel进行开源协作,将先进的机器人策略训练和评估框架集成到Isaac Lab中,为社区提供更强大的基准测试工具和仿真资产。
从底层硬件、中间层平台到顶层的AI模型,英伟达正在编织一张覆盖机器人开发全生命周期的网络。其目标很明确:通过降低高保真仿真与合成数据生成的门槛,并赋予机器人类似的常识推理能力,从根本上加速物理智能(Physical AI)的到来。这场始于图形与AI融合的变革,或许正悄然重塑着万亿美元规模的机器人产业蓝图。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
互联网公司关闭线下实体店是战略转型还是无奈之举?
微软宣布永久关闭全球所有线下零售店,仅保留四家改造为体验中心,将专注于数字零售业务。其线上平台月访问用户已达12亿人次。此次调整预计产生约4 5亿美元税前费用,但不会导致裁员。关店计划因疫情加速,零售团队将继续通过线上渠道服务客户。
阿里通义千问编程能力全球第四 国内唯一进入前五
5月27日,编程模型评测领域迎来重要突破:在权威的Code Arena全球排行榜上,阿里巴巴的通义千问Qwen3 7-Max模型以1541分的优异成绩,强势跻身全球第四。这是中国厂商的AI编程模型首次进入该榜单前五名,标志着国产大模型在代码生成与推理能力上已达到世界顶尖水平。目前,榜单前三名仍由An
MiniMax开源AI编程技能包:从新手到资深工程师的代码实战指南
MiniMax开源技能包旨在提升AI生成代码的专业性,使其从学生作业水平跃升至资深工程师水准。该工具包提供覆盖前端、全栈、移动端等六大场景的完整开发工作流,确保输出可直接用于生产的代码方案。它兼容主流AI编程工具,强调通过硬约束引导模型行为,适合从零搭建项目的综合任务,能显著节省。
工信部将加强汽车标准体系顶层设计
工业和信息化部近日正式发布2026年度汽车标准化工作要点,全面构建新型汽车标准体系。该体系的核心在于强化顶层设计与战略引领,旨在为汽车产业转型升级和高质量发展提供坚实支撑。 那么,这一全新的汽车标准体系具体包含哪些重点任务?总体而言,它将系统性地健全和完善多个关键领域的标准框架。智能网联汽车、汽车芯
专访OpenAI首席科学家探讨AI自主科研还有多远
OpenAI正集中资源开发能独立解决复杂问题的“AI研究员”系统,计划在9月前推出“自主AI研究实习生”,并于2028年实现全自动多智能体研究系统。该系统旨在攻克数学、科学及商业等领域的复杂难题。首席科学家帕乔基表示,现有技术已奠定基础,模型持续工作能力不断提升,但系统安全与治理仍是亟待应对的。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

