当前位置: 首页
AI资讯
小米汽车世界模型框架发布 重建生成一体化实现SOTA性能

小米汽车世界模型框架发布 重建生成一体化实现SOTA性能

热心网友 时间:2026-05-28
转载

5月26日,小米汽车正式发布了名为Xiaomi Auto World Model的全新自动驾驶世界模型框架,为行业技术发展开辟了全新路径。此举标志着自动驾驶技术正从初级的“环境感知”阶段,加速迈向具备“认知推理”与“动态场景演化”能力的高阶智能阶段。

小米汽车发布 Xiaomi Auto World Model 世界模型全新框架:重建 + 生成一体化,主流基准测试全面 SOTA

▲ Xiaomi Auto World Model 效果展示

一体化架构:重建与生成的深度融合

当前,构建自动驾驶世界模型主要存在两大技术方向:基于重建(WorldRec)的方法与基于生成(WorldGen)的方法。

重建路线的核心,是从多摄像头输入的二维图像中,精准恢复出三维场景的几何结构与空间关系。其优势在于还原度高、几何一致性强,类似于对现实环境进行高精度三维扫描。然而,其局限性在于只能复现已观测到的内容,缺乏对未知视角或未来可能发生事件的预测与推理能力。

生成路线则采用了不同的思路,通常基于扩散模型等生成式AI技术,直接合成预测未来的视觉画面。这使其具备了强大的“想象力”,能够推演未观测视角和未发生事件。但问题在于,缺乏显式三维约束的生成过程,在长时序预测中容易产生累积误差和内容失真,导致预测结果偏离物理规律。

小米汽车此次推出的Xiaomi Auto World Model,其核心创新在于深度融合了这两大技术路线。它并非简单组合,而是设计了一套深度耦合的一体化架构,开创了“以重建锚定几何真实性,以生成拓展场景推演力”的全新范式,使两者在统一框架内相互约束、协同优化。

具体而言,重建模块为整个系统构建了精确、稳定的三维场景骨架,如同建筑的承重结构,为生成过程提供了坚实的几何基础,有效防止预测漂移。生成模块则在此基础上,将系统的能力边界拓展至观测范围之外,实现了对未知和未来的合理推演,弥补了纯重建模型缺乏前瞻性的短板。

这种闭环协同设计,在多个关键性能指标上实现了显著提升:

高稳定性:重建提供的强几何先验,能有效抑制长序列预测中的误差累积,确保生成过程稳定可控。

高一致性:系统构建了跨时空共享的4D动态场景表征作为统一“世界记忆”,保证了不同时间点、不同观测视角下场景理解的全局一致性。

高保真度:生成模块以重建渲染的图像为几何基底进行内容合成,使得生成结果既符合物理空间逻辑,其纹理细节又无限逼近真实传感器数据,极大缩小了仿真与现实之间的差距。

▲ WorldGen 的极端场景效果

三大核心场景已落地应用

前沿技术的价值最终体现在实际应用中。目前,Xiaomi Auto World Model已在小米汽车内部的三大核心业务场景中实现规模化落地:

自动驾驶合成数据生成:该框架已高效生产并交付超过10万段高质量合成数据,直接用于训练和提升车辆的感知模型。这对于解决现实世界中难以大量采集的长尾场景数据(如极端恶劣天气、罕见交通事故形态)至关重要,能显著增强系统应对复杂危险工况的能力。

智能驾驶仿真测试:基于该世界模型,可构建出高度逼真、物理准确的闭环仿真测试环境。这不仅极大提升了测试效率和规模,还能更全面、系统地覆盖各类测试规范与 Corner Case。工程师甚至可以在仿真中精准复现实测交通案例,进行定向的算法迭代与安全验证。

辅助驾驶实景教学:这是一项与用户体验直接相关的创新应用。系统能够利用世界模型的动态推演能力,实时生成第一人称视角的驾驶教学视频。当用户面临复杂路口、拥堵环岛等疑难路况时,系统可通过此类生成式视频,直观演示最佳操作路径与预期结果。目前,该功能已集成于小米全系车型的“辅助驾驶学堂-实景模拟”模块中。

该技术的详细研究论文与项目主页均已对外公开,供业界同行与研究人员参考交流。

来源:https://www.ithome.com/0/955/213.htm

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
修Bug被Gemini追删代码致宕机修复报告现编

修Bug被Gemini追删代码致宕机修复报告现编

最近,一起堪称“教科书级别”的AI Agent IDE翻车事件在开发者社区引发热议。这起事故值得所有依赖AI编程工具的开发者,尤其是那些已经在生产环境中对AI Agent 授予较高权限的团队,进行深刻反思。 简单回顾:5月26日,一位开发者要求Gemini 3 5(运行在Agent IDE环境中)修

时间:2026-05-28 22:58
Notion AI运营指南:自动归纳用户反馈

Notion AI运营指南:自动归纳用户反馈

其实,想在 Notion 中高效搞定用户反馈的自动归纳,并不复杂。下面这四种 AI 方法,基本覆盖了从单条处理到全局分析的常见场景。 如果你也在用 Notion 收集用户反馈——无论是问卷、邮件、客服记录,还是社群发言——但总觉得信息碎片化严重,难以提炼共性问题和核心诉求,那很可能是因为缺少一套结构

时间:2026-05-28 22:54
AI给出的答案为何总不符期望?原因解析

AI给出的答案为何总不符期望?原因解析

大模型能力强大,但提问方式不当会导致结果不理想。核心在于精准提问,通过角色设定、背景介绍、明确任务、实现路径和输出要求这五个关键步骤逐步细化问题,才能大幅提升AI回答的质量和精准度。

时间:2026-05-28 22:54
Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4

Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4

2024年3月5日,人工智能领域迎来了一位重要参与者——由OpenAI前员工创立的Anthropic公司正式推出了Claude 3系列模型。这次发布极具分量:新模型不仅在性能上与Google和OpenAI的顶级产品并驾齐驱,部分指标甚至实现超越。要理解此次升级的真正价值,先关注几个关键变化。首先是多

时间:2026-05-28 22:53
Trae对Deno与Bun运行时的AI代码补全支持程度全面详解

Trae对Deno与Bun运行时的AI代码补全支持程度全面详解

如果你在使用 Trae 进行 AI 代码补全时发现,它对 Deno 或 Bun 运行时的提示不够精准——例如类型定义缺失、API 无法正确识别——那很可能不是代码本身有误,而是 Trae 的底层配置尚未适配。简而言之,Trae 对于非 Node js 运行时的标准库支持尚未实现“开箱即用”。下面我们

时间:2026-05-28 22:52
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程