当前位置: 首页
科技数码
小米开源自动驾驶模型OneVL:技术架构与开源价值解析

小米开源自动驾驶模型OneVL:技术架构与开源价值解析

热心网友 时间:2026-05-13
转载

小米技术团队近日正式发布并开源了Xiaomi OneVL一步式潜空间语言视觉推理框架。该框架在行业内首次实现了将视觉语言模型、世界模型与潜空间推理三大核心技术路线统一整合。它在充分继承并扩展大语言模型强大逻辑推理能力的基础上,显著提升了自动驾驶场景下的推理速度与决策精度,是一项具有里程碑意义的创新。具体性能上,其精度超越了传统的显式思维链方法,而在推理效率上则可媲美直接输出的潜空间思维链方案。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

回顾技术发展,视觉语言模型和世界模型在自动驾驶领域长期处于并行发展的状态:视觉语言模型主要用于实时场景理解与驾驶指令生成,而世界模型则专注于对未来场景演变的精准预测。Xiaomi OneVL通过其创新的潜空间推理机制,成功将这两大核心能力深度融合,构建了一套端到端的统一推理框架。

在涵盖感知、推理与规划等多个主流自动驾驶评测基准上,Xiaomi OneVL全面刷新了潜空间推理方法的性能上限,创造了新的纪录。

如图所示,在ROADWork、Impromptu、Alpamayo-R1等权威基准测试中,其性能均达到了当前最优水平,并在NA VSIM基准上展现了卓越的综合表现。

尤为重要的是,Xiaomi OneVL为模型的决策过程提供了语言与视觉双通道的可解释性。这意味着,系统不仅能够用文本清晰阐述“为何做出此项驾驶决策”的逻辑依据,还能通过生成预测画面,直观呈现“未来数秒内可能发生的场景变化”。

上图直观地展示了这种语言描述与视觉预测并行的可解释性输出模式。

目前,小米已将Xiaomi OneVL的完整模型权重、训练代码及推理代码全面开源,以促进学术研究与产业应用。相关资源链接汇总如下:

技术报告:https://arxiv.org/abs/2604.18486
项目主页:https://Xiaomi-Embodied-Intelligence.github.io/OneVL
开源代码:https://github.com/xiaomi-research/onevl

来源:https://www.163.com/dy/article/KSQUTKAQ0511B8LM.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
黄埔落地大湾区生物医药创新中心 打通转化断层路径

黄埔落地大湾区生物医药创新中心 打通转化断层路径

大湾区生物医药未来产业创新中心在广州黄埔成立,由中山三院牵头,聚焦干细胞、人工智能医药等重点领域,旨在打通临床需求、基础研究与产业转化之间的断层。中心整合临床与产业资源,构建从概念验证到产业化的完整链条,联动粤港澳资源,以推动科技成果高效转化,提升产业国际竞争。

时间:2026-05-13 21:22
Claude AI智能体夜间自动编程实战指南

Claude AI智能体夜间自动编程实战指南

工程师鲍里斯·切尔尼在夜间利用数千个AI智能体自动执行深度开发任务。他通过手机调度多个会话,每个会话部署多个智能体,核心依靠循环指令和例行任务实现全天候自动化。这套被他视为常规的操作引发了开发者社区的广泛关注,展现了AI从辅助工具向自主工作伙伴的演进趋势。

时间:2026-05-13 21:22
九州风神玄冰600 ARGB版上市 单塔散热器119元起售

九州风神玄冰600 ARGB版上市 单塔散热器119元起售

九州风神推出玄冰600风冷散热器ARGB新版本,解热能力保持260W。黑色款119元,白色款129元。采用单塔6热管设计,优化热管布局以兼容内存。支持英特尔LGA1851 1700及AMDAM4 AM5平台,适配主流机箱。配备聚风环ARGB风扇,最高转速约2200RPM,最大风量68 85CFM,满载噪音约30 93dBA。

时间:2026-05-13 21:21
小米手环10 Pro白色陶瓷版发布 温润如玉颜值出众

小米手环10 Pro白色陶瓷版发布 温润如玉颜值出众

小米手环10Pro本月发布,首次推出白色陶瓷版本,触感温润贴肤。陶瓷版重量超50克,较常规版略重。新品预计在屏幕、续航、运动健康功能及材质质感上全面升级,具体信息待发布会公布。

时间:2026-05-13 21:20
谷歌AI硬件全家桶发布 正面挑战苹果生态

谷歌AI硬件全家桶发布 正面挑战苹果生态

谷歌推出AI硬件计划,核心为GeminiIntelligence功能,将登陆三星及谷歌手机,并推出AI笔记本Googlebook,具备智能光标等交互创新。同时与PC厂商合作,将Gemini深度整合至安卓生态设备,被视为系统重大更新。但面临性能、市场接受度与隐私等挑战。

时间:2026-05-13 21:20
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程