理想高管回应王兴质疑:详解VLA自动驾驶最优方案
12月10日一则消息引发关注:今年8月的世界机器人大会(WRC)上,宇树科技创始人王兴兴对VLA(视觉语言动作模型)提出质疑的言论,在业界激起了广泛讨论。
王兴兴曾表示,对于当前机器人领域备受追捧的VLA技术路线,他持有一定的怀疑态度,甚至直言“这是一个相对‘傻瓜式’的架构”。
原因在于,当VLA模型需要与现实世界进行交互时,其背后支撑的数据质量和数量,往往并不够用。
而就在近日,理想汽车自动驾驶研发高级副总裁@郎咸朋通过微博发表长文,正式回应了此事。
郎咸朋解释道,当时之所以没有立即提出自己的观点,一是因为理想汽车的VLA司机大模型尚未正式发布,空口无凭;二则是我们对于具身机器人行业,仍处于紧密关注与学习阶段。
我与王兴兴观点最核心的差异在于,他强调模型架构本身更为重要,而我则认为模型的关键在于要与整个具身智能系统深度适配。在此基础之上,数据才是真正起决定性作用的要素。
从今年9月VLA正式发布,到12月6日OTA 8.1版本推送,经过两个多月的“实践出真知”后,我有两点深刻体会:第一,VLA就是自动驾驶当前最好的模型方案;第二,具身智能最终比拼的是整个系统的综合能力。
郎咸朋指出,理想的VLA本质上是一个生成式模型,是在用类似GPT的思路做自动驾驶,只不过它生成的“Token”不是文本,而是车辆轨迹与控制信号。
从目前用户的使用反馈来看,在某些场景下,理想的VLA已经具备了对于物理世界的认知涌现能力。具体表现为,用户越来越多地发现,车辆出现了此前从未有过的、更趋近于人类的拟人化驾驶行为。
而且,世界模型更适合扮演“考场”而不是“考生”的角色。在自动驾驶领域,脱离了海量真实数据去空谈模型架构,无异于空中楼阁。我们之所以坚持VLA路线,正是因为我们拥有由数百万辆汽车构建的数据闭环,这让我们能够在当前算力条件下,将自动驾驶水平做到接近人类驾驶员。
针对具身智能方面,要想做好自动驾驶,必须首先将自动驾驶视为一个完整的具身智能系统来对待。系统中的每一部分在研发过程中都需要相互紧密配合,才能将整体价值发挥出来。理想的自动驾驶团队,正是与基座模型、芯片、底盘团队协同作战,共同打造了完整的自动驾驶系统。
同时,模型的关键在于要与整个具身智能系统相匹配,在此基础之上,数据才是起决定意义的。在通用机器人领域获取高质量数据相对困难,但在自动驾驶领域,特别是对于已经建立起数据闭环能力的车企而言,这并非无法攻克的核心难题。
理想汽车不仅可以从过去几年积累的数十亿公里存量数据中进行挖掘和筛选,更可以通过超过150万车主的日常使用,源源不断地获取新的场景数据。
此外,李想前两天也明确提到,未来五到十年,具身机器人的核心将有两种形态:汽车类的具身机器人、人形态的具身机器人。
理想的VLA不仅服务于现有的理想各系列汽车产品形态,也将服务于未来的汽车类具身机器人。


游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
阿里钉钉文档全功能解析在线协同办公套件使用指南
钉钉文档官网 在探讨企业级协同办公解决方案时,钉钉文档无疑是备受瞩目的核心工具之一。作为阿里巴巴钉钉官方推出的旗舰级应用套件,它深度融合了在线文档编辑、智能表格、思维导图等多种高效创作工具。其核心优势在于与钉钉平台生态的无缝衔接,能够直接同步企业内部组织架构与通讯录,实现团队成员间的即时协作与信息流
商汤小浣熊智能助手基于自研大语言模型
在数字化转型浪潮中,高效、易用的数据分析工具已成为企业提升决策效率的关键。商汤科技推出的“办公小浣熊”智能助手,正是基于自研大语言模型打造的一款创新产品,旨在彻底降低数据分析的技术门槛。用户无需掌握编程知识或复杂操作,即可通过自然对话完成从数据查询、处理到可视化洞察的全流程,让数据价值触手可及。 办
MiniMax新一代智能模型矩阵全面解析与应用指南
在人工智能技术快速发展的今天,MiniMax作为一家专注于全栈自研的AI公司,正以其独特的技术路径和前瞻性的布局,在业界脱颖而出。公司致力于构建覆盖文本、图像、语音和视频的新一代多模态智能模型矩阵,这不仅体现了对核心底层技术自主权的深度掌控,也展现了对未来人机交互与内容生成形态的前瞻思考。 那么,M
智能客服机器人解决方案:AI客服系统提升企业服务效率
在数字化转型浪潮中,一套能够深度适配业务、彰显品牌特色的智能客服系统,已成为企业提升服务效率与用户体验的关键工具。然而,市场上许多解决方案往往模式固化,难以满足个性化需求。如何让AI客服不仅具备基础的自动化应答能力,更能承载独特的品牌文化与服务哲学?其核心在于系统是否支持深度的自定义与持续的AI训练
开源企业答疑工具Danswer:高效解决团队知识管理难题
Danswer 是一款专为企业设计的开源智能问答平台,支持用户使用自然语言直接提问,并能够从公司内部文档、知识库等私有数据源中快速检索,提供带有精准来源引用的可靠答案。 核心功能:它如何解答问题? Danswer 的核心价值在于实现了“智能问答”。用户无需再花费大量时间手动搜索和翻阅各类文件,只需像
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

