特斯拉FSD核心技术架构揭秘:最新进展一图看懂

特斯拉也开始用VLA技术了吗?
时隔多年,特斯拉终于再次公开分享技术进展,在计算机视觉顶会ICCV(International Conference on Computer Vision)上曝光了FSD的核心架构。其中一个技术细节引起了行业热议,不少人猜测特斯拉是否也在采用VLA方案。
VLA与世界模型的路线之争,作为2025年最具话题性的技术方向,如今终于迎来马斯克的亲自站台了吗?
特斯拉也在用VLA?
特斯拉自动驾驶副总裁阿肖克·埃鲁斯瓦米(Ashok Elluswamy)近日作为嘉宾,在ICCV上发表了题为《在特斯拉构建机器人基础模型》(Building Foundational Models for Robotics at Tesla)的主题演讲。
这是特斯拉时隔三年首次对外公开技术细节。上一次技术分享还要追溯到2024年的特斯拉AI Day,当时埃鲁斯瓦米也参与了分享,提出的占用网络新范式引领了行业变革。
不过这次演讲内容目前尚未公开,仅流出了一页PPT,但信息量极大,引发了广泛讨论。
从模糊的图像中可以看到,这页PPT的标题是《可解释性与安全性保障》,这些都是当前自动驾驶领域的重要议题。
图像下方展示了FSD的核心架构。目前FSD已经被整合为一张大型神经网络,能够输入多模态信息,图中涉及的内容包括摄像头视频、导航信息、自车运动状态和语音数据。
输出端则包含了全景分割信息、3D占用网络、3D高斯渲染、语言输出,以及特斯拉用省略号代替不想透露的输出信息,最终汇总经过推理后输出动作指令。
这张图显示和隐藏的信息,与国内玩家当前的一些认知不谋而合,主要有两点。
VLA与世界模型之争,迈向大模型阶段
首先,特斯拉当前的架构最终输出了语言信息,引发了很多人的猜测。众所周知,今年行业除了在传感器选型上存在分歧之外,在软件算法路线上也出现了新的争议,即VLA和世界模型之争。
前者以元戎启行和理想为代表,后者以华为和蔚来为代表。也有一些玩家认为应该将二者结合起来。
支持VLA的玩家认为,这种范式一方面可以利用互联网已有的海量数据,积累丰富常识,进而理解世界。另一方面,模型通过语言能力实际上具备了思维链能力,能够理解长时序数据并进行推理。
甚至有从业者表示,个别不走VLA路线的玩家,是因为自身缺乏大算力芯片供应,进而无法承载大模型。
世界模型的拥护者们则坚信,世界模型更接近问题本质。华为车BU CEO靳玉志认为“VLA这样的路径看似取巧,并不能真正走向自动驾驶”。
知名AI科学家、蔚来智能驾驶副总裁任少卿近期在采访中也表示,世界模型在时空认知能力上比VLA具有“更高的带宽”。也就是说,能够识别和利用更多的信息。
不过他也认可语言在当前阶段很重要,在数据训练、逻辑推理和人机交互上有很大价值。
回到特斯拉的曝光信息来看也是如此,语言在自动驾驶中有着很重要的应用。
有人据此认为,特斯拉也在使用VLA技术。但也有人表示这可能只是特斯拉识别到了道路上的标识,然后将其转化为了语言。你怎么看?欢迎在评论区讨论。
其次,综合当前曝光信息来看,特斯拉FSD已步入大模型阶段,而且参数规模仍在扩大。
此前元戎启行在VLA发布会上就认为,行业当前已进入大模型时代。更大参数量的模型,需要更大算力芯片支撑,所以大家可以看到今年涌现了许多1000TOPS甚至2000TOPS的新车。
特斯拉即将上车的新一代智能辅助驾驶芯片,据测算力也将直奔2000TOPS,模型参数也将提高十倍,算法能力值得期待。
或许是出于对未来能力的足够自信,近期FSD重启了激进模式。在这个小版本更新几天前,FSD还重启了疯狂麦克斯模式(Mad Max Mode),整体驾驶风格很激进,有车主分享的视频片段显示,FSD在该模式下带着他在晚上的洛杉矶车流中闪转腾挪,疯狂变道加塞。看上去比开直升机的通勤效率都高。
埃鲁斯瓦米看到后也推荐了两个适用该模式的场景,比如说你快赶不上飞机了,或者说急着接孩子放学。
埃鲁斯瓦米本人的社交平台更新停留在ICCV演讲的前一天,所以关于特斯拉FSD V14如今用了什么魔法,还是未解之谜。
已知的是,特斯拉停止对外分享后,中国玩家仍然在持续突破,不管是VLA还是世界模型,都是在无人区的探索。
即便特斯拉选择了其中一个方向,也不代表这就是标准答案,正如何小鹏所说,“实际上,国内任何一家有实力AI玩家,早就不care马斯克在做什么了”。
车辆本体告别BBA崇拜后,中国自动驾驶算法,也正在告别特斯拉崇拜。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
软件企业出海指南:亚马逊云科技平台选型与优势解析
在全球化日益加深的今天,企业出海已成为拓展国际市场、寻求新增长点的重要途径。但对软件企业而言,如何快速触达全球客户、简化跨国交易流程,却成了加速其业务全球增长的核心难题。亚马逊云科技Marketpl
LangChain融资1.25亿美元:开源AI框架估值125亿成独角兽
开源AI智能体框架供应商LangChain近日宣布完成1 25亿美元新一轮融资,公司估值跃升至12 5亿美元,正式跻身全球科技独角兽行列。本轮融资由知名风投机构IVP领投,谷歌旗下CapitalG与
《古墓丽影》周年纪念版延期至2025年11月登陆PS+
根据PlayStation商店的最新信息,古墓丽影:周年纪念版原计划于2025年10月21日与当月其他PS Plus Extra及Premium层级的游戏同步上线,现确认延期至2025年11月18日
小米汽车11月交付破5万,YU7与SU7共筑双车格局
新能源汽车赛道上,小米汽车正以黑马之姿加速突围。据行业观察,其11月交付量有望突破5万辆,这一数字不仅印证了市场对品牌的认可,更折射出其在产能爬坡与供应链整合上的显著成效。数据显示,第42周(10月
Servo浏览器引擎发布首个官方版本:Rust编写的新里程碑
感谢热心网友孟起就是神提供的线索10月22日,有科技博客发布文章指出,采用Rust语言开发的浏览器引擎Servo于10月20日推出了首个手机游戏本0 0 1。该项目团队表示,未来将按月更新版本,现阶
热门推荐
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程



















