首页
科技
特斯拉FSD核心技术架构揭秘:最新进展一图看懂

特斯拉FSD核心技术架构揭秘:最新进展一图看懂

热心网友
转载
2025-10-22
来源:https://36kr.com/p/3519984081869697

特斯拉也开始用VLA技术了吗?

时隔多年,特斯拉终于再次公开分享技术进展,在计算机视觉顶会ICCV(International Conference on Computer Vision)上曝光了FSD的核心架构。其中一个技术细节引起了行业热议,不少人猜测特斯拉是否也在采用VLA方案。

VLA与世界模型的路线之争,作为2025年最具话题性的技术方向,如今终于迎来马斯克的亲自站台了吗?

特斯拉也在用VLA?

特斯拉自动驾驶副总裁阿肖克·埃鲁斯瓦米(Ashok Elluswamy)近日作为嘉宾,在ICCV上发表了题为《在特斯拉构建机器人基础模型》(Building Foundational Models for Robotics at Tesla)的主题演讲。

这是特斯拉时隔三年首次对外公开技术细节。上一次技术分享还要追溯到2024年的特斯拉AI Day,当时埃鲁斯瓦米也参与了分享,提出的占用网络新范式引领了行业变革。

不过这次演讲内容目前尚未公开,仅流出了一页PPT,但信息量极大,引发了广泛讨论。

从模糊的图像中可以看到,这页PPT的标题是《可解释性与安全性保障》,这些都是当前自动驾驶领域的重要议题。

图像下方展示了FSD的核心架构。目前FSD已经被整合为一张大型神经网络,能够输入多模态信息,图中涉及的内容包括摄像头视频、导航信息、自车运动状态和语音数据。

输出端则包含了全景分割信息、3D占用网络、3D高斯渲染、语言输出,以及特斯拉用省略号代替不想透露的输出信息,最终汇总经过推理后输出动作指令。

这张图显示和隐藏的信息,与国内玩家当前的一些认知不谋而合,主要有两点。

VLA与世界模型之争,迈向大模型阶段

首先,特斯拉当前的架构最终输出了语言信息,引发了很多人的猜测。众所周知,今年行业除了在传感器选型上存在分歧之外,在软件算法路线上也出现了新的争议,即VLA和世界模型之争。

前者以元戎启行和理想为代表,后者以华为和蔚来为代表。也有一些玩家认为应该将二者结合起来。

支持VLA的玩家认为,这种范式一方面可以利用互联网已有的海量数据,积累丰富常识,进而理解世界。另一方面,模型通过语言能力实际上具备了思维链能力,能够理解长时序数据并进行推理。

甚至有从业者表示,个别不走VLA路线的玩家,是因为自身缺乏大算力芯片供应,进而无法承载大模型。

世界模型的拥护者们则坚信,世界模型更接近问题本质。华为车BU CEO靳玉志认为“VLA这样的路径看似取巧,并不能真正走向自动驾驶”。

知名AI科学家、蔚来智能驾驶副总裁任少卿近期在采访中也表示,世界模型在时空认知能力上比VLA具有“更高的带宽”。也就是说,能够识别和利用更多的信息。

不过他也认可语言在当前阶段很重要,在数据训练、逻辑推理和人机交互上有很大价值。

回到特斯拉的曝光信息来看也是如此,语言在自动驾驶中有着很重要的应用。

有人据此认为,特斯拉也在使用VLA技术。但也有人表示这可能只是特斯拉识别到了道路上的标识,然后将其转化为了语言。你怎么看?欢迎在评论区讨论。

其次,综合当前曝光信息来看,特斯拉FSD已步入大模型阶段,而且参数规模仍在扩大。

此前元戎启行在VLA发布会上就认为,行业当前已进入大模型时代。更大参数量的模型,需要更大算力芯片支撑,所以大家可以看到今年涌现了许多1000TOPS甚至2000TOPS的新车。

特斯拉即将上车的新一代智能辅助驾驶芯片,据测算力也将直奔2000TOPS,模型参数也将提高十倍,算法能力值得期待。

或许是出于对未来能力的足够自信,近期FSD重启了激进模式。在这个小版本更新几天前,FSD还重启了疯狂麦克斯模式(Mad Max Mode),整体驾驶风格很激进,有车主分享的视频片段显示,FSD在该模式下带着他在晚上的洛杉矶车流中闪转腾挪,疯狂变道加塞。看上去比开直升机的通勤效率都高。

埃鲁斯瓦米看到后也推荐了两个适用该模式的场景,比如说你快赶不上飞机了,或者说急着接孩子放学。

埃鲁斯瓦米本人的社交平台更新停留在ICCV演讲的前一天,所以关于特斯拉FSD V14如今用了什么魔法,还是未解之谜。

已知的是,特斯拉停止对外分享后,中国玩家仍然在持续突破,不管是VLA还是世界模型,都是在无人区的探索。

即便特斯拉选择了其中一个方向,也不代表这就是标准答案,正如何小鹏所说,“实际上,国内任何一家有实力AI玩家,早就不care马斯克在做什么了”。

车辆本体告别BBA崇拜后,中国自动驾驶算法,也正在告别特斯拉崇拜。

免责声明

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章

软件企业出海指南:亚马逊云科技平台选型与优势解析

在全球化日益加深的今天,企业出海已成为拓展国际市场、寻求新增长点的重要途径。但对软件企业而言,如何快速触达全球客户、简化跨国交易流程,却成了加速其业务全球增长的核心难题。亚马逊云科技Marketpl

2025-10-22.

LangChain融资1.25亿美元:开源AI框架估值125亿成独角兽

开源AI智能体框架供应商LangChain近日宣布完成1 25亿美元新一轮融资,公司估值跃升至12 5亿美元,正式跻身全球科技独角兽行列。本轮融资由知名风投机构IVP领投,谷歌旗下CapitalG与

2025-10-22.

《古墓丽影》周年纪念版延期至2025年11月登陆PS+

根据PlayStation商店的最新信息,古墓丽影:周年纪念版原计划于2025年10月21日与当月其他PS Plus Extra及Premium层级的游戏同步上线,现确认延期至2025年11月18日

2025-10-22.

小米汽车11月交付破5万,YU7与SU7共筑双车格局

新能源汽车赛道上,小米汽车正以黑马之姿加速突围。据行业观察,其11月交付量有望突破5万辆,这一数字不仅印证了市场对品牌的认可,更折射出其在产能爬坡与供应链整合上的显著成效。数据显示,第42周(10月

2025-10-22.

Servo浏览器引擎发布首个官方版本:Rust编写的新里程碑

感谢热心网友孟起就是神提供的线索10月22日,有科技博客发布文章指出,采用Rust语言开发的浏览器引擎Servo于10月20日推出了首个手机游戏本0 0 1。该项目团队表示,未来将按月更新版本,现阶

2025-10-22.

热门教程

更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程

最新下载

更多
恐怖老师正
恐怖老师正 休闲益智 2025-10-22更新
查看
萌宠传奇消游戏
萌宠传奇消游戏 休闲益智 2025-10-22更新
查看
戏法门
戏法门 动作冒险 2025-10-22更新
查看
我叫MT2
我叫MT2 角色扮演 2025-10-22更新
查看
雷神战纪
雷神战纪 角色扮演 2025-10-22更新
查看
星骸骑士
星骸骑士 棋牌策略 2025-10-22更新
查看
拆迁破坏模拟器
拆迁破坏模拟器 模拟经营 2025-10-22更新
查看
一骑当千2游戏
一骑当千2游戏 角色扮演 2025-10-22更新
查看
元气战纪手游
元气战纪手游 棋牌策略 2025-10-22更新
查看
权倾三国正
权倾三国正 棋牌策略 2025-10-22更新
查看