当前位置: 首页
AI
自动驾驶已实现通用人工智能汽车本质是机器人

自动驾驶已实现通用人工智能汽车本质是机器人

热心网友 时间:2026-05-16
转载

自己夸自己千句,不如旁人赞你一句。

这话放在科技圈也一样。马斯克在播客和推特上没少夸特斯拉的自动驾驶和机器人“天下第一”,但听多了,难免让人觉得有些“王婆卖瓜”。不过,最近情况有点不一样。AI领域的顶尖专家安德烈·卡帕西(Andrej Karpathy)在一档名为《No Priors》的播客节目中现身,分享了不少他在特斯拉工作时的内部观察,以及对行业未来的深刻见解。这些来自“前朝重臣”的一手信息,显然更有分量。

卡帕西的履历堪称传奇:早年追随马斯克从OpenAI转战特斯拉,从零开始搭建了特斯拉的自动驾驶视觉团队,是FSD(完全自动驾驶)核心技术的奠基人之一。然而,随着团队壮大,他的角色从技术专家转向管理者,这与他醉心于从零构建事物的初衷相悖。于是,他做出了那个“艰难的决定”,在团队能够自主运行后,离开了特斯拉。

此后,他短暂回归OpenAI,又因相似原因离开。今年七月,他创立了自己的初创公司Eureka Labs,专注于AI与教育的结合。尽管已自立门户,卡帕西对特斯拉的感情依然深厚。在访谈中,他毫不掩饰对特斯拉在通用人工智能(AGI)、机器人及自动驾驶领域布局的赞赏,甚至透露了未来可能重返特斯拉的意愿。

在这场信息量巨大的对话中,卡帕西不仅回顾了特斯拉在自动驾驶和人形机器人上的技术路径,更分享了他对Scaling Law(规模定律)、AI发展瓶颈以及AI教育未来的独到思考。

自动驾驶:软件与硬件的路线之争

当被问及自动驾驶技术的现状时,卡帕西给出了一个大胆的判断:当前的自动驾驶系统,在能力上已经接近AGI的水平。 他回忆,十年前第一次体验Waymo的演示时,其在一个封闭街区内的表现就已近乎完美。十年过去,这项技术终于从演示走向了商业化产品。

那么,阻碍其全面普及的到底是什么?是技术还是监管?

卡帕西认为两者皆有。从演示到实际部署,需要处理海量的“长尾问题”;而全球范围内的法规批准更是漫长。但他对特斯拉的路线充满信心,并直言不讳地比较了特斯拉与Waymo的差异:

“很多人认为Waymo领先,但我认为特斯拉更具优势。特斯拉的核心是软件问题,而Waymo更多是硬件问题。软件问题比硬件问题更容易解决。”

他进一步解释,特斯拉已经实现了全球规模的车辆部署,而Waymo仍在为规模化挣扎。一旦特斯拉的软件方案彻底跑通,其爆发力将非常惊人。他刚刚体验了特斯拉的最新版本,对其表现印象深刻。

关于特斯拉备受争议的“纯视觉”方案,卡帕西透露了一个关键细节:特斯拉在训练阶段其实使用了包括激光雷达在内的多种昂贵传感器来构建高精地图和收集数据,只是在最终车辆部署时移除了这些传感器。 这种“训练用多传感器,部署用纯视觉”的策略非常聪明,既利用了多源数据优化算法,又保证了量产车的成本与可靠性。

至于从传统模块化架构转向“端到端”深度学习,卡帕西指出这正是特斯拉明确的方向。系统里的C++代码正在被神经网络逐步取代。他预测,未来理想的系统将是直接输入视频流,输出驾驶指令的纯神经网络。当然,这需要克服监督信号不足等挑战,而中间层的表征学习将是关键。

人形机器人:特斯拉是一家机器人公司

谈到特斯拉的Optimus人形机器人项目,卡帕西的观点非常鲜明:“特斯拉本质上是一家机器人公司,而非汽车公司。”

他解释说,汽车本身就是一种机器人。而特斯拉真正的核心竞争力在于“规模化制造”的能力——不仅是制造产品,更是制造生产产品的机器。这种能力可以无缝迁移到人形机器人上。

“事实上,早期版本的Optimus机器人一度‘以为’自己是辆汽车,”卡帕西分享了一个有趣的细节,“因为它使用了完全相同的计算机和摄像头,运行着汽车的算法。它在办公室里移动,试图识别‘可驾驶空间’,而实际上它面对的是步行空间。” 这个例子生动地说明了技术迁移的可行性与初期需要做的适配。

Optimus项目的启动速度之快,也印证了特斯拉内部积累的深厚工程能力。马斯克一声令下,所有的工具链、供应链、制造经验都能迅速被重新配置到机器人项目上。

对于人形机器人的商业化路径,卡帕西给出了一个务实的推演:

  1. 内部孵化:首先在自家工厂应用,处理物料搬运等任务,规避早期B2B合同的法律与安全复杂性。
  2. B2B拓展:随后进入拥有大型仓库的企业市场。
  3. B2C普及:最后才是进入消费级市场。

他特别提到了一个让他兴奋的“吹叶机挑战”:希望未来Optimus能灵巧地捡起街上的每一片落叶,取代噪音巨大的传统吹叶机。

为何要坚持“人形”设计?卡帕西给出了几个核心理由:

  • 集中化研发:每个机器人平台的固定成本极高,聚焦于一个通用平台(人形)更经济。
  • 数据收集优势:人类可以轻松地为“人形”机器人进行动作演示和数据标注,这常被忽视。
  • 多任务学习:如同大语言模型在统一文本领域学习各种任务,一个通用的人形平台能让AI在不同物理任务间共享知识,实现能力迁移。

Scaling Law与“数据墙”:架构已成熟,数据是王道

作为Transformer架构的布道者之一,卡帕西盛赞其革命性意义。他认为Transformer不仅仅是一个神经网络,更是一个“可微分计算机”,其出现让Scaling Law变得清晰可见,是算法领域一个偶然发现的“奇迹”。

然而,他认为当前AI发展的瓶颈已经转移。“神经网络的架构不再是瓶颈,至少Transformer不是了。” 他指出,像Llama这样的主流模型,其架构相比五年前并无根本性变革,微小的调整只能带来个位数的性能提升。

真正的瓶颈在于数据。互联网上的公开文本数据只是一个“近似解”,并非AI训练的“理想数据”。我们真正需要的是能反映人类思维链条和推理过程的“内心独白”式数据。

因此,合成数据将成为未来的关键。但卡帕西发出了重要警告:必须警惕合成数据导致的“模式坍塌”和“熵减”。如果让AI生成训练下一代AI的数据,很容易陷入输出越来越单一、缺乏多样性的循环,最终导致数据集“贫瘠化”。

他举例说,就像让ChatGPT讲笑话,它可能反复只输出那几个套路。解决之道在于精心设计数据生成过程,例如为合成数据注入丰富的角色和背景,强制模型探索更广阔的可能性空间,以保持数据集的“活力”。

人工智能与未来教育:AI作为“学习伴侣”

最后,卡帕西谈到了他目前全心投入的AI教育领域。他深受“一对一辅导能极大提升学习效果”这一经典研究的启发,认为AI的终极目标不应仅是替代人类,更应是赋能于人。

他构想的未来教育模式是:由人类顶尖教师负责设计核心课程内容与教学法,而AI则扮演前端的“超级助教”角色。 这个AI助教可以7x24小时以任何语言与学生互动,解释概念、答疑解惑、引导学习路径,从而实现高质量的个性化教育普惠。

当然,他也承认,当前AI在“适应性学习”方面还处于非常早期的阶段。现有的模型擅长翻译和呈现内容,但要真正理解学生的学习状态、知识背景并动态调整教学策略,还有很长的路要走。目前看到的更多是演示效果,而非成熟产品。

卡帕西的这次分享,像是一次坦诚的“技术复盘”。他从亲历者的视角,勾勒出特斯拉在自动驾驶和机器人领域独特的技术哲学与务实路径,同时也以前瞻者的眼光,指出了整个AI行业在数据与教育应用上面临的挑战与机遇。这些思考,无疑比任何宣传口号都更有价值。

来源:https://www.leiphone.com/category/ai/7dT9TmehaFsBqn49.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
百川智能联合创始人谢剑离职内幕与未来动向

百川智能联合创始人谢剑离职内幕与未来动向

百川智能联合创始人谢剑即将离职,原因与去向未明。谢剑拥有深厚AI研发管理经验,曾参与百度核心业务,2023年与王小川共同创立百川智能并取得多项技术成果。近期该公司高管持续动荡,商业化、医疗、金融业务负责人及联合创始人等相继离开,创始团队仅剩两人。密集人事变动或预示行业面临。

时间:2026-05-16 10:48
DeepSeek强化学习与通用人工智能发展路径深度解析

DeepSeek强化学习与通用人工智能发展路径深度解析

DeepSeek通过大规模强化学习替代监督微调,显著提升推理能力。研究证实从指令微调到强化学习的训练路径有效,并在隐式推理、符号神经融合、混合智能体及数学推理等领域取得进展。

时间:2026-05-16 10:48
百度云企业级大模型应用落地产业实践与对话

百度云企业级大模型应用落地产业实践与对话

AI大模型正从技术探索转向产业落地。百度以文心大模型为基础,结合算力平台,推动其在金融、医疗等领域的应用。智能客服、数字人定制、编程工具等产品,分别助力企业降本增效、满足场景需求并提升开发效率。统一的基础设施进一步降低了应用门槛与复杂度。

时间:2026-05-16 10:48
夸克AI务实进阶:从浪潮到落地应用之路

夸克AI务实进阶:从浪潮到落地应用之路

夸克从搜索转向AI助理更易被接受,因其在用户熟悉路径中嵌入能力,顺应使用习惯。产品注重设计:页面纯净、交互流畅,如模拟问诊引导描述病情。功能从场景出发,力求一步到位。近期PC端升级为“系统级全场景AI”,渗透数字生活,以精准答案回应传统搜索痛点。行业竞争显示,卓越体验需技术通过产品。

时间:2026-05-16 10:48
AI陪伴赛道能否复制泡泡玛特的商业奇迹

AI陪伴赛道能否复制泡泡玛特的商业奇迹

AI正从工具转向情感陪伴,核心从解决问题变为共度时光,以满足现代人情感需求。这需平衡技术可控性、沉浸感与人设鲜活度,并通过角色定义与个性化互动建立连接。硬件凭借“在场感”占优,软件则迭代更快。市场出海取决于定位与资源。尽管挑战众多,该领域已展现出创造深度情感连接的潜力。

时间:2026-05-16 10:47
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程