LeCun批评Hinton认可大语言模型是为退休找借口

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

业界动态

LeCun批评Hinton认可大语言模型是为退休找借口

热心网友时间：2026-05-19

转载

近日，图灵奖得主、人工智能先驱杨立昆（Yann LeCun）在一场深度播客访谈中，系统阐述了他对下一代人工智能发展的独到见解。在这场信息量密集的对话中，他不仅重申了对“世界模型”与JEPA架构的坚定信念，更对当前以大语言模型（LLM）为主导的技术路线提出了根本性质疑，并分享了离开Meta、创立AMI（先进机器智能公司）背后的思考，以及与杰弗里·辛顿（Geoffrey Hinton）、约书亚·本吉奥（Yoshua Bengio）等AI领军人物观点分歧的根源。

大语言模型（LLM）为何不是通向通用人工智能（AGI）的路径

访谈从LeCun新创立的AMI公司开始。主持人指出，这与他当年押注神经网络时的情景相似——再次站在了主流趋势的对立面。LeCun首先澄清，他并非否定LLM的价值与实用性。LLM是许多优秀AI产品的基础，在处理语言任务上表现出色。然而，他尖锐地指出：“LLM并非通向人类水平智能，甚至动物水平智能的正确路径。”

他认为，语言是一种特殊、离散的信号，而现实世界是高维、连续、充满噪声和不确定性的。LLM擅长处理前者，却难以应对后者的复杂物理交互。AMI的目标正是开发能够理解并适应真实物理世界的AI，例如真正的家用服务机器人或L5级全自动驾驶系统。而Meta在全面投入LLM竞赛后，已不再是推进这类探索性基础研究的理想环境。

通往高级智能的关键：世界模型

那么，什么才是实现更高级智能的正确方向？LeCun的答案是构建“世界模型”。这个概念近来虽成热词，但LeCun对其有严格定义。

“本质上，世界模型让一个智能体能够预测自身行为将导致何种后果。”他解释道，“你无法想象一个不具备这种能力的智能系统。如果人类行动前不考虑后果，我们会被视为愚蠢。”拥有预测能力后，智能体便能通过规划、推理和搜索一系列行动来达成目标，而非像LLM那样仅通过自回归预测下一个词元（token）。因此，真正的智能行为需要三大支柱：预测行为后果的能力、通过优化进行规划的能力，以及一个能在抽象层面（而非像素级）进行预测的模型。这正是当前LLM所缺失的核心能力。

实现世界模型的架构：JEPA

如何构建这样的世界模型？LeCun提出了“联合嵌入预测架构”（JEPA）。这一架构的灵感部分源于认知科学中“系统二”的慢思考过程，但更关键的是来自实证研究的启发。

大约五年前，LeCun意识到，所有成功学习了优秀图像和视频表征的架构都是非生成式的。像变分自编码器（VAE）或去噪自编码器这类试图精确重建原始输入的方法效果有限。JEPA则另辟蹊径：它使用两个编码器分别处理原始图像及其经过“破坏”（如遮挡、噪声）的版本，然后训练一个预测器，从后者的抽象表征去预测前者的表征。这种方法放弃了对像素的精确复原，转而学习数据中更本质的抽象关系与潜在结构，为理解世界提供了更高效的框架。

当前具身智能与机器人技术的根本瓶颈

谈及当前火热的机器人领域，LeCun承认那些展示复杂操作的演示令人印象深刻，但他指出了根本性瓶颈：数据效率低下。

现有系统大多依赖模仿学习，需要为每一个新任务收集海量的演示数据，成本高昂且泛化能力弱。而一个拥有世界模型的系统，则有望实现“零样本”学习——面对全新任务，无需专门训练即可通过内部模拟和规划找到解决方案。他以学车为例：“一个青少年只需几十小时就能学会开车。而我们拥有数百万小时的驾驶数据，却仍未实现L5自动驾驶。这恰恰说明，依赖海量数据的模仿学习，连‘开车’这单一任务都未能彻底解决。”

行业现状：硅谷的“羊群效应”与创新惯性

既然新架构前景广阔，为何整个行业仍扎堆于LLM？LeCun将其归因于商业惯性与“羊群效应”。“如果你是OpenAI，你知道继续扩大模型和数据规模就能持续提升效果，从商业角度看，确实缺乏足够动力去探索数据效率更高的路径。”他分析道，“而其他公司也承受不起落后的代价。于是所有人都在深挖同一条战壕。”这正是他将AMI总部设在巴黎、美国办公室设在纽约而非硅谷的原因之一——为了保持独立思考、远离技术同质化的压力。

对于JEPA的发展时间表，他给出了一个大胆预测：“五年内，JEPA类的世界模型将占据主导地位。”他笑着补充这引用了林纳斯·托瓦兹（Linus Torvalds）关于Linux的豪言。但他坚信，JEPA代表了未来智能系统的蓝图，而LLM最终将主要作为语言接口存在。“到2027年初，这一点对所有人都会变得显而易见。”

构建开放生态：Tapestry项目

除了AMI，LeCun还在推动名为“Tapestry”的开放AI模型平台项目。他观察到，随着AI助手普及，全球信息获取可能被少数几家大公司的AI系统所中介，这对中美之外的国家和多样化的语言文化群体不利。

Tapestry旨在构建一个全球协作的开源AI平台，思路类似联邦学习：全球贡献者提供数据与算力，共同训练一个全局共识模型，作为全球知识与文化的数字存储库。参与者无需共享原始数据，只需交换模型参数。最终，任何人都可以基于这个开放的“基座模型”，针对特定语言和文化进行微调。LeCun相信，正如Linux最终成为互联网基础设施的基石，开源与开放协作的力量将在AI领域再次胜出。

历史类比：OpenAI会成为下一个Sun Microsystems吗？

“还记得1996年互联网基础设施的主要玩家吗？是Sun Microsystems、HP、Dell。”LeCun抛出一个历史类比，“那时的Unix系统比Windows可靠得多。但现在呢？整个互联网都运行在Linux上。”他断言，“今天的OpenAI、Anthropic，就像是昨天的Sun和HP-UX。”

这一判断基于他对LLM能力上限的评估。他认为，高质量公开文本数据即将耗尽，闭源模型通过私有数据和合成数据建立的壁垒，终将被开源社区跨越。LLM在数学和代码上的优异表现，恰恰因为语言本身就是这些领域推理的载体。但它缺乏真正的创造性，无法进行概念创新或复杂的系统设计。“它改变的是人类的角色——我们负责决定‘建造什么’，而具体的建造过程可以由LLM辅助完成。”

那么，LLM需要做到什么才能改变他的看法？答案是：实现零样本的智能体行为。即面对一个从未训练过的新任务，能自主理解、规划并完成。“除非这个系统具备预测行为后果并据此规划的能力，否则不可能实现。”而这正是JEPA架构旨在解决的核心问题。

与Hinton和Bengio的分歧根源

谈及与另两位图灵奖得主的分歧，LeCun直言：“不是我改变了主意，是他们的观点发生了变化。”

他回忆，Hinton在GPT-4发布后仿佛经历“顿悟”，认为这些系统已接近人类智能，甚至可能拥有主观体验。LeCun推测，Hinton可能进行了一种粗略的估算，比较了大脑皮层神经元数量与实现反向传播所需的“等效神经元”数量，得出了GPT-4已接近阈值的结论。“我完全不认同这个说法。”LeCun坦言，“我感觉他有点想‘宣布胜利，然后退休’的意味。”不过他也注意到，Hinton近来关于AI危险性的论调已有所缓和。

至于Bengio，LeCun认为其担忧更多在于社会伦理层面——如何确保AI的益处被广泛共享，而非加剧社会不平等。“这并非那种AI统治世界的末日场景，更多是关于‘技术被滥用’的问题。”

LLM的安全性质疑与“目标驱动AI”

LeCun对当前LLM的安全性持根本性质疑。“LLM无法被做到完全可靠，因为你无法从根本上阻止它们产生幻觉（胡言乱语）。”在代码生成等可验证输出的领域，LLM表现尚可，但一旦涉及现实世界的复杂任务，其缺乏常识和无法预测后果的缺陷便暴露无遗。

他举了一个经典例子：当你要求LLM规划“洗车时顺便取咖啡”，它可能会建议你步行前往，完全忽略了汽车是移动工具这一基本常识。虽然LLM后续可通过针对性训练“学会”回答此问题，但这并非真正的理解，只是记忆的体现。

他提出的“目标驱动AI”架构，则试图从系统设计上保障安全。该系统拥有一个世界模型来预测行动后果，并通过优化成本函数来规划行动序列。此外，可以叠加多个目标函数和约束条件，从结构上限制系统做出危险行为。“LLM做不到这一点。它总能找到被‘提示词工程’诱导的漏洞，其训练误差与测试误差之间的鸿沟始终存在。”

离开Meta：战略转向与创新环境的变迁

在Meta任职超过十年并创立FAIR（Facebook AI Research）的LeCun，最终选择了离开。回顾过往，他认为做对的是建立了一个顶级的研究实验室和开放的科研文化。但创新链条在从研究向工程转化的环节常常出现断裂。

他描述了FAIR的演变：早期的小型创新项目（如Llama 1）成功后，公司成立了Gen AI部门进行产品化，这带来了巨大的短期业绩压力，导致团队变得保守，并与研究部门（FAIR）逐渐脱节。当Meta战略全面转向追赶LLM竞赛时，专注于探索性研究（尤其是JEPA这类与公司核心业务直接关联度不高的方向）的环境便不复存在。

“到了2024年初，尤其是2025年，FAIR已经不符合我认为保持前沿创新、进行突破性研究所需的条件了。”他总结道，“很多优秀的人才都离开了。”当主持人追问Scale AI的收购是否是Meta全面聚焦LLM的催化剂时，LeCun给出了肯定的回答，并补充了一个观察：“扎克伯格可能在亚历山大王（Alexandr Wang， Scale AI CEO）身上看到了某种接班人的影子，一个更年轻版本的自己。”

对AI研究者的建议与未来展望

对于有志于AI研究的年轻人，LeCun的建议非常直接：“如果你在读博士，别只做LLM相关研究。没有太大意义，你很难做出独特贡献。”他认为，在学术界单纯研究LLM为何有效、有何局限，属于“描述性科学”，缺乏创造性，且学术界无法提供产业界规模的算力。

他分享了自己在Meta后期的工作重心：自2016年提出世界模型的愿景后，他于2020年左右形成了JEPA的核心想法，并在2024年发表了一篇详尽的愿景论文，公开了所有想法，希望吸引更多人加入这一方向。这一策略确实在FAIR内部凝聚起一个团队。

然而，随着公司战略转向，机器人研究组被裁撤，JEPA的许多应用场景（如工业制造）并非Meta的兴趣所在，FAIR也越来越被要求去支持LLM项目。最终，他感到环境已不再适合推进这项雄心勃勃的基础研究。

整场访谈中，LeCun观点犀利，金句频出。从技术路径的争论，到行业趋势的批判，再到个人职业生涯的抉择，他勾勒出一幅与当前主流叙事截然不同的AI未来图景。其核心信息明确而坚定：LLM虽是目前成功的应用范式，但并非通往通用人工智能的终极答案；真正的智能，源于对世界因果关系的深度理解、模拟与规划。这场关于AI发展方向的“一个人的战争”，他显然已做好了长期探索与奋斗的准备。

来源:https://36kr.com/p/3814630505422597

上一篇： Scale AI被Meta收购后为何发展更佳

下一篇：大厂高管与天才少年为何纷纷投身智能体创业