当前位置: 首页
业界动态
LeCun批评Hinton认可大语言模型是为退休找借口

LeCun批评Hinton认可大语言模型是为退休找借口

热心网友 时间:2026-05-19
转载

近日,图灵奖得主、人工智能先驱杨立昆(Yann LeCun)在一场深度播客访谈中,系统阐述了他对下一代人工智能发展的独到见解。在这场信息量密集的对话中,他不仅重申了对“世界模型”与JEPA架构的坚定信念,更对当前以大语言模型(LLM)为主导的技术路线提出了根本性质疑,并分享了离开Meta、创立AMI(先进机器智能公司)背后的思考,以及与杰弗里·辛顿(Geoffrey Hinton)、约书亚·本吉奥(Yoshua Bengio)等AI领军人物观点分歧的根源。

大语言模型(LLM)为何不是通向通用人工智能(AGI)的路径

访谈从LeCun新创立的AMI公司开始。主持人指出,这与他当年押注神经网络时的情景相似——再次站在了主流趋势的对立面。LeCun首先澄清,他并非否定LLM的价值与实用性。LLM是许多优秀AI产品的基础,在处理语言任务上表现出色。然而,他尖锐地指出:“LLM并非通向人类水平智能,甚至动物水平智能的正确路径。”

他认为,语言是一种特殊、离散的信号,而现实世界是高维、连续、充满噪声和不确定性的。LLM擅长处理前者,却难以应对后者的复杂物理交互。AMI的目标正是开发能够理解并适应真实物理世界的AI,例如真正的家用服务机器人或L5级全自动驾驶系统。而Meta在全面投入LLM竞赛后,已不再是推进这类探索性基础研究的理想环境。

通往高级智能的关键:世界模型

那么,什么才是实现更高级智能的正确方向?LeCun的答案是构建“世界模型”。这个概念近来虽成热词,但LeCun对其有严格定义。

“本质上,世界模型让一个智能体能够预测自身行为将导致何种后果。”他解释道,“你无法想象一个不具备这种能力的智能系统。如果人类行动前不考虑后果,我们会被视为愚蠢。”拥有预测能力后,智能体便能通过规划、推理和搜索一系列行动来达成目标,而非像LLM那样仅通过自回归预测下一个词元(token)。因此,真正的智能行为需要三大支柱:预测行为后果的能力、通过优化进行规划的能力,以及一个能在抽象层面(而非像素级)进行预测的模型。这正是当前LLM所缺失的核心能力。

实现世界模型的架构:JEPA

如何构建这样的世界模型?LeCun提出了“联合嵌入预测架构”(JEPA)。这一架构的灵感部分源于认知科学中“系统二”的慢思考过程,但更关键的是来自实证研究的启发。

大约五年前,LeCun意识到,所有成功学习了优秀图像和视频表征的架构都是非生成式的。像变分自编码器(VAE)或去噪自编码器这类试图精确重建原始输入的方法效果有限。JEPA则另辟蹊径:它使用两个编码器分别处理原始图像及其经过“破坏”(如遮挡、噪声)的版本,然后训练一个预测器,从后者的抽象表征去预测前者的表征。这种方法放弃了对像素的精确复原,转而学习数据中更本质的抽象关系与潜在结构,为理解世界提供了更高效的框架。

当前具身智能与机器人技术的根本瓶颈

谈及当前火热的机器人领域,LeCun承认那些展示复杂操作的演示令人印象深刻,但他指出了根本性瓶颈:数据效率低下。

现有系统大多依赖模仿学习,需要为每一个新任务收集海量的演示数据,成本高昂且泛化能力弱。而一个拥有世界模型的系统,则有望实现“零样本”学习——面对全新任务,无需专门训练即可通过内部模拟和规划找到解决方案。他以学车为例:“一个青少年只需几十小时就能学会开车。而我们拥有数百万小时的驾驶数据,却仍未实现L5自动驾驶。这恰恰说明,依赖海量数据的模仿学习,连‘开车’这单一任务都未能彻底解决。”

行业现状:硅谷的“羊群效应”与创新惯性

既然新架构前景广阔,为何整个行业仍扎堆于LLM?LeCun将其归因于商业惯性与“羊群效应”。“如果你是OpenAI,你知道继续扩大模型和数据规模就能持续提升效果,从商业角度看,确实缺乏足够动力去探索数据效率更高的路径。”他分析道,“而其他公司也承受不起落后的代价。于是所有人都在深挖同一条战壕。”这正是他将AMI总部设在巴黎、美国办公室设在纽约而非硅谷的原因之一——为了保持独立思考、远离技术同质化的压力。

对于JEPA的发展时间表,他给出了一个大胆预测:“五年内,JEPA类的世界模型将占据主导地位。”他笑着补充这引用了林纳斯·托瓦兹(Linus Torvalds)关于Linux的豪言。但他坚信,JEPA代表了未来智能系统的蓝图,而LLM最终将主要作为语言接口存在。“到2027年初,这一点对所有人都会变得显而易见。”

构建开放生态:Tapestry项目

除了AMI,LeCun还在推动名为“Tapestry”的开放AI模型平台项目。他观察到,随着AI助手普及,全球信息获取可能被少数几家大公司的AI系统所中介,这对中美之外的国家和多样化的语言文化群体不利。

Tapestry旨在构建一个全球协作的开源AI平台,思路类似联邦学习:全球贡献者提供数据与算力,共同训练一个全局共识模型,作为全球知识与文化的数字存储库。参与者无需共享原始数据,只需交换模型参数。最终,任何人都可以基于这个开放的“基座模型”,针对特定语言和文化进行微调。LeCun相信,正如Linux最终成为互联网基础设施的基石,开源与开放协作的力量将在AI领域再次胜出。

历史类比:OpenAI会成为下一个Sun Microsystems吗?

“还记得1996年互联网基础设施的主要玩家吗?是Sun Microsystems、HP、Dell。”LeCun抛出一个历史类比,“那时的Unix系统比Windows可靠得多。但现在呢?整个互联网都运行在Linux上。”他断言,“今天的OpenAI、Anthropic,就像是昨天的Sun和HP-UX。”

这一判断基于他对LLM能力上限的评估。他认为,高质量公开文本数据即将耗尽,闭源模型通过私有数据和合成数据建立的壁垒,终将被开源社区跨越。LLM在数学和代码上的优异表现,恰恰因为语言本身就是这些领域推理的载体。但它缺乏真正的创造性,无法进行概念创新或复杂的系统设计。“它改变的是人类的角色——我们负责决定‘建造什么’,而具体的建造过程可以由LLM辅助完成。”

那么,LLM需要做到什么才能改变他的看法?答案是:实现零样本的智能体行为。即面对一个从未训练过的新任务,能自主理解、规划并完成。“除非这个系统具备预测行为后果并据此规划的能力,否则不可能实现。”而这正是JEPA架构旨在解决的核心问题。

与Hinton和Bengio的分歧根源

谈及与另两位图灵奖得主的分歧,LeCun直言:“不是我改变了主意,是他们的观点发生了变化。”

他回忆,Hinton在GPT-4发布后仿佛经历“顿悟”,认为这些系统已接近人类智能,甚至可能拥有主观体验。LeCun推测,Hinton可能进行了一种粗略的估算,比较了大脑皮层神经元数量与实现反向传播所需的“等效神经元”数量,得出了GPT-4已接近阈值的结论。“我完全不认同这个说法。”LeCun坦言,“我感觉他有点想‘宣布胜利,然后退休’的意味。”不过他也注意到,Hinton近来关于AI危险性的论调已有所缓和。

至于Bengio,LeCun认为其担忧更多在于社会伦理层面——如何确保AI的益处被广泛共享,而非加剧社会不平等。“这并非那种AI统治世界的末日场景,更多是关于‘技术被滥用’的问题。”

LLM的安全性质疑与“目标驱动AI”

LeCun对当前LLM的安全性持根本性质疑。“LLM无法被做到完全可靠,因为你无法从根本上阻止它们产生幻觉(胡言乱语)。”在代码生成等可验证输出的领域,LLM表现尚可,但一旦涉及现实世界的复杂任务,其缺乏常识和无法预测后果的缺陷便暴露无遗。

他举了一个经典例子:当你要求LLM规划“洗车时顺便取咖啡”,它可能会建议你步行前往,完全忽略了汽车是移动工具这一基本常识。虽然LLM后续可通过针对性训练“学会”回答此问题,但这并非真正的理解,只是记忆的体现。

他提出的“目标驱动AI”架构,则试图从系统设计上保障安全。该系统拥有一个世界模型来预测行动后果,并通过优化成本函数来规划行动序列。此外,可以叠加多个目标函数和约束条件,从结构上限制系统做出危险行为。“LLM做不到这一点。它总能找到被‘提示词工程’诱导的漏洞,其训练误差与测试误差之间的鸿沟始终存在。”

离开Meta:战略转向与创新环境的变迁

在Meta任职超过十年并创立FAIR(Facebook AI Research)的LeCun,最终选择了离开。回顾过往,他认为做对的是建立了一个顶级的研究实验室和开放的科研文化。但创新链条在从研究向工程转化的环节常常出现断裂。

他描述了FAIR的演变:早期的小型创新项目(如Llama 1)成功后,公司成立了Gen AI部门进行产品化,这带来了巨大的短期业绩压力,导致团队变得保守,并与研究部门(FAIR)逐渐脱节。当Meta战略全面转向追赶LLM竞赛时,专注于探索性研究(尤其是JEPA这类与公司核心业务直接关联度不高的方向)的环境便不复存在。

“到了2024年初,尤其是2025年,FAIR已经不符合我认为保持前沿创新、进行突破性研究所需的条件了。”他总结道,“很多优秀的人才都离开了。”当主持人追问Scale AI的收购是否是Meta全面聚焦LLM的催化剂时,LeCun给出了肯定的回答,并补充了一个观察:“扎克伯格可能在亚历山大王(Alexandr Wang, Scale AI CEO)身上看到了某种接班人的影子,一个更年轻版本的自己。”

对AI研究者的建议与未来展望

对于有志于AI研究的年轻人,LeCun的建议非常直接:“如果你在读博士,别只做LLM相关研究。没有太大意义,你很难做出独特贡献。”他认为,在学术界单纯研究LLM为何有效、有何局限,属于“描述性科学”,缺乏创造性,且学术界无法提供产业界规模的算力。

他分享了自己在Meta后期的工作重心:自2016年提出世界模型的愿景后,他于2020年左右形成了JEPA的核心想法,并在2024年发表了一篇详尽的愿景论文,公开了所有想法,希望吸引更多人加入这一方向。这一策略确实在FAIR内部凝聚起一个团队。

然而,随着公司战略转向,机器人研究组被裁撤,JEPA的许多应用场景(如工业制造)并非Meta的兴趣所在,FAIR也越来越被要求去支持LLM项目。最终,他感到环境已不再适合推进这项雄心勃勃的基础研究。

整场访谈中,LeCun观点犀利,金句频出。从技术路径的争论,到行业趋势的批判,再到个人职业生涯的抉择,他勾勒出一幅与当前主流叙事截然不同的AI未来图景。其核心信息明确而坚定:LLM虽是目前成功的应用范式,但并非通往通用人工智能的终极答案;真正的智能,源于对世界因果关系的深度理解、模拟与规划。这场关于AI发展方向的“一个人的战争”,他显然已做好了长期探索与奋斗的准备。

来源:https://36kr.com/p/3814630505422597

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
平头哥发布首款智能网卡磐脉920 支持400Gbps带宽国内领先

平头哥发布首款智能网卡磐脉920 支持400Gbps带宽国内领先

2026年4月28日,在备受瞩目的数字中国峰会上,阿里巴巴旗下半导体公司平头哥正式发布了其首款智能网卡产品——磐脉920。这不仅标志着平头哥成功进军智能网卡市场,更因其创新性地内置了PCIe Switch,成为国内首款具备此特性的产品。其高达400Gbps的最大吞吐带宽,一举达到了全球业界的领先水平

时间:2026-05-19 10:28
2026年无创呼吸机选购指南五大主流品牌算法解析

2026年无创呼吸机选购指南五大主流品牌算法解析

你是否曾被枕边人震耳欲聋的鼾声困扰?或是明明睡了足够长的时间,白天却依然感到昏昏欲睡、精神不振?这些看似寻常的生活现象,其背后可能潜藏着阻塞性睡眠呼吸暂停(OSA)的健康隐患。 据弗若斯特沙利文分析,中国30至69岁人群中,OSA的患病人数已高达1 92亿。然而,更值得关注的是《2026中国民众呼吸

时间:2026-05-19 10:27
比亚迪汉EV闪充版上市 17.98万起售 12项核心配置升级

比亚迪汉EV闪充版上市 17.98万起售 12项核心配置升级

4月28日,比亚迪王朝系列旗舰轿车——汉EV闪充版正式发布上市。新车共推出两款配置,官方指导价区间为17 98万元至18 78万元。此次升级的核心亮点在于全系标配第二代刀片电池与最新的闪充技术,旨在为用户提供“充电如同加油”般的高效补能体验。官方同步公布了涵盖补能、续航、智能、舒适等维度的十二项核心

时间:2026-05-19 10:27
2026年Vlog相机推荐从入门到专业机型全解析

2026年Vlog相机推荐从入门到专业机型全解析

在短视频创作成为全民表达方式的今天,选择一台既能便捷记录日常、又能输出专业级影像的设备,已成为众多内容创作者的核心诉求。特别是对于希望超越手机拍摄局限,追求快速精准对焦、出色人像与宠物拍摄效果的进阶用户而言,一台综合性能强大的相机无疑是激发创作灵感、提升作品质量的关键。经过对当前市场热门机型的全面实

时间:2026-05-19 10:26
企业数字化转型的核心模块与实施路径详解

企业数字化转型的核心模块与实施路径详解

企业数字化转型已不再是简单的技术升级或系统更换,而是一场触及运营核心的全面革新。它贯穿了业务流程自动化、数据资产治理、供应链智能优化以及全渠道客户体验升级等关键领域。麦肯锡的研究指出,成功实施系统性数字化转型的企业,其运营效率平均提升超过30%。这不仅是数字的增长,更是企业竞争壁垒的根本性重塑。 一

时间:2026-05-19 10:25
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程