当前位置: 首页
AI
Karpathy加入Anthropic原因解析与团队角色深度解读

Karpathy加入Anthropic原因解析与团队角色深度解读

热心网友 时间:2026-05-20
转载


新智元报道


5月19日,AI界发生了一件足以影响格局走向的大事:OpenAI联合创始人、“Vibe Coding”概念的提出者安德烈·卡帕西(Andrej Karpathy)宣布加入Anthropic的预训练团队。

他的任务很明确:组建一个新团队,用Claude自身来加速预训练研究。消息一出,立刻引发了行业内的广泛讨论。一个师从辛顿和李飞飞、与奥特曼共事、曾是马斯克直接下属的顶尖人物,为何会选择加入竞争对手,并且甘愿在组织架构中处于一个并非顶层的职位?Anthropic又为何对他势在必得?


一个定义行业的人

要理解这次人事变动的分量,首先得理解卡帕西这个人。他的稀缺性,远不止于技术能力——这个级别的研究者虽然不多,但总有一批。他真正的独特之处,在于其定义范式的能力。他总能用一两个词,就改变整个行业理解某个问题的方式。

从多伦多大学时期参加杰弗里·辛顿的读书会,到斯坦福师从李飞飞并一手打造了全球计算机视觉入门“第一神课”CS231n,卡帕西的起点就站在了浪潮之巅。2015年,他成为OpenAI的创始研究科学家;2017年,被马斯克挖至特斯拉担任AI总监,推动自动驾驶走向纯视觉方案。


同年,他在一篇广为流传的文章中提出了“Software 2.0”的概念,将神经网络权重比作新代码,数据集比作源代码,梯度下降比作编译器。这个框架,重塑了人们对编程的认知。

离开特斯拉后,他在YouTube上开设的“Neural Networks: Zero to Hero”系列课程,以及开源项目micrograd、nanoGPT等,都因其极简而精准的风格,被奉为“可运行的教科书”。2025年,他创造的“Vibe Coding”一词甚至被柯林斯词典选为年度词汇。随后提出的“Software 3.0”和“Agent的十年”框架,更是成为当年最受关注的AI叙事之一。


可以说,卡帕西留下的最持久的遗产,并非某个具体产品或论文,而是这些改变了行业思维模式的概念框架。

为何甘居“-2”?

此次加入Anthropic,卡帕西在组织架构中的位置颇值得玩味。他将进入由尼克·约瑟夫领导的预训练团队,而约瑟夫则向Anthropic联合创始人兼CEO达里奥·阿莫代汇报。这意味着,卡帕西在层级上处于第三位。

对于一个即将40岁、早已功成名就且财务自由的人来说,这似乎不是一个“最优”选择。但回顾卡帕西的职业生涯,一条清晰的线索浮现出来:他追逐的从来不是头衔,而是“当下最大、最前沿的实验场”。

2017年去特斯拉,是因为自动驾驶是实践“Software 2.0”理念的最大试验田。2024年离开,是因为架构已定,剩下的主要是工程优化。同年回归OpenAI,是因为ChatGPT与GPT-4带来的爆发期正是最刺激的前沿。2024年创办Eureka Labs,是想验证AI原生教育的假设。而如今加入Anthropic,则是因为他看到了“用AI研究AI”的预训练革命正在这里发生。

每一次离开,都不是出于对前一份工作的不满,而是因为那个“最大的实验”已经转移了阵地。

那么,为什么不是回到OpenAI呢?人才流向本身给出了答案。过去两年,从OpenAI流向Anthropic的核心人物名单令人瞩目:前对齐负责人扬·莱克、联合创始人约翰·舒尔曼,现在则是卡帕西。这种单向流动的趋势,没有任何可比的反向案例。



这背后反映的是两家公司战略重心的分野。OpenAI正日益转向平台化和大规模收购,快速向“AI时代的消费巨头”演进。而对于一个在官宣中明确表示要“回归研发”的研究者来说,Anthropic坚持的“以研究质量取胜”的路线,显然更具吸引力。

Anthropic的“算盘”

Anthropic对卡帕西的渴求,动机是多层次的。

最表层是直接的技术需求。在算力军备竞赛中,背靠微软的OpenAI和坐拥TPU的谷歌拥有天然优势。Anthropic若想胜出,必须找到一条用更少算力训练出更强模型的路径。“用Claude加速预训练研究”正是这条路线,而卡帕西恰好是少数能在大规模训练实践与前沿理论之间架起桥梁的人。

往下一层,是人才吸引人才的“飞轮效应”。连续吸纳OpenAI的核心人物,强化了“一线研究者用脚投票”的叙事,这能显著降低后续吸引其他顶尖人才的心理门槛。

再者,是IPO前的品牌镀金。目前,Anthropic正以约9000亿美元的估值进行巨额融资,并为IPO做准备。卡帕西作为AI领域公众辨识度最高的技术布道者之一——拥有百万订阅的YouTube频道、创造年度词汇、其CLAUDE.md仓库在GitHub上收获超过22万星标——他的加盟,无疑为公司的技术声誉和故事增添了极具分量的一笔。

然而,最具长期价值的一层,或许是卡帕西那无与伦比的“定义范式”的能力。他在Anthropic所做的任何探索,都极有可能通过他的推文、博客或视频被公开谈论和阐释。当他用自己独特的方式为某项技术或趋势命名时,Anthropic便自然而然地成为那个范式的“原产地”。这相当于招聘一位顶级研究者的同时,附带获得了行业里最具影响力的技术叙事者。

飞轮的临界点

将这次人事变动置于更大的技术背景下观察,它可能标志着一个关键的拐点。

2026年4月,Anthropic发布了迄今为止最强大的模型Mythos。其能力之强,甚至超出了开发者的预期。例如,它在未被专门训练网络安全的情况下,自主发现了FreeBSD中一个存在17年的远程代码执行漏洞,以及OpenBSD、FFmpeg中的其他古老缺陷。英国AI安全研究所的评估确认,它是首个能完整执行32步复杂网络攻击模拟的模型。


Anthropic承认,这些能力并非刻意训练所得,而是通用推理与软件工程能力提升后“自然涌现”的结果。这揭示了一个核心逻辑:预训练做得越好,涌现出的能力就越超出预期。

现在,卡帕西要做的,正是拿起Mythos/Claude这把“最强的锤子”,去改进“制造锤子”的工艺本身。即利用AI来发现更优的训练架构、数据配比和实验方向,让模型改进的速度脱离人类研究者的线性节奏,启动“AI改进AI”的进化飞轮。

一旦这个飞轮真正高速运转起来,“AI自我改进预训练”就将从一个研究课题,转变为通往更高级智能的加速通道。届时,当前围绕算力、数据和人才的竞争维度,都可能被彻底改写。

三年内,OpenAI连续失去三位核心人物给同一个竞争对手,这个事实的影响或许比任何融资数字都更为深远。算力可以购买,数据可以积累,但能够亲手启动并推动那个关键进化飞轮的人,全世界屈指可数。卡帕西选择在此时放下自由身份回归一线,显然是他判断,那个决定性的窗口,已经就在眼前。

来源:https://www.163.com/dy/article/KTBJV0D10511ABV6.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
AI生成内容鉴别指南如何判断文章是否为AI撰写

AI生成内容鉴别指南如何判断文章是否为AI撰写

当你阅读一篇文章时,如果隐约感觉它“不太对劲”,缺乏那种人类作者特有的灵光或温度,那么你的直觉可能没错。如今,鉴别AI生成文本已成为一项实用技能。我们可以从语言模式、统计特征、逻辑结构、多模型检测以及跨模态验证这五个维度入手,进行系统性的识别。 一、分析句式规整性与连接词使用频率 人类写作往往带有自

时间:2026-05-20 08:38
Nano Banana 2教程如何保持多人角色相貌一致

Nano Banana 2教程如何保持多人角色相貌一致

在AI生成多人场景时,最令人困扰的问题莫过于角色“脸崩”——明明是同一个角色,在不同画面中却相貌不一,或是服饰发型前后矛盾。如果你在使用Nano Banana 2生成五人团体像时,也遇到了类似的面部不一致、服饰错乱或特征混淆的难题,问题很可能出在提示词隔离、参考图绑定或生成控制环节。 不必焦虑,要让

时间:2026-05-20 08:37
Trae教你用AI优化Web性能代码实战指南

Trae教你用AI优化Web性能代码实战指南

在当今追求极致用户体验的时代,Web性能优化已从“加分项”转变为决定产品竞争力的“核心指标”。传统的优化方法高度依赖工程师的个人经验与手动调试,不仅效率低下,也难以应对复杂多变的用户场景。如今,借助Trae等工具集成的AI能力,我们能够在代码层面实现更智能、更自动化的性能提升。具体而言,AI可以从以

时间:2026-05-20 08:37
DeepSeek并发请求处理能力详解与使用限制

DeepSeek并发请求处理能力详解与使用限制

关于DeepSeek的并发请求处理能力,许多开发者存在一个普遍的认知误区——将其视为一个固定不变的技术指标。实际上,系统的并发上限是一个动态值,它由您选择的部署模式、调用的具体模型版本以及后端资源的实时调度策略共同决定。单纯关注官方文档中“支持2000 QPS”的理论峰值意义有限,在实际生产环境中,

时间:2026-05-20 08:37
多文档AI交叉引用技巧:高效处理与智能关联方法

多文档AI交叉引用技巧:高效处理与智能关联方法

在处理多份文档时,实现内容间的相互关联与彼此印证,是众多研究人员、分析师和专业写作者的核心需求。尽管纳米AI平台并未内置类似Microsoft Word那样的“交叉引用”格式按钮,但这绝不意味着无法实现智能化的引用关联。通过一系列结构化的预处理策略与精准的指令设计,我们不仅能模拟传统工具的引用效果,

时间:2026-05-20 08:37
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程