当前位置: 首页
科技数码
Transformer论文作者Noam Shazeer离开谷歌加入OpenAI

Transformer论文作者Noam Shazeer离开谷歌加入OpenAI

热心网友 时间:2026-06-22
转载

6月18日,一条消息在AI圈炸开了锅:Google DeepMind工程副总裁、Gemini模型联合负责人Noam Shazeer宣布离职,下一站是OpenAI。

帖文的措辞相当客气,他说这是个“艰难的决定”,并对老东家团队表达了“无比自豪”。几乎同一时间,OpenAI也向内部员工通报了这则人事变动。


图丨相关推文(来源:X)

Shazeer的名字,在AI领域的分量不亚于摇滚巨星。2017年,他是划时代论文《Attention Is All You Need》的共同作者之一,Transformer架构从此诞生。这篇论文至今被引用超过25万次,堪称21世纪计算机科学的里程碑,也奠定了当今大模型技术的共同基石。

Transformer只是他履历的一部分。他还是稀疏混合专家模型(MoE)的先驱,深度参与T5、Switch Transformer等关键研究。今天各家实验室普遍采用的MoE架构思路,相当一部分可以追溯到他的研究成果。2024年,《时代》杂志把他列入了全球AI最具影响力100人名单。


图丨Noam Shazeer(来源:Youtube)

Shazeer与Google的缘分要追溯到2000年。早年他改进过搜索的拼写纠错系统,后来深度参与了多项核心AI研发。但转折点出现在2020年前后:他和同事Daniel De Freitas开发的聊天机器人Meena,因Google出于安全与产品风险考量而拒绝发布。两人因此深感沮丧,并在2024年选择离开,创办了Character.AI。

Character.AI主打让用户与AI角色聊天的社交产品。到2024年3月,它的估值已经飙到10亿美元。然而,这个创业故事并没有按照常规剧本发展。

2024年8月,Google通过一种近似“反向收购雇佣”(reverse acqui-hire)的方式请回了Shazeer:没有直接收购公司,而是获取了Character.AI技术的非独家授权,同时让Shazeer、De Freitas及部分核心成员加入Google DeepMind。

多家媒体报道称,交易金额约为27亿美元。算下来,Shazeer持有Character.AI约30%至40%的股份,他个人在这场交易中的收益估计在7.5亿至10亿美元之间。

回到Google后,Shazeer拿到了一个极高规格的职位:Gemini项目的技术联合负责人,与Jeff Dean和Oriol Vinyals并列。2026年2月,他还当选了美国国家工程院院士。

据硅谷业内流传的说法,Shazeer回归后在Gemini项目中发现了一个深层bug,修复后显著提升了模型训练效率,使Gemini在部分基准测试上超越了ChatGPT。DeepMind负责人Demis Hassabis虽然在AGI路径上与Shazeer理念不完全一致,但据报道他在用人方面颇有手腕,通过个人关系和管理技巧维持了合作。从任何角度看,Google都给出了最高规格的挽留。但最终,还是没留住。

OpenAI目前尚未公布Shazeer将担任何种职务。不过,他的加入显然是一次重要的技术实力补强。对一家仍处于前沿模型竞赛中心的公司来说,Shazeer这样的研究者,不只是论文履历那么简单——他带来了模型架构、训练效率、工程判断和大规模系统经验的完整拼图。

某种程度上,Shazeer的流动,也是Transformer论文八位作者命运的一个缩影。这篇划时代论文的作者们早已各奔东西:Aidan Gomez联合创办Cohere;Ashish Vaswani和Niki Parmar先后创办Adept AI和Essential AI;Llion Jones前往日本创办Sakana AI;Łukasz Kaiser加入OpenAI。八位作者中,已没有一个人始终留在Google。发明了Transformer的公司,反复失去发明Transformer的人。

这也折射出AI人才市场更残酷的现实:能够参与前沿模型研发的顶级研究者,数量极其有限。围绕他们的争夺,计价单位已经是数亿乃至数十亿美元。Google用27亿美元请回Shazeer;Meta据说曾向OpenAI研究人员开出1亿美元级别的签约奖金;Google此前还以24亿美元从AI编程工具公司Windsurf获得技术授权并招揽核心人才。这个市场的定价逻辑,早已脱离传统薪酬框架,更像职业体育的转会市场。

对OpenAI来说,Shazeer的加入发生在微妙的时点:马斯克针对OpenAI的一系列诉讼接连受挫,xAI的窃密诉讼刚被法官驳回,GPT-5.5口碑不错,Codex也在把流向Claude的开发者拉回来。在这种背景下,Shazeer的到来,无疑进一步强化了OpenAI在人才叙事和技术叙事上的势头。

不过,Google在AI基础设施层面的优势依然显著。TPU算力、搜索与云服务的分发能力、DeepMind持续的基础研究产出,都不会因一个人的离开而消失。只是,花了27亿美元请回来的人,只用了不到两年,就去了对手那里。Google要面对的难题,恐怕不只是“谁来接替Shazeer”。

参考资料:

1.https://x.com/NoamShazeer/status/2067400851438932297

2.https://www.theinformation.com/articles/star-google-ai-researcher-shazeer-joins-openai

注:封面/首图由 AI 辅助生成

来源:https://www.163.com/dy/article/KVN0QE4H05119734.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元

泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元

泰坦军团“战魂KG277VPLUS”27英寸显示器发售,支持4K165Hz与FHD520Hz双模切换,定价1888元。采用FastIPS面板,97%DCI-P3色域,配备升降支架及双HDMI2 1和双DP1 4接口。

时间:2026-07-03 12:53
苹果调价影响消费需求 2026年全球笔电出货量或降13.6%

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%

迈入2026年,DRAM与NAND闪存的供应持续紧张及价格不断攀升,正逐步传导至终端消费市场。可以预见,下半年市场环境将更加严峻。上半年多家PC厂商已陆续上调产品定价,最终连苹果也不得不跟进,宣布提升iPad、Mac及家居设备的价格,以应对存储成本的快速上涨。 TrendForce分析指出,苹果全面

时间:2026-07-03 12:53
苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波

苹果自研C2芯片仅支持Sub-6GHz,不支持5G毫米波。因此,美版iPhone18Pro继续采用高通基带方案以支持毫米波,而其他地区版本则搭载苹果自研C2芯片。这一差异将导致在毫米波覆盖的市场中,用户峰值速率可能显著低于美版用户。

时间:2026-07-03 12:53
纳睿雷达推出睿宸超精细化短时临近AI气象大模型

纳睿雷达推出睿宸超精细化短时临近AI气象大模型

纳睿雷达近日释放了一项重磅成果。2026年7月1日,公司正式对外发布了两款自主研发的全新产品:一款是“WDSPT0152型”S波段全极化多功能有源相控阵雷达,另一款则是名为“睿宸”的超精细化短时临近AI气象大模型。从产品战略来看,此次发布直指气象监测与灾害预警领域的技术制高点。 先来看这款S波段雷达

时间:2026-07-03 12:53
南航国际创新港一期交付 四大专业园区打造空天产业强磁场

南航国际创新港一期交付 四大专业园区打造空天产业强磁场

近日,南京航空航天大学与六合区深度合作的标杆项目——南航国际创新港一期正式交付投用。两个地块陆续启用,成功串联起高校科研能量、地方产业载体与市场创新主体,为南京打造全国领先的航空航天产业创新中心、助力江苏布局商业航天全产业链,提供了坚实的物理支撑。 该创新港一期位于六合区雄州街道,分为3号和4号两个

时间:2026-07-03 12:52
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜