Meta强化学习专家离职,扎克伯格语录成告别赠言

小扎在这头疯狂挖人,结果家里的老员工纷纷跑路了??
最新消息,Meta万引强化学习大佬Rishabh Agarwal即将离职,还留下了一篇让人浮想联翩的小作文:
这是我在Meta的最后一周。
决定不加入新的超级智能实验室并不容易,毕竟那里人才济济、算力爆棚。但在Google Brain、DeepMind和Meta度过了7年半之后,我更想冒险去尝试一条完全不同的路。
Meta组建超级智能团队的想法非常引人注目,但我最终选择听从扎克伯格的建议:“在这个瞬息万变的世界里,最大的风险就是不去冒险。”
麻 将虽然表面上看起来双方是“和平分手”,但网友们还是从中嗅出了一丝不同寻常的味道:
把小扎的原话甩回他自己脸上,这操作绝了,瑞思拜!
麻 将十亿可以为你买一栋房子,但买不到你的梦想。
麻 将不过猜测也好,吐槽也罢。对于Rishabh Agarwal的离职,谷歌、Meta的同事们都清一色地送上了祝福,而且还顺带回顾了他在工作期间作出的贡献。
据了解,他参与了谷歌Gemini 1.5、Gemma 2以及Meta推理模型后训练方面的重要工作,2024年还以一篇RL算法评估论文拿下了NeurIPS杰出论文奖。
所以,Rishabh Agarwals是谁?他的离职又为何在这个节骨眼掀起波澜?
曾被Hinton劝退“不要做强化学习”,下一站未定
Rishabh Agarwals,一直以来从事强化学习和推理研究,谷歌学术论文被上万次引用,h-index也有34。
本科毕业于印度理工学院孟买分校计算机科学与工程专业,成绩属于系前几名那种。
2018年,他以AI Resident的身份加入Google Brain多伦多团队,在Geoffrey Hinton团队里工作了一年。
颇具戏剧性的是,Hinton还曾建议他“不要做强化学习(RL)”,不过话锋一转,老爷子也留有余地——应该做自己认为最好的事情(毕竟他本人当年做的事也不被所有人看好)。
于是,Rishabh Agarwals义无反顾地投身强化学习,并决定继续攻读博士学位。
第二年,他就前往蒙特利尔的Mila研究所申请PhD,由于和面试官之一Aaron Courville(和Bengio等人合著了《深度学习》这本经典教材)在强化学习领域的研究方向“完全相同”,当场就被邀请并加入其团队。
接下来的四年时间,他在Aaron Courvilleh和Marc Bellemare两位顶尖导师的指导下继续深耕强化学习,同时还保留着在Google Brain的全职工作。
直到2024年,Marc Bellemare发了一条提前庆祝他通过博士毕业答辩的推文,连谷歌首席科学家Jeff Dean这样的大佬也赶来祝贺。
在这之后,他顺理成章地加入蒙特利尔谷歌DeepMind团队,担任研究科学家,同时在麦吉尔大学做兼职教授。
而在谷歌工作期间,他参与了Gemini 1.5(当时号称最强多模态、上下文突破100万)、Gemma 2(新一代轻量级开源模型)、Gemma 3等重要模型的发布工作。
2024年,他还发表了论文《Deep Reinforcement Learning at the Edge of the Statistical Precipice》,一举斩获NeurIPS杰出论文奖。
简单来说,这篇论文分析了深度强化学习中的统计不稳定性问题,指出在有限实验下评估算法可能产生误导性结果。由于系统性揭示了RL中的方差问题与过拟合风险,被认为是评价RL算法的里程碑工作。
后来他才从谷歌跑去了Meta,并着手推进Meta推理模型的后训练工作,具体包括:
用RL规模化训练,把8B稠密模型推到接近DeepSeek-R1的水平; 在训练中途引入合成数据,为RL提供热启动; 提出更高效的on-policy蒸馏方法。如今随着Rishabh Agarwals的离开,网友们也纷纷替Meta惋惜又损失了一员大将。
目前Rishabh Agarwals的下一站并未明确,不过按照他“想要尝试完全不同的一条路”的说法,人们推测大概率会是创业。
Meta老员工开始出逃了?
其实不止Rishabh Agarwals,几乎同一时间,一位在Meta工作了12年的老员工也宣布离职了。
而且下一站还是Anthropic的推理团队(属于直接拥抱曾经的竞争对手了)。
有一说一,Meta这波渐起的老员工出逃趋势并不出人意料。
此前就有消息称,Meta新老员工之间因薪酬待遇悬殊而产生摩擦,其中一些研究人员甚至威胁要辞职。
合理推测,招聘热潮带来的内部矛盾,可能是导致这些资深员工选择离开的重要原因之一。
嗯,小扎这波也属于一边蓄水,一边开闸了(doge)。
参考链接
[1]https://x.com/agarwl_/status/1960034048698388795
[2]https://scholar.google.com/citations?user=aH8AJu4AAAAJ&hl=en
[3]https://x.com/Yuchenj_UW/status/1960038533290450972
[4]https://agarwl.github.io/
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
最新文章
具身天工Ultra创纪录:全球首个人形机器人百米短跑冠军
8 月 17 日消息,据央视新闻报道,2025 世界人形机器人运动会正在国家速滑馆举行。在刚刚结束的百米“飞人大战”决赛中,北京天工队的“具身天工 Ultra”机器人以 21 50 秒的成绩夺得全
汉王Clear 6 Turbo电纸书直降487元,支持微信读书+番茄阅读仅812元
汉王 Clear 6 电纸书日常售价 1299 元,今日京东直降 200 元 + 可用 120 元 PLUS 补贴券,叠加国补后实付 832 元即可入手。晒单再返 20 元 E 卡,折合仅需 812
《Reanimal》12分钟实机首曝:小小梦魇团队新作震撼亮相
8 月 17 日消息,《Reanimal》由《小小梦魇 1&2》的开发商 Tarsier Studios 制作。注意到,游戏最新昨日公布了一段 12 分 43 秒的实机演示视频,展示了游戏里的黑暗
真我15系列9月发布:主打轻薄影像,15T设计致敬经典
8 月 18 日消息,真我手机今日官宣,真我 15 系列手机将于 9 月发布,定位“轻薄影像神器”。博主 @数码闲聊站 则表示,真我 15 系列主打轻薄拍照手机,“新杯真我 15T 果味十足,6
2025雨果奖揭晓:《浊污之杯》斩获最佳长篇小说桂冠
8 月 18 日消息,在上周末举行的第 83 届西雅图世界科幻大会上,2025 年雨果奖正式公布。最佳长篇小说:Robert Jackson Bennett 的《The Tainted Cup(浊
热门推荐
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程



















