ICLR时间检验奖十年回顾：0博士组合论文获封神之作

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

ICLR时间检验奖十年回顾：0博士组合论文获封神之作

热心网友时间：2026-05-18

转载

ICLR 2026的时间检验奖刚刚揭晓，结果颇有些耐人寻味——获奖者之一是Alec Radford，这位如今被OpenAI CEO奥特曼誉为“爱因斯坦级别”的天才，正是初代GPT系列的奠基人之一。

消息一出，社区反响热烈，“实至名归”的祝贺声不绝于耳。这位技术大神在社交媒体上异常低调，动态几乎全是转发和推荐他人的工作。然而，在OpenAI内部，他的地位与Ilya Sutskever齐名。公司总裁Greg Brockman甚至曾公开表示：“只要他想要的，我们都给。”足见其分量。

此次将他推上领奖台的，是一篇发表于十年前的经典论文：DCGAN。这篇引用量超过2万次的著作，不仅是机器学习领域最具影响力的论文之一，更被公认为开启了生成对抗网络（GAN）工程化应用的大门。

有趣的是，这篇里程碑式论文的作者阵容，在当时看来颇为“非主流”：三位作者，没有一位是博士生。两位本科生，一位硕士生，联手改写了历史。这本身，就足够酷了。

时间检验奖首次颁给本科生

本届ICLR的时间检验奖罕见地开出了“双黄蛋”，除了DCGAN，另一篇获奖论文是DeepMind的DDPG。前者为GPT系列模型的核心逻辑埋下了伏笔，后者则证明了深度强化学习能够解决连续控制问题。ICLR连续三年以此奖项致敬经典，也侧面印证了这两项工作的价值难分伯仲。

评审委员会对DCGAN的评价切中要害：这篇俗称DCGAN的论文，首次成功验证了基于学习的生成模型能够产出多样化、逼真且结构复杂的图像。它正式开创了图像生成这一子领域，如今已成为机器学习最炙手可热的方向之一，并在工业界催生了大量成熟应用。尽管技术脉络已从GAN演进至扩散模型，但DCGAN作为奠定整个领域的关键里程碑，其价值历久弥新。

论文的三位作者，人生轨迹也如同他们的研究一样，充满了戏剧性的交汇与重逢。

核心人物Alec Radford本科毕业于富兰克林·欧林工程学院。这所学院规模虽小，仅约400名学生，但以其高自由度的项目制教学和媲美常春藤的学术实力著称。在校期间，Alec便与同学共同创立了公司Indico，此后加入OpenAI，一待就是八年。他是早期GPT系列论文的核心贡献者，几乎参与了OpenAI所有重大突破，也是多模态模型CLIP的主导者。他提出的“Transformer架构+生成式预训练”方法，直接奠定了后来ChatGPT及众多大模型的基础。截至目前，其论文总被引数已超过35万次。

2024年底，Alec选择离开OpenAI追求独立研究，并于去年3月以顾问身份加入了由OpenAI前CTO Mira Murati创立的Thinking Machines Lab。

另一位本科生作者Luke Metz，与Alec师出同门，毕业后加入了Alec的Indico公司，同样是OpenAI的创始成员之一。他后来进入谷歌担任长期研究员，研究方向从生成模型转向优化算法与元学习，并在2024年短暂回归OpenAI，最终于同年年底加入Thinking Machines Lab。

第三位作者Soumith Chintala的故事则更为曲折。他更为人熟知的身份是PyTorch的核心作者和Meta前副总裁。本科就读于印度韦洛尔理工学院（VIT）的他，在申请硕士时曾连续被12所高校拒绝，最终才获得纽约大学的录取，并幸运地师从Yann LeCun，投身早期深度学习研究。硕士毕业后，他的求职之路再次受阻，几乎被所有申请的公司拒绝，最终进入一家名为MusiAmi的小型创业公司。转机发生在2014年，经LeCun引荐，他加入Meta，并带领团队主导开发了PyTorch——如今全球应用最广泛的开源机器学习框架之一。在Meta工作11年，他从L4工程师一路晋升至副总裁。2025年底，他离开Meta，出任Thinking Machines Lab的CTO。

于是，一个奇妙的闭环形成了：DCGAN的三位作者，在各自历经辉煌与转折之后，于Thinking Machines Lab再度聚首。

其余获奖情况

除了时间检验奖，ICLR 2026还公布了两篇优秀论文奖和一篇优秀论文提名。

两篇优秀论文奖分别是：《Transformers are Inherently Succinct》率先提出“简洁性”是衡量Transformer表达能力的新维度，并证明其在描述某些复杂概念时，相比RNN等模型具有指数级甚至双指数级优势；《LLMs Get Lost In Multi-Turn Conversation》设计了一种可扩展的方法来评估大语言模型的多轮对话能力，同时发现当交互轮次增多且指令模糊时，模型的适应性与可靠性会显著下降。