门外汉借ChatGPT破解60年数学难题陶哲轩坦言研究走入误区
困扰数学界长达60年的一个“世纪猜想”,竟然被一位门外汉给攻克了。
这位年轻人只有23岁,从未接受过任何高等数学训练。他仅仅凭借一段提示词,就让ChatGPT在80分钟内破解了这道难题。菲尔兹奖得主陶哲轩在审阅后坦言:过去六十年里,所有研究者在第一步就集体走偏了。


23岁门外汉,让全网破防
故事的主角名叫Liam Price。他的履历里找不到任何高等数学学位的痕迹,完全称不上“数学科班出身”。然而,就在2025年底,他与剑桥大学数学系的大二学生Kevin Barreto联手,开启了一场近乎“疯狂”的实验:从著名的埃尔德什问题集(Erdős Problems)中随机抽取未解难题,直接丢给ChatGPT去尝试。

他们不做前置研究,不读相关论文,也不从任何既定的分析框架入手。全凭直觉,用最朴素的语言描述问题,然后让大模型自己寻找路径。数学圈给这种方法起了个名字,叫“vibe mathing”。

在挑战第1196号问题之前,Price和Barreto已经用类似的方法在几个较小的问题上取得了进展,逐渐引起了一些关注。OpenAI听说后,甚至给他们赠送了ChatGPT Pro订阅,鼓励他们继续探索。这个举动,后来被证明是2026年数学史上回报率最高的一笔“投资”之一。但当时没人能预料到,真正的大鱼会来得如此之快。
60年猜想证毕,ChatGPT仅用80分钟
他们这次盯上的埃尔德什问题#1196,是关于“原始集”的:即一个正整数集合,其中任意两个元素都互不整除。
在这个问题上走得最远的人类数学家,是牛津大学的Jared Lichtman。他在原始集问题上深耕了整整7年,发表了多篇重要论文,将已知的上界一步步推进到了约1.399。距离最终的证明,似乎只差临门一脚。但这最后一脚,七年都没能踢进去。


没想到,Price将问题描述发送出去后,GPT-5.4 Pro推理了80分钟,直接给出了渐近上界1+O(1/log x),一刀到底,完成了证明。
先把问题本身说清楚。所谓“原始集”,就是一组正整数,其中任何一个数都不能被集合中的另一个数整除。举个例子,{2, 3, 7, 12}就不是原始集,因为12能被2和3整除;而{2, 3, 7, 11}则是。

早在1968年,埃尔德什与合作者Sárközy、Szemerédi就提出了一个猜想:关于原始集的一个特定求和式,存在一个渐近意义上的明确上界。表述简洁,却让数学界僵持了58年。
更关键的差距不在于速度,而在于路线。此前所有研究这个问题的数学家,包括Lichtman在内,都默认从解析数论的工具箱入手。这条路看似自然,走了几十年,但它无形中将思维锁死在一个狭窄的通道里。

GPT-5.4 Pro走了一条完全不同的路:它采用了马尔可夫链方法,并结合了冯·曼戈尔特权重。这两样工具在数论的其他分支里都是成熟的,但从来没有人想到把它们组合起来,用在原始集问题上。
耐人寻味的是,Price在接受《科学美国人》采访时坦言:GPT最初的输出“其实质量很差”。证明冗长、混乱,逻辑跳跃随处可见。是Barreto和后来介入的专家,从一堆杂乱的推导中,辨认出了那个关键的全新洞见。
Lichtman的评价很克制,但分量极重:“这需要专家去筛选,才能真正理解它在试图表达什么。”随后,他说了一句让整个数学圈安静下来的话:“这是第一个达到‘埃尔德什之书’水平的AI数学成果。”

熟悉数学史的人会立刻明白这句话的重量。“埃尔德什之书”是埃尔德什生前的一个著名比喻:上帝手中有一本书,里面收录了每个数学定理最优雅、最本质的证明。Lichtman的意思是,AI不仅解了题,而且其解法本身具备了一种数学上的“美”。
陶哲轩:人类集体走偏了
菲尔兹奖得主陶哲轩的点评,引发了更深层的思考。他是这么说的:以前研究这个问题的人,一开始往往会采用一套标准的、已成惯例的路数。而大语言模型则选择了一条完全不同的路线,它使用了一个在相关数学分支中众所周知、却从未有人想过要应用到这类问题上的公式。
这个“集体走偏的第一步”,可以追溯到1935年以来形成的标准路径:把数论问题翻译成概率论问题,沿着“默滕斯定理”那条线走。所有人都默认这条路是对的。一代又一代的研究生进来,先学习这套翻译方法,再在其基础上添加细节、进行修补。

GPT-5.4 Pro完全没学过这套“传统”。它反手就调用了冯·曼戈尔特函数——这是解析数论中用来编码算术基本定理的一个经典对象——从而走上了一条完全不同的道路。Lichtman后来解释:这个公式在相关数学领域里其实大家都熟悉,但就是从来没人想到把它用到埃尔德什这个问题上。
陶哲轩对这次结果的定性更为深刻:“我们发现了一种思考大整数及其结构的全新方式。”一个在Lichtman的问题上钻研了7年的人,最终输给了一个不知道这个问题“应该怎么研究”的素人。在AI时代,“无知”反而成了一种结构性的优势。没有历史包袱,自然不会跟着集体思维一起走偏。
数学的钥匙,正在换手
1900年,大卫·希尔伯特在巴黎国际数学家大会上提出了23个问题,几乎定义了整个20世纪数学的发展方向。那个时代,能够触碰数学前沿的人,全球不过数百。

时间来到2026年4月一个普通的周一下午,一个23岁的年轻人,凭借一段提示词和80分钟的计算,改写了历史。数学圣殿的大门并没有降低门槛,但门上多了一把全新的钥匙。拿着这把钥匙的人,不再需要先花上十年时间,去学会前人走过的所有弯路。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
吉利发布首款原生Robotaxi Eva Cab 千里科技AI全栈赋能
4月24日,在备受瞩目的第十九届北京国际汽车展览会上,吉利汽车集团正式揭晓了其重磅新品——中国首款原生正向开发的Robotaxi(自动驾驶出租车)原型车Eva Cab。这款车型不仅是前沿概念的展示,更是一款具备完整落地潜力的产品,其核心驱动力源自千里科技提供的全栈式Robotaxi解决方案。该方案深
Akamai与NVIDIA合作推动分布式AI推理从内容分发迈向智能分发
自2010年在中国设立团队以来,Akamai已深耕本地市场十六年。在服务中国企业出海的漫长征程中,其团队展现出卓越的稳定性与战略专注度。 回顾NVIDIA GTC 2026,其CEO黄仁勋曾预言,AI推理的规模将迅速达到训练负载的数十亿倍。进入2026年,行业共识已然明确:AI大模型竞争的焦点,正从
跑车品牌宣布暂停全面电动化转型计划
莲花集团发布“Focus2030”战略,宣布调整全面电动化路线,将同步发展燃油、混动及纯电车型,直至市场成熟。未来将推出燃油跑车Emira420,并于2028年上市搭载V8混动系统的超跑Type135,战略重心转向追求更高利润率。
大语言模型如何实现类人对话与思考的智能原理
我们每天都在与大语言模型(LLM)对话,一个直观的感受是,它们似乎真的“懂”我们在说什么,尽管偶尔也会“胡言乱语”。观察它们输出的思维链,那种逐步推理的语言痕迹,更让人觉得它们仿佛具备了某种思考能力。 这引出了一个核心问题:LLM的语言和思考能力,究竟是一种怎样的能力?这些能力又是如何通过其底层的实
ICML 2026论文解读:TGO标量反馈对齐视觉生成模型
生成模型的偏好对齐,可能正在进入一个新的阶段。 过去几年,大模型在训练后优化(post-training)最主流的方法,是让模型从“成对偏好”中学习。无论是经典的RLHF,还是后来更简洁的DPO,都绕不开同一个前提:反馈必须成对出现。 但在真实世界里,反馈往往不是这样。用户给一个结果打分、系统记录一
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

