当前位置: 首页
AI资讯
Claude推翻Erdős猜想 80年数学难题被AI简洁破解

Claude推翻Erdős猜想 80年数学难题被AI简洁破解

热心网友 时间:2026-05-28
转载


AI在数学研究领域的进展,正以一种令人瞠目的速度刷新着我们的认知。


就在OpenAI刚刚用一份长达125页的思维链报告,撼动了一个悬置80年的数学猜想之后,Anthropic的研究员Levent Alpoge在周末用自家的Mythos模型随手一试,竟然找到了一条更短、更优雅的证明路径。最耐人寻味的是,模型在找到第一个可行解后就“停手”了——面对这个声名显赫的开放性问题,AI似乎也表现出了某种“紧张”。

过去一周,堪称AI数学研究的“井喷周”。OpenAI前脚刚宣布成果,Anthropic后脚就亮出了独立证明。同一时间,DeepMind也宣布其AlphaProof Nexus模型一口气解决了9道同类型的Erdős难题。

Levent Alpoge在社交媒体上分享了这一过程。他让Mythos模型尝试解决同一个问题,但设置了严格的测试条件:多个Claude Code实例独立工作,全程断网,彻底杜绝了从OpenAI已公开解法中“借鉴”的可能性。


断网隔离下的优雅解法

这位研究员本人就是数学领域的顶尖人物:哈佛本科满分毕业,剑桥深造,普林斯顿博士师从菲尔兹奖得主,并曾获美国本科生数学研究最高奖。2024年GPT-4的发布让他深感震撼,并因此转向AI领域,加入了Anthropic。


在OpenAI破解Erdős难题的消息传出后,他做的第一件事就是让Mythos也来试试。


结果出乎意料。模型不仅找到了与OpenAI类似的解法,更偏爱另一条截然不同且更为简洁的路径。有趣的是,模型在找到一个足以推翻猜想的可行方案后,便“保守地”停了下来,没有继续探索可能更强的结果。Levent对此会心一笑,称这种感觉“所有数学家都懂”。


目前,完整的证明文稿已由Opus 4.7整理排版完毕。


80年无人赢得的赌注

时间回到1946年。匈牙利传奇数学家保罗·埃尔德什(Paul Erdős)提出了一个听起来极其简单的问题:在平面上任意放置n个点,最多能有多少对点之间的距离恰好是1?

可以想象在桌上摆放100枚硬币,如果两枚硬币圆心之间的距离刚好等于一个硬币的直径,就算作一对“单位距离”。那么,100枚硬币最多能凑出多少对?

埃尔德什自己给出了一个基于方格网格的构造,并经过适当缩放后,推导出单位距离对的数量上限大约是 n^(1 + c/log log n)。也就是说,100个点大概能产生比100多“一丢丢”的对数。他坚信这就是极限,并为此下了“赌注”。


他的自信源于一个关键瓶颈:高斯整数环Z[i]。埃尔德什的方格网格构造依赖于这个数系,而一个固定范数在Z[i]中能分解的方式数量,受限于除数函数,其增长上限大约是 exp(O(log n / log log n))。这构成了那个“多出一丁点”的理论天花板。此后80年,数学家们基本都在这个框架内思考。


数论重武器的降维打击

对于人类数学家而言,代代相传的直觉是“答案要在高斯整数Z[i]里寻找”。但Mythos模型没有这种传统包袱,它一上来就将Z[i]替换为次数远大于2的数域K的整数环O_K。

这听起来像是“用大炮打蚊子”,但正是这种跨学科的“暴力”方法,撬开了持续80年的僵局。


具体方法是,先利用Golod-Shafarevich判则,在一个二次域上构造一座无限高的“数域塔” K₀ ⊂ K₁ ⊂ K₂ ⊂ …… 然后对每一层K_n,再做一个四次根扩张F_n = K_n(D^{1/4}),其次数为d_n。

这座塔之所以有效,关键在于一个性质:无论塔建得多高,数域的“复杂度密度”始终有界,结构始终可控。一旦参数足够大,几何计数就能启动。


接下来是整个证明的核心转折点。

在埃尔德什依赖的Z[i]中,单位群只有{±1, ±i}四个元素。能向外延伸的“单位距离方向”寥寥无几,直接被除数函数卡住了脖子。

但在Mythos采用的高维数域里,情况截然不同。单位群的秩随着维度增长,而van der Corput定理巧妙地将秩转化为了方向数。于是,原本可怜的4个方向,变成了随维度爆炸式增长的海量可能性。


如果觉得抽象,可以这样理解:埃尔德什被困在了一个只有4个出口的房间里,而Mythos直接拆掉了四面墙。


具体的构造步骤如下:首先,选择一个实嵌入将这些数投射到平面上,得到点集P。然后,取一个单位向量来平移这些点,新旧两点之间的距离恰好是1。由于方向数增长极快,满足条件的点对数量远远超过了埃尔德什设定的上限。两者相乘,便得到了多项式级别的增益。

更直观地说:单位距离方向数的增长率为exp(Ω(d log log d)),而所有其他损耗都只是exp(O(d))量级。d log log d 轻松碾压了 d。埃尔德什的猜想,就这样被推翻了。整个论证在解析层面并不复杂,与OpenAI那条长达125页的路径相比,显得尤为简洁。


用Levent自己的话总结,从高层视角看,这本质上是埃尔德什原始构造加上一座类域塔。只不过,这里做的是字面上最“笨”的事——把大小不超过半径一半的点,加到大小不超过半径一半的单位上。而它之所以奏效,完全是因为类域塔的几何计数增长速度快得惊人。


一周三连破,路线各不同

回顾过去一周的时间线,信息密度高得惊人。

5月20日,OpenAI官宣其未公开名称的通用推理模型自主反驳了埃尔德什单位距离猜想。同一天,普林斯顿大学教授Will Sawin在arXiv上贴出了手工改进版,将指数从6×10⁻³⁸提升到了0.014,差距高达10³⁵倍。曾与埃尔德什合作的数学家Tom Trotter感慨道:“如果埃尔德什还活着,他一定会激动到发疯。”

5月21日,DeepMind登场,其AlphaProof Nexus模型一口气解决了9道埃尔德什问题,且每道题的推理成本最多仅需几百美元。

5月26日,Anthropic宣布实现独立证明,其路径比OpenAI的125页简短得多。

三家机构的路线完全不同,但结果都收敛到了同一个结论。


从笑话到顶级期刊的认可

要知道,就在七个月前,AI做数学研究还被不少人视为笑话。

2025年10月,时任OpenAI副总裁的Kevin Weil曾在社交媒体上宣称GPT-5解决了10个埃尔德什问题。结果,负责维护erdosproblems.com网站的数学家Thomas Bloom当场回怼,指出模型只是检索到了已知解法,属于“严重歪曲事实”。Yann LeCun和Demis Hassabis等AI巨头也加入了嘲讽的行列。很快,Weil删除了帖子,并在四个月后离开了OpenAI。


当时业界的普遍判断是:模型会做题,但不会做真正的原创研究。

然而转眼到了今天,风向彻底转变。Thomas Bloom亲自签署了验证报告。菲尔兹奖得主蒂莫西·高尔斯(Timothy Gowers)写下了“如果提交到《数学年刊》,我会毫不犹豫推荐接受”的盛赞。数学家Jacob Litt则表示,这是“AI自主产出的第一个让我觉得本身就有意思的结果”。

Litt甚至在《自然》杂志的采访中坦言:“没有人类能像大语言模型那样吸收全部数学文献。AI正在打破学科之间的壁垒。”


三年前,GPT-4连本科水平的数学题都应付得颇为吃力。如今,让最伟大的数学家都感到棘手的埃尔德什问题,正在变成AI的“入学考试”。

打破80年僵局的,恰恰是一个不知道“这题应该怎么想”的模型。没有传统思维的包袱,反而让它能够自由地从代数数论中借来“重武器”,去攻克一道本质上是几何的问题。埃尔德什留下了超过1000道未解难题,这周,清单上的数字又减少了一个。

来源:https://www.163.com/dy/article/KTUSF77K0511ABV6.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
修Bug被Gemini追删代码致宕机修复报告现编

修Bug被Gemini追删代码致宕机修复报告现编

最近,一起堪称“教科书级别”的AI Agent IDE翻车事件在开发者社区引发热议。这起事故值得所有依赖AI编程工具的开发者,尤其是那些已经在生产环境中对AI Agent 授予较高权限的团队,进行深刻反思。 简单回顾:5月26日,一位开发者要求Gemini 3 5(运行在Agent IDE环境中)修

时间:2026-05-28 22:58
Notion AI运营指南:自动归纳用户反馈

Notion AI运营指南:自动归纳用户反馈

其实,想在 Notion 中高效搞定用户反馈的自动归纳,并不复杂。下面这四种 AI 方法,基本覆盖了从单条处理到全局分析的常见场景。 如果你也在用 Notion 收集用户反馈——无论是问卷、邮件、客服记录,还是社群发言——但总觉得信息碎片化严重,难以提炼共性问题和核心诉求,那很可能是因为缺少一套结构

时间:2026-05-28 22:54
AI给出的答案为何总不符期望?原因解析

AI给出的答案为何总不符期望?原因解析

大模型能力强大,但提问方式不当会导致结果不理想。核心在于精准提问,通过角色设定、背景介绍、明确任务、实现路径和输出要求这五个关键步骤逐步细化问题,才能大幅提升AI回答的质量和精准度。

时间:2026-05-28 22:54
Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4

Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4

2024年3月5日,人工智能领域迎来了一位重要参与者——由OpenAI前员工创立的Anthropic公司正式推出了Claude 3系列模型。这次发布极具分量:新模型不仅在性能上与Google和OpenAI的顶级产品并驾齐驱,部分指标甚至实现超越。要理解此次升级的真正价值,先关注几个关键变化。首先是多

时间:2026-05-28 22:53
Trae对Deno与Bun运行时的AI代码补全支持程度全面详解

Trae对Deno与Bun运行时的AI代码补全支持程度全面详解

如果你在使用 Trae 进行 AI 代码补全时发现,它对 Deno 或 Bun 运行时的提示不够精准——例如类型定义缺失、API 无法正确识别——那很可能不是代码本身有误,而是 Trae 的底层配置尚未适配。简而言之,Trae 对于非 Node js 运行时的标准库支持尚未实现“开箱即用”。下面我们

时间:2026-05-28 22:52
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程