当前位置: 首页
AI资讯
Claude破解80年数学难题 断网解题推翻Erdős猜想

Claude破解80年数学难题 断网解题推翻Erdős猜想

热心网友 时间:2026-05-27
转载

【导读】OpenAI以125页的思维链证明,撼动了悬置80年的埃尔德什猜想大门。如今,Anthropic的Mythos模型找到了一条更短、更优雅的证明路径。令人惊讶的是,它在获得第一个可行解后就停止了探索——面对这个著名的数学开放问题,AI似乎也表现出了“谨慎”。

AI在数学研究领域的进展速度,正以惊人的态势加速。

OpenAI刚刚宣布破解一个长达80年的数学猜想,Anthropic紧随其后公布了其独立证明。同一周内,DeepMind也一举攻克了9道同类型的埃尔德什难题。

近日,Anthropic研究员Levent Alpoge在社交媒体上发布了一系列推文,透露了一个关键信息:

OpenAI耗费125页篇幅解决的难题,他在周末使用Mythos模型进行测试,不仅迅速找到了解决方案,而且发现的证明路径更为简短、清晰。

断网独立测试,Mythos展现实力

研究员Levent Alpoge背景显赫。他于1992年出生,以满分成绩毕业于哈佛大学本科,随后在剑桥大学完成Part III课程,并在普林斯顿大学获得博士学位,师从菲尔兹奖得主Manjul Bhargava。他早在2015年就获得了美国本科生数学研究最高奖摩根奖,曾是哈佛大学初级研究员,并解决了希尔伯特第十问题在任意数域上的推广。

2023年GPT-4发布时,他深受吸引,认为这是“人类有史以来创造的最有趣的事物之一”,并因此决定重返计算机科学领域,随后加入了Anthropic。

本周,在OpenAI破解埃尔德什难题的消息公布后,Levent进行了一项自然的测试:让自家的Mythos模型尝试解决同一问题。

为确保测试的公平与独立性,他设置了严格条件:让多个Claude Code实例在完全断网的环境下独立工作,彻底杜绝了参考OpenAI公开证明的可能性。

结果令人意外。模型不仅找到了与OpenAI类似的解法,更倾向于选择一条完全不同、却更为简洁的证明路径。

一个有趣的细节是:模型在找到第一个足以反驳猜想的可行构造后便停止了。它本可以继续推进,得到一个更强的结论,但它似乎“犹豫”了。面对这道声名显赫的开放性问题,它对自己的结果表现出不确定,保守地停留在了第一个可行解上。

看到这个行为,Levent会心一笑,他表示:“这种感觉,每一位数学家都能理解!”

目前,Opus 4.7模型已经完成了完整证明的整理与排版工作。

尘封80年的数学赌注

时间回到1946年。匈牙利数学家保罗·埃尔德什提出了一个表述简单却极其困难的问题:在平面上任意放置n个点,最多可以形成多少对距离恰好为1的点?

举例来说,就像在桌面上摆放100枚硬币。如果两枚硬币的圆心距离恰好等于一个硬币的直径,就算作一对“单位距离”。那么,100枚硬币最多能产生多少对这样的组合?

埃尔德什本人给出了一个构造:将点排列成方格网格,经过适当缩放后,单位距离对的数量大约是 n^(1 + c/log log n)。也就是说,100个点大概能产生比100略多一些的对数。

随后,他提出了一个著名的“赌注”:这就是理论上限,不可能做得更好了。

他的信心源于一个关键瓶颈——高斯整数环Z[i]。埃尔德什的网格构造依赖于这个代数结构,而一个固定范数在Z[i]中的分解方式数量受除数函数限制,其上限大约是 exp(O(log n / log log n))。这便构成了那个难以突破的“天花板”。

整整80年间,数学家们都在这个框架内探索,无人能够超越。

数论重器,跨界破解几何难题

对于人类数学家而言,代代相传的直觉是“答案要在高斯整数Z[i]中寻找”。但Mythos模型没有这种思维定势,它一开始就将Z[i]替换为次数远大于2的数域K的整数环O_K。

这看似是“杀鸡用牛刀”,但正是这种跨领域的“降维打击”,成功撬开了尘封80年的僵局。

具体方法是,首先利用Golod-Shafarevich定理,在一个二次域上构建一座无限高的“数域塔” K₀ ⊂ K₁ ⊂ K₂ ⊂ …… 然后,对每一层K_n,取其一个四次根扩张F_n = K_n(D^{1/4}),其次数为d_n。

这座塔的有效性基于一个关键性质:无论塔建得多高,数域的“复杂度密度”始终有界,结构保持可控。一旦参数足够大,几何计数机制便可启动。

接下来是证明的核心。在埃尔德什依赖的Z[i]中,单位群仅有{±1, ±i}四个元素。能够产生单位距离的“方向”极其有限,被除数函数牢牢限制。

但在高维数域中,情况完全不同。单位群的秩随着维度增长,van der Corput定理直接将这个秩转化为可用方向的数量。于是,原本可怜的4个方向,变成了随维度指数级增长的海量选择。

如果这段技术细节难以理解,可以记住一个形象的比喻:

埃尔德什被困在一个只有4扇门的房间里,而Mythos直接拆掉了四面墙。

随后的构造就直观了。首先,选择一个实嵌入将这些代数整数投射到平面上,得到点集P。然后,取一个单位向量去平移这些点,新旧两点之间的距离恰好为1。由于可用方向的数量增长极快,满足条件的点对数量远远超过了埃尔德什猜想设定的上限。两者结合,便得到了多项式级别的超越。

更直观的解释是:

单位距离方向数量的增长是exp(Ω(d log log d))量级,而所有其他损耗都只是exp(O(d))量级。d log log d 轻松碾压了 d。

就这样,埃尔德什的猜想被成功反驳。整个论证过程在解析上并不复杂,与OpenAI那条长达125页的路径相比,显得尤为简洁。

用Levent自己的话总结:

从高层视角看,这本质上是埃尔德什原始构造与一座类域塔的结合。只不过,这里做的是字面上最“直接”的事——将大小不超过半径一半的点,加到大小不超过半径一半的单位上。而它之所以成功,纯粹是因为类域塔的几何计数增长速度快得惊人。

一周三连击,AI数学研究迎来突破

过去一周的时间线,信息密度极高。

5月20日,OpenAI官方宣布,其一个未公开名称的通用推理模型,自主反驳了埃尔德什单位距离猜想。同一天,普林斯顿大学教授Will Sawin在arXiv上发布了手工改进版,将指数从6×10⁻³⁸提升到了0.014,差距高达10³⁵倍。曾与埃尔德什合作过的佐治亚理工学院数学家Tom Trotter感慨道:“如果埃尔德什还活着,他一定会激动不已。”

5月21日,DeepMind登场,其AlphaProof Nexus模型一口气解决了9道埃尔德什问题,每道题的推理成本仅需数百美元。

5月26日,Anthropic也宣布实现了独立证明,其路径比OpenAI的125页证明简短得多。

三家公司的技术路线截然不同,但结果都汇聚于同一终点。

从争议到权威认可

要知道,就在七个月前,AI进行数学研究还备受质疑。

2025年10月,时任OpenAI副总裁的Kevin Weil在社交平台宣称GPT-5解决了10个埃尔德什问题。负责维护erdosproblems.com网站的数学家Thomas Bloom当即指出,模型只是检索到了已知解法,属于“严重误导”。Yann LeCun和Demis Hassabis也加入了批评行列。很快,Weil删除了帖子,并在数月后离开了OpenAI。

当时业界的普遍看法是:模型或许能解题,但距离进行真正的数学研究还很遥远。

时至今日,风向彻底转变。Thomas Bloom亲自签署了验证报告。菲尔兹奖得主Timothy Gowers写下了“如果提交到《数学年刊》,我会毫不犹豫推荐接受”的高度评价。数学家Sam Litt则表示,这是“AI自主产生的第一个让我觉得本身就有趣的数学结果”。

Litt甚至在《自然》杂志的采访中坦言:“没有人类能够像大语言模型那样吸收全部的数学文献。AI正在打破学科之间的壁垒。”

回想三年前,GPT-4应对本科水平的数学题尚且吃力。如今,让最杰出的数学家都感到棘手的埃尔德什问题,正在成为AI的“能力测试”。

打破80年僵局的,恰恰是一个没有传统思维包袱的模型。它不知道“这道题应该怎么想”,反而使其能够从代数数论中借用“重型工具”,去攻克一道本质上的几何难题。

埃尔德什留下了超过1000道未解难题。这一周,这份清单上又减少了一道。

来源:https://36kr.com/p/3827354186847105

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
Python批量生成Nano_Banana_API图片自动化脚本教程

Python批量生成Nano_Banana_API图片自动化脚本教程

针对NanoBananaAPI批量生成图片需求,介绍了三种Python自动化方法:使用requests库同步顺序调用,适合少量任务;利用asyncio与aiohttp实现异步并发,可提升大批量处理效率;对于需结合CPU预处理的复杂任务,推荐使用多进程与队列进行分片并行处理。各方法均需注意请求构建与响应解析。

时间:2026-05-27 21:52
如何让海螺AI生成的文章更自然减少AI痕迹

如何让海螺AI生成的文章更自然减少AI痕迹

通过优化提示词结构、控制句式多样性、注入个性化语言以及分段生成与人工干预,可以有效降低海螺AI生成文章的“AI味”。具体方法包括赋予AI明确角色、禁用套路表达、提供范文参考、引入灵活句式、使用个性化词汇、分段生成并实时调整,从而让文本更接近真人写作的自然与生动。

时间:2026-05-27 21:50
Uber四个月用尽全年AI预算 科技巨头烧钱竞赛引关注

Uber四个月用尽全年AI预算 科技巨头烧钱竞赛引关注

Uber在2026年仅四个月就耗尽了全年AI预算,高昂运营成本与业务回报不成正比。其内部AI工具使用量激增,却未转化为用户端的功能提升。为承担AI开销,公司甚至缩减人员招聘规模。管理层质疑,若成本长期无法证明能转化为实用服务,这种投入将难以持续。

时间:2026-05-27 21:21
KIMI WebBridge上线实现浏览器全功能智能操控

KIMI WebBridge上线实现浏览器全功能智能操控

Kimi团队发布WebBridge浏览器插件,使AI助手能直接操控浏览器完成网页操作。插件可通过官方渠道安装并连接AIAgent,连接成功后即可演示其控制浏览器执行任务的能力。该工具基于CDP协议,能提升操作效率。

时间:2026-05-27 21:21
Agent Harness 最小版安装与使用指南

Agent Harness 最小版安装与使用指南

评估Agent需系统考察其工具调用、中间结果与任务遵循过程,而不仅看最终答案。构建最小化harness可将任务置于可控环境,限定工具使用,完整记录执行轨迹并进行客观评分。该框架包含任务、环境、工具、轨迹和评分器五个模块,实现过程可追溯、可复现的评估,推动Agent能力检验走向标准化与透明化。

时间:2026-05-27 21:21
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程