面包屑图标 当前位置: 首页
AI资讯
热点详情

OpenAI破解80年科学难题 人工智能模型实现历史性突破

AI热点日报
AI热点日报时间:2026-05-21
热点解读

OpenAI一款未发布的通用推理模型独立推翻了数学家埃尔德什1946年提出的“平面单位距离猜想”。该模型未针对该猜想专门训练,却利用代数数论工具构造出反例,获得多项式量级改进。此前OpenAI曾因虚假突破受质疑,此次则发布论文及多位顶级数学家的同行评论,包括曾尖锐批评的学者也转为背书。这被。

今天,人工智能在基础科学研究领域取得了里程碑式的突破。OpenAI正式宣布,其内部一款尚未公开的通用推理模型,独立完成了一项原创性数学证明,成功推翻了匈牙利传奇数学家保罗·埃尔德什(Paul Erdős)于1946年提出的“平面单位距离猜想”。这个困扰数学界近八十年的核心难题,被人工智能以一种意想不到的方式找到了反例,并且提供了一系列效果更优的全新构造方法。OpenAI强调,这是人工智能首次独立攻克一个数学领域的著名公开猜想。

▲OpenAI官方X平台推文

更值得关注的是,实现这一突破的并非专为数学设计的系统,而是一个通用人工智能模型。它没有针对该特定猜想进行专门训练或搭建辅助框架,便自主发现了全新的反例构造。尤为引人注目的是,其证明过程巧妙地运用了一个与组合几何看似关联不大的数学分支——代数数论中的工具。

此次事件之所以引发广泛热议,也与一段“前车之鉴”有关。就在七个月前,OpenAI前副总裁凯文·韦尔(Kevin Weil)曾在X上高调宣称GPT-5“解决了10个此前未解的埃尔德什问题”,后经证实只是检索到了已有文献中的答案。这场风波最终以韦尔删帖并于今年4月离职告终。

▲OpenAI前副总裁凯文·韦尔(Kevin Weil)曾发布的争议推文

这一次,OpenAI显然吸取了教训。他们不仅发布了详尽的技术论文,还同步公开了由多位顶尖数学家撰写的同行评审意见。评审者名单中,包括了七个月前那位尖锐的批评者——曼彻斯特大学数学家托马斯·布鲁姆(Thomas Bloom)。布鲁姆此次态度彻底转变,为新证明背书,并称这是首个让他本人感到兴奋的、由AI自主产出的研究成果。

剑桥大学菲尔兹奖得主蒂莫西·高尔斯(Timothy Gowers)的评价则更具分量。他在评论中表示,如果这篇论文以人类作者署名投稿至顶级期刊《数学年刊》(Annals of Mathematics)并请他匿名评审,他会毫不犹豫地推荐发表。

▲OpenAI发布的论文摘要

01 数学家80年未能解决的几何猜想,被AI用跨领域工具成功推翻

这次被攻克的“平面单位距离问题”,陈述起来非常简单:在平面上任意放置n个点,其中恰好相距1个单位的点对,最多能有多少对?

这个经典难题自1946年由埃尔德什提出后,便吸引了无数数学家的目光。2005年出版的《离散几何中的研究问题》一书,将其描述为“组合几何中最知名(也最易于陈述)的问题”。普林斯顿大学组合数学家诺加·阿隆(Noga Alon)也证实,这确实是埃尔德什本人最喜爱的问题之一。

为了推动问题进展,埃尔德什甚至两度为此猜想设立悬赏,奖金从1982年的300美元提高到了1995年的500美元。而OpenAI此次的成果,恰好完成了对这个猜想的反证。用布鲁姆的话说,按埃尔德什的标准,AI解决的是一道价值500美元的悬赏问题。

长久以来,数学界的主流观点倾向于认同埃尔德什的猜想,即单位距离对数量的上界大约是n的1+o(1)次方,这意味着此前基于缩放方格网格的构造方法,几乎被认为是“最优解”。

▲此前已知的、基于缩放方格网格构造的多点单位距离示意图

如今,OpenAI的内部模型给出了不同的答案。它构造了一个无限的反例序列,使得单位距离对的数量获得了多项式量级的显著改进,从而彻底推翻了旧有的猜想。

证明方法本身同样出人意料。构造的关键要素并非来自几何或组合学,而是代数数论——一个研究整数扩张和因子分解等概念的领域。普林斯顿大学数学家威尔·索因(Will Sawin)随后对结果进行了精炼,证明这一改进可以表达为带固定指数的形式。

▲OpenAI模型在不同测试算力下解决该问题的准确率变化曲线

OpenAI联合创始人兼总裁格雷格·布罗克曼(Greg Brockman)在X上总结道,他们的模型在数学领域取得了重大突破,成功推翻了埃尔德什的核心猜想。

▲OpenAI联合创始人兼总裁格雷格·布罗克曼(Greg Brockman)的推文

而OpenAI的CEO萨姆·奥尔特曼(Sam Altman)的发言则透露出一种复杂的心情。他表示非常期待AI能极大地扩展人类对世界的理解,但“今天心情复杂”。

▲OpenAI联合创始人兼CEO萨姆·奥尔特曼(Sam Altman)的推文

02 OpenAI 7个月前曾因虚假突破遭质疑,此次获原批评者主动背书

回顾去年10月的那场风波,当时还是OpenAI副总裁的凯文·韦尔在X上宣称:“GPT-5找到了10个此前未解的埃尔德什问题的解,并在另外11个问题上取得了进展”。

此言一出,迅速引来广泛质疑。维护erdosproblems.com网站的数学家托马斯·布鲁姆直接反驳,指出韦尔的说法是“严重的歪曲”,GPT-5实际上只是检索到了已有文献,并非原创性解决。

谷歌DeepMind的CEO戴密斯·哈萨比斯(Demis Hassabis)评论此事“令人尴尬”。

▲谷歌DeepMind CEO戴密斯·哈萨比斯(Demis Hassabis)的评论

Meta首席AI科学家杨立昆(Yann LeCun)的讽刺则更为犀利,称OpenAI是“被自己的GPT傻瓜们坑了”。

▲Meta首席AI科学家杨立昆(Yann LeCun)的评论

韦尔随后删除了帖子,并于今年4月离开了OpenAI。

正因如此,OpenAI此次的处理方式显得格外谨慎和正式。他们同步发布了一份由9位数学家联合署名的评述文档,其中就包括曾严厉批评他们的布鲁姆。文档不仅给出了AI证明的完整推导,还附上了各位数学家的独立评审意见。

布鲁姆此次的态度发生了180度转变。他在评论中承认,AI能在这种水平的问题上给出解答,既令人惊讶也令人印象深刻。他展望道,AI正在帮助人类更充分地探索几个世纪以来构建的数学知识体系,或许还有更多未被发现的奇迹正等待被揭示。

当然,他也客观地指出,这次AI的原始证明虽然完全有效,但后来被OpenAI的人类研究员和参与评估的数学家们显著改进了。这恰恰说明,人类在讨论、消化、改进AI的证明,并探索其深远影响方面,仍然扮演着不可或缺的关键角色。

▲托马斯·布鲁姆(Thomas Bloom)此次的肯定性评论

03 结语:AI从研究助手向原创贡献者转型,仍需更广泛同行评审

过去半年,从谷歌DeepMind的AlphaEvolve,到Harmonic的Aristotle,再到Sakana AI的“AI Scientist”,AI辅助数学研究的案例已不鲜见。但像这次一样,由AI完全自主完成、并对一个著名公开猜想给出反证,且能获得该领域顶尖数学家集体背书的,尚属首次。

然而,保持审慎依然是科学界的优良传统。OpenAI至今未公开发布这款神秘的模型,完整的证明也仍需接受更广泛、更长时间的同行评审检验。但无论如何,让七个月前那位公开“打脸”的批评者,亲手为新的成果签字背书,这件事本身的性质,已经与上一次截然不同。这或许标志着,AI正在从一个高效的研究助手,悄然向一个能做出原创性贡献的“研究合作者”角色转型。

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:OpenAI破解80年科学难题 人工智能模型实现历史性突破要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://36kr.com/p/3818803831538817
OpenAI

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-05-21 22:31
豆包AI车辆选购对比分析功能实测与使用指南

使用AI工具选车时,应输入明确条件,避免结果不精准。对推荐结果需交叉验证,核对参数与行情,可借助其他AI工具细化筛选,并通过多轮对话补充细节。最后建议通过官方渠道核实车型配置,确保信息准确。

AI热点2026-05-21 22:30
QoderWake自动化平台适用岗位盘点:程序员、运营与客服

QoderWake已发展为覆盖六大岗位的自动化解决方案,包括软件工程师、运营、数字客户经理、数字分析师、数字内容编辑和数字流程专员。各岗位均能自动化处理核心任务,实现了高效的事中执行与协同。

AI热点2026-05-21 22:30
可灵AI制作电影感慢动作视频的详细教程

实现电影级慢动作效果需引导AI超越简单减速。关键在于启用超采样慢动作模式,以高帧率生成中间帧确保运动丝滑。同时需在提示词中描述符合物理规律的运动细节,为复杂动作设定首尾帧以约束轨迹,并后期叠加运动模糊及粒子衰减层来模拟光学特性,避免数字感。

AI热点2026-05-21 22:30
WorkBuddy项目风险评估与预警功能使用指南

WorkBuddy可利用多Agent协同与结构化数据处理构建项目风险预警闭环。通过分析文档与会议纪要识别情绪与关键词风险;聚合Jira与飞书数据生成动态风险仪表盘;调用财报追踪与舆情监测技能扫描外部依赖风险;使用Plan模式为高风险任务嵌入前置检查点,实现风险主动防控。

延伸阅读