陶哲轩紧急呼吁叫停AI造神:人工智能再颠覆数学?

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
文章转载于新智元
你可能刷到过这种极具煽动性的新闻标题:「AI完全自主解决了人类五十年未解的数学难题!数学家要失业了!」
对于渴望见证AGI诞生的人来说,这无疑又是一剂强心针。而对于坚守人类智力尊严的数学家而言,这仿佛是最后堡垒陷落的警报。
随着这些文章的影响力越来越大,终于有人坐不住了,出手降温。
有趣的是,这个人正是AI数学研究最积极的推动者之一——陶哲轩。
陶哲轩并没有否定AI的数学研究能力,他只是想把水温调回现实。
就在今天凌晨,陶哲轩发帖称,AI解决数学问题的能力被断章取义地夸大了。

他在Erdős Problems项目相关的GitHub页面补充了更系统的说明与警示。
他强调外界对AI解决Erdős问题的解读很容易过度,尤其是把某个孤立战果当成「AI已具备高级数学能力」的证据。
陶哲轩到底在澄清什么?AI在Erdős问题上究竟做到了什么程度?
1
陶哲轩的深夜辟谣
首先要说的是,陶哲轩并不是否认AI在数学上的进步。
他否认的主要是一种偷懒叙事:把「AI在某些问题上能产出可验证结果」,偷换成「AI已经会做数学、能独立创新、能替代人类」。
在他更新的「AI contributions to Erdős problems」页面里表示,看AI在Erdős问题上的成绩单时,千万别只盯着「解了多少题」,还特别注意下面几点:
题目难度差得离谱,「解题数」不能直接比:Erdős问题的难度跨度非常夸张,一端是公认超级硬核的核心难题,另一端是大量长期没人细查、研究很少的「长尾题」。后者里有不少其实属于「低垂果实」,更适合当前AI工具发挥。问题是:你很难在不做专家级文献梳理的前提下,提前判断一题属于哪一类。所以,拿「谁解得多」来PK,很可能不是同一难度段的对比。
很多题目「是否未解」本身就不确定: 上不少问题缺少系统文献回顾,因此「Open」(未解)这个标签往往只是暂定。AI解出一题后,大家往往很快发现——原来文献里早有人解过(可能方法略不同)。这会让「AI首解」的叙事非常容易翻车。
我们看到的多是成功案例,失败被隐藏了: 对AI工具的记录并不完整,尤其对没进展、失败尝试的记录更少。
有些题目原始表述有误,可能被「钻字面漏洞」解掉:极少数情况下,Erdős的题目表述可能不严谨甚至有误,要还原本意,往往需要结合上下文、靠领域经验做判断——这一步带有一定主观性。
数学价值不只在答案,更在「连接知识网络」:数学的意义不只是证明成立,还在于这件事对相关领域有什么启发?和已有理论怎么挂钩?有哪些可迁移的方法?人类写证明时,往往会自然补上这些旁白:背景、动机、文献对比、方法边界。但AI主导的证明常常缺少这层知识的光晕,结果可能技术上对,但对数学共同体的可用价值更低。
解出冷门长尾题,不等于够格投顶级期刊:不是每解一个未解题都等价于可发表论文。尤其当题目本身很冷门、方法只是对已有套路的小改动时,更未必能进好期刊。
把AI生成的证明形式化到Lean这类证明助手里,是提高可信度的好办法,但仍可能被钻空子。比如形式化时偷偷引入额外公理、问题陈述被误形式化、或者利用数学库/语法的某些「边角行为」。特别是当形式化证明短得离谱或啰嗦得异常时,更要警惕。
简单来说,陶哲轩认为AI在Erdős问题上的进展值得关注,但真正要看的是题目的难度层级、文献核查、题意还原、知识融入,以及验证链条是否扎实等更多维度的指标。
AI能做出成果不等于AI已具备完整数学能力。

1
AI不是数学家 而是工具链的一环
那现实里,AI到底做了什么?
陶哲轩的这份GitHub页面把AI贡献分成了多个类别。
有AI生成了完整(或部分)解答,有AI以为题目未解、结果发现文献早就解过的案例,有AI参与文献检索,有AI把证明形式化到 Lean,有AI帮人类重写既有论证,等等。
例如,页面列出 在2026年1月6日由Aristotle与ChatGPT 5.2 Pro 给出完整解答(Lean验证), 在1月8-10日也获得完整解答(Lean验证)。
这意味着在某些题型、某些难度区间,AI确实能做出「可运行的证明结构」,甚至进入形式化验证流程。

有些问题完全由AI解决,但后来才发现,有人早就解决了。

陶哲轩还专门列了「AI-powered literature review(AI驱动的文献回顾)」一类:AI被用来搜索是否已有结果、是否存在误判Open的情况。

1
人类仍然是主角
如果仅凭几个孤例就认为「AI数学无敌」,显然有些片面。
但反过来,觉得AI做数学啥也不行,同样会错过它真正有价值的部分。
更准确的说法可能是:AI正在学会做数学的体力活和工程活:跑套路、补漏洞、做形式化、写稿改稿、查文献。
而数学真正的「灵魂」——提出深刻问题、创造新概念、把一个结果嵌进整个学科的知识网络——仍然高度依赖人类。
所以,陶哲轩这次深夜发帖想要说的,正在于此。
未来的数学家,或许不再是孤独的思考者,而是统领着硅基智能大军的指挥官:在那片广袤的数学原野上,人类指引方向,AI开路架桥。
别断章取义地神话AI,但也绝不要低估这股正在重塑真理探索方式的力量。
参考资料:https://mathstodon.xyz/@tao/115871649394962391
点个“爱心”,再走 吧
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
推迟打磨AI影像 荣耀Robot Phone原计划3月开卖
荣耀Robot Phone上市时间调整:精心优化,打造完整智能影像体验 近期,荣耀高管罗巍的一次公开分享,引发了科技圈的广泛讨论。他诚恳地表示,荣耀Robot Phone目前最大的遗憾,是未能如最初规划的那样,在3月份正式推向市场。这一表态并非无的放矢,事实上,依据原定的产品战略与开发进度,这款设备
小米澎湃 OS 3 Beta 版上线自研系统级输入法,支持 AI 对话、高级材质等
小米澎湃OS 3 Beta版迎来新成员:自研系统级输入法初亮相 3月30日,小米澎湃OS迎来了重要更新。据知名数码博主@懒酱的日记本爆料,在最新推送的小米澎湃OS 3 Beta版本中,小米自研的系统级输入法已悄然上线,引发了科技圈和米粉的广泛关注。但博主同时指出,作为早期的内测版本,该输入法目前在功
耐寒防水还耐折 OPPO Find N6寒冷冬季随便用
天寒地冻也能随心折叠?折叠屏手机冬季户外使用体验解析 许多用户,尤其是北方地区的朋友,在选择折叠屏手机时常存疑虑:严寒冬季户外使用时,屏幕能否经受考验,实现稳定开合?毕竟,传统认知与厂商指南常将低温视为折叠屏可靠性的潜在挑战。 针对这一普遍关切,OPPO Find N6系列以实测数据给出了肯定回应。
中国联通eSIM机型再扩容 三星S26系列联通首销
中国联通eSIM尝鲜季迎来三星Galaxy S26系列:开启无卡生活新选择 中国联通“eSIM尝鲜季”持续升温,近日再迎重磅合作伙伴。三星电子与中国联通在北京西单营业厅联合举办了三星Galaxy S26系列的首销发布仪式。本次活动不仅完整展示了Galaxy S26系列的强劲性能与创新功能,更重点发布
松下将参展2026 AWE 科技成果描绘家居新蓝图
中国家电及消费电子博览会(AWE 2026)定于3月12日-15日举行。松下家电将携全系列创新产品与尖端科技亮相,以百年匠心与智能科技,深度诠释现代家庭对高品质理想生活的追求。 业界年度盛事——中国家电及消费电子博览会(AWE)已正式公布2026年展会日程:3月12日至15日。松下家电将重磅参展,依
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

