数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

科技数码

陶哲轩紧急呼吁叫停AI造神：人工智能再颠覆数学？

陶哲轩紧急呼吁叫停AI造神：人工智能再颠覆数学？

热心网友时间：2026-01-12

转载

文章转载于新智元你可能刷到过这种极具煽动性的新闻标题：「AI完全自主解决了人类五十年未解的数学难题！数学家要失业了！」对于渴望见证AGI诞生的人来说，这无疑又是一剂强心针。而对于坚守人类智力尊严的

文章转载于新智元

你可能刷到过这种极具煽动性的新闻标题：「AI完全自主解决了人类五十年未解的数学难题！数学家要失业了！」

对于渴望见证AGI诞生的人来说，这无疑又是一剂强心针。而对于坚守人类智力尊严的数学家而言，这仿佛是最后堡垒陷落的警报。

随着这些文章的影响力越来越大，终于有人坐不住了，出手降温。

有趣的是，这个人正是AI数学研究最积极的推动者之一——陶哲轩。

陶哲轩并没有否定AI的数学研究能力，他只是想把水温调回现实。

就在今天凌晨，陶哲轩发帖称，AI解决数学问题的能力被断章取义地夸大了。

他在Erdős Problems项目相关的GitHub页面补充了更系统的说明与警示。

他强调外界对AI解决Erdős问题的解读很容易过度，尤其是把某个孤立战果当成「AI已具备高级数学能力」的证据。

陶哲轩到底在澄清什么？AI在Erdős问题上究竟做到了什么程度？

1

陶哲轩的深夜辟谣

首先要说的是，陶哲轩并不是否认AI在数学上的进步。

他否认的主要是一种偷懒叙事：把「AI在某些问题上能产出可验证结果」，偷换成「AI已经会做数学、能独立创新、能替代人类」。

在他更新的「AI contributions to Erdős problems」页面里表示，看AI在Erdős问题上的成绩单时，千万别只盯着「解了多少题」，还特别注意下面几点：

题目难度差得离谱，「解题数」不能直接比：Erdős问题的难度跨度非常夸张，一端是公认超级硬核的核心难题，另一端是大量长期没人细查、研究很少的「长尾题」。后者里有不少其实属于「低垂果实」，更适合当前AI工具发挥。问题是：你很难在不做专家级文献梳理的前提下，提前判断一题属于哪一类。所以，拿「谁解得多」来PK，很可能不是同一难度段的对比。

很多题目「是否未解」本身就不确定：上不少问题缺少系统文献回顾，因此「Open」（未解）这个标签往往只是暂定。AI解出一题后，大家往往很快发现——原来文献里早有人解过（可能方法略不同）。这会让「AI首解」的叙事非常容易翻车。

我们看到的多是成功案例，失败被隐藏了：对AI工具的记录并不完整，尤其对没进展、失败尝试的记录更少。

有些题目原始表述有误，可能被「钻字面漏洞」解掉：极少数情况下，Erdős的题目表述可能不严谨甚至有误，要还原本意，往往需要结合上下文、靠领域经验做判断——这一步带有一定主观性。

数学价值不只在答案，更在「连接知识网络」：数学的意义不只是证明成立，还在于这件事对相关领域有什么启发？和已有理论怎么挂钩？有哪些可迁移的方法？人类写证明时，往往会自然补上这些旁白：背景、动机、文献对比、方法边界。但AI主导的证明常常缺少这层知识的光晕，结果可能技术上对，但对数学共同体的可用价值更低。

解出冷门长尾题，不等于够格投顶级期刊：不是每解一个未解题都等价于可发表论文。尤其当题目本身很冷门、方法只是对已有套路的小改动时，更未必能进好期刊。

把AI生成的证明形式化到Lean这类证明助手里，是提高可信度的好办法，但仍可能被钻空子。比如形式化时偷偷引入额外公理、问题陈述被误形式化、或者利用数学库/语法的某些「边角行为」。特别是当形式化证明短得离谱或啰嗦得异常时，更要警惕。

简单来说，陶哲轩认为AI在Erdős问题上的进展值得关注，但真正要看的是题目的难度层级、文献核查、题意还原、知识融入，以及验证链条是否扎实等更多维度的指标。

AI能做出成果不等于AI已具备完整数学能力。

1

AI不是数学家而是工具链的一环

那现实里，AI到底做了什么？

陶哲轩的这份GitHub页面把AI贡献分成了多个类别。

有AI生成了完整（或部分）解答，有AI以为题目未解、结果发现文献早就解过的案例，有AI参与文献检索，有AI把证明形式化到 Lean，有AI帮人类重写既有论证，等等。

例如，页面列出在2026年1月6日由Aristotle与ChatGPT 5.2 Pro 给出完整解答（Lean验证），在1月8-10日也获得完整解答（Lean验证）。

这意味着在某些题型、某些难度区间，AI确实能做出「可运行的证明结构」，甚至进入形式化验证流程。

有些问题完全由AI解决，但后来才发现，有人早就解决了。

陶哲轩还专门列了「AI-powered literature review（AI驱动的文献回顾）」一类：AI被用来搜索是否已有结果、是否存在误判Open的情况。

1

人类仍然是主角

如果仅凭几个孤例就认为「AI数学无敌」，显然有些片面。

但反过来，觉得AI做数学啥也不行，同样会错过它真正有价值的部分。

更准确的说法可能是：AI正在学会做数学的体力活和工程活：跑套路、补漏洞、做形式化、写稿改稿、查文献。

而数学真正的「灵魂」——提出深刻问题、创造新概念、把一个结果嵌进整个学科的知识网络——仍然高度依赖人类。

所以，陶哲轩这次深夜发帖想要说的，正在于此。

未来的数学家，或许不再是孤独的思考者，而是统领着硅基智能大军的指挥官：在那片广袤的数学原野上，人类指引方向，AI开路架桥。

别断章取义地神话AI，但也绝不要低估这股正在重塑真理探索方式的力量。

参考资料：https://mathstodon.xyz/@tao/115871649394962391

点个“爱心”，再走吧

来源:https://www.163.com/dy/article/KJ2JB5EN0511N33R.html

上一篇：小马智行与北汽新能源深化合作，加速自动驾驶布局

下一篇：宁德时代成立两家新能源公司，布局物联网业务

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

地下室发现尘封12年AMD前CEO旧PC苏姿丰签名推土机硬件

地下室发现尘封12年AMD前CEO旧PC苏姿丰签名推土机硬件

一位技工在客户家地下室发现一台属于AMD前CEORoryRead的旧PC，机箱上留有苏姿丰等高管签名，配置为推土机时代硬件且从未开机。这台电脑封存了AMD从推土机失败到Zen架构崛起的关键转折历史。

时间：2026-07-10 10:06

Laravel 12生态成熟助力全栈开发效率提升

Laravel 12生态成熟助力全栈开发效率提升

Laravel12延续开发体验优势，在项目结构、查询构建、API开发、调试及性能上持续优化。其生态日趋成熟，形成Reverb、Pulse等完整工具链，覆盖API、SaaS、企业后台及AI应用开发。与Next js的组合逐渐流行，Laravel已演变为现代Web开发平台，保持社区活力。

时间：2026-07-10 10:06

Linux内核持续演进：Rust语言与零拷贝网络成新焦点

Linux内核持续演进：Rust语言与零拷贝网络成新焦点

LinuxKernel6 15重大更新：Rust驱动正式入主线，NOVADRM成为首个实践案例；io_uring新增零拷贝网络接收，降低CPU开销与延迟；Btrfs增强实时zstd压缩、DirectIO及稳定性。内核同步推进安全化与高性能网络化。

时间：2026-07-10 10:06

谷歌Gemini进入Agent时代打造全天候AI助理

谷歌Gemini进入Agent时代打造全天候AI助理

Google推出GeminiSpark、Omni等新功能。Spark可全天候在后台运行，主动处理邮件、日历等任务；Omni侧重视频理解与环境推理，布局世界模型。AI正从被动回答转向主动观察、规划与执行，标志着竞赛进入新阶段。

时间：2026-07-10 10:05

CPU-Z 2.20.2正式版发布支持Intel三大平台及AMD锐龙AI Max

CPU-Z 2.20.2正式版发布支持Intel三大平台及AMD锐龙AI Max

CPU-Z2 20 2正式版发布，新增支持IntelPantherLake、WildcatLake、BartlettLake三大架构及AMD锐龙AIMax、Pro系列，加入锐炫G3识别库，修复缓存错误和锐龙77700X3D检测问题，免费下载。

时间：2026-07-10 10:05

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

热门数据榜

专业Logo设计打造令人难忘的品牌形象

Stratup.ai AI创业点子与工具平台

猫眼人工智能反欺凌软件学校智能监控与预警

SAP旗下最新推出的商业智能AI助手Joule全面介绍

AI-FraudGuard 智能电商欺诈预防与合规平台

智能定制化测验生成工具Criov

PicWish快速在线人工智能驱动全能图片编辑美化平台

PhishNet产品比价帮您找到最优优惠

AI驱动安全视频播客托管平台，畅享无忧流媒体

Anomify实时指标分析与问题解决异常检测AI平台

专业Logo设计打造令人难忘的品牌形象

Stratup.ai AI创业点子与工具平台

猫眼人工智能反欺凌软件学校智能监控与预警

SAP旗下最新推出的商业智能AI助手Joule全面介绍

AI-FraudGuard 智能电商欺诈预防与合规平台

智能定制化测验生成工具Criov

PicWish快速在线人工智能驱动全能图片编辑美化平台

PhishNet产品比价帮您找到最优优惠

AI驱动安全视频播客托管平台，畅享无忧流媒体

Anomify实时指标分析与问题解决异常检测AI平台

专业Logo设计打造令人难忘的品牌形象

Stratup.ai AI创业点子与工具平台

猫眼人工智能反欺凌软件学校智能监控与预警

SAP旗下最新推出的商业智能AI助手Joule全面介绍

AI-FraudGuard 智能电商欺诈预防与合规平台

智能定制化测验生成工具Criov

PicWish快速在线人工智能驱动全能图片编辑美化平台

PhishNet产品比价帮您找到最优优惠

AI驱动安全视频播客托管平台，畅享无忧流媒体

Anomify实时指标分析与问题解决异常检测AI平台

相关攻略

相关攻略

地下室发现尘封12年AMD前CEO旧PC苏姿丰签名推土机硬件

2026-07-10 10:06

地下室发现尘封12年AMD前CEO旧PC苏姿丰签名推土机硬件

Laravel 12生态成熟助力全栈开发效率提升

2026-07-10 10:06

Laravel 12生态成熟助力全栈开发效率提升

Linux内核持续演进：Rust语言与零拷贝网络成新焦点

2026-07-10 10:06

Linux内核持续演进：Rust语言与零拷贝网络成新焦点

谷歌Gemini进入Agent时代打造全天候AI助理

2026-07-10 10:05

谷歌Gemini进入Agent时代打造全天候AI助理

CPU-Z 2.20.2正式版发布支持Intel三大平台及AMD锐龙AI Max

2026-07-10 10:05

CPU-Z 2.20.2正式版发布支持Intel三大平台及AMD锐龙AI Max

苹果CEO库克主持WWDC26数次拭泪连说18声谢谢

2026-07-10 10:05

苹果CEO库克主持WWDC26数次拭泪连说18声谢谢

中国空间站成功培育出番茄

2026-07-10 10:05

中国空间站成功培育出番茄

A电竞全线领先锐龙5 9600X vs 酷睿Ultra5 250K PLUS八款游戏实测

2026-07-10 10:05

A电竞全线领先锐龙5 9600X vs 酷睿Ultra5 250K PLUS八款游戏实测

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

北境酒馆实况我在中世纪经营知名酒馆

北境酒馆实况我在中世纪经营知名酒馆发布于 2026-07-10

天堂2盟约剑盾职业玩法：技能搭配装备选择实战技巧

天堂2盟约剑盾职业玩法：技能搭配装备选择实战技巧发布于 2026-07-10

战意三国7月24日定档违约最高送1亿电影票

战意三国7月24日定档违约最高送1亿电影票发布于 2026-07-10

天堂2盟约手游深度评测：玩法特色、职业系统及新手入门指南

天堂2盟约手游深度评测：玩法特色、职业系统及新手入门指南发布于 2026-07-10

年大型手游排行榜前十人气耐玩网游大盘点

年大型手游排行榜前十人气耐玩网游大盘点发布于 2026-07-10

怪物猎人旅人冰原双刀强度解析与实战评测

怪物猎人旅人冰原双刀强度解析与实战评测发布于 2026-07-10

女生最爱玩的热门高人气手游推荐下载合集

女生最爱玩的热门高人气手游推荐下载合集发布于 2026-07-10

最新十大好用安卓手机飞机订票App推荐下载

最新十大好用安卓手机飞机订票App推荐下载发布于 2026-07-10

如何用Linux查看网络数据包在内核的流向

如何用Linux查看网络数据包在内核的流向发布于 2026-07-10

如何在CentOS 7中修改文件系统配额的具体操作步骤

如何在CentOS 7中修改文件系统配额的具体操作步骤发布于 2026-07-10

Linux查看具体硬件驱动列表的命令

Linux查看具体硬件驱动列表的命令发布于 2026-07-10

电脑0x800401f3无效类字符串系统底层报错解决

电脑0x800401f3无效类字符串系统底层报错解决发布于 2026-07-10

奔驰电动GLC与理想i6怎么选，40万内家用优势对比

奔驰电动GLC与理想i6怎么选，40万内家用优势对比发布于 2026-07-10

三星S20U设置5G后信号变差常见原因及解决方法

三星S20U设置5G后信号变差常见原因及解决方法发布于 2026-07-10

家用取暖器暖和又省电的选购指南与推荐

家用取暖器暖和又省电的选购指南与推荐发布于 2026-07-10

超声波加湿器如何安装使用更省电

超声波加湿器如何安装使用更省电发布于 2026-07-10

热门话题

可灵AI使用教程_可灵视频生成指南_AI短片创作技巧

可灵AI使用教程_可灵视频生成指南_AI短片创作技巧

海螺AI使用教程_MiniMax视频音乐生成指南_海螺AI实战技巧

海螺AI使用教程_MiniMax视频音乐生成指南_海螺AI实战技巧

讯飞星火使用教程_星火大模型功能解析_办公写作学习指南

讯飞星火使用教程_星火大模型功能解析_办公写作学习指南

文小言使用教程_百度AI助手功能解析_文心智能体使用指南

文小言使用教程_百度AI助手功能解析_文心智能体使用指南

智谱清言使用教程_GLM大模型能力解析_清言AI实用指南

智谱清言使用教程_GLM大模型能力解析_清言AI实用指南

天工AI使用教程_天工搜索写作指南_昆仑万维AI助手解析

天工AI使用教程_天工搜索写作指南_昆仑万维AI助手解析

腾讯元宝使用教程_腾讯元宝AI功能解析_搜索写作智能体指南

腾讯元宝使用教程_腾讯元宝AI功能解析_搜索写作智能体指南

即梦AI使用教程_即梦图片视频生成指南_提示词与创作技巧

即梦AI使用教程_即梦图片视频生成指南_提示词与创作技巧

Microsoft Copilot使用教程_Copilot办公与编程指南_微软AI助手实战

Microsoft Copilot使用教程_Copilot办公与编程指南_微软AI助手实战