DeepMind联手五大AI神殿:陶哲轩警示AI世纪难题挑战

谷歌DeepMind再次重磅出击,联合全球五大顶尖科研机构,集结人工智能的力量直指数学界的桂冠!与此同时,陶哲轩冷静地发出警示:AI的滥用可能带来的潜在风险同样需要警惕。
今天,谷歌DeepMind正式启动了“AI赋能的数学研究计划”,汇集了全球五大顶尖学术机构的力量。
他们将运用谷歌最先进的数学专用AI系统,探索数学未知疆域中的新发现。

参与这次计划的AI系统阵容强大,包括曾获国际数学奥林匹克金牌的Gemini Deep Think,能够自主发现新算法的AlphaEvolve,以及擅长形式化证明的自动补全工具AlphaProof。
目前,首批合作的学术机构堪称豪华阵容:
伦敦帝国理工学院普林斯顿高等研究院(IAS)法国高等科学研究所(IHES)西蒙斯计算理论研究所(加州大学伯克利分校)塔塔基础科学研究所(TIFR)这五大机构拥有一个共同的使命——发掘那些有望通过AI技术获得突破性进展的数学难题,从而推动科学发现的进程。
然而,令陶哲轩担忧的是,“随着AI在数学研究中的应用日益加深,除了负责任的使用外,AI滥用的案例也屡见不鲜”。
他认为现在正是启动相关讨论的最佳时机,探讨如何将AI最佳地融入数学研究,透明公开其作用方式,并建立风险缓释机制。

这不仅能够守护数学研究的严谨性,更将为AI与数学的深度融合铺设坚实的道路。
五大顶尖机构,联手攻坚数学难题
数学,是描述宇宙运行规律最基础的语言。
在谷歌DeepMind看来,AI可以作为强大的辅助工具,与数学家展开深度合作,激发研究人员的创造力。
“AI赋能数学计划”的诞生,旨在实现三个核心目标:
发掘有望借助AI获得深刻见解的新一代数学难题;
构建支持这些前沿探索所需的基础设施与工具;
最终推动科学发现的加速前进。
这项计划将获得Google.org的专项资金支持,以及谷歌DeepMind顶尖技术的全面赋能。
近几个月来,谷歌DeepMind在自身研究领域取得了显著突破。
2024年,其开发的AlphaGeometry和AlphaProof系统在国际数学奥林匹克竞赛中斩获银牌。

而搭载Deep Think模块的最新Gemini模型,更在今年IMO中展现出金牌水准的卓越表现——完美破解全部六道题目,取得了42分的满分成绩。

今年5月,谷歌DeepMind发布的AlphaEvolve系统,被业界誉为当前最强大的通用人工智能体。

在数学分析、几何学、组合数学和数论领域的50个公开难题中,AlphaEvolve在其中20%的题目上获得了最优解。
更令人瞩目的是,在数学与算法发现领域,它发明了一种全新的、效率更高的矩阵乘法运算方法。

具体而言,在4x4矩阵乘法这一特定问题上,它发现了仅需48次标量乘法的新算法。
这一突破性成果,打破了1969年由Strassen算法保持的长达半个多世纪的历史记录。
不仅如此,在计算机科学领域,AlphaEvolve还协助研究人员发现了一些全新的数学结构。
同时,它也证明了某些复杂问题的求解难度实际上比人们过去想象的要更高,这促使研究者对计算边界有了更清晰、更精准的认知,为未来探索指明了方向。

以上这些重要进展,都是当前AI模型快速发展的有力证明。
对于AI的全部潜力如何推动最深奥的科学问题研究,人类的理解才刚刚开始。
AI与数学融合,边界在何处?
一直以来,陶哲轩既是“AI+数学”领域应用的坚定支持者,也是最佳实践的探索者。
他曾多次联合GPT-5 Pro等顶尖AI系统,破解了许多数学领域的难题,显著提升了研究效率。

毋庸置疑,在数学研究领域,大型语言模型和证明助手等AI工具,正悄然改变着传统的研究范式。
最近,一些顶尖学术论文开始融合AI技术,推动着从形式化证明到复杂计算的全方位创新。

论文地址:https://borisalexeev.com/pdf/erdos707.pdf
然而,随着AI的深度介入,也引出了一个关键问题:
如何确保这些工具的使用,不会损害论文的严谨性和学术价值?
基于这一契机,陶哲轩在公开平台上发起了深入讨论,在长篇贴文中,他提出了三大核心建议。

在以下讨论中,“AI”一词不仅涵盖大语言模型,还包含神经网络、可满足性求解器、证明助手以及其他任何复杂的辅助工具。
1 AI使用声明
论文中,所有对AI实质性功能的使用,包括自动补全、拼写检查,或是用于生成摘要的搜索引擎AI,都必须明确声明。
2 AI风险讨论与缓解措施
论文中,应讨论所用AI工具可能带来的一般性风险,并说明为缓解这些风险已采取的具体措施。
以下将举例说明:
2.1. 内容虚构,出现“幻觉”
AI可能会编造参考文献、证明过程或相关文本,导致事实性错误。
建议不要在论文正文中,直接使用AI生成的文本内容;若必须使用AI输出,则用不同字体或明显标记清晰标注。
2.2. 缺乏可复现性
专有AI或高计算成本的结果难以复现。解决方案是开源提示词、工作流程、验证数据等,让他人都能低成本验证。
2.3. 缺乏可解释性
AI输出往往晦涩难懂,其解释可能站不住脚。建议为每个AI输出配以人类撰写、可读性强的对应内容。
比如,一个定理可以同时包含一个由人类撰写、易于阅读的非形式化证明,以及一个由AI生成但不易阅读的形式化证明。
2.4. 缺乏可验证性
AI容易隐藏细微错误,检查耗时。形式化验证、一致性检查都有助于缓解这一问题,并采用多层次验证方法。
关键是在定理旁加“校验标记”,对未验证部分则明确说明。
2.5. 目标形式化不当
AI可能精确解决“错位”目标,即形式化后偏离作者意图的命题。为此,应从独立来源获取形式化目标,或由人类深度审视形式化过程。
2.6. 可能利用漏洞达成目标
与上一个问题相关联,AI可能会钻形式化表述的空子,例如添加任意公认“证明”的命题。
应对方法是列出已知漏洞,并讨论确保过程严谨的排除机制。
2.7. AI生成代码存在Bug
AI生成代码的bug更加隐蔽,难以用传统标准方法来检测修复。
为此,建议采用大量单元测试、外部验证,或将AI使用限于简单场景,复杂任务由人类修改适配。
3 责任归属
最终,论文的所有作者必须对AI贡献的内容承担责任,包括任何不准确、疏漏或虚假陈述。
除非明确标记为“未经核实”,否则作者不能推卸责任。

以上这些,只是陶哲轩抛砖引玉的初步思考,他希望能够促进更多业界研究人员的深入讨论,进一步完善这份清单。
评论下方,一位研究者John Dvorak直指痛点——
除非我们能跨越临界点,让所有数学证明都用Lean做形式化验证成为学界标准,否则这个问题基本无解。

对此,陶哲轩分享了一个最近观察到的观点,即使用AI审阅稿件质量是可以接受的,但它并非是最主要的筛选工具之一。
说白了,AI评估器终究只是辅助工具,而不能完全取代人类评估者。

免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
一加Ace 6评测:7800mAh电池配165Hz屏的旗舰体验
10月23日消息,一加正式宣布将于10月27日发布一加 Ace 6新机。一加中国区总裁李杰将其称为“史上最强Ace”,并强调这款产品
奥特曼揭秘GPT-6:正式改名GPT-6.7,实现重大技术跨越
OpenAI首席执行官山姆・奥特曼近日在社交平台X上宣布,公司计划将下一代语言模型GPT-6更名为GPT-6-7。这一突如其来的命名调整引发业界关注,但最新尚未就具体原因作出说明。据科技媒体披露,奥
谷歌AI转型财报解读:传统业务与AI融合的中国经验
谷歌母公司Alphabet近日公布了最新季度财报,数据表现全面超出市场预期,引发资本市场热烈反应。财报显示,公司当季总营收达1023 46亿美元,同比增长16%,较华尔街预期高出逾20亿美元。摊薄每
2025日本移动出行展:日系车企蓝图,揭秘未来出行新趋势
在近期举办的日本移动出行展上,各大车企纷纷亮出创新产品与技术,勾勒出未来出行的多元图景。这场展会不仅展示了传统汽车领域的突破,更将视野拓展至海洋、天空乃至太空,展现了日本车企对未来移动出行的全面构想
00后天才学生回归!Sora核心贡献者与OpenAI团队重塑超强AI
OpenAI内部一支由年轻工程师组成的特种团队,正悄然推进一项可能改变人工智能发展轨迹的重大项目。这支三人小组的核心成员Will Depue,这位年仅22岁便在AI领域声名鹊起的工程师,正带领团队向
相关攻略
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
 
												
                                                 
												
                                                 
												
                                                 
												
                                                 
												
                                                 
												
                                                 
												
                                                 
												
                                                 
												
                                                 
												
                                                 
												
                                                 
												
                                                 
												
                                                 
												
                                                 
												
                                                 
												
                                                 
												
                                                 
												
                                                 
												
                                                 
												
                                                








 
								 
								 
								 
								 
								 
								 
								 
								 
								