陶哲轩最新演讲AI将催生出一个大数学时代
陶哲轩的这场演讲,信息量极为丰富。我们来深入探讨他对人工智能在数学和科学领域未来所扮演角色的判断。他的核心观点非常明确:AI是一项了不起的技术,将加速科学和数学的发展,但绝不能把它当作某种“魔法”——它经常被过度神化。
从本质上讲,AI就像一个极其复杂的“猜测引擎”。你输入信息,它把每个单词、每个数字拆分为微小碎片,乘以不同的权重,再反复重组,最终给出一个输出。这个过程在数学上其实相当普通,甚至有些单调。真正有趣的地方在于如何寻找和调整那些权重。但无论如何,它并非《星际迷航》里的传送器,它仍然遵循物理定律和数学规则。
为了说明这个道理,陶哲轩打了一个非常形象的比方:想象一下,在动力飞行器尚未被发明的世界里,人们只有汽车、卡车和轮船。突然有人发明了喷气发动机。最初它只是个玩具,什么都做不了;后来它变得越来越强大,速度比最快的汽车还快十倍。但问题是,你不能直接把喷气发动机绑在汽车上就指望它能飞起来——你必须重新设计飞机、安全协议、导航仪表,甚至理解全新的物理规律。AI也是一样,它不是魔法,只是改变了规模和可能性的边界。
我们平时使用的软件很“无聊”:你输入一个地址,它每次都返回同样的内容。大语言模型则完全相反——它更“有创意”。你不需要学习编程语言,直接用自然语言就能与它交流。即使你输入的信息有误,它也能猜出你的意思。但代价是:它不再可靠。你问同一个问题两次,可能得到两个不同的答案,而且它从不保证答案是正确的。

去年GPT-4刚发布时,有团队用数学奥林匹克竞赛题去测试它。结果呢?有时候它确实能给出完全正确的证明——对于那几百名顶尖高中学生来说都极具挑战的题目。但你猜怎么着?他们测试了几百道题,成功率只有1%。所以,当它发挥威力时很惊艳,但当它出错时,后果也可能很糟糕。

同一个测试中,他们让它计算一道简单的算术题:7×4+8×8。它先是直接猜了个答案——120。然后它可能觉得哪里不对劲,又逐步重新计算了一遍:7×4=28,8×8=64,加起来是92。实验者追问:“等等,你刚才不是说答案是120吗?”它回答:“那是个错误,正确答案是92。”看到了吧?这些技术,至少在目前这个阶段,还没有真正建立一个关于“正确性”的基本事实。人们试图通过强迫它“一步一步思考”来补救,但这多少有点“黑客”式的凑合——它不像一个真正的专家那样可靠,尽管有时确实能输出专家级别的答案。
那么问题来了:到底该如何利用这项技术?我们以前也遇到过会出错的技术,但那些糟糕的输出很容易被识别出来——一看就知道是假的。而AI被专门设计成“尽可能接近正确答案”,所以即使错了,也错得很有说服力。这就带来了一个全新的问题:如何判断它什么时候是对的,什么时候只是看起来对?尤其是当你想把它用于可能造成实际伤害的领域时——比如医疗决策、财务规划,甚至心理治疗。它们可能是个好伙伴,但也可能给出非常糟糕的建议。
所以在很多领域,尽管AI潜力巨大,但安全性还远远不达标。这就像喷气发动机刚发明出来的时候:你可以用它做快速原型,但要达到让公众觉得安全的状态,可能需要几十年。航空旅行现在是地球上最安全的出行方式,但那是设计、安全协议和无数次迭代的结果。这些问题可以解决,但你必须认真对待安全,而且必须假设事故一定会发生。
当然,在那些“下行风险”很小的场景里,AI已经大有可为。比如,你可能已经注意到了,陶哲轩这场演讲的背景图片全都是AI生成的。虽然有些地方看起来还是有点别扭(比如文字生成依然很烂),但风险极低——它只是背景,不是演讲的核心。所以,在某些应用中,这样的风险完全可以接受。
尤其是在科学领域,一个有效的办法是“独立验证”。想象一下,你有一个水龙头,每天只能放出一定量的饮用水。突然有人给了你一个消防水带,出水量是原来的100倍,但水不干净。如果你加上一个过滤装置,把不能喝的部分滤掉,你就有了海量的饮用水。这就是AI在科学和数学领域最可能的角色。
很多科学领域现在都面临一个共同的瓶颈:需要找出“好的候选者”。比如药物研发:你得先想出某个分子可能有效,然后合成它,再做多年的临床试验,而这些试验极其昂贵。大多数候选者都会失败。AI的作用就是大幅缩减候选者的数量——不是100个,可能只要测试10个,就能找到那个真正有效的。材料科学也是如此。人们找了半个多世纪的室温超导体,试了无数种材料都失败了。如果AI能帮你跳过昂贵的合成过程,把候选材料从几万种缩小到几十种,那就是真正的变革。
另一方面,AI也在加速建模。无论是气候预测、交通建模还是宇宙学,传统方法都需要超级计算机跑几个月。而AI只需几个小时就能给出同样准确的预测——在某些场景下,它甚至比美国国家气象局的预测还要精准。所以,任何存在“模拟瓶颈”的地方,都是AI大显身手的好机会。
陶哲轩是数学家,他更兴奋的是AI对数学本身的改变。与许多其他学科相比,把AI应用到数学上的风险要小得多。如果你让它解决一个数学问题,它答错了,那又怎样?不会是世界末日。更重要的是,数学有一个绝对可靠的标准——证明。你可以用其他软件独立验证这个证明的正确与否,所以你不必信任AI,你只需要使用它。
这就引出了“证明助手”的概念。这是一种特殊的计算机软件,它不生成程序,而是验证某个陈述的正确性。数学家和工程师都有巨大的需求:比如飞机上的某个电子电路,你希望它百分之百按照设计执行任务。但问题是,把证明变成这种“形式化”语言非常耗时。一个中等规模的数学问题,数学家可能需要几个月写证明,而把它形式化却至少需要10个月的时间,而且通常一个人干不了,需要组队。

好消息是,这个过程正在加速。比如四色定理在1970年代被证明,直到2000年代才完成形式化;克卜勒猜想1998年被证明,因为太复杂了,拖了很久。但最近,陶哲轩和合著者用了一个20人的团队,在三周内就完成了一个猜想的形式化验证。更快了,但还不够方便。
关键的变化在于,AI已经开始介入形式化项目。比如在Freiman-Ruzsa猜想的形式化中,GitHub Copilot能自动填写证明中的某些步骤。虽然目前只能填一两行,但随着技术进步,我们完全可以想象:未来的数学家将不再是手动写证明,而是像教学生一样,口述证明思路给AI。AI会尝试把它形式化,如果成功就保存,如果失败就返回提示。来回迭代几次,过程会比传统方式快得多。
而且,如果你想修改证明中的一个假设,传统做法是:你得重新检查每一行,很容易出错。但在形式化系统中,你只需要改动那几行代码,系统会保证其他部分正确无误。这种便利性,其实已经在悄悄改变数学研究的方式了。
陶哲轩很乐观:他认为AI和数学将产生巨大的协同效应,最终催生出一个真正意义上的“大数学时代”。在这个时代里,数学家们可以共同完成规模空前的大型项目,而AI就是那个最得力的助手。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
批处理BAT入门教程第一篇
提供13个批处理实战技巧,覆盖全盘查找并删除文件夹或文件、拷贝移动文件、创建畸形文件夹及设置隐藏属性等场景,可一键完成系统维护与文件管理工作,极大提升自动化操作效率和便捷性。
从零开始批处理命令For循环详解与实战案例
批处理For命令支持 d、 l、 r、 f四个参数。 d仅列出当前目录下的目录名; r递归搜索指定路径及其子目录中的文件; l生成数值序列; f可解析文件、字符串或命令输出,通过delims、tokens、skip、eol等选项灵活处理内容。
批评你的人是你生命中的贵人
批评你的人往往最值得珍惜,因为他们关注你、助你成长。面对批评应包容反思,用行动改进而非辩解。接受批评是自我完善的过程,能让人少走弯路,避免重复犯错。这样的人正是生命中的贵人,值得感恩与珍惜。
测试人员角色定位与职责详解
测试人员角色经历了从找问题、保证质量到分析风险的转变,最终核心职责是提供关键信息,协助团队创造优秀产品。这包括识别问题、评估风险及帮助团队了解项目状态,而非单纯把关或追求完美。
经营成功测试生涯的实用方法与策略
一、测试生涯的起点 1989年,我在田纳西大学攻读研究生时,意外地从软件开发人员转行成为一名软件测试工程师。这并非我主动选择,说起来还有些戏剧性——某个早晨,教授质问我为何缺席那么多开发会议,我解释说这些会议总是安排在周末早上,对我这个第一次离家、刚入学的学生来说实在不便。结果呢?等待我的不是解聘通
- 日榜
- 周榜
- 月榜
相关攻略
2026-07-03 16:15
2026-07-03 16:14
2026-07-03 16:14
2026-07-03 16:14
2026-07-03 16:14
2026-07-03 16:14
2026-07-03 16:13
2026-07-03 16:13
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

