当前位置: 首页
科技数码
陶哲轩18个月没搞定的数学挑战,被这个“AI高斯”三周完成了

陶哲轩18个月没搞定的数学挑战,被这个“AI高斯”三周完成了

热心网友 时间:2025-09-14
转载

不得了,这个名叫Gauss(高斯)的新AI Agent,有点杀疯了的感觉。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

因为它只用了三周的时间,就完成了陶哲轩和Alex Kontorovich提出的数学挑战——

在Lean中形式化强素数定理(Prime Number Theorem,PNT)。

要知道,陶哲轩和Kontorovich在2024年1月提出这个挑战后,足足花了18个月(今年7月)的时间,也才取得阶段性的进展。

那么这个Gauss到底是什么来头?

它的背后是一家叫做Math的AI公司,据介绍,Gauss是首个可以协助顶级数学家进行形式验证的自动形式化(autoformalization)Agent:

这里的形式化(formalization),指的是把人类写的数学内容转换成一种机器可读、可检查、严密无歧义的形式语言,然后利用计算机帮助验证其正确性。

而陶哲轩和Alex Kontorovich之所以目前仅取得阶段性进展,问题就卡在了复分析(complex analysis)的核心难题上。

而这个Gauss作为硅基生命,它的特点就是可以不停的工作,极大地压缩了以前只有顶尖形式化专家才能完成的工作量;与此同时,Gauss还形式化了上面提到的复分析中关键的缺失结果。

这就是为什么它能三周解决陶哲轩18个月都未能完成的数学挑战的原因了。

Gauss是如何实现的?

目前Math公司最新并没有发布具体的技术报告。

但从最终结果来看,Gauss生成了大约25000行Lean代码,包含上千个定理和定义。

要知道,这种规模的形式化证明,以前往往需要多年才能完成。

历史上最大的单个形式化项目(往往需要跨甚至10年的时间),也只是比这大一个数量级(最多50万行代码)。

相比之下,Lean的标准数学库Mathlib有约200万行代码,包含35万个定理,但却由600多位贡献者花了8年时间才建立起来。

为了支撑Gauss的运行,团队还和Morph Labs合作开发了Trinity环境基础设施。

因为要让Gauss如此大规模运行,会涉及数千个并发Agent,且每个Agent都有自己的Lean运行环境,会消耗数TB的集群内存,是一个极其复杂的系统工程挑战。

Math团队还表示:

Gauss将大幅缩短完成大型数学项目所需的时间。

随着算法不断进步,我们计划在未来12个月内,让形式化代码的总量提升100到1000倍。

这将成为新范式的训练场——走向“可验证的超级智能”和“通才型机器数学家”。

麻 将

而就在刚刚,陶哲轩本人在Mastodon上对形式化相关的问题做了一番解释(以下为陶哲轩的陈述)。

任何复杂的项目往往都有明确陈述的目标和隐含的未陈述目标。例如,一个Lean形式化项目的明确目标可能是获得某个数学命题X的形式化证明;但通常还有一些未陈述的目标,例如以适合上游到 Mathlib 库的方式形式化X的关键子命题和定义X1, X2, …;学习如何使用各种协作工具和分配任务;有机地发现X证明的更精细结构,这在以前的非形式化证明中可能没有被强调;为新手形式化者提供实际培训和经验;以及更普遍地建立一个精通形式化艺术的人类社区。

过去,通常没有必要阐明这些隐含目标,因为这些目标的实现与明确目标的实现之间存在很强的经验相关性。在形式化项目的例子中,几乎任何以人为中心的努力来实现明确目标,最终都会自然而然地实现上述大部分隐含目标。因此,明确目标有效地成为了更广泛实际目标的可行替代。

然而,随着功能强大的AI工具的出现,情况正在发生变化,这些工具采用与人类截然不同的方法。这些工具可以被指示去解决一个明确的目标,而不必实现如果由人类团队执行任务时可能同时实现的所有隐含目标。事实上,AI优化算法的性质决定了它们甚至可能以牺牲所有隐含目标为代价,在明确目标上取得高绩效。(参见古德哈特定律:“当一个衡量标准成为目标时,它就不再是一个好的衡量标准。”)

鉴于这些工具的日益部署,这向我表明,项目组织者现在需要付出更大的努力,明确阐述项目的所有目标,而不仅仅是名义上的目标。在某些情况下,这些目标甚至可能最初对组织者自己来说并不明显,可能需要参与者之间进行一些讨论。而有兴趣用其AI工具测试此类项目的外部各方,则应提前与组织者协调,以防他们遗漏了一个或多个其工具不会优化的关键隐含目标。

创始人是ICML’25时间检验奖作者

值得一提的是,Math这家公司的老板也是有点实力在身上的。

因为他正是拿下今年AI定会ICML时间检验奖论文的作者之一,Christian Szegedy。

这篇论文是他和另一位作者Sergey Loffe在2015年提出的Batch Normalization(批次归一化,简称BatchNorm)。

如今,这篇论文的引用量超过6万次,是深度学习发展史上一个里程碑式的突破,极大地推动了深层神经网络的训练和应用。

可以说它是让深度学习从小规模实验,走向大规模实用化和可靠性的关键技术之一。

当然,网友们看罢Gauss之后虽然惊呼Amazing,但同时也在喊最新赶紧把论文公开喽。

至于更细节的技术内容,我们可以蹲一波了~

参考链接:[1]https://x.com/mathematics_inc/status/1966194751847461309[2]https://www.math.inc/gauss[3]https://www.math.inc/vision

欢迎在评论区留下你的想法!

金磊 发自 凹非寺量子位 | 公众号 QbitAI

来源:https://36kr.com/p/3466108385908098

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
11.58万起售 埃安N60携激光雷达入场 15万级纯电SUV市场迎新变局

11.58万起售 埃安N60携激光雷达入场 15万级纯电SUV市场迎新变局

埃安N60正式预售:11 58万元起,主打“Easy Life”与硬核安全 长沙的发布会现场,埃安带来了它的新答案——全新纯电SUV埃安N60正式亮相并开启预售,价格定在11 58万元起。这个开局颇具诚意,预订用户还能获得价值1 5万元的权益包,覆盖了充电、保养等实实在在的服务。与新车一同亮相的,还

时间:2026-04-19 22:56
雷军直播坦言:小米汽车聚焦驾驶乐趣,有司机的大老板慎选!

雷军直播坦言:小米汽车聚焦驾驶乐趣,有司机的大老板慎选!

在近期一场直播互动中,小米科技创始人雷军以直率风格引发汽车行业热议 他坦言,小米汽车的设计初衷并非服务于传统商务场景,而是聚焦驾驶体验本身,甚至直言“有专职司机的大老板不建议购买”。这一观点,与当前新能源市场普遍强调“后排豪华”的营销策略形成了鲜明对比。 如何理解这种差异?雷军以即将上市的YU7为例

时间:2026-04-19 22:54
广交会“老面孔”汪和平:从语言障碍到畅行全球,见证中国外贸新变迁

广交会“老面孔”汪和平:从语言障碍到畅行全球,见证中国外贸新变迁

从“打哑语”到全球生意:一位外贸人的二十年 在今年的广交会现场,浙江诺特电器创始人汪和平的展位并不起眼——面积不大,装修也朴素。但有意思的是,这位几乎不会说外语的老板,就凭着一部手机、一台双屏翻译机和一副耳机,从容地接待着来自世界各地的贸易伙伴。展位外,他刚和美国的老朋友敲定了新一年的合作。如果把时

时间:2026-04-19 22:43
从“工具车”到“生活伙伴” 埃安2.0时代以焕新姿态拥抱新未来

从“工具车”到“生活伙伴” 埃安2.0时代以焕新姿态拥抱新未来

在汽车行业发布会密集举办的当下,一场以“智悦生活 Easy Life”为主题的新品发布会引起关注。埃安品牌携全新车型N60亮相,试图通过产品与品牌双升级,打破市场对品牌的固有认知。 新车N60的外观设计,可以说一登场就引发了讨论。其短车头、长座舱、高车顶的方盒子造型,搭配圆润车身线条与贯穿式灯带,与

时间:2026-04-19 22:36
比亚迪领汇e7闪充版低调登场,价格亲民充电快,出行市场友商压力倍增

比亚迪领汇e7闪充版低调登场,价格亲民充电快,出行市场友商压力倍增

比亚迪领汇e7:10万元级闪充车型,如何搅动出行市场? 最近,汽车圈里有个消息值得玩味:比亚迪旗下新品牌领汇,低调推出了首款闪充车型——领汇e7。价格定在9 58万到11 58万元之间。其中,10 98万和11 58万的次顶配与顶配版本,直接搭载了第二代刀片电池,纯电续航550公里,还支持闪充技术。

时间:2026-04-19 22:35
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程