菲尔兹奖得主Michael Freedman新作揭开数学真相
当数学不再是“硬科学”:菲尔兹奖得主眼中的“柔软”本质
提起数学,我们脑海中浮现的,往往是严谨、精确、不容置疑的逻辑大厦。但在菲尔兹奖得主迈克尔・弗里德曼(Michael Freedman)看来,这幅图景或许需要被重新描绘。人类真正创造和使用的数学,其内核其实是“柔软且可塑”的。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
迈克尔・弗里德曼因解决四维庞加莱猜想而荣获数学界最高荣誉菲尔兹奖,该成果是拓扑学领域的里程碑。此后,他的研究轨迹并未局限于纯数学的象牙塔,而是转向了应用前沿——他创立了微软StationQ实验室,成为拓扑量子计算的重要推手。近年来,他的兴趣又延伸至人工智能领域,试图用数学的透镜,去透视人类知识的结构与生成机制。

想象一下:一个仅由600个token写成的数学命题,如果将其底层逻辑完全展开,其长度将达到10的104次方——一个比“古戈尔”(googol,10的100次方)还要庞大的天文数字。这并非科幻设定,而是弗里德曼团队在分析现代数学库Mathlib时观察到的真实现象。
这种将庞大演绎链条凝练为简洁概念的能力,背后隐藏着数学家们使用了三千年却鲜少言明的秘密:数学的本质,或许并非证明,而是压缩。
最近,弗里德曼在一篇论文中直接喊出了这一宣言:“压缩,就是你所需要的全部”(Compression is all you need)。

论文链接:https://arxiv.org/pdf/2603.20396
在近期的一次访谈中,弗里德曼深入阐释了这一观点,探讨了人类数学直觉与机器逻辑之间的深刻鸿沟。他认为,人类数学数千年的演进史,本质上是一部不断创造“宏”、构建抽象层的“压缩史”。从三千年前的位值记数法,到现代复杂的微分方程,文明一直在进行一场宏大的“数据压缩”实验。
人类从事数学,从来不是在穷举所有推理路径,而是在近乎无限的可能性空间中,敏锐地寻找那些可以被高度压缩的结构。相比之下,当前AI的推理方式,则更接近于“穷举”。
因此,在人工智能发展的关键十字路口,理解“压缩”这一核心机制,或许正是开启人类与AI在数学领域真正协作的钥匙。以下是经过梳理的访谈核心内容。
从“位值记数法”说起:压缩如何贯穿数学三千年
主持人: 通常我们认为数学是严密、完美的逻辑体系,但您的研究暗示,人类实际使用的数学并非如此。能否从“压缩”这个概念开始解释?
迈克尔・弗里德曼: 可以。我们的论文里开了个小玩笑:压缩技术其实在三千年前就被“发明”了——那就是位值记数法,它或许堪称数学的第一个伟大定理。
想想看,“10”可以用一个“1”放在特定位置来表示,“100”也是如此。仅仅通过改变“1”所处的位置,就能用极少的符号表达极大的数。这种表示法让整数的表达效率呈对数级增长,却能在有限符号内涵盖指数级数量的数值。
这是一种极其强大的压缩。但压缩远不止于数字表示,它贯穿了整个数学体系。
微分方程“看起来不难”的秘密:站在十几层抽象之上
主持人: 能举一个更具体的例子吗?
迈克尔・弗里德曼: 我大学时第一次上微分方程课,教授在黑板上写下一个巨大的Ω符号,然后说它是“向量丛截面的芽层”。当时我连“向量丛”是什么都不知道。
后来才明白,要理解这句话,你需要穿透多层概念:向量丛、截面、层、芽,以及它们之间的映射关系。如果再往下深挖,还涉及自然数、整数、有理数、实数、向量空间、流形等一系列基础结构。
这意味着,数学家在思考时,实际上是站在十几层抽象概念的顶端。这就是为什么微分方程“看起来不难”——海量的底层信息已经被高度压缩,封装在了高层概念之中。
这就是“压缩”的力量:巨量信息被隐藏在了高层的“黑箱”里。如果用Lean这类形式化语言来表达,就必须把这些压缩全部展开。所以说,压缩是数学的核心,且已存在了三千年。
在论文中,我们试图将这种直觉量化。我们使用Lean的数学库(Mathlib,约50万行代码)作为“人类数学”的一个近似模型,分析其结构:一个定理如何调用其他引理,定义如何复合与嵌套。我们能看到一种清晰的分层和压缩结构,使得命题能以高度“包装”的形式编写,随后再展开为基础的Lean术语。
我们研究了两者的关系,发现这种层次结构能将相对简单的数学命题,变成源自基础术语的、极其巨大的树状结构。
从600个Token到10^104:惊人的“信息膨胀”与“压缩比”
主持人: 我记得这个数字非常夸张:10的104次方。您做这些分析,是想强调这本质上就是数学的核心,对吗?
迈克尔・弗里德曼: 是的。我们将这个数学库视为人类行为的一个良好样本。虽然它在数学各领域的分布并不完美(例如数论和代数几何的内容远多于分析或拓扑),但它与“从一组公理出发进行每一种可能的逻辑推演”所产生的“混沌数学”截然不同。
无论如何进行形式化,结构的发现都会呈现双指数级的增长。最终,我们在Lean库中找到的最长的“解包”命题,其大小正是10的104次方,比古戈尔还大。而它对应的“包装”命题,只有600个Token。
这展示了惊人的信息膨胀,但反过来,也揭示了通过使用抽象概念所能获得的、同样惊人的压缩率。
我想说的是,数学家和他们的AI智能体实际上在同一条船上。但当你面对古戈尔这样的尺度时,即使我们的机器比我们快一百万倍,这个倍数在古戈尔面前也微不足道。
所以,真正关键的问题不是人类与机器将探索数学空间的哪一部分,而是在庞大的形式推理空间中,哪一部分是能够被压缩成我们和智能体都能理解的形态——我称之为“形式数学”。我相信,人类数学(在此我将我们的AI智能体也视为“人类”探索的延伸)正是如此。
如何知道“触底”?从“玩具模型”到数学的“多项式结构”
主持人: 在你们分析的这些结构中,是否存在某些不具备相同“公分母”的方程或过程?如何决定什么是最基础的?或者说,如何知道自己已经“触底”?
迈克尔・弗里德曼: 对于Lean来说,“触底”很容易判断,因为它的库结构就是那样设计的。基本上,存在一些原始项,你可以用它们构建更复杂的命题。这个“展开后长度”有时被称为树表示法。你查看一个命题的子节点(即它的构成部分),再看子节点的子节点,形成一棵越来越深的树,直到终止于原始的Lean项。然后统计所有节点的调用,并为每个节点根据其调用的先前节点赋予权重(原始项权重为1)。最后,将顶层所有权重相加,就得到了那个巨大的展开数字。
而压缩的精妙在于,人类设计并利用Lean表达了一种语言,使得用大约600个token写下这个古戈尔量级的数字成为可能。
我们论文的方法论从数学物理中汲取了灵感。物理学中为自然某部分建立简化模型以辅助分析时,会使用“玩具模型”——它不追求捕捉全部真相,而是抓住核心结构,有意选择一个现实的粗略投影,以期能进行完整分析,从而指导对更复杂问题的直觉。电磁学、量子力学等理论的发展都受益于此。
在论文中,我们用“幺半群”来为数学建模。幺半群类似于群,但不一定有逆元,最简单的例子就是自然数。在幺半群中,可以引入“宏”(即“新思想”),代表新的抽象,能帮助我们更高效地表达信息。
例如,“10的幂次方”就是一个能高效压缩、表示整数的“宏”。一旦幺半群中有了宏,就能推导出层级属性,衡量压缩程度。结果显示,宏越多,压缩程度越高;宏越少,表达能力就越弱。
而在数学这一侧,在Lean库中,我们尚不清楚具体的“宏”是什么。这有点像在寻找数学的使用手册。我们对此获得的洞察越多,人类(包括我们和AI智能体)探索数学就会越顺畅。我们的想法是,去学习数学中已经在使用的机制:原则是什么?推论是如何组织的?
当前的主要挑战是解决“逆问题”:找出在数学侧对应的“宏”到底是什么。
人类的“数学品味”与机器的“穷举”:差异能否弥合?
主持人: 在数学推理中,机器往往需要遍历指数级的可能性,而人类却能以更“慢”、近似多项式的方式直击要害。这种差异是否源于一种“数学品味”?我们是如何从海量可能性中筛选出有意义路径的?这种能力能否被建模并复制到机器中?
迈克尔・弗里德曼: 这正是实验科学,也是我们试图发现的。我们某种程度上是在循环分析数学的历史,试图理解是什么引导我们走向这些高度可压缩的形式推理领域。也许通过澄清这个概念,举出一些“宏”的例子,就能更清楚地看到什么是可压缩的,什么是不可压缩的。
主持人: 有没有更直观的例子?
迈克尔・弗里德曼: 比如拉格朗日定理:任何整数都可以表示为四个平方数之和。这意味着,如果你把“平方数”当作一个“宏”,那么使用这个增长极快的宏,每个整数只需要四步就能表示。
这听起来很疯狂,但解释是:表达这些平方数本身需要很多比特,所以并不违背信息论。它只是说明,如果有更稠密的宏集合,就可以用更少的步骤表达更多内容。也就是说,宏的“密度”决定了表达效率。而“10的幂次方”正好处于一个平衡点,在宏的简洁性(不能太大)和表达能力(能够大量扩展)之间找到了最佳平衡。
我们论文中有一个结论是:多项式增长的幺半群容易压缩,而指数增长的幺半群难以压缩。根据经验和数值研究,我们发现数学具有高度可压缩性。如果它能被一个幺半群很好地表示,那么它必须是一个多项式增长的幺半群,才能展现出我们眼前所见的这种压缩。因此,一个合理的推测是:数学的结构本质上是多项式的。
用PageRank思想导航数学:定义人机协作的新模式
主持人: 论文中还提到,建议使用类似PageRank的算法来识别数学中具有高中心性的节点和核心定义,即那些支撑整个结构的关键点。我们如何在这些庞大的证明网络中识别并找到它们?如果能识别,这是否定义了一种数学家与AI协作的新模式?
迈克尔・弗里德曼: 这是个好问题。PageRank本质上是一种寻找马尔可夫链平衡的算法,即通过观察节点之间的相互引用关系来确定谁更重要。这是一种分配重要性的自然思路,但它需要对结构和互联有全局性了解。
我们在论文中提出了更简单的指标。因为数学依赖抽象,我们定义了两种比例:“还原压缩”和“演绎压缩”。
“还原压缩”是“展开长度”与“压缩长度”的比值。如果一个陈述处于极高的抽象水平,展开后变得极其庞大,那么这个比值就会非常大。这不仅是自动智能体可以使用的局部指标,还能用来判断是在提升还是降低抽象层级。
“演绎压缩”则是观察证明长度与命题陈述长度的比值。这个比例告诉我们,有多少数学工作被压缩进了那个命题中。例如,费马大定理可以用一句话描述,但证明需要数百页。这个极高的比例证明了该命题具有非凡的“压缩密度”。
AI在探索证明路径时,可以追踪这些指标,从而感知它正在穿越的数学“景观”。
“压缩即全部”:一个面向AI时代的数学宣言
主持人: 整体来看,这篇论文在研究数学智能本质时提出了一个非常大胆的宣言,似乎也与大语言模型的发展相关。当初为什么选择这个特定方向?想传达的核心信息是什么?
迈克尔・弗里德曼: 我们论文的标题“压缩就是你所需要的全部”本身就是一个强观点。用大胆的措辞陈述观点是好事,这样人们可以反驳它,从而引发更深入的讨论。
至于我个人为何选择这个方向?从宏观历史视角看,我认为我们正处在一个非常特殊的节点。从文艺复兴到科学革命、工业革命,再到高科技革命和现在的AI,历史似乎正奔向某个“奇点”,世界即将发生巨变。甚至可以说,“外星人”已经抵达了,只不过它们是我们自己创造的。而我,更希望作为参与者而非观察者进入这个时代。
更具体地说,我们正在探索。寻找能够引导我们发现“有趣数学”(即人类所创造的数学)的简单组织原则,将是富有成效的。我们已经看到,可压缩性在数学中有着非常不同的形式。
论文中讨论的可压缩性是“局部”的:你将一组符号压缩成新符号(如10的幂次方)。但像柯尔莫哥洛夫这样的人,通过算法研究了更一般类型的“全局”压缩。数学家惯用局部压缩,而全局压缩是不可计算的。但或许存在某种中间地带,通过仔细研究压缩,我们和智能体也许能探索出超越局部压缩的新思维模式。这是一个尚显模糊的想法,但我想呈现给大家。
所以,我认为我们和AI在某种意义上是“同一条船上的人”。它们也无法通过暴力计算探索全部空间,必须像我们一样依赖某种“直觉”。未来的关键在于:我们如何与AI一起,发展出新的数学直觉。
这篇论文,其实是在尝试绘制一张“数学的地形图”,帮助我们理解这个我们共同探索的、广阔而深邃的空间。
https://arxiv.org/abs/2603.20396
https://x.com/SAIRfoundation/status/2036916216913330552
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
Interview Solver
Interview Solver 是什么 在编程面试这场专业较量中,准备充分与否往往决定了最终去向。市场上不少工具声称能提供帮助,但真正能模拟临场压力并给出针对性指导的却不多见。这正是Interview Solver诞生的初衷:一个由专业团队深度打造的AI辅助面试平台,它存在的唯一目标,就是帮助求职
Gift Recommender
Gift Recommender是什么 挑礼物这事儿,是不是经常让你觉得头疼?面对琳琅满目的商品和捉摸不定的喜好,时间花了,心思费了,结果可能还不尽如人意。Creati ai推出的Gift Recommender,正是为解决这个普遍痛点而生的智能工具。简单来说,它是一个人工智能驱动的礼物推荐系统。
MovieWiser
MovieWiser是什么 面对海量的影视内容,如何快速找到真正合自己胃口的那一部?这是个让人头疼的问题。现在,一个创新的解决方案出现了——MovieWiser。这个由AI Pure开发的网络应用,核心目标就是用人工智能,把“找片儿”这件事变得个性化、智能化。它不再只是罗列热门榜单,而是像一个懂你的
Swimm AI
Swimm AI是什么 在当今软件开发中,团队面对大型、复杂的代码库时,文档缺失或过时常常让人头疼。Swimm AI的出现,正是为了解决这个痛点。它本质上是一款AI驱动的代码理解与文档助手,由Swimm公司精心打造。它的使命很明确:帮助开发者快速吃透庞杂的代码,并通过智能化的方式,将团队内部的隐性知
Windward AI
Windward AI是什么 简单来说,Windward AI是一款革命性的“海洋人工智能”工具。它由业内知名的Windward公司打造,核心目标直指两个关键领域:提升海洋态势感知能力和优化风险管理。对于任何希望强化运营准备、驾驭复杂供应链风险的组织而言,这款工具正成为一个不可或缺的助手。 那么,它
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

