菲尔兹奖得主Michael Freedman新作揭开数学真相

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

菲尔兹奖得主Michael Freedman新作揭开数学真相

热心网友时间：2026-04-20

转载

当数学不再是“硬科学”：菲尔兹奖得主眼中的“柔软”本质

提起数学，我们脑海中浮现的，往往是严谨、精确、不容置疑的逻辑大厦。但在菲尔兹奖得主迈克尔・弗里德曼（Michael Freedman）看来，这幅图景或许需要被重新描绘。人类真正创造和使用的数学，其内核其实是“柔软且可塑”的。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

迈克尔・弗里德曼因解决四维庞加莱猜想而荣获数学界最高荣誉菲尔兹奖，该成果是拓扑学领域的里程碑。此后，他的研究轨迹并未局限于纯数学的象牙塔，而是转向了应用前沿——他创立了微软StationQ实验室，成为拓扑量子计算的重要推手。近年来，他的兴趣又延伸至人工智能领域，试图用数学的透镜，去透视人类知识的结构与生成机制。

想象一下：一个仅由600个token写成的数学命题，如果将其底层逻辑完全展开，其长度将达到10的104次方——一个比“古戈尔”（googol，10的100次方）还要庞大的天文数字。这并非科幻设定，而是弗里德曼团队在分析现代数学库Mathlib时观察到的真实现象。

这种将庞大演绎链条凝练为简洁概念的能力，背后隐藏着数学家们使用了三千年却鲜少言明的秘密：数学的本质，或许并非证明，而是压缩。

最近，弗里德曼在一篇论文中直接喊出了这一宣言：“压缩，就是你所需要的全部”（Compression is all you need）。

论文链接：https://arxiv.org/pdf/2603.20396

在近期的一次访谈中，弗里德曼深入阐释了这一观点，探讨了人类数学直觉与机器逻辑之间的深刻鸿沟。他认为，人类数学数千年的演进史，本质上是一部不断创造“宏”、构建抽象层的“压缩史”。从三千年前的位值记数法，到现代复杂的微分方程，文明一直在进行一场宏大的“数据压缩”实验。

人类从事数学，从来不是在穷举所有推理路径，而是在近乎无限的可能性空间中，敏锐地寻找那些可以被高度压缩的结构。相比之下，当前AI的推理方式，则更接近于“穷举”。

因此，在人工智能发展的关键十字路口，理解“压缩”这一核心机制，或许正是开启人类与AI在数学领域真正协作的钥匙。以下是经过梳理的访谈核心内容。

从“位值记数法”说起：压缩如何贯穿数学三千年

主持人： 通常我们认为数学是严密、完美的逻辑体系，但您的研究暗示，人类实际使用的数学并非如此。能否从“压缩”这个概念开始解释？

迈克尔・弗里德曼： 可以。我们的论文里开了个小玩笑：压缩技术其实在三千年前就被“发明”了——那就是位值记数法，它或许堪称数学的第一个伟大定理。

想想看，“10”可以用一个“1”放在特定位置来表示，“100”也是如此。仅仅通过改变“1”所处的位置，就能用极少的符号表达极大的数。这种表示法让整数的表达效率呈对数级增长，却能在有限符号内涵盖指数级数量的数值。

这是一种极其强大的压缩。但压缩远不止于数字表示，它贯穿了整个数学体系。

微分方程“看起来不难”的秘密：站在十几层抽象之上

主持人： 能举一个更具体的例子吗？

迈克尔・弗里德曼： 我大学时第一次上微分方程课，教授在黑板上写下一个巨大的Ω符号，然后说它是“向量丛截面的芽层”。当时我连“向量丛”是什么都不知道。

后来才明白，要理解这句话，你需要穿透多层概念：向量丛、截面、层、芽，以及它们之间的映射关系。如果再往下深挖，还涉及自然数、整数、有理数、实数、向量空间、流形等一系列基础结构。

这意味着，数学家在思考时，实际上是站在十几层抽象概念的顶端。这就是为什么微分方程“看起来不难”——海量的底层信息已经被高度压缩，封装在了高层概念之中。

这就是“压缩”的力量：巨量信息被隐藏在了高层的“黑箱”里。如果用Lean这类形式化语言来表达，就必须把这些压缩全部展开。所以说，压缩是数学的核心，且已存在了三千年。

在论文中，我们试图将这种直觉量化。我们使用Lean的数学库（Mathlib，约50万行代码）作为“人类数学”的一个近似模型，分析其结构：一个定理如何调用其他引理，定义如何复合与嵌套。我们能看到一种清晰的分层和压缩结构，使得命题能以高度“包装”的形式编写，随后再展开为基础的Lean术语。

我们研究了两者的关系，发现这种层次结构能将相对简单的数学命题，变成源自基础术语的、极其巨大的树状结构。

从600个Token到10^104：惊人的“信息膨胀”与“压缩比”

主持人： 我记得这个数字非常夸张：10的104次方。您做这些分析，是想强调这本质上就是数学的核心，对吗？

迈克尔・弗里德曼： 是的。我们将这个数学库视为人类行为的一个良好样本。虽然它在数学各领域的分布并不完美（例如数论和代数几何的内容远多于分析或拓扑），但它与“从一组公理出发进行每一种可能的逻辑推演”所产生的“混沌数学”截然不同。

无论如何进行形式化，结构的发现都会呈现双指数级的增长。最终，我们在Lean库中找到的最长的“解包”命题，其大小正是10的104次方，比古戈尔还大。而它对应的“包装”命题，只有600个Token。

这展示了惊人的信息膨胀，但反过来，也揭示了通过使用抽象概念所能获得的、同样惊人的压缩率。

我想说的是，数学家和他们的AI智能体实际上在同一条船上。但当你面对古戈尔这样的尺度时，即使我们的机器比我们快一百万倍，这个倍数在古戈尔面前也微不足道。

所以，真正关键的问题不是人类与机器将探索数学空间的哪一部分，而是在庞大的形式推理空间中，哪一部分是能够被压缩成我们和智能体都能理解的形态——我称之为“形式数学”。我相信，人类数学（在此我将我们的AI智能体也视为“人类”探索的延伸）正是如此。

如何知道“触底”？从“玩具模型”到数学的“多项式结构”

主持人： 在你们分析的这些结构中，是否存在某些不具备相同“公分母”的方程或过程？如何决定什么是最基础的？或者说，如何知道自己已经“触底”？

迈克尔・弗里德曼： 对于Lean来说，“触底”很容易判断，因为它的库结构就是那样设计的。基本上，存在一些原始项，你可以用它们构建更复杂的命题。这个“展开后长度”有时被称为树表示法。你查看一个命题的子节点（即它的构成部分），再看子节点的子节点，形成一棵越来越深的树，直到终止于原始的Lean项。然后统计所有节点的调用，并为每个节点根据其调用的先前节点赋予权重（原始项权重为1）。最后，将顶层所有权重相加，就得到了那个巨大的展开数字。

而压缩的精妙在于，人类设计并利用Lean表达了一种语言，使得用大约600个token写下这个古戈尔量级的数字成为可能。

我们论文的方法论从数学物理中汲取了灵感。物理学中为自然某部分建立简化模型以辅助分析时，会使用“玩具模型”——它不追求捕捉全部真相，而是抓住核心结构，有意选择一个现实的粗略投影，以期能进行完整分析，从而指导对更复杂问题的直觉。电磁学、量子力学等理论的发展都受益于此。

在论文中，我们用“幺半群”来为数学建模。幺半群类似于群，但不一定有逆元，最简单的例子就是自然数。在幺半群中，可以引入“宏”（即“新思想”），代表新的抽象，能帮助我们更高效地表达信息。

例如，“10的幂次方”就是一个能高效压缩、表示整数的“宏”。一旦幺半群中有了宏，就能推导出层级属性，衡量压缩程度。结果显示，宏越多，压缩程度越高；宏越少，表达能力就越弱。

而在数学这一侧，在Lean库中，我们尚不清楚具体的“宏”是什么。这有点像在寻找数学的使用手册。我们对此获得的洞察越多，人类（包括我们和AI智能体）探索数学就会越顺畅。我们的想法是，去学习数学中已经在使用的机制：原则是什么？推论是如何组织的？

当前的主要挑战是解决“逆问题”：找出在数学侧对应的“宏”到底是什么。

人类的“数学品味”与机器的“穷举”：差异能否弥合？

主持人： 在数学推理中，机器往往需要遍历指数级的可能性，而人类却能以更“慢”、近似多项式的方式直击要害。这种差异是否源于一种“数学品味”？我们是如何从海量可能性中筛选出有意义路径的？这种能力能否被建模并复制到机器中？

迈克尔・弗里德曼： 这正是实验科学，也是我们试图发现的。我们某种程度上是在循环分析数学的历史，试图理解是什么引导我们走向这些高度可压缩的形式推理领域。也许通过澄清这个概念，举出一些“宏”的例子，就能更清楚地看到什么是可压缩的，什么是不可压缩的。

主持人： 有没有更直观的例子？

迈克尔・弗里德曼： 比如拉格朗日定理：任何整数都可以表示为四个平方数之和。这意味着，如果你把“平方数”当作一个“宏”，那么使用这个增长极快的宏，每个整数只需要四步就能表示。

这听起来很疯狂，但解释是：表达这些平方数本身需要很多比特，所以并不违背信息论。它只是说明，如果有更稠密的宏集合，就可以用更少的步骤表达更多内容。也就是说，宏的“密度”决定了表达效率。而“10的幂次方”正好处于一个平衡点，在宏的简洁性（不能太大）和表达能力（能够大量扩展）之间找到了最佳平衡。

我们论文中有一个结论是：多项式增长的幺半群容易压缩，而指数增长的幺半群难以压缩。根据经验和数值研究，我们发现数学具有高度可压缩性。如果它能被一个幺半群很好地表示，那么它必须是一个多项式增长的幺半群，才能展现出我们眼前所见的这种压缩。因此，一个合理的推测是：数学的结构本质上是多项式的。

用PageRank思想导航数学：定义人机协作的新模式

主持人： 论文中还提到，建议使用类似PageRank的算法来识别数学中具有高中心性的节点和核心定义，即那些支撑整个结构的关键点。我们如何在这些庞大的证明网络中识别并找到它们？如果能识别，这是否定义了一种数学家与AI协作的新模式？

迈克尔・弗里德曼： 这是个好问题。PageRank本质上是一种寻找马尔可夫链平衡的算法，即通过观察节点之间的相互引用关系来确定谁更重要。这是一种分配重要性的自然思路，但它需要对结构和互联有全局性了解。

我们在论文中提出了更简单的指标。因为数学依赖抽象，我们定义了两种比例：“还原压缩”和“演绎压缩”。

“还原压缩”是“展开长度”与“压缩长度”的比值。如果一个陈述处于极高的抽象水平，展开后变得极其庞大，那么这个比值就会非常大。这不仅是自动智能体可以使用的局部指标，还能用来判断是在提升还是降低抽象层级。

“演绎压缩”则是观察证明长度与命题陈述长度的比值。这个比例告诉我们，有多少数学工作被压缩进了那个命题中。例如，费马大定理可以用一句话描述，但证明需要数百页。这个极高的比例证明了该命题具有非凡的“压缩密度”。

AI在探索证明路径时，可以追踪这些指标，从而感知它正在穿越的数学“景观”。

“压缩即全部”：一个面向AI时代的数学宣言

主持人： 整体来看，这篇论文在研究数学智能本质时提出了一个非常大胆的宣言，似乎也与大语言模型的发展相关。当初为什么选择这个特定方向？想传达的核心信息是什么？

迈克尔・弗里德曼： 我们论文的标题“压缩就是你所需要的全部”本身就是一个强观点。用大胆的措辞陈述观点是好事，这样人们可以反驳它，从而引发更深入的讨论。

至于我个人为何选择这个方向？从宏观历史视角看，我认为我们正处在一个非常特殊的节点。从文艺复兴到科学革命、工业革命，再到高科技革命和现在的AI，历史似乎正奔向某个“奇点”，世界即将发生巨变。甚至可以说，“外星人”已经抵达了，只不过它们是我们自己创造的。而我，更希望作为参与者而非观察者进入这个时代。

更具体地说，我们正在探索。寻找能够引导我们发现“有趣数学”（即人类所创造的数学）的简单组织原则，将是富有成效的。我们已经看到，可压缩性在数学中有着非常不同的形式。

论文中讨论的可压缩性是“局部”的：你将一组符号压缩成新符号（如10的幂次方）。但像柯尔莫哥洛夫这样的人，通过算法研究了更一般类型的“全局”压缩。数学家惯用局部压缩，而全局压缩是不可计算的。但或许存在某种中间地带，通过仔细研究压缩，我们和智能体也许能探索出超越局部压缩的新思维模式。这是一个尚显模糊的想法，但我想呈现给大家。

所以，我认为我们和AI在某种意义上是“同一条船上的人”。它们也无法通过暴力计算探索全部空间，必须像我们一样依赖某种“直觉”。未来的关键在于：我们如何与AI一起，发展出新的数学直觉。

这篇论文，其实是在尝试绘制一张“数学的地形图”，帮助我们理解这个我们共同探索的、广阔而深邃的空间。

https://arxiv.org/abs/2603.20396

https://x.com/SAIRfoundation/status/2036916216913330552

来源:https://www.163.com/dy/article/KQVDPAR90511AQHO.html

上一篇： Text2Cron

下一篇： Generate JSON