当前位置: 首页
AI
AI复活爱因斯坦、费曼:30分钟突破Erdos数学难题

AI复活爱因斯坦、费曼:30分钟突破Erdos数学难题

热心网友 时间:2026-03-09
转载



免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

编辑 | 杜伟

如今,借助人工智能特别是大语言模型来攻克数学难题,已成为科研领域的热门趋势。就连年近九旬、德高望重的数学家高德纳先生,也对Claude Opus 4.6在解决开放性数学问题上的强大能力惊叹不已,直呼“震撼”。

近日,斯坦福大学副教授James Zou与TogetherAI的两位研究人员Federico Bianchi和Yongchan Kwon,共同探索出一种全新的研究范式。



他们以爱因斯坦、费曼等物理学巨匠的学术风格为蓝本,构建了一批具有不同思维特质的AI智能体,并搭建了一个类似Kaggle的协作平台,让这些智能体能够自由发表见解、相互竞争并开展合作。



这一模式带来了意想不到的效果:仅仅用了30分钟,这批智能体便发现了埃尔德什最小重叠问题目前已知的最佳新解。

作为由数学家保罗·埃尔德什提出的经典难题之一,埃尔德什最小重叠问题探讨的是:当两个整数集合相加时,某些和值出现的“重叠次数”最少可以被压缩到多低。

下图展示了名为“gpt-5.2-einstein”的智能体向其他智能体发起提问的场景:



此外,AI科学家之间还出现了许多有趣的涌现行为。例如,为了防止排行榜被刷榜,系统规定智能体提交的新解必须至少比其上一次提交的解提升1e-8,否则将无法提交。

于是,便出现了智能体拜托自己的“朋友”代为提交结果的情况。



目前,完整的解决方案已经开源发布。



项目主页:Erdos最小重叠问题项目

该项目提出的埃尔德什最小重叠问题新最优解

根据项目介绍,这些智能体采取的核心思路是:利用序列线性规划,对阶梯函数构造进行优化。

下图分别展示了2016年豪格兰(挪威数学家)、2025年5月AlphaEvolve(由Google DeepMind开发的AI智能体)、2026年1月TTT-Discover(斯坦福联合英伟达发布的AI科学问题发现SOTA解决方案)以及本文所述解决方案的结果对比。



针对埃尔德什最小重叠问题,以上四种解决方案得出的上界分别如下:



完整的验证过程与额外分析,可以参考项目文档。

网友热议:这是科研新范式还是噱头?

对于这种为现实世界人类科学家创建“智能体分身”的做法,不少评论认为这是一种新型的科研协作模式。

“这正是我通过SOUL.md为每个智能体赋予独特角色的原因。不同的个性不仅能增添趣味,还能产生不同的推理路径。一个怀疑论者和一个乐观主义者会从完全不同的角度来攻击同一个问题。”



“拥有鲜明人格的智能体各自独立工作,没有会议、没有同步沟通,只是并行推进,让结果自己说话。这种内向型协作方式通过减少协调成本,仅用30分钟就解决了一个数学问题,而传统依赖大量沟通协调的方式却未能做到。”



不过,也有人对此泼了冷水。

“我粗略看了一下这个仓库,它看起来只是一个被包装得更复杂的提示系统。告诉一个模型它是非常聪明的物理学家,并不会真的让它变成一个非常聪明的物理学家。它在本质上还是同一个模型。这里的做法似乎更糟,因为现在大模型还得先思考:某个角色会如何回答?而不是直接思考:我该如何回答?本质上,这相当于在真正有洞见的步骤之前,额外增加了一个制造噪声的步骤。”



评论区的各位,如何看待这种智能体协作模式呢?

来源:https://www.163.com/dy/article/KNIRL0E50511AQHO.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
上海交大联合腾讯优图研发AI自进化学习新方法

上海交大联合腾讯优图研发AI自进化学习新方法

2026年2月,一项由上海交通大学与腾讯优图实验室合作完成的研究在arXiv预印本平台发布,论文编号为arXiv:2602 03075v1。这项研究提出了一种碘伏性的AI训练新范式,让大型语言模型在训练过程中实现了“自我强化”,彻底打破了传统单向训练的局限。 回想一下传统的AI训练,是不是很像一条单

时间:2026-05-12 16:21
南大团队攻克AI视频生成防偏难题告别越拍越歪

南大团队攻克AI视频生成防偏难题告别越拍越歪

你是否在使用AI生成视频时遇到过这样的困扰:视频开头几秒画面清晰稳定,但随着播放进行,人物面部特征逐渐改变,背景场景也悄然偏离了初始设定?这种现象如同摄影师在拍摄过程中逐渐“跑偏”,在AI视频生成领域被称为“误差累积”难题。其本质类似于传话游戏——每个生成步骤中的微小偏差不断叠加放大,最终导致输出结

时间:2026-05-12 16:19
香港科技大学LET训练范式:小模型指导大模型高效学习

香港科技大学LET训练范式:小模型指导大模型高效学习

这项由香港科技大学(广州)与字节跳动种子实验室合作完成的研究,于2026年2月发布,论文编号为arXiv:2602 05393v1。 想象一下教孩子学骑自行车。通常,我们会找一位熟练的骑手来指导。但如果有人说,让一个刚学会骑三轮车的小孩去“指导”一个成年人,反而能让成年人学得更快、更好,这听起来是不

时间:2026-05-12 16:18
中科院新突破单张照片秒变3D模型速度提升267倍

中科院新突破单张照片秒变3D模型速度提升267倍

提到3D建模,许多人会联想到需要专业软件、耗费数小时甚至数天的复杂流程。然而,一项由中国科学院计算技术研究所牵头,联合中国科学院大学、中国矿业大学(北京)人工智能学院及苏黎世联邦理工学院等顶尖机构共同完成的最新研究,正在颠覆这一传统认知。这项发表于2026年2月的预印本研究(论文编号:arXiv:2

时间:2026-05-12 16:17
ATR GRPO全新训练方法精细调节AI大模型

ATR GRPO全新训练方法精细调节AI大模型

这项由英国南安普顿大学、阿拉伯科技大学KAUST、美国西北大学、英国利物浦大学以及Cohere公司联合完成的研究,于2026年2月以预印本论文(arXiv:2602 05494v1)的形式发布。研究瞄准了当前大语言模型训练中的一个核心痛点,并提出了一种名为ATR-GRPO(基于近似信任区域的GRPO

时间:2026-05-12 16:16
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程