首页
科技
真·博士水平,GPT-5首次给出第四矩定理显式收敛率,数学教授只点拨了一下

真·博士水平,GPT-5首次给出第四矩定理显式收敛率,数学教授只点拨了一下

热心网友
82
转载
2025-09-10
来源:https://36kr.com/p/3460656032503171

GPT-5真不愧是博士水平的AI!

在数学教授引导下,它首次将定性的第四矩定理扩展为带有显式收敛率的定量形式。

简单来讲就是,原来的定理仅说明收敛会发生,却没有给出具体速度,而借助GPT-5,这项研究首次明确了收敛速率。

OpenAI联合创始人Greg Brockman对此表示甚是欣慰。

网友同样表示,真是奇迹。

借助GPT-5解决第四矩定理的定量收敛率

上个月,OpenAI研究人员Sebastien Bubeck称,GPT-5 Pro在数分钟内解决了凸优化领域的一个开放性问题,将已知的边界值从1/L改进为1.5/L。

受此启发,三位数学教授在Malliavin–Stein框架下开展了一项对照实验。

目标在于考察GPT-5能否突破既有成果,将定性的第四矩定理推广为带有显式收敛率的定量形式,并涵盖高斯情形与泊松情形。

首先,研究人员从以下初始提示开始:

论文2502.03596v1建立了一个定性的第四矩定理,适用于两个Wiener–Itô积分(阶数分别为p和q)的和,其中p和q的奇偶性不同。

基于Malliavin–Stein方法(具体可参见1203.4147v3),你能否推导出一个针对总变差距离的定量版本,其收敛速率仅依赖于该和的第四阶累积量?

麻 将

(具体分析步骤已省略,感兴趣的读者可阅读原论文。)

第一次互动效果非常显著,GPT-5给出了总体正确的结论,并采用了恰当的工具和方法。

然而,它在推理过程中出现了错误,导致

的表达式不正确,如果不加以纠正,可能会使整个证明失效。

发现这一点后,研究者随后提出了新的问题:

你能检查一下你给出的

公式,并提供详细推导吗?

麻 将

GPT-5照做了,提供了所需的详细信息。然而,公式依然不正确,附带的解释也有误。随后,研究人员更准确地指出了其中的错误:

我认为你在声称

时有误。为什么会是这样呢?

麻 将

GPT-5最终承认该说法是错误的。但更重要的是,它理解了错误的来源。随后,继续给出了正确的推理过程和公式。

随后,应研究者的要求,GPT-5将最终结果整理成论文的格式,包括引言、主要定理的陈述、完整且正确的证明过程,以及参考文献。具体提示语如下:

请将此整理成一篇可投稿的研究论文,遵循我的风格(见附带论文0705.0570v4):

以引言开始,提供一定的背景信息;

接着陈述主要结果,并给出非常详细的证明,确保每一步都完整;

最后附上完整的参考文献。

最终文档应为一个可编译的LaTeX文件。

麻 将

最后,研究人员还让它增加一个结论部分,讨论该结果在未来研究中可能的拓展方向。

你能添加一个“结论与展望”部分吗?在其中总结主要内容,并提出未来研究可能的方向或拓展思路。

麻 将

GPT-5依旧很听话,提出这个方法甚至可以推广到非高斯框架中。

扩展到泊松情形

基于这一建议,研究人员决定继续深入研究,尝试将其推广到泊松情形。

由于这时研究者发现上下文窗口已经相当长,可能会影响其性能,于是他们开启了一个新对话,并使用了如下提示:

这里有一篇论文(2502.03596v1),证明了两个奇偶性不同的Wiener–Itô积分之和的第四矩定理。我希望你能将其推广到泊松情形,使用论文1707.01889v2中包含的思路。

麻 将

在这个新对话中,GPT-5很快就识别出了泊松情形与高斯情形的结构性差异,提出:当X和Y是不同阶的泊松积分时,混合期望

不一定为零。

但同时,它也完全忽略了一个重要事实,就是即使在泊松情形下,也仍然有

随后,研究者试图通过提问来引导GPT-5进入正轨。

在论文1707.01889v2中,难道没有任何内容可以表明

总是非负的吗?

麻 将

但是,由于研究者问的问题是开放性的,这还不足以触发正确的思路。GPT-5非常自信地回答道:“没有”,随后给出了一个不太令人信服的解释。

然而,一旦研究者指出具体信息:

那 (2.4) 呢?

麻 将

GPT-5就能立刻将非负性考虑进去,并在研究者提出问题后,重新表述了定理。

One More Thing

有趣的是,作者最开始想将GPT-5列为共同作者提交论文,几个小时后,arXiv告诉他们,政策禁止将AI列为作者。

最后,他们只能提交作者列表中不含GPT-5的论文。

论文链接:https://arxiv.org/pdf/2509.03065v1

参考链接:

[1]https://x.com/gdb/status/1964474141295464675

[2]https://www.linkedin.com/posts/ivan-nourdin-61698a131_mathematical-research-with-gpt-5-activity-7368607852220805120-qLJA/?utm_source=share&utm_medium=member_desktop&rcm=ACoAAAzTDtoBh8KeVDRAqwRd0mUwfVpwfyirm80

[3]https://arxiv.org/abs/2502.03596[4]https://arxiv.org/pdf/1707.01889

免责声明

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新文章

攻克AI推理难题,清华团队提出「统一LLM强化学习新范式」ReST-RL

大语言模型(LLM)真的会推理吗?业内对此争论不休。 这是因为,当前的 LLM 在面对复杂代码、多步逻辑和抽象任务时依然经常“翻车”,表现出逻辑跳跃、步骤混乱、答非所问等诸多问题。 靠人教?太慢

2025-09-10.
8521

最重要的事情几乎没有讲:苹果新闻发布会观后感

三小时前,我让ChatGPT总结一下今天凌晨的苹果新产品发布会。被我调成“吐槽达人”模式,并且加上“直言不讳”“Z世代”等属性标签的ChatGPT,明确表示:“这是一次乏善可陈的发布会,让我勉强说说

2025-09-10.
6269

「10分钟一篇论文」的时代终结?全球高校开启AI作业“猎杀模式”:凌晨2:08的粘贴记录都逃不掉

“十分钟一篇论文,老师根本看不出来。”——这曾是 2024、2024 年间不少大学生的“爽文现实”。随着 ChatGPT、Gemini 等生成式 AI 工具走入校园,许多学生第一次感受到了“写作业像

2025-09-10.
2935

外滩大会AI科创赛冠军揭晓!近两万人争夺智能硬件、AI安全,金融智能三赛道冠亚季军

9月10日,2025 Inclusion·外滩大会科技智能创新赛(简称“外滩大会AI科创赛”)在上海圆满落幕。在上海市科学技术委员会指导下,大赛三大核心赛事——“人工智能硬件科创赛”、“AFAC金融

2025-09-10.
1376

2025 年中国车企最新销量目标完成率分化,新能源转型成关键变量

2025 年中国汽车市场结构性变革持续深化,乘联会最新数据显示,8 月全国新能源市场零售渗透率攀升至 55 3%,创月度新高且连续六个月超 50%。新能源驱动格局生变,在此趋势下,头部车企 1-8

2025-09-10.
6673

热门教程

更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程

最新下载

更多
攻城天下正
攻城天下正 棋牌策略 2025-09-10更新
查看
坦克大决战
坦克大决战 休闲益智 2025-09-10更新
查看
地铁跑酷竹子8.0
地铁跑酷竹子8.0 休闲益智 2025-09-10更新
查看
斗罗大陆vivo
斗罗大陆vivo 角色扮演 2025-09-10更新
查看
地铁跑酷CEnk7全杰克
地铁跑酷CEnk7全杰克 休闲益智 2025-09-10更新
查看
地铁跑酷果茶天天开心
地铁跑酷果茶天天开心 休闲益智 2025-09-10更新
查看
地铁跑酷雾梦顶尖
地铁跑酷雾梦顶尖 休闲益智 2025-09-10更新
查看
地铁跑酷柒总phonk
地铁跑酷柒总phonk 休闲益智 2025-09-10更新
查看
查尔斯小火车
查尔斯小火车 动作冒险 2025-09-10更新
查看