GPT5仅用18分钟破解黑洞方程效率远超人类科学家
2026年,科学研究的范式正在悄然改变。人工智能,这位曾经的“辅助工具”,如今正以“合作者”的身份,深度介入从数学证明到黑洞物理的前沿探索。它带来的不仅是效率的提升,更是一种思维模式的拓展——科学加速的时代,已然拉开序幕。

从三个夜晚到一页证明:AI如何成为数学家的“思维翻跟斗”
数学,被誉为科学的皇后,向来是对人类智力极限的终极考验。就在两年前,大语言模型还在基础算术上磕磕绊绊;而如今,顶尖模型已能在国际数学奥林匹克竞赛中摘得金牌。这种进步的速度,堪比一年前AI还只能补全代码行,如今却能独立开发完整应用程序的飞跃。
数学家Ernest Ryu的经历,是这一转变的生动注脚。2024年,他曾尝试让ChatGPT解决一个复杂的棒球赛季赛程安排问题,其中涉及大量硬性约束和软性优化目标。当时的模型在处理这类多约束复杂问题时仍显稚嫩,时常遗漏关键条件,最终未能成功。

然而,2025年AI在奥赛中的惊艳表现,让Ryu看到了其潜力的巨大跃迁。他首先将AI用于日常学术工作,比如在编写讲义时,询问那些他确信为真但一时难以完整回忆证明过程的定理。在获得积极反馈后,他决定迈出更大的一步:将AI引入真正的学术研究。
他选择的目标,是一个与“Nesterov加速”这一经典优化技术相关的、悬而未决的开放性问题。接下来的三个晚上,一场密集的人机协作攻关展开了。
AI首先给出了一个包含计算错误的初始证明思路。Ryu的工作并非简单地接受或拒绝,而是扮演一位高明的向导:他纠正错误,在持续增长的对话中保留正确的中间步骤,果断放弃走入死胡同的路径,并将模型的注意力引导向新的可能性。
他将这个过程比作“走迷宫”——在不断转弯、尝试开门的过程中,同时在心里绘制着一幅标记了失败路径和希望之路的地图。他感到,ChatGPT将他探索迷宫的速度提升了3到10倍。
关键的突破发生在第三个晚上。AI完成了一次微小的、但至关重要的思维跃迁,其产生的论证“看起来有所不同”。正是这一点“不同”,成为了解开整个证明的钥匙。
出于科学家的严谨,Ryu“反复检查了不止三遍”,并请学生进行独立验证。随后,他将这一成果分享给优化领域的同行,引发了广泛的惊讶与兴奋。最终,他们通过一个精炼的提示,将连续时间下的理论结果转化为了离散时间的实用算法陈述,其中最具创新性的核心部分,被凝练成了仅仅一页纸的内容,达到了可发表的水平。
这次成功的合作,也改变了Ryu的职业轨迹。此后,他加入了OpenAI的合成数据团队,其核心使命正是继续提升模型的数学推理能力。

跨越学科的“加速”:从黑洞对称性到蛋白质设计
AI带来的“加速”效应,正在各个基础科学领域百花齐放。
理论物理学家Alex Lupsasca的经历颇具代表性。他曾花费数年时间培养相关数学技能,又投入了数月进行集中攻关,才最终推导出描述黑洞潮汐响应的重要方程。出于好奇,他将这个方程交给了GPT-5 Pro,并只给予了最少的背景指导。模型进入了“思考”模式。大约18分钟后,它返回了结果——完全相同的对称性生成元。

AI在短短18分钟内,重现了他凭借深厚积累和长期努力才获得的关键发现。这一震撼体验促使Lupsasca也加入了OpenAI。他现在的目标,是推动AI在科研中的应用从一次性的“奇迹时刻”,迈向可重复、系统化的“科学加速”。他正致力于开发更强大的工具来阅读和解释学术论文,构建比单一聊天窗口更复杂的工作流,将前沿物理学的知识更深地嵌入模型。最终目的,是让研究人员能花更少时间纠缠于复杂的代数推导,而将更多精力聚焦于识别和攻克那些困扰物理学界的根本性谜题。
在生命科学领域,OpenAI与RetroBioSciences的合作则展示了AI解决具体生物学难题的潜力。RetroBio的目标是使细胞重编程技术变得实用和可扩展,以期应用于延长健康寿命。细胞重编程通常使用四种“OSKM”因子来重置细胞的衰老特征,但在老年细胞中,这一过程会显著变慢。
为了找到能加速这一过程的新蛋白质,OpenAI构建了专用基础模型GPT-4B Micro。与通用模型不同,它在海量的多模态生物数据上进行了深度训练。

GPT-4B Micro生成了数千个候选蛋白质序列。经过筛选,RetroBio合成了最有希望的序列,并通过慢病毒载体将其递送到人类成纤维细胞中进行测试。后续实验表明,AI设计出的某些蛋白质,其性能与之前人工设计的最佳因子相当,甚至在部分指标上实现了超越。
科学家如何与AI“并肩作战”?
2026年1月,OpenAI发布的《AI作为科学合作者》白皮书,通过一系列鲜活案例指出,对于前沿科学家而言,AI已经可以成为一个真正并肩作战的科研伙伴。
数据揭示了这一趋势的广度:每周,ChatGPT上会产生840万条关于高级科学和数学话题的对话,这些对话来自全球130万活跃用户。仅在2025年,与高级科学相关的消息数量就暴涨了50%。

科学家们使用AI的方式与普通用户有着显著区别:他们更为专注和深入。平均而言,科研用户的消息量是普通用户的3.5倍,其中编程相关消息的频率高出12倍。他们的工作流高度集中在几个核心领域:代码生成与调试、复杂数据分析、数学公式推导以及文献综述与理解。

OpenAI科学部门副总裁Kevin Weil断言,AI正越来越多地被用作真正的科学合作者。在真实的研究环境中,其影响力日益凸显,科学正在进入一个全新的加速阶段。而OpenAI所描绘的愿景,是为每一位科学家配备AI赋予的“超能力”,以期在2030年达成原本预计2050年才能实现的科学水平。
未来十年,科学发现的速度或将超越过去百年。这场由人机协作驱动的知识革命,值得我们共同期待。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
Claude代码助手插件解决编程中断难题
对于深度依赖Claude Code进行开发的用户而言,最令人沮丧的体验莫过于在终端中“盲开”:你永远无法知晓当前对话的上下文容量还剩多少,只能被动等待系统提示耗尽,导致所有精心构建的对话逻辑和代码成果瞬间归零。 就在近期,一个典型的开发场景几乎让项目进度停滞:在编写一个复杂的批量交互脚本时,与Cla
谷歌Gemma 4大模型本地部署安装配置完全指南
4月3日凌晨,谷歌DeepMind向开源AI社区投下了一枚重磅冲击波:Gemma 4正式发布。 这个拥有310亿参数的模型,性能提升堪称“暴力”。在数学竞赛基准上,它从上一代的20 8%直接跃升至89 2%;编程能力方面,LiveCodeBench得分从29 1%飙升至80%。更关键的是,它采用了A
Linux CUPS打印系统高危漏洞可零点击获取root权限
近日,Linux生态系统中一项基础且至关重要的服务——打印服务CUPS被披露存在高危安全漏洞。根据网络安全媒体cyberkendra的报道,攻击者无需任何身份凭证,即可通过远程方式执行恶意代码,并最终获取系统的最高root权限。 这组漏洞由安全研究员Asim Manizada在人工智能工具的辅助下发
手机运行Gemma 4模型实测与可行性分析
昨天看到一条消息,说有人在 iPhone 17 Pro 上运行 Google 最新发布的 Gemma 4 模型,推理速度超过了每秒 40 个 token。第一反应是:这可能吗? 要知道,Gemma 4 是 Google 在 4 月 2 号刚发布的开源模型家族中的旗舰款。其参数量最大的 31B 版本在
大模型训练合成数据生成的十大实用策略
合成数据,这个曾经被视为“辅助工具”的技术选项,如今正快速演进为驱动大模型开发与迭代的核心基础设施。对于任何致力于长期模型训练、优化和持续升级的团队而言,构建高质量的合成数据能力已成为一项战略性任务。 背后的驱动力非常现实:获取大规模、高质量的训练数据始终是AI团队面临的主要瓶颈。数据或许存在,但面
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

