GPT-5.5自进化150小时优化AlphaFold2蛋白质折叠模型

新智元报道
最近,GitHub上一个名为SimplexFold的开源项目突然火了。原因无他,项目共同作者名单里,赫然出现了“GPT-5.5”这个名字。

据Meta的机器学习工程师、开源社区硬核黑客Chris Hayduk爆料,他让GPT-5.5开启了“全自主目标模式”。在没有人类干预的情况下,这个AI连续不间断地运行了超过150个小时。
它的任务只有一个:扮演一位硅基科学家,去挑战、重构,甚至试图碘伏那个刚刚斩获诺贝尔奖的行业神话——AlphaFold2。

在这场长达数天的“疯狂长跑”中,GPT-5.5展现出了惊人的科研自主性:自己分析论文、自己设计网络拓扑、自己推导几何公式、自己修改PyTorch代码、自己跑训练。

甚至,在遭遇严重过拟合时,它还展现出了连人类专家都难以完全解释的“自发泛化”现象。
诺奖AI的重大缺陷:AlphaFold2到底漏掉了什么?
要理解GPT-5.5为何要对AlphaFold2“开刀”,得先看看这位“行业霸主”留下了什么遗憾。
2024年,AlphaFold2凭借其无可争议的晶体结构预测精度斩获诺贝尔化学奖。它的核心武器是Evoformer模块。

在Evoformer内部,包含了一套强大的“残基对”与“三角形”推理机制。模型把蛋白质的氨基酸残基两两配对,用一个二阶的成对张量来表示它们之间的关系,这在图论里相当于蛋白质的“边”。
著名的“三角更新”机制,则是通过引入第三个残基,来反复校正和增强这些边之间的空间几何一致性。

但是,精妙设计的背后存在一个代价:遗忘。
现有的AlphaFold2在完成极其复杂的三角形计算后,做了一件非常“偷懒”的事——它顺手把计算结果又塞回了那条一阶的“边”里面。也就是说,AlphaFold2内部并没有为一整个完整的三角形面或是四面体单元,维护一个持久的、连续更新的“高阶状态表示”。

这就像一个记忆力只有3秒的工匠,虽然每次砌砖时都会用一把精密的三角尺量一下角度,但量完就把尺子扔了,脑子里记住的依然只有“砖头A和砖头B挨得有多近”。
这,就是AlphaFold2的核心禁区,也是限制其在极微观空间拓扑表达上更进一步的“隐形天花板”。

而GPT-5.5在翻阅了大量生物信息学文献后,敏锐地盯住了这个盲区。SimplexFold项目的核心设问由此诞生:如果我们在神经网络里,直接让模型去学习、维护、更新一整个“三角形面”和“四面体单元”的持久状态,会发生什么?
用数学降维打击生物学复杂性
为了解决这个问题,GPT-5.5引入了一个在近代拓扑学中大放异彩的概念——单纯形。

名字听起来高深,但直观含义非常纯粹:单纯形,就是某个维度里最简单的几何图形。项目主页用一张极其优雅的表格,展示了蛋白质结构是如何被“单纯形化”的。

现有的绝大多数蛋白质神经网络,本质上都是普通的图神经网络。在拓扑学语言里,它们只是一个孤独的“1-骨架”——只有节点和边。
然而,生命不是一根根铁丝拧成的网,生命是丰满的三维实体。蛋白质的折叠和多肽链的缠绕,内部充满了极其苛刻的三体、四体甚至多体物理约束。

如果只用“边”来表达,模型不得不转无数个弯去猜这些高阶特征。但如果引入“单纯形”,情况就不同了。一个“面特征”可以直接理直气壮地描述残基i, j, k组成了一个局部的朝向表面,它的面积和内角系统是怎样的。一个“四面体特征”则可以直接宣告残基i, j, k, l构成了一个紧凑的三维包装核心,它的体积和空间位阻情况如何。

这就是SimplexFold压下的惊天豪赌:通过引入显式的高阶拓扑状态,为神经网络注入极其强大的几何归纳偏置,从而用更少的数据、更优雅的架构,榨干蛋白质主链折叠的最后一丝精度。

自动研究150小时,GPT-5.5究竟改了啥?
以上概念或许有些专业。那么,在这150个小时里,AI到底折腾出了什么硬核优化?
作者Chris Hayduk大方地公开了GPT-5.5的“科研成果”。在原始的设计里,SimplexFold的信息传递路径比较简单:边→面→体→面→重新倒回边和点。

这就好比大家开完会,最后派个代表写个大杂烩简报,把高维信息粗鲁地倒回一维的单体特征里。
而GPT-5.5疯狂加班150小时后,精细化地重构了整个通信路径。它设计了一套“高度结构化的回写机制”。现在,被选中的三角形和四面体在往回传导信息时,不再是“大锅饭”式的倾倒,而是必须严格通过自己真正的边界边进行精准路由。
AI还贴心地加入了几何感知门控和弱三角形注意力提示。这直接把原本粗糙的“传话游戏”,升级成了带有精准导航、具备空间方向感的“高维立体通信网络”。

反转与吃瓜
对于这个炸裂的项目,网上的技术大牛和围观群众立刻展开了讨论。
疑问一:等一下,这个实验图表怎么还带穿越的?
在作者晒出的自主实验进程图中,有眼尖的网友发现了一个诡异的现象:在第80次运行附近,曲线突然“倒流”了,它回到了过去,然后创下了一个比后来还要高的新纪录。

面对这个怪事,大家疯狂猜测。最后得出的结论细思极恐:AI自己给自己开辟新路了。它在推进到某一步时,发现后面的路越走越窄,于是非常理智地回滚到了第80步那个曾经表现不错的历史分叉口,放弃了后面的错误路线,重新开辟了一条新战线。
这在人类科研里太常见了。唯一不同的是,人类要是做实验做了好几天发现错了要推倒重来,那种心理崩溃要痛苦得多。
疑问二:结果其实不太行?
就在大家激动的时候,冷酷的现实给了当头一棒。有人发现,这玩意儿虽然疯狂,但最新的指标结果其实相当糟糕。在这条Y轴上,正牌的AlphaFold分数大概在90左右,而这个SimplexFold差得远呢。别忘了,这模型可是把AlphaFold的论文喂给它训出来的。

所以,闹了半天,最后搞出来的模型性能其实被原生AlphaFold吊打?既然最终的预测结果并不能比肩AlphaFold,那这个疯狂的“150小时实验”失败了吗?
恰恰相反。
几乎所有的一线AI实验室和科学家都给出了相同的答案:这事儿的意义,根本不在于SimplexFold这个模型本身,而是在于“自动研究员”这个范式。

这次实验,是一次极其硬核的概念验证。它证明了高阶逻辑的自洽性,展现了恐怖的样本效率和抗挫折能力,而且是一次低成本的试错。连续150小时,自己给自己debug、看报错、换路线、主动回滚历史分支。这种全自动的实验闭环,一旦配上更强的大模型,进化速度将超出人类想象。
当AI自动研究员全面走向实验室的那一天,或许就是人类探索未知边界的方式被彻底重塑的时刻。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
谷歌AI世界模型原型Project Genie技术解析与应用前景
Project Genie是什么 你是否曾幻想过,只需用一句话描述一个想法,或是随手上传一张图片,就能瞬间“进入”一个由人工智能实时生成、并可自由漫游的虚拟空间?这并非遥远的科幻情节,而是谷歌DeepMind实验室正在研发的突破性项目——“Project Genie”。 简而言之,Project G
月之暗面Kimi开源K2.5全能旗舰模型正式发布
Kimi K2 5是什么?月之暗面开源的全能旗舰AI模型详解 在人工智能技术飞速发展的当下,每一次重要模型的发布都牵动着业界的目光。月之暗面(Moonshot AI)最新开源推出的Kimi K2 5,正是这样一款定位为“全能旗舰”的重量级AI大模型。它基于高达约15T(万亿)Token的视觉与文本混
昆仑万维AI音乐模型Mureka V8功能详解
Mureka V8是什么 如果说过去的AI音乐生成技术还停留在“声音素材拼接”的初级阶段,那么昆仑万维最新发布的Mureka V8模型,则标志着AI音乐创作向“类人化思维创作”迈出了实质性的一步。这一突破的核心驱动力,在于其创新的MusiCoT(音乐思维链)技术架构。该模型在旋律的流畅性与完整性、人
企业引入AI智能体 IT与业务部门如何高效分工协作
一、 范式演进:从‘单一工具’到‘智能同事’的协同重构 当前,企业数字化转型已进入深水区,其核心远不止于部署新系统。随着AI智能体的广泛应用,一场深刻的组织协同变革正在发生。权威机构Gartner预测,到2026年,超过80%的企业将采用生成式AI技术。这标志着,传统的“IT建设、业务使用”的线性模
数据采集出错率如何降低 从手工到自动化实操指南
在数字化运营的核心战场上,数据是驱动决策的命脉。然而,许多企业的运营团队仍深陷“数据沼泽”:每日手动穿梭于数十个平台,搬运订单、流量与财务数据。这种低效且易错的操作模式成本高昂——据IDC研究,企业因数据质量问题导致的年均损失可达1500万美元。因此,提升数据采集的准确性,已从效率优化升级为关乎企业
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

