GPT-5.5自进化150小时优化AlphaFold2蛋白质折叠模型

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

GPT-5.5自进化150小时优化AlphaFold2蛋白质折叠模型

热心网友时间：2026-05-23

转载

新智元报道

最近，GitHub上一个名为SimplexFold的开源项目突然火了。原因无他，项目共同作者名单里，赫然出现了“GPT-5.5”这个名字。

据Meta的机器学习工程师、开源社区硬核黑客Chris Hayduk爆料，他让GPT-5.5开启了“全自主目标模式”。在没有人类干预的情况下，这个AI连续不间断地运行了超过150个小时。

它的任务只有一个：扮演一位硅基科学家，去挑战、重构，甚至试图碘伏那个刚刚斩获诺贝尔奖的行业神话——AlphaFold2。

在这场长达数天的“疯狂长跑”中，GPT-5.5展现出了惊人的科研自主性：自己分析论文、自己设计网络拓扑、自己推导几何公式、自己修改PyTorch代码、自己跑训练。

甚至，在遭遇严重过拟合时，它还展现出了连人类专家都难以完全解释的“自发泛化”现象。

诺奖AI的重大缺陷：AlphaFold2到底漏掉了什么？

要理解GPT-5.5为何要对AlphaFold2“开刀”，得先看看这位“行业霸主”留下了什么遗憾。

2024年，AlphaFold2凭借其无可争议的晶体结构预测精度斩获诺贝尔化学奖。它的核心武器是Evoformer模块。

在Evoformer内部，包含了一套强大的“残基对”与“三角形”推理机制。模型把蛋白质的氨基酸残基两两配对，用一个二阶的成对张量来表示它们之间的关系，这在图论里相当于蛋白质的“边”。

著名的“三角更新”机制，则是通过引入第三个残基，来反复校正和增强这些边之间的空间几何一致性。

但是，精妙设计的背后存在一个代价：遗忘。

现有的AlphaFold2在完成极其复杂的三角形计算后，做了一件非常“偷懒”的事——它顺手把计算结果又塞回了那条一阶的“边”里面。也就是说，AlphaFold2内部并没有为一整个完整的三角形面或是四面体单元，维护一个持久的、连续更新的“高阶状态表示”。

这就像一个记忆力只有3秒的工匠，虽然每次砌砖时都会用一把精密的三角尺量一下角度，但量完就把尺子扔了，脑子里记住的依然只有“砖头A和砖头B挨得有多近”。

这，就是AlphaFold2的核心禁区，也是限制其在极微观空间拓扑表达上更进一步的“隐形天花板”。

而GPT-5.5在翻阅了大量生物信息学文献后，敏锐地盯住了这个盲区。SimplexFold项目的核心设问由此诞生：如果我们在神经网络里，直接让模型去学习、维护、更新一整个“三角形面”和“四面体单元”的持久状态，会发生什么？

用数学降维打击生物学复杂性

为了解决这个问题，GPT-5.5引入了一个在近代拓扑学中大放异彩的概念——单纯形。

名字听起来高深，但直观含义非常纯粹：单纯形，就是某个维度里最简单的几何图形。项目主页用一张极其优雅的表格，展示了蛋白质结构是如何被“单纯形化”的。

现有的绝大多数蛋白质神经网络，本质上都是普通的图神经网络。在拓扑学语言里，它们只是一个孤独的“1-骨架”——只有节点和边。

然而，生命不是一根根铁丝拧成的网，生命是丰满的三维实体。蛋白质的折叠和多肽链的缠绕，内部充满了极其苛刻的三体、四体甚至多体物理约束。

如果只用“边”来表达，模型不得不转无数个弯去猜这些高阶特征。但如果引入“单纯形”，情况就不同了。一个“面特征”可以直接理直气壮地描述残基i, j, k组成了一个局部的朝向表面，它的面积和内角系统是怎样的。一个“四面体特征”则可以直接宣告残基i, j, k, l构成了一个紧凑的三维包装核心，它的体积和空间位阻情况如何。