独立研究者揭示人工智能架构演化与生物进化的惊人相似性

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

独立研究者揭示人工智能架构演化与生物进化的惊人相似性

热心网友时间：2026-05-15

转载

如果有人告诉你，硅基的人工智能架构和碳基的生物基因组，这两种看起来风马牛不相及的东西，居然遵循着同一套进化法则——你会不会觉得这是在开玩笑？一个是工程师在键盘上敲出来的代码结构，一个是亿万年自然选择磨砺出来的生命蓝图，它们能有什么共同点？

然而，一项独立研究给出了严肃的答案：有，而且不只是隐约相似，而是在统计数字上高度吻合。这项研究以预印本形式发布于2026年4月，论文编号为arXiv:2604.10571。

AI进化的秘密：一位独立研究者发现人工智能架构的演化规律竟与生物进化惊人相似

研究者做的事情，可以打个比方：你是一名考古学家，手里有两堆来自截然不同文明的陶器碎片——一堆来自古埃及，一堆来自古代中国——你想知道这两批陶器是否遵循相同的制作规律。于是你把它们打碎，测量每一块碎片的厚度、重量和形状，然后比较这些测量数据的分布规律。研究者做的正是类似的事情，只不过他“打碎”的是神经网络架构，“测量”的是每一次小改动对性能的影响，然后把这些数据和生物学家测量基因突变影响的数据放在一起比较。

为了完成这项比较，研究者从161篇机器学习论文中收集了935个“消融实验”的数据。所谓消融实验，就是工程师在验证一个神经网络架构时，专门把其中某个组件拆掉，看看性能会怎么变化——这和生物学家做的“基因敲除实验”几乎是同一件事：把某个基因关掉，看看生物体的健康状况如何改变。收集完这些数据之后，他把结果和来自九种生物体的基因突变数据进行了系统比较，这九种生物体横跨了从RNA病毒到人类的四个数量级的基因组复杂度。

接下来发生的事情，就是这篇论文最令人着迷的部分。

一、被改动的零件，大多数都是坏消息

先来理解一个核心概念，叫做“适应度效应分布”，生物学家用英文缩写DFE来表示它。这个概念本质上很简单：当你对一个系统做一次随机改动，这次改动是好是坏、好到什么程度、坏到什么程度，把所有这些结果的分布画成一张图，就得到了DFE。

生物学家发现，对于任何生物体，这张图的形状都非常相似：大多数突变是有害的，少数突变几乎没有影响，极少数突变是有益的。更具体地说，这张图有一个“厚尾巴”——极端情况（极度有害或极度有益）出现的频率，比正常的钟形曲线预测的要高得多。这个形状可以用一种叫做“Student's t分布”的数学函数来精确描述。

研究者对那935个神经网络改动数据做了同样的测量。结果是：AI架构的DFE，形状和生物的DFE高度吻合——同样的厚尾巴，同样的偏斜，同样用Student's t分布能够完美描述。

具体数字方面，在568个“主要消融”实验（即完整拆除某个组件的实验，类似于完全敲除一个基因）中，68%的改动是有害的，19%的改动几乎没有影响，只有13%的改动是有益的。换句话说，当工程师把神经网络的某个核心模块整个拿掉，十次里有将近七次会让性能变差，只有一两次会带来惊喜。

把这个比例放到生物世界里对比，就会发现一个有趣的位置关系。AI架构的“有害改动比例”（68%），比病毒（约72%）稍低，比简单的真核生物如酵母（约60%）和果蝇（约52%）稍高。换句话说，AI架构在进化的坐标系里，大致坐落在“紧凑基因组病毒”和“简单真核生物”之间的位置。

用形状相似度来衡量的话，AI架构的DFE与果蝇（KS距离0.07）和酵母菌（KS距离0.09）最为接近。这里的KS距离可以理解为两条曲线之间的“差异程度”，数值越小说明越相似，0.07和0.09都是非常小的数字，意味着这两条来自截然不同世界的曲线，几乎像是同一个模具刻出来的。

不过，这里需要做一个重要的方法论说明。大多数生物体的DFE数据，并非逐条记录每一次突变的效果，而是通过统计模型推算出来的汇总参数。因此，AI数据和生物数据之间的比较，严格来说是在拿一份真实的原始数据，和一批根据已发表参数重新生成的“模拟数据”做对比。这个不对称性确实存在，研究者明确标注了这一点，并表示主要结论依赖的是不受这个问题影响的参数比较（如各类别的比例和分布形状参数），而不是样本级别的细节比较。

二、“定向搜索”和“随机搜索”，差在哪里

在所有的发现里，最能说明问题的，是那个“13%的有益改动”。

在生物世界里，有益突变的比例通常只有1%到6%。为什么这么低？因为自然界里的突变是随机的。一个已经被自然选择打磨了亿万年的生物体，就像一个已经调好参数的精密机器，随机乱动一个零件，几乎不可能恰好改进性能。

但AI工程师不是随机乱动，他们是有目的地做改动——他们测试的改动，都是他们认为“也许有用”的改动。这就像是一个技术娴熟的工匠，在调整一件乐器时，不是随机拨弄零件，而是根据音色判断哪里可能还有提升空间。正因如此，AI实验里有益改动的比例（13%）显著高于生物界的随机突变。

但关键在于：虽然有益改动的比例更高了，但整体分布的形状没有变。分布依然是那个厚尾巴、负偏斜的样子，依然可以用同一个数学函数描述。这意味着什么？它意味着AI架构进化的整体地形，和生物进化的地形是一样的——工程师只是在这块地形上走得更快、更准，但地形本身的形状（哪些方向是悬崖，哪些方向是缓坡，哪些方向通往山顶）并没有改变。这就是研究者提出的核心论点：进化的统计规律，是由适应度景观的形状决定的，而不是由搜索机制（随机突变还是有目的设计）决定的。

研究还发现，不同类型的改动呈现出和生物学高度吻合的分层结构。完全拆除一个组件（主要消融，类似于完全删除一个基因）的有害比例最高，达到68%；只调整超参数（次要消融，类似于基因表达量的轻微变化）的有害比例则降低到51%，中性比例上升到32%；介于两者之间的改动（用更简单的替代品替换一个组件）有害比例为72%。这个“改动幅度越大，越容易出问题”的规律，在生物学里早已被充分记录，如今在AI架构里得到了同样的体现。

还有一个关于数据来源的有趣发现。研究者对比了手动整理的数据（140条）和用AI工具自动提取的数据（795条），发现两者之间存在显著差异。差异的根源很具体：手动整理时，研究者主要记录了“拆掉组件”的实验，结果有益改动的比例为0%；而自动提取工具扫描了更广泛的实验类型，包括了那些测试“替换成更好的组件”的实验，结果有益改动的比例上升到15.3%。这说明手动整理反而带来了一种系统性偏差——漏掉了积极的发现。这个结论有点出乎意料：在这个案例里，AI工具提取的数据，比人工整理的数据更全面。

三、AI架构的进化历史，像极了寒武纪大爆发

研究者不只看了AI架构的“基因突变分布”，还研究了它的宏观进化历史——从2012年到2024年，AI架构的种类是如何随时间涌现和消亡的。

他整理了125个有名字的AI架构，记录了每一个的诞生年份、“祖先架构”和应用领域。然后把这些数据和古生物学数据库里的化石记录做对比——对比对象包括寒武纪的三叶虫（从5.4亿年前到4.8亿年前），以及恐龙灭绝之后哺乳动物的大辐射（从8000万年前到4000万年前）。

把AI架构数量随时间变化的曲线画出来，会发现它非常完美地符合一个叫做“逻辑斯谛增长”的数学模型，拟合优度R²高达0.994。这个模型的含义可以用一个生活化的类比来理解：一个新开业的咖啡馆，刚开始客人很少，然后口碑发酵，客流急速增长，最终因为店里座位数量有限，客流稳定在一个天花板附近。AI架构的多样性也是这样——从2012年AlexNet问世开始快速增长，目前已经接近饱和，估算的“容量上限”大约是142种主要架构，目前已经到达了其中的约88%。

更有趣的是，这条增长曲线不是平滑的，而是跌宕起伏的。在2017年（Transformer架构横空出世）和2021年（CLIP和扩散模型涌现）出现了两个明显的爆发期，前后各有十几个新架构密集出现。这两个峰值之间，有一段相对平静的时期。这种“爆发—平静—再爆发”的节奏，和古生物学里著名的“间断平衡”理论高度吻合——生物进化不是匀速的漂移，而是长期稳定、偶尔剧变。

从“生态位填充”的角度看，这个过程也和生物进化惊人相似。计算机视觉（CV）领域是最先被开拓的“生态位”（2012年到2016年），然后是自然语言处理（2017年之后），再然后是音频和多模态领域（2021年之后）。这个“先占广泛生态位，再深入细分领域”的顺序，和生态学里大灭绝之后的物种复苏规律完全一致：泛化型物种先繁荣，特化型物种随后填充剩余空间。

RNN（循环神经网络）的衰落和Transformer的崛起，则被类比为一次“质量灭绝”事件。RNN的最后一个新变体大约出现在2015年，然后沉寂，两年后Transformer大爆发——这个“衰落先于继任者崛起约两年”的时间差，和古生物学里大灭绝之后物种恢复所需的滞后时间规律相符。GAN（生成对抗网络）的衰落与扩散模型的崛起，也呈现出同样的节奏。

把AI架构的辐射曲线、三叶虫的辐射曲线、哺乳动物的辐射曲线标准化后叠放在一起，会看到三条来自不同时代、不同基底的曲线，呈现出几乎相同的“加速上升、达到峰值、然后下降”的弧形。

四、相同的问题，独立发现了相同的答案

研究者还专门统计了AI领域里的“趋同进化”现象。趋同进化是生物学里一个著名的现象：比如鸟类的翅膀、蝙蝠的翅膀、昆虫的翅膀，这三种“翅膀”是由完全不同的祖先、通过完全不同的进化路径独立演化出来的，但它们都是为了解决“如何在空气中飞行”这个共同问题。

在AI架构里，类似的事情也发生了。研究者找出了14个被不同团队、在不同应用领域里独立发明了至少三次的架构特性。注意力机制（就是Transformer里那个让模型学会“关注什么”的核心组件）被独立发明了5次，分别出现在自然语言处理、计算机视觉、视频处理和多模态领域。特征归一化（让模型内部的数据保持稳定分布的技术）同样被独立发明了5次，门控机制（控制信息是否通过的结构）5次，位置编码（让模型理解序列顺序的技术）5次，对比自监督学习（一种不依赖标注数据进行训练的范式）也是5次。

这些发现与生物趋同进化有一个有趣的功能类比：注意力机制在功能上类似于动物的眼睛，都是“选择性收集信息”的工具，眼睛在生物界被独立进化了约7次；特征归一化类似于生物体的体内稳态调节机制，独立进化了约3次；门控机制类似于细胞膜上的离子通道，独立进化了约4次。虽然AI的独立发明次数（3到5次）少于某些生物特性的独立进化次数（可以多到上百次），但考虑到AI领域只有大约20个主要研究团队，而生物世界有数百万个独立的物种谱系，把这个数字按照“独立谱系数量”归一化之后，AI趋同进化的密度大约是生物界的5万倍——定向搜索大大加速了趋同发现的速度。

研究者坦诚地指出了这个分析的一个局限性：生物界的不同物种谱系真的是互相隔离的，而AI研究者会读彼此的论文、参加同一个学术会议、阅读同一个预印本平台。这意味着AI里的“独立发明”，可能受到了潜移默化的知识传播影响，独立性不如生物界那么纯粹。因此，这14个“趋同进化”案例的独立发明次数，应该被理解为“上限估计”而非严格的独立性证明。即便如此，在严格要求“不同应用领域、无共同作者”的前提下，注意力机制有4个独立起源，归一化有4个，门控机制有4个，这些数字依然是实质性的。

五、越成熟的系统，越脆弱

研究者还追踪了几个具体的架构谱系随着“世代推进”发生的变化，包括CNN家族、Transformer NLP家族和视觉Transformer家族。

在Transformer NLP谱系里，随着从2017年的原始Transformer，到2019年的BERT，再到2020年的T5，再到2022年的Switch Transformer，DFE的分布越来越“集中”，有害改动的比例越来越高。换句话说，越是成熟的架构，越容不下随意的改动——因为每个组件都已经被高度优化，拆掉任何一个都会造成明显损失。

这个规律在生物世界里也是一样：RNA病毒（基因组高度紧凑、每个基因都被充分利用）的有害突变比例高达约70%，而人类（基因组里有大量“非功能序列”、改动空间更大）的有害突变比例只有约55%。把AI架构的各个世代和这些生物体放在同一张图上，会看到它们点缀在同一条趋势线上——随着系统优化程度提高，有害改动的比例单调上升。这是一条跨越碳基和硅基的普适规律。

Mamba架构（一种近年来被认为很有潜力的新型序列模型，是一个相对年轻的架构谱系）提供了一个有些微妙的测试案例。总体来看，Mamba的中性改动比例（0.16）低于数据集平均水平（0.19），似乎说明它“已经很成熟”。但细分来看，Mamba的主要消融实验（拆除核心组件）100%都是有害的——说明其核心结构极为紧凑，不能随意删减；而次要消融实验（调整超参数）的中性比例高达0.60，远高于平均水平的0.32，说明其参数空间还有大量未被探索的余地。这个“核心高度约束、外围高度灵活”的组合，正是一个年轻架构该有的样子：核心设计已经非常精炼，但还没有被充分调参。研究者据此判断，这与“年轻谱系应保留更多中性空间”的预测部分吻合，但需要更多数据来做最终验证。

六、这不只是巧合，而是更深层规律的体现

既然模式如此吻合，一个自然的问题是：这究竟说明什么？研究者提出了两种可能的解释，并对它们做了区分。

第一种解释是“模块化系统的普遍性质”：任何复杂的模块化系统，不论是神经网络、飞机、还是软件代码，只要你去系统地测试“拆掉各个模块会怎样”，得到的分布都应该是负偏斜、厚尾巴的，这只是复杂系统的一般统计属性，和进化没有特别关系。研究者承认，软件工程领域的“突变测试”研究确实发现软件代码也有类似的分布形态，这为这种解释提供了部分支持。

第二种解释是“适应度景观的拓扑结构决定论”：生物和AI架构之所以展现相同的统计模式，是因为它们面临的功能挑战有着相似的数学结构——“解决复杂信息处理问题”的可行解空间，有着固有的几何形状，这个形状体现为特定形式的DFE、特定节奏的多样性增长、特定程度的趋同发现，无论搜索者是随机突变还是有意设计的工程师。

研究者认为，仅凭DFE形状一条证据，无法区分这两种解释。但当DFE形状、多样性增长动态、趋同进化频率这三条证据同时成立，并且三者的参数都落在生物学的范围之内时，“只是模块化系统的巧合”这个解释就变得不够有说服力。三条独立预测同时被验证，更指向“这些系统共享同一种景观几何结构”的更深层解释。

研究者还提出了一个关于热力学的联系，尽管这部分更偏向理论推测。他指出，有一些物理学家发展了一种把进化视为“在结构化能量景观上优化耗散”的理论框架，根据这个框架，任何处理信息的系统——无论是生物细胞还是神经网络——都必须在“性能最大化”（低能量）和“鲁棒性最大化”（高熵）之间取得平衡，这个权衡会在数学上产生厚尾DFE、逻辑斯谛增长和趋同进化。如果这个方向的理论是正确的，那么我们观察到的统计普适性，最终可能是热力学的必然结果。

研究者还在讨论部分提到了一个延伸视角，关于人类和AI之间的“协同进化”。他在另一项配套研究中发现，GPT-4o、Claude和Gemini三个大语言模型在预测问题时，错误之间的相关性高达0.77——这意味着这些名义上独立的AI系统，实际上共享着大量相同的盲点，很可能源自它们都从人类生成的文本中学习了相同的认知偏见。在这个意义上，人类既是AI架构的“选择环境”（决定哪些架构存活和传播），也是AI的“遗传物质来源”（通过训练数据把人类偏见传递给AI）。随着AI工具越来越多地参与AI研究本身，这个反馈回路可能越来越紧密，出现某种类似于“红皇后效应”的动态——人类设计AI，AI改变了人类研究方式，进而影响下一代AI的设计。研究者预测，随着这种共同进化循环加速，AI实验中有益改动的比例可能会继续上升（因为AI辅助的研究会更精准地命中有益修改），目前的13%只是起点。

这项研究提出了四个具体可测试的预测。首先，AI架构多样性的年增长数量将持续下降，未来若再出现爆发，规模应小于2017年和2021年的两次高峰。其次，随着AI扩展进入机器人、生物AI和材料科学等新领域，注意力机制和归一化技术将在这些新领域被再度独立发明。第三，无论未来哪种架构占据主流，描述DFE形状的参数β将始终保持在0.4到0.7之间。第四，随着AI辅助研究工具的普及，AI实验中有益改动的比例将随时间升高。

说到底，这项研究做的事情是把两个看似毫不相关的领域——分子进化生物学和机器学习工程——用同一把统计尺子量了一遍，然后发现两边的数字惊人地吻合。这不代表AI“有生命”，也不代表工程师等同于自然选择，而是说，在“复杂信息处理系统”这个更宏观的类别下，可能存在某些超越具体基底的普遍规律，就像无论用什么材料造的桥，最终都要服从同样的力学定律。

这对普通人意味着什么？如果这个发现是可靠的，那么几十年积累的进化生物学知识——关于什么样的改动是安全的，什么样的改动是危险的，进化在什么情况下会“卡住”——可能直接被用来指导AI架构设计，帮助工程师更好地预判哪些改动值得尝试、哪些几乎注定失败。反过来，AI架构进化因为保存了完整的“化石记录”（所有论文、代码和实验数据都可以被追溯），也可以成为一个测试进化理论的精确实验室，弥补古生物学记录不完整、实验无法重复的天然缺陷。

这项研究本身也有一些未解决的局限性值得记在心里。935个实验样本虽然是目前最大的同类数据集，但能否代表整个AI架构进化的全貌仍有疑问。论文编号arXiv:2604.10571中包含了补充材料，其中有更详细的方法描述和额外的鲁棒性检验，对方法细节感兴趣的读者可以在那里找到更全面的信息。

Q&A

Q1：AI架构消融实验和生物基因突变实验有什么本质区别？

A：消融实验是工程师主动拆除神经网络某个组件来观察性能变化，而生物基因突变实验是随机或人工修改某个基因后观察生物体的健康变化。两者最大的区别在于“意图”：工程师测试的是他们认为可能有价值的改动，而自然界的突变是随机发生的。这也正是AI实验里有益改动比例（13%）远高于生物突变（1%~6%）的原因。但两者的改动效果分布在形状上高度相似，说明底层的适应度景观具有共同结构。

Q2：AI架构进化的“饱和”意味着以后不会再有新架构出现了吗？

A：不是这个意思。模型预测的是在现有任务类型和评价框架下，主要架构种类的多样性趋近于一个上限（约142种）。就像生物界的物种数量在某一时期趋于稳定，但这不妨碍新物种出现，也不妨碍某些“大灭绝”事件（比如一个碘伏性新范式）清空空间再引发新一轮爆发。研究者预测未来若出现新爆发，规模应小于2017年和2021年的两次高峰，但新范式的出现本身是无法被排除的。

Q3：这项研究如何定义AI架构中的“中性改动”？

A：研究者将“中性改动”定义为性能变化幅度非常小、落在统计噪声范围之内的改动，与生物学里“对适应度几乎没有影响”的中性突变概念类比。在数据处理中，具体阈值的设定参考了生物DFE研究中的惯例，将相对性能变化绝对值低于某一阈值的改动归入中性类别。这个类别在次要消融（如超参数调整）中比例更高，达到32%，而主要消融（核心组件拆除）中只有19%，这与生物学里小改动比大改动更容易是中性的规律完全一致。

来源:https://www.techwalker.com/2026/0428/3185375.shtml

上一篇：亚利桑那州立大学研究AI视觉识别需理解真实物体才能认知世界

下一篇： AI乘法计算盲区揭秘：德克萨斯大学与新加坡国立大学研究新发现