EPFL研究发现大语言模型内部思维与人类创造性大脑高度同步

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

EPFL研究发现大语言模型内部思维与人类创造性大脑高度同步

热心网友时间：2026-05-15

转载

这项由瑞士洛桑联邦理工学院（EPFL）、意大利卢加诺大学（USI）、韦斯利安大学、巴黎脑研究所（ICM）以及宾夕法尼亚州立大学联合开展的研究，于2026年4月以预印本形式发布，论文编号为arXiv:2604.03480。

当AI开始

一、为什么要研究AI与创意大脑的关系

盯着一个普通的回形针，你脑海里能蹦出多少种奇思妙想？当书签、当项链吊坠，甚至撬开手机的SIM卡槽……这种从一个点出发，向四面八方发散出无数可能性的能力，心理学称之为“发散性思维”，它正是人类创造力的核心引擎。与之相对的，则是聚焦于唯一正确答案的“收敛性思维”，比如解一道数学题。

近年来，以ChatGPT为代表的大语言模型，在衡量创造力的经典测试中表现得出人意料。心理学家常用“替代用途测试”来评估发散性思维：给出一个普通物品（比如“砖头”），要求尽可能多地想出它的不寻常用途，再根据答案的创意程度打分。一些顶尖的AI模型，在这个测试上的得分已经达到甚至超过了普通人类的平均水平。

于是，一个更深层的问题浮出水面：AI在行为上表现出创意，但它的内部“思考过程”，真的和人类大脑产生创意时的状态相似吗？这就好比一个人能流利地说外语，但我们无法确定他是在用这门语言思考，还是在机械地套用翻译模板。解开这个谜题，正是研究团队的初衷。

这个问题的重要性，远不止于学术好奇。如果AI在处理创意任务时，其内部的信息处理方式能映射到人类大脑的运作模式，那就意味着AI在某种程度上“理解”了创造力，而非仅仅在统计学层面进行模仿。这对于我们理解AI的本质，以及设计更强大的AI系统，都具有深远意义。

为了找到答案，研究团队做了一次开创性的尝试：他们将神经科学的功能性磁共振成像技术，与对大语言模型内部数学表示的系统性测量相结合，专门针对主动创意思考任务，比较两者的相似度。这在历史上尚属首次。

二、实验是怎么设计的

研究的基础，是一批由神经科学家贝蒂等人在2018年收集的珍贵数据。170名健康参与者在核磁共振扫描仪中完成了两项任务。

第一项是创意任务，即“替代用途测试”：参与者看到物品名称后，需要想出最有创意的用途并报告。第二项是非创意控制任务，即“物体特征任务”：看到同一物品名称后，只需报告其最明显的物理特征（如“砖头是红色的”）。两项任务使用相同的46个物品，结构对称，唯一区别在于是否要求创意。最终，162名参与者的数据被用于分析。

处理大脑数据时，团队对原始的磁共振信号进行了标准化处理，去除了干扰。他们使用“广义线性模型”这一统计方法，从复杂的脑信号中精确提取出每一次试验对应的大脑激活模式，就像从嘈杂的录音中分离出每个清晰的音符。

分析聚焦于两个与创造力密切相关的大脑网络：“默认模式网络”（当你发呆、做白日梦、自由联想时异常活跃，被视为创意的神经基础）和“额顶网络”（负责认知控制和想法筛选）。作为对照，他们还分析了与创意思维基本无关的“躯体运动网络”。

在AI侧，研究团队向一系列不同规模的开源大语言模型输入了完全相同的任务指令和物品名称。关键创新在于，他们不仅提取了模型看到提示词后的激活状态，还提取了生成回答后的激活状态，以捕捉完整的处理过程。

比较AI与大脑相似度的方法，叫做“表征相似性分析”。其核心思路可以这样理解：让两个人分别评价46首歌曲两两之间的相似度。如果两人的评价模式高度吻合，就说明他们的音乐品味在深层结构上一致，尽管他们用的描述词汇可能完全不同。这个方法正是通过比较大脑响应模式与AI内部表示结构的几何相似性，来量化两者的一致性。

所有参与者的创意回答均由四位独立评审按1-5分打分，评审间的一致性系数达到0.75，属于统计学上的“良好一致性”，确保了评分的可靠性。

三、模型越大、越有创意，就越像人类创意大脑

研究测试了近20个开源大语言模型，参数量从2.7亿到720亿不等，涵盖Gemma、Llama、Qwen、Falcon等多个主流系列。

分析结果显示，在模型处理提示词的阶段，其内部激活与人类默认模式网络响应的对齐程度，呈现出一个清晰规律：模型参数量越大，对齐得分越高。两者之间的相关系数达到0.58，且具有统计显著性。这意味着，720亿参数的大模型，比2.7亿参数的小模型，更能“复现”人类进行创意思考时的内部神经状态。

更有趣的发现是，每个模型的“替代用途测试”得分（由另一个AI评估其回答的创意程度）与其对齐得分之间，也存在显著的正相关关系。也就是说，AI在创意任务上表现得越出色，它的内部思维结构就越接近人类创意大脑的神经模式。

这个发现具有双重意义。从神经科学角度看，它暗示默认模式网络所编码的创意信息，可能也存在于大语言模型足够深层的表示空间中。从AI研究角度看，它提供了一种基于神经科学的新评估维度，超越了单纯的行为测试分数。

然而，当模型开始生成回答后，这种对应关系明显减弱。用“提示词+模型回答”阶段的激活进行分析时，对齐程度与模型大小的相关性骤降至接近零，与创意得分的相关性也下降且不再显著。这表明，一旦模型真正“开口说话”，其内部状态就开始偏离人类大脑的创意模式。

对此，研究团队提出了两种可能解释：一是不同规模的模型在输出层面可能趋向于生成相似的答案（创意同质化），掩盖了差异；二是大模型生成的回答在长度和结构上与人类的简短回答差异较大，导致比较困难。这个发现指出了当前研究的一个重要局限：对齐分析主要在输入处理阶段成立，生成阶段的动态机制仍需深入探索。

对额顶网络的分析显示，其对齐得分与模型的创意性能同样存在正相关，但与模型大小的关系不显著。这说明，默认模式网络和额顶网络在与AI规模的关系上模式不同，后者更直接地与模型的“创意能力”本身挂钩。

为了确认这些效应是创意特有的，团队进行了关键对照实验。当使用非创意的“物体特征任务”数据重复分析时，未发现显著相关性。当分析目标换成与创意无关的躯体运动网络时，同样没有发现显著相关。这种“双重解离”模式有力地证明，先前观察到的对齐效应，确实由“创意任务”和“创意相关大脑网络”共同决定，而非普遍巧合。

四、越深的层，越懂创意

大语言模型内部由多层网络组成，如同一条信息加工流水线。已有研究表明，浅层通常处理基础的词汇和语法，而深层则处理更抽象、与任务相关的高级语义。

研究发现，在所有测试的模型中，与默认模式网络对齐程度最高的，往往是靠后的那些层。计算每个模型“最佳对齐层”的相对位置后发现，层的相对深度与对齐得分之间存在显著正相关。从分布来看，峰值集中在相对深度0.5到0.75的区间，即模型的中后段。

这个结果与创造力的本质相符。大脑的默认模式网络负责的是复杂的联想和抽象思维，而非基础处理。对应到AI中，也理应是那些处理高级抽象表示的深层网络部分，才与人类的创意神经几何最为接近。

五、训练方式决定了AI对“创意大脑”的亲疏远近

研究中最具启发性的部分，是关于不同训练策略如何影响AI与大脑创意响应对齐关系的分析。

团队将参与者的大脑数据按创意得分分为高创意组和低创意组，随后测量了几个不同版本的Llama-3.1-8B模型与这两组的对齐程度。这些版本包括：基础预训练版、标准指令微调版、经过“创意偏好优化”的版本、模拟人类行为微调的版本，以及经过推理链训练的版本。

在提示词处理阶段，所有版本的表现差异不大，都对高、低创意的大脑响应有一定正向对齐。真正的分水岭出现在模型生成回答之后。

标准指令微调版本对高、低创意响应的对齐程度相对均衡。而经过创意优化的版本则表现出明显的“选择性”：它对低创意大脑响应的对齐程度显著下降，而对高创意响应仍保持较高对齐。这完全符合其训练目标——被专门训练生成更有创意的内容，其内部结构自然向高创意的神经几何靠拢。

人类行为模拟版本则呈现另一种模式：它对高、低创意的大脑响应都有所提升。这可能是因为该模型被训练复现真实人类（包括创意程度参差的普通人）的行为，因此其表示空间与人类神经响应的整体分布更加吻合。

基础预训练版本在生成阶段几乎丧失了对齐能力。这很可能是因为，未经指令微调的模型无法有效理解创意任务要求，其“尝试完成任务”时的内部状态与真正进行创意思考的人类大脑状态无关。

最引人注目的，是推理链训练版本的表现：它对高创意大脑响应呈现负向对齐，而对低创意响应呈现正向对齐。这是一个方向完全反转的戏剧性结果。

这意味着，经过“先分析，再一步步推导”这种思维方式训练的模型，其内部表示结构实际上与人类创意思考的神经模式背道而驰。推理链训练强化了有条理的收敛性思维，而创意大脑活跃时的神经几何，与这种分析推导模式在表示空间上处于相反方向。简言之，AI学会了“理性推理”，却在某种程度上“失去”了对创意大脑的感应能力。

六、这对AI开发意味着什么

研究团队在讨论中指出，当前主流的大语言模型后训练策略，如训练模型解数学题、写代码、进行逻辑推理，本质上都是在优化收敛性思维。这类任务有标准答案，便于机器自动评判，训练效率高。

然而，这项研究的结果暗示，过度强调这类训练，可能会在无意中削弱模型的发散性思维能力，让模型的内部表示结构越来越远离人类创意神经几何的形状。推理链训练版本在神经对齐层面出现的反转，以及其输出往往更“规整”但创意上可能保守的直观感受，都印证了这一点。相反，专门针对创意优化的版本，则在对齐上呈现出更符合预期的选择性模式。

可以说，大脑对齐分析提供了一种超越行为测试的、更深层的评估维度。一个模型在创意测试上得分高，未必意味着其内部机制真正在“以类似人类的方式”进行创意处理；反之，如果一个模型的内部表示在神经层面与创意大脑高度对齐，则可能意味着它掌握了更接近人类创造性认知的计算原理。

归根结底，这项研究像一次精密的“内窥镜检查”，首次让我们窥见AI在“思考创意”时，其内部状态与人类创意大脑之间的共鸣与分歧。更大的模型、更高的创意能力、更深的网络层次，都会让AI的“创意思维”更接近人脑——但前提是训练方向要对。如果一味朝着“理性推理”的方向强化，即便参数再多，也可能让AI的大脑越来越不像那个擅长天马行空、浮想联翩的人类大脑。这对于未来希望AI能在科学发现、艺术创作等真正需要创造力的领域发挥作用而言，是一个关乎根本方向的重要提醒。

Q&A

Q1：替代用途测试是什么，为什么用它来研究创造力？

替代用途测试是心理学中衡量发散性思维的经典工具。测试者需要针对一个普通物品（如“砖头”），尽可能多地想出它的不寻常用途，评审根据答案的创意程度打分。这个测试能有效反映从单一出发点产生多元、原创想法的能力，被广泛认为是衡量创造力的可靠指标，因此被同时用于测试人类参与者和AI模型的创意表现。

Q2：推理链训练为什么会让AI与创意大脑的对齐出现“反转”？

推理链训练旨在让模型学会一步步逻辑推导，这种思维模式本质上是收敛性的，目标是找到唯一正确答案。而人类进行创意思维时活跃的默认模式网络，对应的则是发散、自由联想的神经状态。两种思维方式在大脑的表示空间中处于相反的方向。因此，推理链训练会将模型的内部表示结构推向与创意大脑响应相反的方向，导致对高创意响应出现负向对齐。

Q3：表征相似性分析是怎么比较AI和大脑的？

表征相似性分析的核心思路是比较“相似度结构”，而非直接比较数值。研究团队将46个物品分别输入AI和呈现给人类参与者，然后分别计算每两个物品在AI内部表示空间中的距离，以及在大脑响应模式中的距离，形成两个“距离矩阵”。如果AI认为某两个物品很相似（距离近），大脑响应也认为它们相似，就说明两者的几何结构是对齐的。这种方法不要求AI和大脑使用相同的“语言”，只要求它们对物品间关系的“感知结构”一致。

来源:https://www.techwalker.com/2026/0420/3184536.shtml

上一篇：浙江大学发布ClawGUI工具链让AI机器人学会操作手机

下一篇： AI视觉模型数数能力揭秘：阿布扎比研究揭示其四大盲区