中科少年班校友打造进化式AI记忆，创新解题效率减半

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

科技数码

中科少年班校友打造进化式AI记忆，创新解题效率减半

热心网友时间：2026-01-19

转载

今年 26 岁的魏天心，是中国科学技术大学少年班毕业生，目前在美国伊利诺伊大学香槟分校读博，同时也是谷歌 DeepMind 的实习生。实习期间，他与所在团队围绕大模型智能体在长期使用过程中如何积累和利用经验这一问题，构建了名为 Evo-Memory 的评测框架，用于系统性刻画智能体在测试阶段的记忆进化行为，即如何在持续使用过程中，像人脑一样不断积累经验，并逐步提升解决问题的能力。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

图 | 魏天心（来源：魏天心）

魏天心让 Evo-Memory 去挑战数学竞赛题目、研究生级别的科学问题、甚至让其在虚拟实验室里完成复杂的多步骤人物。结果发现在某个虚拟任务中，新型 AI 的步骤从平均 22.6 步减少到了 11.5 步，这说明其学会了更优的路径和方法。

即使任务的难度突然变化，或者记忆里混入了一些失败经验，记忆进化之后的 AI 也能保持稳定的表现，因为它会主动整理和优化记忆，而不是被杂乱的信息干扰。

（来源：https://arxiv.org/abs/2511.20857）

有了 Evo-Memory：AI 变得会更会搜索，面对新问题的时候 AI 会迅速在记忆里找到类似的情况；AI 也会变得更会思考，不仅会查看旧有答案，还会分析此前在给出旧有答案时是怎么想的以及使用了什么方法；AI 还会变得更会自我优化，每当解决一个新的问题，AI 就会把这次的经验比如怎么想的、怎么做的、结果如何等内容整理好，整理好之后还会扔掉没用的、突出有用的。

这个过程叫做测试时进化，即每次在被使用以及每次在解决问题的时候，AI 都在实时地自我学习和自我进化。为了测试这种能力，魏天心设计了一个名为 Evo-Memory 的基准测试，把数学题、科学实验和虚拟世界任务等十多种不同类型的挑战，编成连续的任务流，让 AI 一个一个去完成，结果发现它果然可以借助以往经验解决新问题。

魏天心告诉 DeepTech：“我们此次成果的核心贡献是系统性地定义、设计并评估了大模型智能体的测试时学习能力。也就是在不改变模型训练参数的前提下，让智能体通过自我演化，实现跨任务、跨时间的持续改进。”

（来源：https://arxiv.org/abs/2511.20857）

过去两年，大模型和 AI 智能体的能力提升很快，但在实际部署后魏天心发现它们几乎不会从经验中学习。大多数评测默认它们是一次性系统，而在现实中，智能体是长期运行的。

它会不断遇到新情况、会犯错、会修正，这才符合真实世界的背景。因此，本次研究不仅关注它当下的能力，更关注它能否持续进化、持续从经验中学习，并把这种进化变成可控、可衡量的一个系统性过程。

为了让 AI 学会进化记忆，魏天心构建了一个基准测试框架，对相关方法进行了全面评估，并在其中提出并实现了两种关键测试方法，用于刻画智能体在持续学习过程中的记忆进化行为：

第一个方法叫做 ExpRAG，负责经验检索与聚合。其实它是一个错题本，每当 AI 遇到新题目的时候，它就会立马去错题本里搜搜看，看看是否有类似的旧题目和旧答案。然后，它会把找到的旧有例子和当前题目放在一起思考并给出新答案，最后再把这次的新经历记录到错题本里。

第二个方法叫做 ReMem，它能让 AI 进行协同的推理、行动和记忆，并能给 AI 装上“三核处理器”。首先是思考核，专门负责分析问题和制定计划；其次是行动核，专门负责执行具体的操作或者给出答案；再次是记忆整理核，这是一个全新的部分，它专门负责管理经验宝箱，实时地判断哪些记忆有用、哪些应该合并或删除，让记忆库始终保持在最佳状态。

这三个核心协同工作，让 AI 在解决问题的同时，不仅可以思考怎么做，还能同步思考自己之前学的哪些经验能够用上、这次的新经验应该怎么存，真正实现了边学边用和越用越聪明。

（来源：https://arxiv.org/abs/2511.20857）