谷歌AI新突破：剪切技术让模型记忆力提升98%

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

谷歌AI新突破：剪切技术让模型记忆力提升98%

热心网友时间：2026-05-12

转载

与AI进行长对话时，你是否常感到困惑：随着对话轮次增加，AI的回答开始变得逻辑混乱、前后矛盾，仿佛患上了“记忆衰退症”？这普遍现象的背后，核心症结在于AI模型的“长上下文处理能力”存在瓶颈。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

谷歌研究团队的神奇发现：只需轻轻

近期，一项由约翰斯·霍普金斯大学与卡内基梅隆大学联合进行的研究，在预印本平台arXiv上发布（论文编号arXiv:2602.05258v1），为这一难题带来了一个简单而高效的解决方案。研究人员发现，仅需一个巧妙的“剪切”操作，即可将AI的长文本记忆与理解能力提升近一倍。更关键的是，该方法无需对模型进行耗时的重新训练，也无需改动复杂的底层架构，成本极低且效果立即可见。

要理解这一突破的价值，首先需了解AI如何“记忆”信息。在大型语言模型内部，一项名为“旋转位置编码”（RoPE）的核心技术，负责为序列中的每个词元赋予一个“位置坐标”，类似于时间戳，以确定词语间的相对顺序。

然而，此系统存在固有缺陷。当需要处理的文本长度超出模型训练时的预设范围，这套“定位系统”便会失效，导致AI的认知出现混乱。更深层的研究还揭示了一个此前被低估的问题：即使在训练长度范围内，AI识别语义关联的能力也会随着词元间距离的拉大而显著衰减。换言之，文本越长，AI就越难准确关联分散在各处的相关信息。

有趣的是，这两个看似独立的问题，其根源都指向RoPE系统中的低频分量。这些低频分量如同走时不准的时钟，运行越久，累积的误差越大，最终导致系统失灵。为此，研究团队提出了名为CoPE（Clipped RoPE）的解决方案，其核心思想正是“修剪”这些不稳定的低频部分。

需要强调的是，这里的“剪切”并非简单粗暴的移除，而是一种“软剪切”策略。如果将RoPE比作一首交响乐，硬剪切好比突然关掉部分乐器，必然产生刺耳杂音；而软剪切则如同用调音台平滑地减弱某些声部的音量，确保整体旋律依然和谐、连贯。

一、AI记忆原理深度剖析：为何对话越长越易“遗忘”

要透彻理解CoPE为何有效，必须深入AI处理序列信息的底层机制。RoPE技术本质上是一个精妙的多层旋转编码系统，不同层级以不同频率旋转，共同编码词元间的相对位置关系。

问题的核心在于该系统的频谱构成。高频分量擅长捕捉局部、近距离的位置关系，而低频分量则负责建模长距离的语义依赖。麻烦在于，在模型训练阶段，许多低频分量并未经历完整的周期变化。这就像一个学生只观察了钟摆的半次摆动，却要预测其未来的完整轨迹，准确性自然难以保证。

理论分析给出了更直观的数据：以一个在8192长度上训练的模型为例，其64个频率分量中，竟有最后29个低频分量从未完成过一个完整周期。这意味着近一半的“定位感知器”处于“训练不足”的状态。

这直接引发了双重困境：当文本超出训练长度时，这些未充分训练的低频分量会“失控”，导致外推能力崩溃；即便在训练长度内，它们也会造成语义理解能力随距离增加而系统性下降。可以说，低频分量既是AI“长文本失忆”的元凶，也是其“远程理解力衰退”的主因。

二、化混乱为有序：软剪切技术如何重塑AI认知能力

既然找到了问题根源，最直接的想法是移除有问题的低频分量，即实施“硬剪切”。但信号处理理论表明，这种突然截断会引发“频谱泄漏”，在时域中产生“振铃效应”。

映射到AI的注意力机制中，这种效应表现为虚假的长距离关联——AI会错误地认为相隔很远的词语存在强联系，从而导致注意力分散与逻辑推理混乱。

因此，研究团队选择了更为优雅的“软剪切”方案。他们采用余弦衰减窗口函数，平滑地降低低频分量的权重，使其影响力逐渐减弱而非瞬间消失。这种方法既有效抑制了不稳定的低频噪声，又保留了必要的长程语义连接，同时完美规避了硬剪切带来的副作用。

从工程实现角度看，CoPE的优势堪称“开箱即用”：它不改变模型原有架构，无需进行重新训练，推理过程也保持不变。开发者仅需在模型初始化阶段应用预先计算好的软剪切权重，即可立即获得性能提升，真正实现了“零成本”升级。

三、突破性实验验证：从64K到256K的上下文处理飞跃

为验证CoPE的实际效果，研究团队以Llama-3-8B模型为基础，将其上下文处理长度从原始训练的8K扩展至64K，并进一步测试了更长的外推能力。

在涵盖文档摘要、长文本问答、检索增强生成等多种现实任务的HELMET基准测试中，CoPE展现出了全面而显著的性能优势。

尤其在处理长达256K（约相当于一本中型小说）的文档摘要任务时，传统RoPE方法的得分已降至9.06，而采用CoPE的模型仍能保持32.37的高分，性能提升幅度超过250%。在超长文档问答任务中，CoPE在128K和256K长度上的准确率分别达到18.23%和19.06%，远高于传统方法的8.21%和7.93%。

更值得关注的是性能提升的规律：文本越短，提升越温和（在8K-16K长度提升约4.54%）；在训练长度附近（32K-64K），提升增至10.39%；而当进入真正的挑战区——外推范围（128K-256K）时，提升幅度则飙升至58.61%。这恰恰证明，CoPE精准地弥补了传统方法最薄弱的环节。

当然，任何改进都不能以牺牲基础能力为代价。在MMLU、GPQA等通用知识基准测试中，CoPE不仅完全保持了模型的原有性能，部分任务上还有小幅提升，证明了其优化的精准性与安全性。