首页科技资讯软件教程游戏攻略手机游戏

首页

科技

Meta超级智能实验室首篇论文：重新定义RAG

Meta超级智能实验室首篇论文：重新定义RAG

热心网友

61

转载

2025-09-08

来源:https://36kr.com/p/3457731101464199

Meta超级智能实验室的首篇论文，来了——

提出了一个名为REFRAG的高效解码框架，重新定义了RAG（检索增强生成），最高可将首字生成延迟（TTFT）加速30倍。

毕竟算是超级智能实验的“开山之作”，研究一出，就已经在网上掀起了不少的热议。

例如Reddti网友表示：

若效果真如研究所说的那样，那对RAG来说是相当不错的改进，看起来可以做到在不牺牲准确性的情况下，能显著提高速度和上下文大小。

麻将

天下苦RAG上下文计算冗余久矣

首先，我们需要理解并回顾一下RAG的工作原理。

当一个大型语言模型（LLM）被要求回答需要精确背景知识的问题时，如果仅依赖它内部参数化的知识，可能会出现事实性错误或信息滞后等情况。

而RAG就通过一个外部知识库（如企业文档、专业数据库等）进行检索，将与问题最相关的信息提取出来，作为上下文与原始问题一同提供给LLM。LLM在获得这些精确的参考资料后，就能生成内容更可靠、更具时效性的答案。

然而，这个模式在工程方面也带来了不小的挑战，即推理效率与信息量的权衡。

当AI检索到的参考资料非常多（也就是我们通常说的“长上下文”）时，LLM的处理负担会大幅增加。

模型处理上下文的计算复杂度通常与上下文长度的平方成正比，导致生成第一个字的延迟（Time-to-First-Token, TTFT）显著增加，这直接影响了实时交互应用的用户体验。

同时，处理长上下文也意味着更高的计算和内存开销，为系统的规模化部署带来了挑战。

基于这样的背景，Meta超级智能实验室的研究人员发现，在RAG应用中，LLM处理检索到的多个文档时，其计算过程存在大量冗余。

通过实验，他们观察到模型内部的注意力机制在处理这些文档时，呈现出一种“块对角”（block-diagonal）的稀疏模式。

这意味着，模型的注意力主要集中在单个文档内部，以及各文档与用户问题之间的关联上。而不同文档片段之间的交叉注意力得分通常很低，表明它们之间的关联性较弱。

然而，标准的Transformer架构并不会区分这些关联性的强弱，而是对上下文中的所有词元（token）进行全局的注意力计算，这导致了大量计算资源被消耗在分析那些关联性很弱的文档片段上。

基于这一观察，研究团队提出：RAG解码过程中的大部分注意力计算对于最终结果的贡献有限，可以在不显著影响性能的前提下被优化或移除。

REFRAG，就此应运而生。

REFRAG：一种选择性压缩解码方案

REFRAG这个框架，主要通过“压缩（Compress）、感知（Sense）、扩展（Expand）”的流程，优化了LLM处理外部知识的方式。

压缩：将上下文转换为紧凑表征

REFRAG首先改变了上下文的呈现方式，它没有将所有检索到的原始文本直接输入给主LLM，而是引入了一个轻量级的编码器模型。

这个编码器将长篇的参考资料切分为多个“块”（chunks），并为每个“块”生成一个紧凑的向量表示——“块嵌入”（chunk embedding）。这个“块嵌入”可以视为原始文本块的浓缩摘要。

这一步骤带来了两个直接的好处，首先就是缩短输入序列长度，因为LLM需要处理的输入从数千个词元缩减为数百个“块嵌入”，显著降低了后续的计算量。

其次是由于这些“块嵌入”可以被预先计算并存储，当知识库中的同一文档被再次检索时，系统可以直接调用缓存的嵌入，避免了重复的编码计算。

感知：智能判断关键信息

考虑到并非所有信息都适合压缩，某些包含关键细节的文本片段需要被保留。

为此，REFRAG训练了一个基于强化学习（RL）的策略网络。

这个网络的功能是分析所有的“块嵌入”和用户问题，判断哪些文本块包含最核心的信息，需要以原始文本的形式呈现给LLM。

扩展：结合压缩与原始文本

经过前两步的处理，最终输入到主LLM的是一个混合序列，它包含了大部分上下文的“块嵌入”（压缩表示）和少量被判断为关键的“原始文本块”。

LLM基于这份经过优化的输入材料来生成答案，大部分背景信息通过压缩表示快速获取，而核心细节则通过原始文本进行精确理解。通过这种方式，REFRAG在保留关键信息的同时，最大限度地降低了计算负载。

性能无损，效率提升

根据论文数据，REFRAG框架在多个维度上取得了较为不错的成果。

例如在推理速度方面，以首字生成延迟（TTFT）为例，REFRAG实现了最高30.85倍的加速。与之前的先进方法相比，也取得了3.75倍的提升。

这意味着在需要快速响应的场景下，系统的延迟可以得到有效控制。

其次，实验还表明，在获得显著加速的同时，REFRAG在困惑度（Perplexity）以及多种下游任务（如问答、摘要）的准确率上，与使用完整上下文的基线模型相比没有性能损失。

此外，由于压缩技术使得模型能在同等计算预算下处理更多信息，上下文窗口等效扩大了16倍，这在某些任务上反而带来了性能增益。

据了解，这个方法的设计不仅适用于RAG，也适用于多轮对话、长文档摘要等其他需要处理长上下文信息的任务。

总而言之，Meta超级智能实验室的这项研究，通过巧妙的算法设计，有效解决了当前大模型在处理长上下文时面临的核心效率问题。REFRAG为开发更高效、更经济、更具扩展性的AI应用提供了一个重要的解决方案。

参考链接：

[1]https://arxiv.org/abs/2509.01092

[2]https://www.reddit.com/r/singularity/comments/1nai17r/new_research_from_meta_superintelligence_labs_big/

上一篇：万亿级深空经济呼之欲出，十大产业方向明确，商业航天迎发展契机

下一篇：博通AI半导体崭露头角，能否成为下一个英伟达？

免责声明

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

最新文章

《午夜之南》实机预告：民间神话冒险之旅

在今日凌晨的Xbox发布会上，动作冒险游戏《午夜之南》公布了实机演示预告，确认将于2025年发售，并加入Xbox Game Pass。《午夜之南》是一款全新的动作冒险游戏。游戏中，玩家将置身于一个现

2025-09-09.

7082

追觅科技进军汽车行业，德国建厂对标布加迪

近日，追觅科技在宣布进军汽车行业后，再次迈出实质性一步。公司创始人兼CEO俞浩率领团队前往德国，为追觅汽车及大家电业务进行工厂选址。据悉，追觅汽车的德国工厂计划选址在特斯拉柏林超级工厂附近。同时，追

2025-09-09.

4183

小米智能音箱新配色发布：五色可选，质感升级，199元开售

小米今日推出了一款全新配色的小米智能音箱，现已正式开售，定价为199元。新款在硬件配置上延续了今年4月发布版本的设计，但在外观颜色上进行了升级，新增了霜白、沧蓝、麦黄、松绿以及醇红五种色彩选择，使得

2025-09-09.

5260

全新速腾L今日上市，预售11.99万起，外观内饰全面升级，搭载1.5T动力

全新速腾L将于今日正式上市，此前公布的预售价格区间为11 99万至13 59万元。作为换代车型，新车在外观设计、内饰布局及配置方面均进行了较大幅度的调整与升级。前脸部分采用了全新的设计语言，与现款车

2025-09-09.

8926

《完美黑暗》首日登陆XGP，全新实机演示公布

在今天的Xbox发布会中，《完美黑暗》正式发布了全新的实机演示，并确认游戏将在发售当日加入Xbox Game Pass。敬请期待更多消息。实机演示详情可通过移动端查看>>>

2025-09-09.

4151

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

热门推荐

苹果首发！曝iPhone 17系列国行版将落地eSIM 从“响应式”到“协作级”，联想百应智能体2.0重磅升级，开启企业AI服务新范式捷达VS8正式上市，定位家用SUV，预售价9.9万起华为Mate XTs发布，金铲铲之战鸿蒙版9月25日上线密码策略不设防？等保 2.0 下，这些 Linux 加固配置你必须知道！领峰环球：非农之夜行情波动加剧，专业黄金交易平台为投资保驾护航！单用户模式密码重置，运维人最最最基本技能，别说你不懂！《明末：渊虚之羽》少女刀剑度众生网络性能提升实战：单队列vs多队列性能实测对比库克、扎克伯格都去了特朗普宴请科技大佬：马斯克缺席

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

十三号病院怎么拿到痒痒挠十三号病院拿痒痒挠详细攻略

十三号病院怎么拿到痒痒挠十三号病院拿痒痒挠详细攻略发布于 2025-09-09

地下城与勇士手游攻略选择哪个角色好后期 dnf手游后期强力职业推荐

地下城与勇士手游攻略选择哪个角色好后期 dnf手游后期强力职业推荐发布于 2025-09-09

占山为王2游戏怎么玩占山为王2开局详细攻略

占山为王2游戏怎么玩占山为王2开局详细攻略发布于 2025-09-09

永远的蔚蓝星球攻略90关永远的蔚蓝星球90关速通攻略

永远的蔚蓝星球攻略90关永远的蔚蓝星球90关速通攻略发布于 2025-09-09

永远的蔚蓝星球攻略75关怎么打永远的蔚蓝星球75关攻略

永远的蔚蓝星球攻略75关怎么打永远的蔚蓝星球75关攻略发布于 2025-09-09

育碧揭秘：Switch 2 实体版采用钥匙卡，非为省钱而是性能受限

育碧揭秘：Switch 2 实体版采用钥匙卡，非为省钱而是性能受限发布于 2025-09-09

《空洞骑士：丝之歌》热度爆棚，Steam 预估销量突破 250 万份大关

《空洞骑士：丝之歌》热度爆棚，Steam 预估销量突破 250 万份大关发布于 2025-09-09

《三角洲行动》主机版发售引爆热潮 Steam同时在线破21.3万创新高

《三角洲行动》主机版发售引爆热潮 Steam同时在线破21.3万创新高发布于 2025-09-09

苏联传奇防空利器 “入驻”《战争雷霆》，山毛榉 - M3 正式亮相

苏联传奇防空利器 “入驻”《战争雷霆》，山毛榉 - M3 正式亮相发布于 2025-09-09

魔灵召唤： SWC2025中国选拔赛冠军 “Kangjing”，晋级巴黎总决赛

魔灵召唤： SWC2025中国选拔赛冠军 “Kangjing”，晋级巴黎总决赛发布于 2025-09-09

iPhone 17 Pro Max电池容量首破5000mAh，但国行版因物理卡槽略有缩水

iPhone 17 Pro Max电池容量首破5000mAh，但国行版因物理卡槽略有缩水发布于 2025-09-09

消息称苹果 Apple Watch SE 3 本周发布：全新 S11 芯片、同步配大尺寸显示屏

消息称苹果 Apple Watch SE 3 本周发布：全新 S11 芯片、同步配大尺寸显示屏发布于 2025-09-09

消息称苹果今年将量产 1 亿部 iPhone 17 系列手机：Pro Max 领跑，Air 产量最低

消息称苹果今年将量产 1 亿部 iPhone 17 系列手机：Pro Max 领跑，Air 产量最低发布于 2025-09-09

苹果 iPhone 17 / Pro 系列电池容量曝光：国行小于美版，Pro Max 首破 5000mAh

苹果 iPhone 17 / Pro 系列电池容量曝光：国行小于美版，Pro Max 首破 5000mAh 发布于 2025-09-09

堪比尼区远低土区：苹果 iCloud+ 国区限时 8.5 折，iPhone 17 系列官方云上扩容

堪比尼区远低土区：苹果 iCloud+ 国区限时 8.5 折，iPhone 17 系列官方云上扩容发布于 2025-09-09

宏碁新款Swift 16亮相：首发英特尔Panther Lake AI处理器

宏碁新款Swift 16亮相：首发英特尔Panther Lake AI处理器发布于 2025-09-05

罗技Signature Slim太阳能键盘亮相：10年续航无线体验

罗技Signature Slim太阳能键盘亮相：10年续航无线体验发布于 2025-09-05

英伟达或将削减RTX 5060系列显卡供货量

英伟达或将削减RTX 5060系列显卡供货量发布于 2025-09-03

Framework推出定制散热配件：猫头鹰升级款降低7dB噪音风扇

Framework推出定制散热配件：猫头鹰升级款降低7dB噪音风扇发布于 2025-09-03

【新品速递】BYONE BAX16三屏笔记本上架：16英寸主屏+双10.5英寸副屏，672美元起

【新品速递】BYONE BAX16三屏笔记本上架：16英寸主屏+双10.5英寸副屏，672美元起发布于 2025-09-03

最新下载

小黄人快跑国际

小黄人快跑国际休闲益智 2025-09-09更新

查看

何人在渡劫

何人在渡劫休闲益智 2025-09-09更新

查看

蠢蠢的死法3手游

蠢蠢的死法3手游休闲益智 2025-09-09更新

查看

僵尸射击与防御

僵尸射击与防御飞行射击 2025-09-09更新

查看

NBA2K26

NBA2K26 体育竞技 2025-09-09更新

查看

梦王子百度

梦王子百度角色扮演 2025-09-09更新

查看

英雄战纪游戏

英雄战纪游戏动作冒险 2025-09-09更新

查看

侠客行游戏

侠客行游戏角色扮演 2025-09-09更新

查看

芭比梦幻屋国际

芭比梦幻屋国际角色扮演 2025-09-09更新

查看

梦王子

梦王子角色扮演 2025-09-09更新

查看

热门话题

魔术游戏鸣人的假期刀塔传奇饥荒拉布布游戏洛克王国神魔幻想思美人疯狂越野