RAPTOR:让大模型学会“树状思考”的检索增强技术
RAPTOR是一种通过递归抽象处理构建树状检索结构的方法,帮助大语言模型更高效地整合长文本信息,解决传统RAG在复杂推理时的信息碎片化问题。
一句话解释
RAPTOR是一种让大模型先对文本片段进行递归摘要,再构建成树状结构进行检索的技术。它能在回答复杂问题时,同时获取局部细节和全局脉络,避免信息遗漏。
为什么会被关注
传统RAG(检索增强生成)只能从文档中拉取几个独立片段,面对需要跨段落、跨章节推理的任务时经常断章取义。RAPTOR的出现填补了这一空白,它像人类读书时先做笔记再整理框架,让AI也能把握整体逻辑。
2024年相关论文发布后,RAPTOR迅速被开发者和研究者关注,因为它显著提升了长文档问答、法律条款解析等场景的准确率,且与现有大模型架构兼容,无需额外训练。
核心逻辑
RAPTOR的核心分两步:首先将文档切分成小段,用LLM对相邻片段递归生成摘要,形成多层级的节点;然后为每一层的节点生成向量索引。检索时,系统同时匹配底层细粒度信息和高层抽象概念。
这种树状结构使模型既能回答“某条款具体说了什么”,也能回答“整章的核心思想是什么”。递归抽象过程还能自动压缩重复内容,降低检索噪音,提升回答的连贯性。
常见场景
在科研论文综述中,RAPTOR可帮助模型提取各章节关键结论并归纳全文主题,用于生成文献摘要或回答跨章节比较问题。例如问“这篇论文的方法与结果之间有何关联”,模型能同时检索方法和结果两层的总结。
在法律文档分析中,RAPTOR能将几十页合同拆解为条款树,用户问“违约责任的例外情况有哪些”,模型会从树状结构中定位相关子条款及上层的责任框架,给出更准确的答案。
容易混淆的点
RAPTOR常被误认为是一种新的向量数据库或索引算法,实际上它提供的是文档预处理和检索策略的框架,可以搭配已有的向量库(如FAISS)使用。它不是存储技术,而是组织信息的方式。
另有人将RAPTOR与“多跳检索”混淆。多跳检索通常需要模型多次调用检索器来逐步推理,而RAPTOR通过预建树状结构一次性提供多层级信息,减少了迭代调用次数,效率更高。
本文内容用于 AI 热词解释和概念整理,仅供学习和理解参考。若涉及表述偏差或内容修正,欢迎联系站点进行更新。
相关热词RAG(检索增强生成)是一种将信息检索与大语言模型生成能力相结合的技术范式。它让模型在回答前,先从外部知识库中查找相关文档,然后基于这些检索到的准确信息进行生成,从而显著提升回答的准确性、时效性和可追溯性。

