RAPTOR：让大模型学会“树状思考”的检索增强技术

本次查询RAPTORAI 热词解释结果

中文解释递归树状检索增强

热词类型大模型检索增强技术

常见场景适用于需要长文档理解 / 多层次推理的AI应用 / 如法律文档分析 / 科研文献综述 / 多轮对话问答等。

一句话解释

RAPTOR是一种让大模型先对文本片段进行递归摘要，再构建成树状结构进行检索的技术。它能在回答复杂问题时，同时获取局部细节和全局脉络，避免信息遗漏。

传统RAG（检索增强生成）只能从文档中拉取几个独立片段，面对需要跨段落、跨章节推理的任务时经常断章取义。RAPTOR的出现填补了这一空白，它像人类读书时先做笔记再整理框架，让AI也能把握整体逻辑。

2024年相关论文发布后，RAPTOR迅速被开发者和研究者关注，因为它显著提升了长文档问答、法律条款解析等场景的准确率，且与现有大模型架构兼容，无需额外训练。

RAPTOR的核心分两步：首先将文档切分成小段，用LLM对相邻片段递归生成摘要，形成多层级的节点；然后为每一层的节点生成向量索引。检索时，系统同时匹配底层细粒度信息和高层抽象概念。

这种树状结构使模型既能回答“某条款具体说了什么”，也能回答“整章的核心思想是什么”。递归抽象过程还能自动压缩重复内容，降低检索噪音，提升回答的连贯性。

在科研论文综述中，RAPTOR可帮助模型提取各章节关键结论并归纳全文主题，用于生成文献摘要或回答跨章节比较问题。例如问“这篇论文的方法与结果之间有何关联”，模型能同时检索方法和结果两层的总结。

在法律文档分析中，RAPTOR能将几十页合同拆解为条款树，用户问“违约责任的例外情况有哪些”，模型会从树状结构中定位相关子条款及上层的责任框架，给出更准确的答案。

RAPTOR常被误认为是一种新的向量数据库或索引算法，实际上它提供的是文档预处理和检索策略的框架，可以搭配已有的向量库（如FAISS）使用。它不是存储技术，而是组织信息的方式。

另有人将RAPTOR与“多跳检索”混淆。多跳检索通常需要模型多次调用检索器来逐步推理，而RAPTOR通过预建树状结构一次性提供多层级信息，减少了迭代调用次数，效率更高。

来源：AI 热词解释频道整理

RAPTOR RAG 信息检索树状结构上下文压缩

本文内容用于 AI 热词解释和概念整理，仅供学习和理解参考。若涉及表述偏差或内容修正，欢迎联系站点进行更新。

相关热词

RAG更新：2026-05-14

RAG（检索增强生成）是一种将信息检索与大语言模型生成能力相结合的技术范式。它让模型在回答前，先从外部知识库中查找相关文档，然后基于这些检索到的准确信息进行生成，从而显著提升回答的准确性、时效性和可追溯性。

常查热词