数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

热点详情

RAG五种分块策略深度解析与比较

AI热点日报时间：2026-05-29

热点解读

RAG分块策略包括固定大小、语义、递归、基于文档结构和基于LLM五种。固定大小分块易切断语义；语义分块保留逻辑边界但阈值难定；递归分块保留语境完整性但计算开销大；基于结构分块需文档清晰，常需递归辅助；基于LLM分块最准确但成本高昂。选型需根据文档特性和资源权衡。

```html

在优化检索增强生成（RAG）流程时，如何对文档进行有效分块以提升检索效果，始终是一个核心问题。

简单回顾一下RAG的核心逻辑：先将外部文档转换为向量嵌入并存储，随后计算查询的向量表示，与已存储的向量进行语义匹配，最后将最相似的信息连同原始查询一起输入大语言模型——这是整个流程的关键环节。但现实挑战在于：外部文档往往篇幅很大，无法整篇直接处理。因此，第一步必须将长文档切分成便于管理的小文本片断。这一步操作，即称为分块。

目前主流的RAG分块策略共有五种。下面逐一进行剖析。

RAG的五种分块策略

固定尺寸分块：简单直接但存在明显局限

固定尺寸分块确实是最直观的方法——按照预设的字符数、单词数或Token数将文本均匀切割成等长片段。然而在实际应用中，简单一刀切很容易破坏语义的完整性，因此通常会引入少量重叠区域，以保持上下文之间的连贯性。

不过，这种方法的硬伤同样突出：它完全忽略句子或段落的自然边界。一个完整的思想观点可能被拦腰截断，导致重要信息散落在不同分块中，检索时自然容易遗漏关键内容，影响RAG的整体效果。

语义分块：块间存在逻辑边界

语义分块注重以句子、段落甚至主题为基本单位，将文档拆分为具有完整意义的片段。其原理是通过计算每个片段的向量嵌入，并衡量它们之间的余弦相似度。若相似度较高，说明上下文语义连贯，可以继续追加；一旦相似度显著下降，则意味着话题或逻辑方向发生转变，应当在此处切断。

与固定尺寸分块相比，语义分块最大的优势在于保留了语言的自然流畅性，每个块都是一个完整的语义单元。检索时，得到的片段信息密度高、逻辑自洽，输入给大语言模型的内容更加干净，最终生成的回答也更连贯、更相关，有效提升RAG的检索精度。

当然，语义分块也存在一个棘手的问题——阈值的设定。这个阈值决定了“相似度下降到何种程度才算断开”，但不同的文档类型、不同的语料库，该数值波动范围很大。要找到一个通用且可靠的阈值，并非易事。

递归分块：先粗切再细调

递归分块的操作流程是：首先依据段落、章节这类固有的分隔符进行初步切割。如果切出的片段仍然超过预设的Token限制，则继续向下拆解；若符合尺寸要求，则停止拆分。

这种方法的优势十分突出：它能够自然地保持语言的流动性和上下文语境完整性。但付出的代价是实施复杂度相对较高，计算开销也会增加——需要在不同粒度上反复判断并执行拆分操作。

基于文档结构的分块：借力文档原生层次

很多文档本身就具有清晰的标题、章节和段落结构，那么为什么不充分利用这些结构呢？让分块边界直接对齐文档的逻辑层次，例如按标题拆分或按章节划分。

这种方式最大的好处是结构完整性很强，每个分块与文档本身的逻辑框架一一对应。但前提是文档必须真正具备清晰的结构。现实中大量文档结构混乱甚至毫无结构性，此时该方法便难以生效。另一个问题是，某些分块的长度差异悬殊，可能超出模型的Token限制，通常需要配合递归拆分来弥补不足。

基于LLM的分块：最智能但成本最高

最后一种策略也是最聪明但最耗费资源的方法——直接让大语言模型（LLM）负责分块。它不仅能深刻理解上下文和语义，还能主动将逻辑完整的独立含义单独提取出来，形成高质量的分块。在语义准确性方面，这几乎是天花板级别的方案。

然而，该方法的计算开销不容小觑。LLM推理本身速度较慢，还要逐段判断边界，成本会急剧攀升。此外，还需考虑LLM自身的上下文窗口限制——如果文档过长，模型本身可能也无法完整处理。因此，目前这更多是一种理论上的优秀方案，实际落地时需要仔细权衡预算与性能。

总结：没有通用的最优方案，合理选择分块策略才是关键

每种分块策略都有其独特优势，同时也存在无法回避的短板。选择哪一种，很大程度上取决于内容自身的特点、嵌入模型的能力，以及你愿意投入的计算资源。

从实际应用来看，语义分块在多数场景下表现均衡，既能够保留语义完整性，又不至于过度消耗算力。但具体到不同项目，由于数据样本和任务目标各异，最终效果很可能天差地别。建议多尝试几种方案，用实测数据说话，这才是优化RAG分块的最佳路径。

```

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：RAG五种分块策略深度解析与比较要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://www.53ai.com/news/RAG/2025080450746.html

ai 人工智能

上一篇：Vidu制作狗追飞盘跳起接住的运动抓拍效果

下一篇：ClawBot团队共享代码规范配置与统一编码风格设置

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

延伸阅读

iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态真我828真粉节揭晓：10000mAh超大电池手机即将亮相？苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套刘志强：京东方坚持开放合作，拒绝低质低价竞争 Redmi K90系列全系标配5000万长焦与3D超声波指纹，配置再升级 vivo X300系列曝光：天玑9500+2亿像素主摄，长焦微距实力升级

日榜
周榜
月榜

01 / 08-26iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 02 / 08-26iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 03 / 08-26真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 04 / 08-26苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别 05 / 08-27对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套

01 / 本周OmniParser基于AI的解析工具 02 / 本周通义灵码智能编码助手助你高效编程 03 / 本周基于AI的自动化道路巡逻与资产数据收集方案 04 / 本周通义智文AI助你高效阅读全网文章 05 / 本周Applitools Eyes 基于人工智能的端到端测试平台

01 / 本月OmniParser基于AI的解析工具 02 / 本月通义灵码智能编码助手助你高效编程 03 / 本月基于AI的自动化道路巡逻与资产数据收集方案 04 / 本月通义智文AI助你高效阅读全网文章 05 / 本月Applitools Eyes 基于人工智能的端到端测试平台

热点快看

07-05 19:47OmniParser基于AI的解析工具 07-05 19:47通义灵码智能编码助手助你高效编程 07-05 19:47基于AI的自动化道路巡逻与资产数据收集方案 07-05 19:47通义智文AI助你高效阅读全网文章 07-05 19:47Applitools Eyes 基于人工智能的端到端测试平台

热点追踪

持续追踪iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 持续追踪iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 持续追踪真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 持续追踪苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别