Multi-Vector Retrieval 是什么?多向量检索让搜索结果更精准
Multi-Vector Retrieval(多向量检索)是一种将文档或查询拆分为多个向量进行检索的方案,通过融合稠密向量与稀疏向量,或为同一对象生成多个不同视角的嵌入,来提升语义匹配的准确性和召回率。它常被用于高级 RAG 系统、搜索引擎和推荐场景,以弥补传统单向量检索在细粒度匹配上的缺陷。
一句话解释
Multi-Vector Retrieval 是一种检索策略,它不再用单个向量代表一个文档或查询,而是生成多个向量(如每个段落一个向量,或同时使用稠密和稀疏向量),然后分别计算相似度并合并得分。这样能捕捉文档中不同侧面的语义信息,提升检索的全面性和精确度。
为什么会被关注
传统检索常用一个固定长度的稠密向量表示整个文档,容易丢失局部细节。实际场景中,用户查询可能只与文档某部分相关,单向量难以精准匹配。Multi-Vector Retrieval 通过多种向量表达局部和全局信息,在 RAG 系统中能直接引用更相关的原文段落,减少幻觉,因此受到研究和工业界的关注。
而且它天然支持混合检索:既利用稠密向量理解语义,又利用稀疏向量(如BM25)匹配关键词,使结果既准确又高召回。很多向量数据库和搜索框架已内置此类能力,推动其普及。
核心逻辑
核心思想是将一个对象(文档或查询)表示为多个向量组成的集合。例如,将文档按句子或段落切分,每个片段生成一个向量;查询也可以分解为多个子意图的向量。检索时,对每个查询向量与所有文档向量计算相似度,并采用聚合策略(如 max, sum, top-k 加权)得到最终分数。
另一种常见实现是同时保留稠密向量和稀疏向量,分别检索后按比例融合得分。这种多向量表示打破了单向量维度限制,允许模型在不同粒度上匹配信息,从而提升复杂查询的检索效果。
常见场景
智能问答和 RAG 系统:用户提问后,首先通过多向量检索从知识库中找出最相关的多个段落,再交给生成模型回答。相比单向量检索,它能更准确定位到包含答案的句子,减少无关上下文。
企业搜索引擎:产品文档、研究报告等长文档需要同时理解主题和具体细节,多向量检索可以让用户快速定位到含有关键词的章节,兼顾语义和精确匹配。
推荐系统:将用户行为历史生成多个兴趣向量,与物品的多向量库比对,找到用户可能感兴趣的多个维度的物品,提升推荐多样性。
容易混淆的点
容易与“混合检索”混为一谈。混合检索通常指同时使用语义向量和关键词(如 BM25)进行检索,而 Multi-Vector Retrieval 更强调为同一对象生成多个向量,可以是同一类型的多个(如多个稠密向量),也可以是不同类型(混合检索只是其中一种形式)。
另一个易混淆概念是“多向量嵌入”,即一个对象有多个向量,但检索时若只取其中一个向量做相似度,就不是 Multi-Vector Retrieval。必须使用多个向量的组合查询或评分,才算应用了该技术。
本文内容用于 AI 热词解释和概念整理,仅供学习和理解参考。若涉及表述偏差或内容修正,欢迎联系站点进行更新。
相关热词RAG(检索增强生成)是一种将信息检索与大语言模型生成能力相结合的技术范式。它让模型在回答前,先从外部知识库中查找相关文档,然后基于这些检索到的准确信息进行生成,从而显著提升回答的准确性、时效性和可追溯性。
Embedding(嵌入)是将离散的非结构化数据(如文字、图片)映射为连续稠密向量的技术。这些向量能捕捉数据间的语义关系,让AI能进行语义相似度计算、推荐、分类等任务,是连接人类语言与机器计算的桥梁。
向量数据库是一种专门为存储和检索高维向量数据而设计的数据库。它通过将文本、图像、音视频等非结构化数据转化为数学向量(即一组数字),并计算向量间的“距离”来衡量相似性,从而实现高效的相似性搜索。它是构建AI应用,如智能问答、推荐系统和内容检索的核心基础设施。
向量检索是一种基于深度学习的技术,它将文本、图像等数据转换为高维空间中的向量(一组数字),并通过计算向量间的相似度来寻找最相关的内容。它突破了传统关键词匹配的局限,实现了基于语义的智能搜索与推荐。
Dense Retrieval(密集检索 / 稠密检索)是一种基于神经网络将文本映射为稠密向量,再通过向量相似度匹配来寻找相关信息的技术。它突破了传统关键词匹配只能处理字面重叠的局限,能够理解同义、近义和上下文语义,是现代语义搜索引擎和问答系统的核心技术之一。
稀疏检索是一种基于词频和倒排索引的信息检索方法,与稠密检索形成互补,在RAG、知识库搜索等场景中扮演关键角色。

