Approximate Nearest Neighbor（近似最近邻搜索）

本次查询Approximate Nearest NeighborAI 热词解释结果

中文解释近似最近邻搜索

热词类型搜索算法 / 数据结构

常见场景大规模向量检索与相似度匹配

一句话解释

近似最近邻搜索（ANN）是一种能在海量数据中快速找到与查询项“足够相似”的个体，而不要求绝对精确最近邻的算法。它通过牺牲可接受的精度来换取数量级的速度提升，是处理高维向量检索最有效的通用方案之一。

为什么会被关注

随着大模型和多模态AI的普及，文本、图像、音频都被转化为高维向量（如768维的BERT嵌入）。传统精确最近邻搜索在百万级数据上就需要一次全量遍历，速度完全无法接受。ANN将搜索时间从分钟级压缩到毫秒级，直接支撑起了推荐系统、搜索引擎和向量数据库的实时响应能力。

核心逻辑

ANN的核心思路是“以结构换速度”：通过预先构建索引，把高维空间划分成可快速定位的子区域。常见技术包括：基于树的空间划分（KD-Tree、VP-Tree）、基于哈希的近似映射（LSH将相似向量映射到同一桶）、基于图的小世界导航（HNSW在图中跳跃式搜索）、以及基于量化的编码压缩（PQ将向量拆分为子空间近似）。

常见场景

推荐系统中的“相似物品”召回：用户行为向量在百万商品库中匹配最相似的Top-K物品，ANN将延迟控制在10ms以内。图像/视频指纹检索：比如以图搜图应用，将图片编码成向量后用ANN索引快速找到相同或相似图片。向量数据库（如Milvus、Pinecone、Weaviate）的内核均依赖ANN算法实现毫秒级查询。

容易混淆的点

ANN与精确最近邻（KNN）的区别：KNN要求绝对精确，必须比较全部数据；ANN允许有误差但速度快成百上千倍。二者不是替代关系，而是精度与效率的权衡——若数据量小于10万且需要严格结果，可使用精确搜索；大规模场景下ANN才是实际能用的方案。

来源：AI 热词解释频道整理

Approximate Nearest Neighbor 向量数据库推荐系统相似度搜索 LSH

上一篇：ANN Search

下一篇：语义搜索（Semantic Search）到底是什么？

本文内容用于 AI 热词解释和概念整理，仅供学习和理解参考。若涉及表述偏差或内容修正，欢迎联系站点进行更新。

相关热词

向量数据库更新：2026-05-14

向量数据库：让AI“理解”非结构化数据的关键底座

向量数据库是一种专门为存储和检索高维向量数据而设计的数据库。它通过将文本、图像、音视频等非结构化数据转化为数学向量（即一组数字），并计算向量间的“距离”来衡量相似性，从而实现高效的相似性搜索。它是构建AI应用，如智能问答、推荐系统和内容检索的核心基础设施。

向量检索更新：2026-05-14

向量检索：让AI“理解”你的搜索意图

向量检索是一种基于深度学习的技术，它将文本、图像等数据转换为高维空间中的向量（一组数字），并通过计算向量间的相似度来寻找最相关的内容。它突破了传统关键词匹配的局限，实现了基于语义的智能搜索与推荐。

常查热词

大语言模型大语言模型：AI的“语言大脑”，如何理解与生成人类语言？ 大模型大模型：AI的“全能大脑”，为何能掀起技术革命？ RAGRAG：让大模型学会“翻书”的检索增强技术 智能体智能体是什么？从AI助手到自主决策的进化 扩散模型扩散模型：从噪声中“生长”出图像的AI魔法 AIGCAIGC：当人工智能成为内容创作者 代码生成代码生成：AI帮你写代码，从自然语言到可执行程序 向量数据库向量数据库：让AI“理解”非结构化数据的关键底座