Weaviate构建智能体系统的上下文工程完整指南

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

Weaviate构建智能体系统的上下文工程完整指南

热心网友时间：2026-05-28

转载

```html

超越提示词工程：揭秘构建智能AI系统的六大核心组件，掌握上下文工程打造真正懂需求的AI应用

在大模型应用开发中，单纯依赖提示词工程往往难以满足复杂场景的需求。如何构建一套能够根据上下文动态调整、具备持久记忆、并能调用外部工具的智能系统，才是打造高质量AI应用的关键所在。这项核心技术，被称为上下文工程（Context Engineering）。

Context Engineering：Wea viate构建智能体系统的完整指南

大型语言模型的能力虽然令人惊叹，但开发者很快会发现一个现实难题：模型本身虽然强大，却像一座信息孤岛。它既无法读取你的私有文档，也不了解之前发生的对话，甚至在无法回答时会毫不犹豫地编造答案。

问题的根源在于上下文窗口——模型的工作记忆空间存在固有限制。它就像一块白板，一旦写满，旧内容就会被清除，关键信息随之丢失。单纯优化提示词，无法解决这一根本瓶颈。我们需要在模型周围，构建一整套支持系统。这正是上下文工程的核心价值。

上下文工程的六大核心组件

上下文工程是一门系统设计学科，目标是在恰当的时机，将正确的信息传递给大模型。它不改变模型本身，而是搭建模型与外部世界之间的高效桥梁。

1. 智能体（Agents）

决策大脑，负责协调何时使用何种信息，驱动整个系统运转。

2. 查询增强（Query Augmentation）

将混乱、模糊的用户请求，转化为机器能够精确理解的意图表达。

3. 检索（Retrieval）

连接模型与特定文档、知识库的核心桥梁，确保信息可访问。

4. 提示技术（Prompting Techniques）

通过清晰有效的指令，引导模型进行高质量推理与生成。

5. 记忆（Memory）

赋予应用“历史意识”，使其能够从交互中持续学习与改进。

6. 工具（Tools）

让应用能够直接执行操作，与实时数据源和服务进行交互。

智能体：动态决策的核心协调者

静态的“检索-生成”流程，在简单的RAG场景中或许够用。但一旦任务需要判断、适应或多步推理，这种固定模式就显得力不从心。

智能体是什么？

一个真正成熟的AI智能体，至少需要具备以下能力：

动态决策信息流：根据已获取的信息，自主决定下一步行动方向
维护跨交互状态：记录已执行的操作，用历史信息指导后续决策
根据结果调整策略：当一条路径行不通时，能够主动尝试其他方案
自适应使用工具：从可用工具中灵活选择，甚至组合出从未被明确编程的新用法

上下文窗口的核心挑战

LLM的信息处理容量有限，上下文窗口一次只能容纳一定量的内容。每次智能体处理信息时，都需要做出关键抉择：哪些信息应保留在上下文窗口？哪些应存储到外部，需要时再检索？哪些可以摘要或压缩以节省空间？还需预留多少空间给推理和规划？

更大的上下文窗口，并不能真正解决问题，反而可能引入新的复杂性。

常见的上下文错误类型：

上下文污染（Context Poisoning）：错误或幻觉信息混入上下文，智能体反复使用，错误像滚雪球一样不断放大
上下文分散（Context Distraction）：智能体被过多历史信息压垮，过度依赖重复过去的行为，而非重新思考
上下文混淆（Context Confusion）：不相关的工具或文档挤满上下文，分散模型注意力，导致用错工具或误解指令
上下文冲突（Context Clash）：上下文中的矛盾信息让智能体左右为难，陷入逻辑困境

智能体的核心策略与任务

智能体之所以能成为上下文系统的有效协调者，关键在于其动态推理与决策能力。常见任务包括：

上下文总结（Context Summarization）：定期将累积历史压缩为摘要，减轻负担同时保留关键知识
质量验证（Quality Validation）：检查检索到的信息是否一致、有用且可靠
上下文修剪（Context Pruning）：主动删除不相关或过时的上下文内容
自适应检索策略（Adaptive Retrieval Strategies）：重新表述查询、切换知识库或调整分块策略
上下文卸载（Context Offloading）：将细节存储到外部，仅在需要时进行检索
动态工具选择（Dynamic Tool Selection）：只加载与当前任务相关的工具，减少干扰
多源综合（Multi-Source Synthesis）：整合多个来源的信息，解决冲突，提供连贯一致的回答

智能体在上下文工程中的角色定位

在上下文工程系统中，智能体扮演的是协调者角色。它不会取代其他技术，而是将它们智能地编排在一起，发挥协同效应。

查询增强：深入理解用户意图

上下文工程中至关重要的一步，是如何准备和呈现用户查询。如果搞不清楚用户真正在问什么，LLM自然无法给出准确回应。

两个核心问题：

用户交互往往不理想：现实场景中，用户与聊天机器人的对话常常含混不清、逻辑跳跃、信息不全。
不同管道需要不同的查询格式：LLM能理解的问题，未必是搜索向量数据库的最佳格式。

查询重写（Query Rewriting）

将原始用户查询，转换为更有效的检索版本。具体实现方式包括：

重构模糊问题：将不清晰或表述不当的输入，转化为精确、信息密集的术语
移除冗余上下文：删除可能干扰检索过程的不相关信息
关键词增强：引入常用术语，提高匹配到相关文档的概率

查询扩展（Query Expansion）

从单个用户输入中，生成多个相关查询，从而改善检索效果。这在查询本身模糊、表述不清或需要更广泛覆盖时尤为有效。

面临的挑战包括：

查询漂移（Query Drift）：扩展后的查询可能偏离用户原本意图
过度扩展（Over-Expansion）：添加过多术语反而会降低检索精度
计算开销（Computational Overhead）：处理多个查询会增加系统延迟

查询分解（Query Decomposition）

将复杂、多维度的问题，拆解为更简单、更聚焦的子查询，让每个子查询都能独立处理。

通常分为两步：

分解阶段：LLM分析原始复杂查询，将其拆分为更小、更聚焦的子查询
处理阶段：每个子查询独立走完检索管道，从而更精准地匹配到相关文档

查询智能体（Query Agents）

这是最先进的查询增强形式，由AI智能体智能地处理整个查询流程。

查询智能体能够执行的任务包括：

动态查询构建：根据对用户意图和数据模式的理解，按需构建查询
多集合路由：理解所有数据集合的结构，智能决定查询哪些集合
评估：在原始用户查询的上下文中，评估检索到的信息是否真正有用
上下文感知：维护对话的上下文信息，以便处理后续的追问

检索：连接知识的核心桥梁

LLM的能力水平，取决于它能访问到的信息质量。虽然模型在海量数据上训练过，但对其训练完成后出现的私有文档和最新信息，却一无所知。

分块策略实用指南

分块（Chunking），是影响检索系统性能最重要的设计决策。这个过程，就是将大文件切割成更小、更易于管理的片段。

设计分块策略时，本质上是在权衡两个相互矛盾的优先级：

检索精度（Retrieval Precision）：分块要小，聚焦于单一主题，以便生成独特、精确的嵌入向量
上下文丰富性（Contextual Richness）：分块又必须足够大、足够自包含，让模型拿到后能够理解

基础分块技术

固定大小分块（Fixed-Size Chunking）：最简单直接的方法，直接将文本按预定大小（如512个token）进行切割。

递归分块（Recursive Chunking）：使用优先级列表（如段落、句子、单词）作为分隔符进行切分，从而尊重文档的自然结构。

基于文档的分块（Document-Based Chunking）：直接利用文档自带的固有结构，如Markdown标题、HTML标签或源代码中的函数进行切分。

高级分块技术

语义分块（Semantic Chunking）：根据含义对文本进行分割，将语义上相关的句子组合在一起，形成有意义的片段。

基于LLM的分块（LLM-Based Chunking）：让LLM自身智能处理文档，生成语义上连贯的分块结果。

智能体分块（Agentic Chunking）：AI智能体动态分析文档的结构和内容，针对特定文档选择最优的分块策略。

层次分块（Hierarchical Chunking）：在不同细节级别上，创建多层分块结构，满足多样化检索需求。

延迟分块（Late Chunking）：与标准流程相反——先嵌入整个文档，再按token粒度关联分块。

预分块与后分块对比

预分块（Pre-Chunking）：最常见的方法，所有数据处理在前期离线完成。

✅ 优点：查询时检索速度非常快
❌ 缺点：分块策略固定，如需更改则需重新处理整个数据集

后分块（Post-Chunking）：一种更先进的实时方案，分块发生在文档检索完成之后。

✅ 优点：灵活性极高，可根据用户查询的上下文创建动态分块策略
❌ 缺点：会增加系统延迟，也需要更复杂的基础设施支持

提示技术：有效引导模型推理

提示工程，就是设计、优化和打磨给LLM的输入，以获得期望输出的实践。提问的方式，直接决定了回复的准确性、实用性和清晰度。

经典提示技术

思维链（Chain of Thought）：让模型“逐步思考”，将复杂的推理过程拆解为中间步骤，提升逻辑性。

少样本提示（Few-Shot Prompting）：在上下文窗口中提供几个示例，展示你期望的输出风格或“正确答案”的格式。

高级提示策略

思维树（Tree of Thoughts）：在思维链基础上更进一步，指示模型并行探索和评估多条推理路径，选择最优方案。

ReAct提示：将思维链与智能体结合，让模型能够动态地进行“推理”和“行动”循环。

工具使用提示

当LLM需要与外部工具交互时，清晰的提示是确保其正确选择和使用工具的关键。

关键要素：

清晰定义参数和执行条件
提供少样本示例供参考
明确说明何时该使用工具
详细描述如何使用工具

专业提示：如何写出高质量的工具描述

多使用主动动词
把输入参数说清楚
描述清楚输出结果
别忘了提及限制条件

记忆：赋予系统持久记忆能力

在构建智能体时，记忆不只是一个附加功能——它是赋予系统生命力的核心要素。没有记忆，LLM不过是一个强大但无状态的文本处理器。

Andrej Karpathy曾给出一个精妙的类比：将LLM的上下文窗口比作计算机的RAM，将模型本身比作CPU。

记忆架构设计

短期记忆（Short-Term Memory）：智能体的即时工作空间，将所有内容塞入上下文窗口，用于推动即时的决策和推理。

长期记忆（Long-Term Memory）：突破上下文窗口的限制，将信息存储到外部，在需要时快速检索。

它包括：

情景记忆（Episodic Memory）：存储特定事件或过去的交互记录
语义记忆（Semantic Memory）：保存一般性的知识和事实

混合记忆设置（Hybrid Memory Setup）：大多数现代系统采用混合路线，结合了短期记忆的速度和长期记忆的深度。

有效记忆管理的关键原则

修剪和精炼记忆：定期扫描长期存储，删除重复条目，合并相关信息，或淘汰过时内容。

有选择地存储：设立过滤标准，在保存前先评估信息的质量和相关性。

根据任务定制架构：不存在放之四海而皆准的记忆方案。从最简单的办法开始，再逐步分层，持续完善。

掌握检索艺术：有效的记忆，不在于能存多少，而在于能否在正确的时间，把正确的信息找出来。

工具：连接外部世界的桥梁

如果说记忆给了智能体一种“自我感”，那么工具就是赋予它“超能力”的钥匙。LLM本身是出色的对话者和文本处理器，但它们活在一个封闭的气泡里。

从提示到行动的演变

真正的突破在于函数调用（Function Calling），也称为工具调用。这种能力已经成为大多数模型的原生功能，它允许LLM输出结构化的JSON数据，其中包含要调用的函数名称和所需的参数。

应用可能性包括：

简单工具：例如旅行智能体可以使用search_flights工具
工具链：复杂请求可能需要将多个工具串联起来，如find_flights、search_hotels再加上get_local_events

编排挑战

给智能体一个工具很容易，但让这个工具被可靠、安全、高效地使用，才是真正的技术难点。

关键编排步骤：

工具发现（Tool Discovery）：智能体需要先了解自己有哪些工具可用。

工具选择与规划（Tool Selection and Planning）：面对用户请求时，智能体必须判断是否需要使用工具。

参数制定（Argument Formulation）：确定使用哪个工具后，智能体还需明确应该传递什么参数。

反思（Reflection）：工具执行完毕后，输出结果被反馈到上下文窗口，智能体需要反思这个输出，决定下一步行动。

工具调用的下一代技术：MCP

工具使用的演进正变得越来越标准化。Model Context Protocol (MCP) 由 Anthropic 在2024年底推出，它为连接AI应用与外部数据源和工具，提供了一套通用标准。

MCP将传统的M×N集成问题（M个应用，每个都要为N个工具写自定义代码），简化为M+N的问题，大幅降低了集成复杂度。

总结：从提示者到架构师的转变

上下文工程，绝不仅仅是提示大模型、构建检索系统或设计AI架构。它是在构建一个互联的、动态的系统，让AI能够在各种不同的用途和用户面前，都能稳定、可靠地工作。

上下文工程的六大核心组件，构成了这个系统的骨架：

智能体——系统的决策大脑，负责协调与调度
查询增强——将混乱的人类请求，转化为可操作的精确意图
检索——连接模型与事实和知识库的核心桥梁
记忆——赋予系统历史感和持续学习能力
工具——让应用能够与实时数据和API交互
提示技术——引导模型的推理过程，提升输出质量

我们正在完成一个角色转变：从一个跟模型对话的提示者，变成一个为模型构建生活世界的架构师。最好的AI系统，往往不是来自更大的模型，而是来自更优秀的系统工程。

```

来源:https://www.53ai.com/news/knowledgegraph/2025112083657.html

上一篇：豆包AI智能体怎么分享与传播完整详细教程

下一篇：每天学点AI五个阶段了解大模型发展史

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

热门专题

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

日榜
周榜
月榜

选技大乱斗兑换码大全与永久有效领取方法

Niko直播分析Falcons战队Major备战关键在图池与心态

龙魂旅人宙斯强度解析实战阵容搭配与角色评测指南

支付宝服务3亿笔AI智能体支付 xAI开放Grok Build测试

瑞典CS女选手7licious宣布退役告别赛场后内心空虚

Steam Deck OLED价格飙升关键部件短缺致成本上涨

七界梦谭开发商是谁游戏制作团队背景与成员揭秘

Valve掌机Steam Deck上市两年半后价格飙升40%

2026年VCT CN伦敦大师赛赛制规则详解

古天乐出道前曾坐牢后逆袭成为慈善天王

洛克王国绿色命运之钥获取攻略与详细步骤

洛克王国VIP扭蛋机具体位置与获取方法

光遇2026年520发布会爆料内容全解析

洛克王国S2赛季异色精灵盒子查看与使用指南

洛克王国城堡守护者具体位置与寻找攻略

星辰变归来神兽获取攻略新手快速入手指南

洛克王国宠物医院地址查询与位置导航指南

星辰变归来时装系统详解新手入门穿搭攻略

阴阳师2026年520兑换码领取方法与最新福利一览

星辰变归来境界系统详解与修炼攻略

漫蛙漫画防走失网页链接

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

Weaviate构建智能体系统的上下文工程完整指南

上下文工程的六大核心组件

1. 智能体（Agents）

2. 查询增强（Query Augmentation）

3. 检索（Retrieval）

4. 提示技术（Prompting Techniques）

5. 记忆（Memory）

6. 工具（Tools）

智能体：动态决策的核心协调者

智能体是什么？

上下文窗口的核心挑战

智能体的核心策略与任务

智能体在上下文工程中的角色定位

查询增强：深入理解用户意图

两个核心问题：

查询重写（Query Rewriting）

查询扩展（Query Expansion）

查询分解（Query Decomposition）

查询智能体（Query Agents）

检索：连接知识的核心桥梁

分块策略实用指南

基础分块技术

高级分块技术

预分块与后分块对比

提示技术：有效引导模型推理

经典提示技术

高级提示策略

工具使用提示

记忆：赋予系统持久记忆能力

记忆架构设计

有效记忆管理的关键原则

工具：连接外部世界的桥梁

从提示到行动的演变

编排挑战

工具调用的下一代技术：MCP

总结：从提示者到架构师的转变

修Bug被Gemini追删代码致宕机修复报告现编

Notion AI运营指南：自动归纳用户反馈

AI给出的答案为何总不符期望？原因解析

Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4

Trae对Deno与Bun运行时的AI代码补全支持程度全面详解