当前位置: 首页
AI资讯
Claude Code工具调用上下文爆炸?新版已修复占用归零

Claude Code工具调用上下文爆炸?新版已修复占用归零

热心网友 时间:2026-05-28
转载

Claude Code 2.1.69版本悄然上线了一项堪称“革命性”的性能优化。如果你已升级至最新版本,不妨在对话中输入 /context 命令检查一下,或许会有一个惊喜:System tool 栏的占用显示为 0。

Claude Code 工具调用上下文爆炸?新版占用归零

这个“0”的背后,意味着性能体验的巨大跃升。在传统工具加载机制下,一旦配置了大量MCP工具,仅工具定义部分就可能消耗海量的上下文窗口。让我们具体计算一下:

  • 传统全量加载方式:大约消耗77K tokens(其中工具定义约72K,系统提示约5K)。
  • 新版 Tool Search 方式:大约只需8.7K tokens(其中搜索工具逻辑约0.5K,实际发现的工具定义约3K,系统提示约5K)。

这意味着,上下文空间节省了惊人的95%。释放出的这些计算资源,能够完全用于实际对话与代码生成,性能提升立竿见影。

两种搜索方式:精准匹配的“双引擎”策略

那么,这个神奇的Tool Search究竟如何运作?它提供了两种并行的搜索策略,以适应多样化的使用场景。

1. Regex 正则表达式搜索

这种方式对程序员极为友好。当需要调用工具时,Claude会动态生成一个Python正则表达式,用于匹配工具的名称、描述和参数。示例:

  • 输入 "weather",系统会查找所有与天气相关的工具。
  • 输入 "get_.*_data",可以精准匹配所有以“get”开头、以“data”结尾的工具函数。
  • 输入 "(?i)slack",则能够不区分大小写地查找所有Slack集成工具。

这种方法特别适合工具命名规范、描述清晰明确的开发环境,匹配精准度极高。

2. BM25 自然语言搜索

如果记不住复杂的工具名,或者工具描述过于冗长,BM25搜索正是为这种场景设计的。你只需用自然语言描述需求:

  • “send a message to a user”(向用户发送一条消息)
  • “create a pull request on GitHub”(在GitHub上创建拉取请求)
  • “search customer orders by date”(根据日期搜索客户订单)

系统会基于经典的BM25算法,对自然语言描述进行语义分析,并排序返回最相关的工具。无论采用哪种方式,Claude最终只会看到3-5个最相关的工具被完整展开,而不是面对全部50多个工具的庞杂定义。这种“按需加载”机制,正是效率提升的核心所在。

defer_loading:一个标记如何改变一切

实现这套精妙机制的关键,其实只是一个简单的配置标记。在工具定义的JSON中,增加了一个可选字段:

{
  "name": "github-create-pr",
  "description": "Create a pull request on GitHub",
  "input_schema": {...},
  "defer_loading": true
}

defer_loading 设置为 true 时,该工具在Claude启动时不会被加载进上下文,它成为一个“隐藏技能”,只能通过上述搜索机制被发现和调用。

基于此,Claude官方推荐的最佳实践非常明确:

  • 将最常用的3-5个核心工具(例如日常的代码执行、文件读写),设置为 defer_loading: false(或者不设置该字段),确保它们随时可用,响应延迟为零。
  • 其余所有低频或专用工具,均加上 defer_loading: true

这样一来,既保障了高频操作的极致流畅,又彻底避免了上下文资源的浪费,可谓鱼与熊掌兼得。

如何使用?你可能已经在使用了

最精彩的部分在于:你几乎不需要做任何操作

如果你使用的是Claude Code 2.1.69或更高版本,那么Tool Search功能已经自动开启。系统会智能检测所配置的MCP工具总量是否超过上下文窗口的10%。一旦超过该阈值,便会自动无缝切换到Tool Search模式。

无需修改任何配置文件,也无需调整一行代码。你只需完成升级,然后享受它带来的性能红利。

总结

这次更新背后,反映了Anthropic一个重要的工程洞察:在诸多实际任务中,盲目追求1M(100万)的超大上下文窗口,其效果往往不及一个管理精准的200K窗口。问题的关键不在于窗口的绝对大小,而在于对有限资源的精准管控能力。Tool Search正是这一思路的完美体现。

当然,市场上也有观点认为,Claude的“Skills”功能未来或许能完全取代MCP。从技术演进角度看,这确实是一个可能的方向。但现实情况是,目前主流厂商(如GitHub、Slack、Notion等)提供的深度集成,基本都以MCP server的形式交付。因此,MCP生态下的工具膨胀问题,短期内不会消失。这也意味着,类似Tool Search的针对性优化,其价值将持续存在,并且将日益重要。

来源:https://www.53ai.com/news/LargeLanguageModel/2026030694816.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
修Bug被Gemini追删代码致宕机修复报告现编

修Bug被Gemini追删代码致宕机修复报告现编

最近,一起堪称“教科书级别”的AI Agent IDE翻车事件在开发者社区引发热议。这起事故值得所有依赖AI编程工具的开发者,尤其是那些已经在生产环境中对AI Agent 授予较高权限的团队,进行深刻反思。 简单回顾:5月26日,一位开发者要求Gemini 3 5(运行在Agent IDE环境中)修

时间:2026-05-28 22:58
Notion AI运营指南:自动归纳用户反馈

Notion AI运营指南:自动归纳用户反馈

其实,想在 Notion 中高效搞定用户反馈的自动归纳,并不复杂。下面这四种 AI 方法,基本覆盖了从单条处理到全局分析的常见场景。 如果你也在用 Notion 收集用户反馈——无论是问卷、邮件、客服记录,还是社群发言——但总觉得信息碎片化严重,难以提炼共性问题和核心诉求,那很可能是因为缺少一套结构

时间:2026-05-28 22:54
AI给出的答案为何总不符期望?原因解析

AI给出的答案为何总不符期望?原因解析

大模型能力强大,但提问方式不当会导致结果不理想。核心在于精准提问,通过角色设定、背景介绍、明确任务、实现路径和输出要求这五个关键步骤逐步细化问题,才能大幅提升AI回答的质量和精准度。

时间:2026-05-28 22:54
Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4

Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4

2024年3月5日,人工智能领域迎来了一位重要参与者——由OpenAI前员工创立的Anthropic公司正式推出了Claude 3系列模型。这次发布极具分量:新模型不仅在性能上与Google和OpenAI的顶级产品并驾齐驱,部分指标甚至实现超越。要理解此次升级的真正价值,先关注几个关键变化。首先是多

时间:2026-05-28 22:53
Trae对Deno与Bun运行时的AI代码补全支持程度全面详解

Trae对Deno与Bun运行时的AI代码补全支持程度全面详解

如果你在使用 Trae 进行 AI 代码补全时发现,它对 Deno 或 Bun 运行时的提示不够精准——例如类型定义缺失、API 无法正确识别——那很可能不是代码本身有误,而是 Trae 的底层配置尚未适配。简而言之,Trae 对于非 Node js 运行时的标准库支持尚未实现“开箱即用”。下面我们

时间:2026-05-28 22:52
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程