腾讯云开源Agent Memory技术大幅降低61%的Token消耗
近日,腾讯云数据库团队正式开源了TencentDB Agent Memory,这是一套专为AI Agent长周期任务设计的分层记忆引擎,采用MIT协议开放。该项目创新性地运用“上下文卸载”与“Mermaid任务画布”两大核心技术,旨在解决传统Agent记忆方案在长会话中的效率瓶颈。在多任务连续会话的实测中,该方案最高可降低61.38%的Token消耗,同时将任务成功率相对提升51.52%。目前,项目已适配OpenClaw、Hermes等主流AI Agent框架,支持开发者一键集成,快速提升AI智能体性能。

长周期任务中,传统记忆方案的三大核心痛点
当前,主流AI Agent的记忆管理方案,普遍采用将对话历史压缩成摘要并注入后续上下文的方式。这种方法在简短对话中尚可应对,但一旦面临真实的长周期、多步骤任务场景,三大核心痛点便暴露无遗。
首先是跨会话记忆断裂。Agent在每次新会话中难以继承历史信息,导致用户昨天反复确认的需求或规范,今天需要重新沟通,任务无法连贯执行。
其次是信息价值混淆。用户陈述的事实性偏好(如“使用TypeScript开发”)与临时性指令(如“查询天气”)被同等对待并压缩,致使关键长期信息被大量瞬时信息稀释,影响决策准确性。
最后是上下文窗口膨胀。随着任务周期拉长,堆砌的历史信息不断占用宝贵的上下文Token,不仅导致API调用成本攀升,更会分散模型对当前任务的注意力,严重影响执行效率与效果。
两大核心技术:从“模糊摘要”到“结构化可执行地图”
TencentDB Agent Memory旨在系统性地攻克上述难题。其核心突破在于两项关键技术,它们从根本上重塑了AI Agent记忆的存储、组织与调用方式。
Mermaid任务画布:实现记忆的结构化与可视化
第一项核心技术是“Mermaid任务画布”。该系统能够将Agent执行任务的完整过程,动态组织成一张结构清晰的可视化任务图谱。这张图谱基于Mermaid Flowchart语法,将任务状态、步骤摘要及执行依赖关系直观呈现。
这意味着,Agent无需再记忆冗长的原始对话文本,而是掌握了一张“可执行的任务地图”。重要信息被锚定在任务图的特定节点,既可折叠收纳以节省空间,也能按需展开回溯细节。记忆从此不再是不可逆的模糊摘要,其保真度与可用性获得质的提升。
上下文卸载:实现分层存储与精准回溯
第二项核心技术是“上下文卸载”。在每次工具调用(如网页抓取、代码执行)结束后,产生的大量原始结果(如完整网页内容、日志、代码块)将不再持续占用上下文窗口。它们会被完整持久化存储至外部,而在上下文中仅保留一行精炼摘要和一个索引路径。
当Agent需要回顾细节时,可通过清晰的四层递进结构进行精准回溯:从高层级的轻量摘要(L2-L3),到结构化的JSONL记录(L1),最终可直达底层存储的完整原始证据(L0)。这种分层机制确保了任何压缩操作都是可追溯的,关键信息无一丢失。
实测数据:效率与准确率实现双重飞跃
理论优势需要数据支撑。在针对超长会话的专项评测中,将TencentDB Agent Memory作为插件接入OpenClaw框架后,效果极为显著:Token消耗最高降低61.38%,任务整体通过率相对提升51.52%。
更值得关注的是,在衡量Agent记忆用户长期偏好的PersonaMem指标上,准确率从基准的48%大幅跃升至76%,优化幅度接近60%。这直接印证了该方案在理解和持久化用户个性化需求方面的强大能力。
另一项关键发现是:单独使用“上下文卸载”技术,可实现约15%的Token节省;而当结合“Mermaid任务画布”共同使用时,节省率跃升至31%-33%。这充分证明,任务画布带来的结构化记忆能力,对消除上下文噪声、聚焦模型注意力具有独立且显著的贡献。
清晰四层架构与灵活部署选项
为支撑上述高级能力,TencentDB Agent Memory设计了清晰的四层递进式记忆架构:
- 底层(L0):完整保留所有原始对话与执行证据,确保百分之百可追溯性。
- 中间层(L1-L2):对原始信息进行逐步提炼,形成场景化归纳与原子记忆单元。
- 顶层(L3):抽象并生成持续演进的用户画像与长期偏好。
各层职责单一,通过提取、聚合、蒸馏的管道有序连接。这种模块化设计使得任一层次均可独立优化或替换,保证了系统良好的可演进性与维护性。
在部署层面,项目充分考虑了易用性与扩展性。默认采用本地SQLite作为存储后端,实现零外部API依赖,且所有中间产物均输出为人类可读的Markdown和Mermaid文件,极大降低了调试与审计门槛。对于有更高性能需求的场景,可无缝接入腾讯云向量数据库TCVDB,实现BM25与向量检索的混合查询,以提升复杂记忆的检索效率与准确度。系统同时支持跨Agent、跨框架、跨设备的记忆导入导出与实时迁移,为团队协作与记忆持久化提供了极大便利。
从内部实践到全面开源
事实上,TencentDB Agent Memory的长期记忆核心能力已于今年4月初在腾讯云内部上线并免费开放。彼时,在PersonaMem测试集上,已成功将OpenClaw的回答准确率从48%提升至76.10%。
此次于5月14日的正式开源,则重点聚焦于短期记忆的智能压缩与管理能力,旨在将腾讯云内部经过大规模实践验证的产品级解决方案,完整贡献给全球开发者社区。目前,项目在GitHub上已迅速获得超过1300个Star。开发者可通过OpenClaw插件或Hermes Gateway轻松一键接入,极简安装通常仅需一行命令即可完成,助力快速构建更高效、更经济的AI Agent应用。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
多伦多大学AI突破:模型学会自我反思与改进
2026年4月,一项来自多伦多大学计算机科学系与Coolwei AI Lab的联合研究,在arXiv预印本平台(论文编号:arXiv:2604 01591v2)上公布了一项突破性进展。这项研究提出了一种名为“ThinkTwice”的创新训练方法,其核心发现令人振奋:通过引导AI模型在给出答案后进行自
英特尔酷睿Ultra游戏本性能解析:AI加持下的全新体验
根据Gartner最新市场报告,2025年全球PC出货量突破2 7亿台,同比增长9 1%。在人工智能技术浪潮与AI PC算力升级需求的双重驱动下,整个PC行业正迈入一个全新的增长周期。作为细分市场的重要力量,游戏笔记本电脑也迎来了关乎性能、体验与场景定义的关键换代节点。 回顾行业发展,英特尔于202
OpenClaw Peekaboo v3发布:机器人视觉抓取技术实现一日三更
OpenClaw 生态中那个关键的“眼睛”和“手”——Peekaboo v3,正式回归了。这不仅是一次版本更新,更像是一次关键的“补完”。它让 AI 不再只是停留在聊天框里给出建议,而是真正获得了观察屏幕、点击按钮、操作真实桌面的能力。 过去几个月,OpenClaw 的热度经历了一个典型的周期:从概
豆包AI评论回复撰写方法与互动技巧教程
豆包AI能自动分析留言情绪与关键信息,生成多风格回复初稿。通过设定平台语境与人设,可使回复更真实生动。人工需校准业务细节与责任表述,确保准确。支持导入历史优质回复训练专属模型,提升匹配度。结合敏感词拦截与人工复核,保障回复安全合规。
GEO生成式引擎优化指南 AI时代SEO实战策略解析
GEO(生成式引擎优化)旨在让品牌信息被AI精准识别并稳定输出,核心是从追求“点击率”转向提升“被引用率”。它结合传统SEO与RAG逻辑,通过结构化数据、清晰语义层级和知识图谱增强内容可发现性与可信度,并将E-E-A-T原则转化为AI可验证的信号,确保核心信息以机器易读方式呈现。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

