腾讯开源Agent记忆方案大幅降低Token消耗达61%
5月14日,腾讯云正式开源其核心AI智能体记忆管理技术——TencentDB Agent Memory。该方案精准解决了当前AI智能体(Agent)在执行长周期、多步骤任务时面临的关键瓶颈:记忆膨胀与Token成本失控。通过创新的“外存内精”架构,它能显著优化上下文使用效率,提升复杂任务的成功率与执行连贯性。

随着AI智能体在代码生成、自动化研究、深度数据分析等领域的应用日益深化,任务流程变得冗长而复杂。每一次工具调用(如网页搜索、代码执行)都会产生海量的中间结果、日志和原始数据,迅速挤占有限且昂贵的模型上下文窗口。这不仅导致Token消耗激增、成本高涨,更可能因关键信息被挤出窗口而造成任务状态丢失或逻辑混乱,影响最终输出质量。
行业常见的应对方案,如单纯扩大上下文窗口或进行简单的文本摘要,在应对复杂的多轮交互与长链条任务时往往捉襟见肘。上下文信息过载、关键细节丢失等问题依然普遍存在,制约了智能体的实际应用效能。
腾讯云数据库团队开源的TencentDB Agent Memory,提供了一套系统性的解决方案。其核心理念是“外存内精”:将完整、冗长的原始数据卸载到外部存储中管理,而在执行上下文中仅保留任务的核心状态骨架与结构化关系图谱,从而在保证任务连续性的前提下,最大化压缩Token占用。
该方案主要依托两大核心技术模块实现高效记忆管理。
首先是“Mermaid任务画布”功能。这一模块将整个Agent的任务执行过程动态可视化为一个结构化的任务图谱,类似于智能体的“思维导图”或“项目路线图”。图中清晰定义了每个子任务步骤的状态、摘要以及步骤间的依赖关系。Agent仅需在上下文中维护这张轻量级的“任务地图”,即可时刻掌握整体进度、当前所处位置以及后续行动路径,确保了长任务执行的方向性与逻辑清晰度。
其次是“上下文卸载”机制。当Agent调用外部工具并获取到原始结果(如大段网页内容、代码日志)后,这些庞杂的细节信息不会持续占用宝贵的上下文空间。它们会被自动摘要并索引,随后完整内容被存储到外部文件系统中。上下文里仅保留精炼的摘要和快速检索键。只有当Agent在后续步骤中需要回溯特定细节时,才按需将相关部分精准加载回上下文。这相当于为Agent配备了一个智能的“外部记忆库”,有效释放了主工作内存的压力。
该方案的实际效果如何?腾讯云公布的基准测试数据提供了有力证明。启用TencentDB Agent Memory记忆优化方案后:
- 在自动化网页搜索与信息整合场景中,Token消耗最高可降低61%,同时任务成功率相对提升52%;
- 在自动化代码调试与修复场景中,Token消耗最高降低33%,任务完成率相对提升10%;
- 在复杂长文档分析与总结场景中,Token消耗最高降低31%,关键信息分析准确率相对提升8%。
除了优化单次任务的短期记忆管理,该项目还集成了一个长期个性化记忆模块。该模块支持Agent在跨对话会话中持续学习并记忆用户的个性化偏好、历史背景与行为模式。在PersonaMem基准测试中,该模块将Agent对用户画像的理解准确率从48%显著提升至76%。据悉,此长期记忆能力此前已作为一项免费服务对外开放试用。
目前,TencentDB Agent Memory项目已在GitHub上全面开源,并兼容OpenClaw、Hermes等主流Agent开发框架。其对开发者极为友好,仅需一行安装命令即可快速集成,无需额外配置数据库或依赖外部服务。所有Agent的任务历史与记忆内容均以标准文件格式本地化存储,方便开发者直接查看、分析与调试,提供了极高的操作透明度和可控性。
值得注意的是,这是腾讯近期在AI智能体技术生态布局中的又一重要举措。就在上月,腾讯云刚刚开源了高性能Agent执行底座“Cube”,其在GitHub上迅速获得了超过5000颗星标。这一系列连贯动作清晰地表明,腾讯正在持续加大对AI智能体底层基础设施的研发投入与开源开放,旨在为构建更复杂、更可靠、更实用的下一代AI应用奠定坚实的技术基础。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
蚂蚁百灵Ring-2.6-1T开源模型Agent执行能力全面升级
蚂蚁百灵开源Ring-2 6-1T模型,核心为可调节的“按需思考”机制,提供high与xhigh两档推理强度。high模式高效处理多轮对话等任务,xhigh模式专攻数学竞赛等高难度挑战。模型采用异步强化学习与“棒冰算法”提升训练效率,战略聚焦于提升真实环境下的计算效率与实用性。
海信视像发布会无电视产品 揭示第二增长曲线战略
5月8日,海信召开无电视发布会,推出多款3C智能硬件,实现从单一电视向全场景智能生态的战略跃迁。依托显示技术与AI智造平台,海信以屏幕为感知入口,为用户提供全场景科技陪伴。战略转型推动公司从规模驱动转向价值驱动,净利润持续增长,第二增长曲线成效显著。
腾讯开源Agent记忆方案大幅降低Token消耗达61%
腾讯云开源TencentDBAgentMemory技术,针对AI智能体长任务记忆管理痛点,通过“外存内精”思路降低Token消耗。其核心包括动态结构化任务状态的“Mermaid任务画布”,以及将详细结果卸载至外部存储、仅保留摘要索引的“上下文卸载”功能。测试显示,该方案在网页搜索等场景中最高降低61%的Token消耗,并显著提升任务成功率与准确率。
AIGC2026峰会参会指南明日520正式发布
中国AIGC产业峰会将于5月20日9:30开幕。议程聚焦智能体从概念到落地,探讨其演进与产业趋势;下午涉及模型开源、场景落地等多元议题。现场有20位嘉宾、主题圆桌及年度榜单。签到从8:30开始,备有早鸟礼品。适逢周三早高峰,建议提前规划出行。
Meta重组计划曝光 7000人转岗AI影响20%劳动力
Meta公司内部备忘录披露,将于5月20日启动全球裁员与组织重组计划,首轮影响约10%员工。公司推行扁平化管理,削减管理层,并计划将约7000名员工转岗至AI相关项目。结合裁员与转岗,此次重组涉及约20%劳动力,同时冻结6000个招聘岗位。此举标志着Meta正以AI原生原则重塑组织,加速向AI战略转型。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

