当前位置: 首页
AI资讯
腾讯开源Agent记忆方案大幅降低Token消耗达61%

腾讯开源Agent记忆方案大幅降低Token消耗达61%

热心网友 时间:2026-05-20
转载

5月14日,腾讯云正式开源其核心AI智能体记忆管理技术——TencentDB Agent Memory。该方案精准解决了当前AI智能体(Agent)在执行长周期、多步骤任务时面临的关键瓶颈:记忆膨胀与Token成本失控。通过创新的“外存内精”架构,它能显著优化上下文使用效率,提升复杂任务的成功率与执行连贯性。

腾讯开源 Agent 记忆技术方案,Token 消耗最高降低 61%

随着AI智能体在代码生成、自动化研究、深度数据分析等领域的应用日益深化,任务流程变得冗长而复杂。每一次工具调用(如网页搜索、代码执行)都会产生海量的中间结果、日志和原始数据,迅速挤占有限且昂贵的模型上下文窗口。这不仅导致Token消耗激增、成本高涨,更可能因关键信息被挤出窗口而造成任务状态丢失或逻辑混乱,影响最终输出质量。

行业常见的应对方案,如单纯扩大上下文窗口或进行简单的文本摘要,在应对复杂的多轮交互与长链条任务时往往捉襟见肘。上下文信息过载、关键细节丢失等问题依然普遍存在,制约了智能体的实际应用效能。

腾讯云数据库团队开源的TencentDB Agent Memory,提供了一套系统性的解决方案。其核心理念是“外存内精”:将完整、冗长的原始数据卸载到外部存储中管理,而在执行上下文中仅保留任务的核心状态骨架与结构化关系图谱,从而在保证任务连续性的前提下,最大化压缩Token占用。

该方案主要依托两大核心技术模块实现高效记忆管理。

首先是“Mermaid任务画布”功能。这一模块将整个Agent的任务执行过程动态可视化为一个结构化的任务图谱,类似于智能体的“思维导图”或“项目路线图”。图中清晰定义了每个子任务步骤的状态、摘要以及步骤间的依赖关系。Agent仅需在上下文中维护这张轻量级的“任务地图”,即可时刻掌握整体进度、当前所处位置以及后续行动路径,确保了长任务执行的方向性与逻辑清晰度。

其次是“上下文卸载”机制。当Agent调用外部工具并获取到原始结果(如大段网页内容、代码日志)后,这些庞杂的细节信息不会持续占用宝贵的上下文空间。它们会被自动摘要并索引,随后完整内容被存储到外部文件系统中。上下文里仅保留精炼的摘要和快速检索键。只有当Agent在后续步骤中需要回溯特定细节时,才按需将相关部分精准加载回上下文。这相当于为Agent配备了一个智能的“外部记忆库”,有效释放了主工作内存的压力。

该方案的实际效果如何?腾讯云公布的基准测试数据提供了有力证明。启用TencentDB Agent Memory记忆优化方案后:

  • 在自动化网页搜索与信息整合场景中,Token消耗最高可降低61%,同时任务成功率相对提升52%;
  • 在自动化代码调试与修复场景中,Token消耗最高降低33%,任务完成率相对提升10%;
  • 在复杂长文档分析与总结场景中,Token消耗最高降低31%,关键信息分析准确率相对提升8%。

除了优化单次任务的短期记忆管理,该项目还集成了一个长期个性化记忆模块。该模块支持Agent在跨对话会话中持续学习并记忆用户的个性化偏好、历史背景与行为模式。在PersonaMem基准测试中,该模块将Agent对用户画像的理解准确率从48%显著提升至76%。据悉,此长期记忆能力此前已作为一项免费服务对外开放试用。

目前,TencentDB Agent Memory项目已在GitHub上全面开源,并兼容OpenClaw、Hermes等主流Agent开发框架。其对开发者极为友好,仅需一行安装命令即可快速集成,无需额外配置数据库或依赖外部服务。所有Agent的任务历史与记忆内容均以标准文件格式本地化存储,方便开发者直接查看、分析与调试,提供了极高的操作透明度和可控性。

值得注意的是,这是腾讯近期在AI智能体技术生态布局中的又一重要举措。就在上月,腾讯云刚刚开源了高性能Agent执行底座“Cube”,其在GitHub上迅速获得了超过5000颗星标。这一系列连贯动作清晰地表明,腾讯正在持续加大对AI智能体底层基础设施的研发投入与开源开放,旨在为构建更复杂、更可靠、更实用的下一代AI应用奠定坚实的技术基础。

来源:https://www.qbitai.com/2026/05/417753.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
蚂蚁百灵Ring-2.6-1T开源模型Agent执行能力全面升级

蚂蚁百灵Ring-2.6-1T开源模型Agent执行能力全面升级

蚂蚁百灵开源Ring-2 6-1T模型,核心为可调节的“按需思考”机制,提供high与xhigh两档推理强度。high模式高效处理多轮对话等任务,xhigh模式专攻数学竞赛等高难度挑战。模型采用异步强化学习与“棒冰算法”提升训练效率,战略聚焦于提升真实环境下的计算效率与实用性。

时间:2026-05-20 12:08
海信视像发布会无电视产品 揭示第二增长曲线战略

海信视像发布会无电视产品 揭示第二增长曲线战略

5月8日,海信召开无电视发布会,推出多款3C智能硬件,实现从单一电视向全场景智能生态的战略跃迁。依托显示技术与AI智造平台,海信以屏幕为感知入口,为用户提供全场景科技陪伴。战略转型推动公司从规模驱动转向价值驱动,净利润持续增长,第二增长曲线成效显著。

时间:2026-05-20 12:07
腾讯开源Agent记忆方案大幅降低Token消耗达61%

腾讯开源Agent记忆方案大幅降低Token消耗达61%

腾讯云开源TencentDBAgentMemory技术,针对AI智能体长任务记忆管理痛点,通过“外存内精”思路降低Token消耗。其核心包括动态结构化任务状态的“Mermaid任务画布”,以及将详细结果卸载至外部存储、仅保留摘要索引的“上下文卸载”功能。测试显示,该方案在网页搜索等场景中最高降低61%的Token消耗,并显著提升任务成功率与准确率。

时间:2026-05-20 12:07
AIGC2026峰会参会指南明日520正式发布

AIGC2026峰会参会指南明日520正式发布

中国AIGC产业峰会将于5月20日9:30开幕。议程聚焦智能体从概念到落地,探讨其演进与产业趋势;下午涉及模型开源、场景落地等多元议题。现场有20位嘉宾、主题圆桌及年度榜单。签到从8:30开始,备有早鸟礼品。适逢周三早高峰,建议提前规划出行。

时间:2026-05-20 12:07
Meta重组计划曝光 7000人转岗AI影响20%劳动力

Meta重组计划曝光 7000人转岗AI影响20%劳动力

Meta公司内部备忘录披露,将于5月20日启动全球裁员与组织重组计划,首轮影响约10%员工。公司推行扁平化管理,削减管理层,并计划将约7000名员工转岗至AI相关项目。结合裁员与转岗,此次重组涉及约20%劳动力,同时冻结6000个招聘岗位。此举标志着Meta正以AI原生原则重塑组织,加速向AI战略转型。

时间:2026-05-20 12:06
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程