香港科技大学AI助手突破记忆瓶颈实现类人记忆功能

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

香港科技大学AI助手突破记忆瓶颈实现类人记忆功能

热心网友时间：2026-05-14

转载

当你让手机AI助手处理一个稍复杂的任务，比如“先在淘宝和京东比比AirPods Pro 2的价格，把便宜的那款加购物车，再把链接分享给微信好友”，结果常常令人沮丧。助手可能在第一步查价时表现尚可，但几步之后，它似乎就“忘了”之前看到的信息——明明刚对比过两个平台的价格，转眼就不知道哪个更便宜了。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

香港科技大学团队破解AI手机助手的

这个普遍存在的痛点，引起了一个国际研究团队的注意。该团队由香港科技大学（广州）、香港科技大学、西安交通大学、香港城市大学、悉尼科技大学等多所院校的研究人员组成。他们在2026年3月发表的最新研究中，深入剖析了这一问题的根源，并提出了一种名为“锚定状态记忆”（Anchored State Memory, ASM）的创新解决方案。这项研究已发表在计算机视觉领域的顶级会议上，论文编号为arXiv:2603.18429v1。

不妨想想人类是如何完成这类多步骤任务的。我们的大脑会自动筛选并记住关键信息点：淘宝价、京东价、哪个更低。这些信息如同记忆中的“锚点”，稳固可靠，为后续决策提供依据。反观现有的AI系统，它们在处理长任务时往往陷入两个极端：要么试图事无巨细地记住一切（导致信息过载），要么只保留一个模糊的概要（丢失关键细节）。这两种方式都无法有效支撑复杂的序列决策。

为了系统性地探究这个问题，研究团队首先构建了一个名为“AndroTMem-Bench”的测试基准。这个基准就像一个精心设计的“考场”，包含了1069个需要多步骤操作的手机任务，平均每个任务长达32.1步，最复杂的甚至需要65步。这些任务的核心设计在于，后续步骤的执行严重依赖于前序步骤所获取的信息——例如，必须先完成比价，才能决定将哪个商品加入购物车。

在这个基准上对12个不同的AI系统（包括开源和闭源模型，如谷歌的Gemini和OpenAI的GPT系列）进行评估后，一个清晰的规律浮现出来：所有模型的性能都随着任务步数的增加而显著下滑。关键的是，这种下滑主要并非源于模型“看不懂”当前屏幕或“不知道”该点哪里，而是因为它们无法有效地记住和调用之前步骤中获得的关键信息。

这就像一种特殊的认知障碍：患者能清晰感知当下环境，也知道眼前该做什么动作，却唯独记不住几分钟前发生的、对当前决策至关重要的事情。通过细致分析，研究团队将现有AI在长任务中的缺陷归纳为四种典型的“记忆障碍”：重要信息丢失（如前序步骤查到的价格被遗忘）、信息关联混乱（如将A平台的价格错误地关联到B平台的商品）、上下文漂移（如忘记整个任务流当前所处的阶段），以及进度验证失败（如无法确认某个前置步骤是否已成功执行）。

针对这些痛点，“锚定状态记忆”方案应运而生。其核心思想是让AI模仿人类的记忆模式，即选择性记忆任务流中的关键状态节点，而非全部细节。研究团队定义了六类需要被“锚定”的关键状态：子目标完成（如“已在淘宝查询到价格”）、状态转换（如“已进入支付页面”）、依赖关系（如“此价格将用于后续比较”）、异常处理（如“已关闭弹出广告”）、上下文信息（如“用户指定的联系人是Alice”），以及任务完成（如“商品链接已发送”）。

更为巧妙的是，该系统会主动建立这些锚点状态之间的因果关联网络。这就好比在记忆仓库中为相关的信息点贴上标签并连上线，当AI需要回溯信息以做出决策时，它能迅速定位并提取出相关的历史状态，而无需在庞杂的记忆库中进行低效的全盘搜索。

实验结果表明，这一方法是有效的。在各种测试场景下，采用锚定状态记忆机制的AI系统，其任务成功率比传统方法提升了5%到30%。尤其是在那些需要跨应用协作的复杂任务中，性能提升更为显著。可以说，这相当于给一位容易“断片”的助手配备了一个智能便签本，不仅能记录要点，还能在需要时瞬间找到关联记录。

这项研究的价值超越了单纯的技术指标提升。随着人们对AI助手的依赖日益加深，期望其处理的任务从简单查询扩展到冗长的多步骤操作，这种“记忆能力”的强弱将直接决定用户体验的上限。试想未来，你可以自然地对手机说：“帮我订一张下周末下午2点后去上海的高铁票，如果没票就改查航班，并把最终行程分享给家人。”而AI助手能够稳健地、一步不差地执行到底，中途不再“迷路”或“遗忘”。

当然，这项技术目前仍处于研究阶段，走向大规模商用还需时日。研究团队也客观指出了当前方案的局限：例如，它主要针对单次会话内的任务设计，尚未解决跨越数天或更长时间的任务连续性难题；同时，对于应用界面动态变化或内容实时更新等复杂情况，其鲁棒性也有待进一步验证。尽管如此，这项工作无疑为AI系统的“记忆机制”研究开辟了一个富有前景的新方向，为我们理解和增强AI在长程任务中的执行能力提供了全新的理论框架与实践工具。

从更宏观的视角看，这项研究触及了人工智能发展的一个核心命题：如何让机器具备更接近人类的认知能力。记忆远不止是信息的静态存储，更是智能行为得以涌现和持续的基础。当AI系统学会像人类一样，有选择地记住关键信息，并在恰当的时机灵活调用，它们就在成为真正智能助手的道路上，迈出了坚实的一步。正如研究团队所展望的，他们希望这项工作能为构建可靠、可扩展的长期AI助手奠定基石，让人工智能真正成为我们日常生活中无缝融合、值得信赖的伙伴。

Q&A

Q1：什么是锚定状态记忆技术？

A：锚定状态记忆是由香港科技大学团队提出的一种新型AI记忆机制。它旨在让AI系统模拟人类的记忆模式，在执行长任务时，只主动记住那些关键的状态节点信息（例如查询到的价格、已完成的子目标等），而非尝试记忆全部交互细节。这些关键信息像锚一样被固定在记忆系统中，并通过因果关系相互关联，从而帮助AI在复杂的多步骤决策中保持连贯性和准确性。

Q2：现在的AI手机助手为什么完成不了复杂任务？

A：核心瓶颈在于“记忆障碍”。当任务步骤超过20-30步时，现有AI系统普遍会出现四种典型问题：重要信息丢失（忘记前序结果）、信息关联错误（混淆不同步骤的上下文）、任务目标遗忘（不知道当前步骤的目的），以及进度确认困难（无法判断前置步骤是否成功）。这类似于一种“情境性健忘”，AI能解析当前屏幕，却难以维持对任务历史关键信息的连贯记忆，导致后续决策失去依据。

Q3：锚定状态记忆技术什么时候能用到我们的手机上？

A：目前该技术尚处于学术研究阶段，距离集成到商用手机助手中还需经过进一步的工程化开发和验证。研究团队目前主要完成了技术原理的可行性论证，在实验室环境下将AI长任务成功率提升了5%-30%。但要应对真实世界的复杂场景（如跨天任务、应用界面频繁更新等），仍需解决一系列实际问题。预计相关技术的初步应用可能会在未来几年内逐步出现。

来源:https://www.techwalker.com/2026/0330/3182677.shtml

上一篇：新加坡南洋理工大学AI新技术：单张照片解构物体并驱动运动

下一篇：阿里云HopChain框架实现AI分步推理精准解读复杂图像