香港科技大学AI助手突破记忆瓶颈实现类人记忆功能
当你让手机AI助手处理一个稍复杂的任务,比如“先在淘宝和京东比比AirPods Pro 2的价格,把便宜的那款加购物车,再把链接分享给微信好友”,结果常常令人沮丧。助手可能在第一步查价时表现尚可,但几步之后,它似乎就“忘了”之前看到的信息——明明刚对比过两个平台的价格,转眼就不知道哪个更便宜了。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

这个普遍存在的痛点,引起了一个国际研究团队的注意。该团队由香港科技大学(广州)、香港科技大学、西安交通大学、香港城市大学、悉尼科技大学等多所院校的研究人员组成。他们在2026年3月发表的最新研究中,深入剖析了这一问题的根源,并提出了一种名为“锚定状态记忆”(Anchored State Memory, ASM)的创新解决方案。这项研究已发表在计算机视觉领域的顶级会议上,论文编号为arXiv:2603.18429v1。
不妨想想人类是如何完成这类多步骤任务的。我们的大脑会自动筛选并记住关键信息点:淘宝价、京东价、哪个更低。这些信息如同记忆中的“锚点”,稳固可靠,为后续决策提供依据。反观现有的AI系统,它们在处理长任务时往往陷入两个极端:要么试图事无巨细地记住一切(导致信息过载),要么只保留一个模糊的概要(丢失关键细节)。这两种方式都无法有效支撑复杂的序列决策。
为了系统性地探究这个问题,研究团队首先构建了一个名为“AndroTMem-Bench”的测试基准。这个基准就像一个精心设计的“考场”,包含了1069个需要多步骤操作的手机任务,平均每个任务长达32.1步,最复杂的甚至需要65步。这些任务的核心设计在于,后续步骤的执行严重依赖于前序步骤所获取的信息——例如,必须先完成比价,才能决定将哪个商品加入购物车。
在这个基准上对12个不同的AI系统(包括开源和闭源模型,如谷歌的Gemini和OpenAI的GPT系列)进行评估后,一个清晰的规律浮现出来:所有模型的性能都随着任务步数的增加而显著下滑。关键的是,这种下滑主要并非源于模型“看不懂”当前屏幕或“不知道”该点哪里,而是因为它们无法有效地记住和调用之前步骤中获得的关键信息。
这就像一种特殊的认知障碍:患者能清晰感知当下环境,也知道眼前该做什么动作,却唯独记不住几分钟前发生的、对当前决策至关重要的事情。通过细致分析,研究团队将现有AI在长任务中的缺陷归纳为四种典型的“记忆障碍”:重要信息丢失(如前序步骤查到的价格被遗忘)、信息关联混乱(如将A平台的价格错误地关联到B平台的商品)、上下文漂移(如忘记整个任务流当前所处的阶段),以及进度验证失败(如无法确认某个前置步骤是否已成功执行)。
针对这些痛点,“锚定状态记忆”方案应运而生。其核心思想是让AI模仿人类的记忆模式,即选择性记忆任务流中的关键状态节点,而非全部细节。研究团队定义了六类需要被“锚定”的关键状态:子目标完成(如“已在淘宝查询到价格”)、状态转换(如“已进入支付页面”)、依赖关系(如“此价格将用于后续比较”)、异常处理(如“已关闭弹出广告”)、上下文信息(如“用户指定的联系人是Alice”),以及任务完成(如“商品链接已发送”)。
更为巧妙的是,该系统会主动建立这些锚点状态之间的因果关联网络。这就好比在记忆仓库中为相关的信息点贴上标签并连上线,当AI需要回溯信息以做出决策时,它能迅速定位并提取出相关的历史状态,而无需在庞杂的记忆库中进行低效的全盘搜索。
实验结果表明,这一方法是有效的。在各种测试场景下,采用锚定状态记忆机制的AI系统,其任务成功率比传统方法提升了5%到30%。尤其是在那些需要跨应用协作的复杂任务中,性能提升更为显著。可以说,这相当于给一位容易“断片”的助手配备了一个智能便签本,不仅能记录要点,还能在需要时瞬间找到关联记录。
这项研究的价值超越了单纯的技术指标提升。随着人们对AI助手的依赖日益加深,期望其处理的任务从简单查询扩展到冗长的多步骤操作,这种“记忆能力”的强弱将直接决定用户体验的上限。试想未来,你可以自然地对手机说:“帮我订一张下周末下午2点后去上海的高铁票,如果没票就改查航班,并把最终行程分享给家人。”而AI助手能够稳健地、一步不差地执行到底,中途不再“迷路”或“遗忘”。
当然,这项技术目前仍处于研究阶段,走向大规模商用还需时日。研究团队也客观指出了当前方案的局限:例如,它主要针对单次会话内的任务设计,尚未解决跨越数天或更长时间的任务连续性难题;同时,对于应用界面动态变化或内容实时更新等复杂情况,其鲁棒性也有待进一步验证。尽管如此,这项工作无疑为AI系统的“记忆机制”研究开辟了一个富有前景的新方向,为我们理解和增强AI在长程任务中的执行能力提供了全新的理论框架与实践工具。
从更宏观的视角看,这项研究触及了人工智能发展的一个核心命题:如何让机器具备更接近人类的认知能力。记忆远不止是信息的静态存储,更是智能行为得以涌现和持续的基础。当AI系统学会像人类一样,有选择地记住关键信息,并在恰当的时机灵活调用,它们就在成为真正智能助手的道路上,迈出了坚实的一步。正如研究团队所展望的,他们希望这项工作能为构建可靠、可扩展的长期AI助手奠定基石,让人工智能真正成为我们日常生活中无缝融合、值得信赖的伙伴。
Q&A
Q1:什么是锚定状态记忆技术?
A:锚定状态记忆是由香港科技大学团队提出的一种新型AI记忆机制。它旨在让AI系统模拟人类的记忆模式,在执行长任务时,只主动记住那些关键的状态节点信息(例如查询到的价格、已完成的子目标等),而非尝试记忆全部交互细节。这些关键信息像锚一样被固定在记忆系统中,并通过因果关系相互关联,从而帮助AI在复杂的多步骤决策中保持连贯性和准确性。
Q2:现在的AI手机助手为什么完成不了复杂任务?
A:核心瓶颈在于“记忆障碍”。当任务步骤超过20-30步时,现有AI系统普遍会出现四种典型问题:重要信息丢失(忘记前序结果)、信息关联错误(混淆不同步骤的上下文)、任务目标遗忘(不知道当前步骤的目的),以及进度确认困难(无法判断前置步骤是否成功)。这类似于一种“情境性健忘”,AI能解析当前屏幕,却难以维持对任务历史关键信息的连贯记忆,导致后续决策失去依据。
Q3:锚定状态记忆技术什么时候能用到我们的手机上?
A:目前该技术尚处于学术研究阶段,距离集成到商用手机助手中还需经过进一步的工程化开发和验证。研究团队目前主要完成了技术原理的可行性论证,在实验室环境下将AI长任务成功率提升了5%-30%。但要应对真实世界的复杂场景(如跨天任务、应用界面频繁更新等),仍需解决一系列实际问题。预计相关技术的初步应用可能会在未来几年内逐步出现。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
慕尼黑工业大学AI医疗新突破 放射科诊断精准度媲美专业医生
在传统的医学诊断中,放射科医生的工作方式更像一位侦探——他们并非仅仅审视一张孤立的X光片或CT图像就得出结论,而是需要仔细翻阅整套医学影像资料,在不同的切片间寻找关联线索,调整显示参数以优化观察效果,有时还需借助专业工具进行测量与分析,最终才能形成准确的诊断。然而,当前大多数医疗人工智能系统,却如同
大阪大学首创动物声音图像文字三模态智能识别系统
大自然中的每一种动物都拥有独特的“生物身份证”——绚丽的羽毛、特殊的鸣叫、标志性的行为,这些都是它们用于识别与交流的“自然语言”。长期以来,科学家们如同在破译一部无字天书,致力于解读这些多样“语言”背后的深层联系。如今,一项突破性的研究取得了重大进展。由大阪大学、东京大学、科学技术东京研究院及OMR
MIT团队革新AI诊断模式 语言模型可生成多套医疗方案
麻省理工学院(MIT)的一项最新研究,为人工智能的“答题模式”带来了碘伏性的改变。这项发表于2026年机器学习顶级会议(论文编号:arXiv:2603 24844v1)的工作,旨在让语言模型不再像死记硬背的考生,而是更像一位经验丰富的医生——能够给出包含多种可能性的“鉴别诊断”。 想想看,当你向医生
微软亚洲研究院MSA技术突破AI记忆瓶颈实现人类级别终生记忆
人工智能通常以博学多才的形象示人,能够解答疑问、辅助写作与翻译。然而,当前主流AI模型普遍存在一个关键局限——其“记忆”能力实际上非常短暂。这类似于一个只能记住最近几页内容的学生,当面对一整部厚重的百科全书时,往往只能捕捉开头或结尾的片段,而中间的大量核心信息很可能已被“遗忘”。 这一被称为“上下文
清华大学6Bit-Diffusion技术实现视频生成AI模型3倍压缩与速度翻倍
2026年3月,一项由清华大学TSAIL实验室联合复旦大学、上海交通大学共同完成的重磅研究,在预印本平台arXiv上正式发布(论文编号:arXiv:2603 18742v1)。这项研究精准地瞄准了当前AI视频生成技术普及的核心瓶颈——模型体积庞大、生成速度缓慢,并创新性地提出了名为“6Bit-Dif
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

