当前位置: 首页
科技数码
港科团队破解AI助手记忆难题:手机应用获突破

港科团队破解AI助手记忆难题:手机应用获突破

热心网友 时间:2026-03-30
转载


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

当你拿起手机,想让AI助手帮你完成一项复杂的任务时,比如先在淘宝和京东上比较AirPods Pro 2的价格,然后把便宜的那款加入购物车,最后把链接分享给微信好友,你会发现现在的AI助手往往力不从心。它们可能在前几步表现不错,但随着任务步骤的增加,就开始"健忘"了——明明刚才查到了两个平台的价格,转眼就忘记了哪个更便宜。

这种现象引起了一个由香港科技大学(广州)、香港科技大学、西安交通大学、香港城市大学、悉尼科技大学等多所知名院校组成的国际研究团队的关注。他们在2026年3月发表的最新研究中,深入分析了这个问题的根本原因,并提出了一种名为"锚定状态记忆"(Anchored State Memory,简称ASM)的解决方案。这项研究成果发表在计算机视觉领域的顶级会议上,论文编号为arXiv:2603.18429v1。

想象一下人类是如何完成复杂任务的。当我们要完成上述比价购物任务时,大脑会自动记住几个关键节点:淘宝上的价格是多少,京东上的价格是多少,哪个更便宜。这些"关键信息点"就像锚一样,稳定地固定在我们的记忆中,帮助我们在后续步骤中做出正确决策。然而,现有的AI系统在处理长任务时,要么试图记住所有细节(就像把整个图书馆都搬进大脑),要么只保留粗略的总结(就像只记住"我去过图书馆"),都无法准确保存和使用这些关键信息。

为了彻底研究这个问题,研究团队首先构建了一个名为"AndroTMem-Bench"的测试平台。这个平台就像一个专门设计的"考场",包含了1069个需要多步骤完成的手机操作任务,平均每个任务需要32.1步操作,最多的甚至达到65步。这些任务都有一个共同特点:后面的步骤必须依赖前面步骤获得的信息才能正确完成。比如,只有先在两个购物平台都查到价格,才能决定把哪个商品加入购物车。

通过在这个测试平台上评估12个不同的AI系统,研究团队发现了一个令人惊讶的规律:无论是开源还是闭源的AI模型,无论是谷歌的Gemini还是OpenAI的GPT系列,它们的表现都随着任务长度的增加而急剧下降。更重要的是,这种下降主要不是因为AI看不懂屏幕内容或不知道该点击哪个按钮,而是因为它们无法有效地记住和使用之前获得的重要信息。

这就好比一个人患了特殊的健忘症:他能清楚地看到眼前的景象,也知道下一步该做什么,但就是记不住几分钟前发生的关键事情。研究团队通过详细分析发现,现有AI系统在长任务中主要面临四种"记忆障碍":一是重要信息丢失,比如忘记了之前查到的价格;二是信息混乱,比如把淘宝的价格错误地关联到了京东的商品上;三是上下文漂移,比如忘记了当前正在进行什么任务;四是进度验证失败,比如不确定某个步骤是否已经成功完成。

基于这些发现,研究团队提出了"锚定状态记忆"这一创新解决方案。这种方法的核心思想是让AI系统像人类一样,只记住任务中的关键节点信息,而不是试图记住每一个细节。这些"锚点"包括六种类型:子目标完成(比如"已在淘宝查到价格"),状态转换(比如"进入了支付页面"),依赖关系(比如"这个价格将用于后续比较"),异常处理(比如"关闭了弹出广告"),上下文信息(比如"用户选择的联系人是Alice"),以及任务完成(比如"商品链接已发送")。

更巧妙的是,这套系统还会建立这些锚点之间的因果关系。就像在大脑中用看不见的线把相关记忆连接起来一样,当AI需要做决策时,它可以快速找到相关的历史信息,而不必翻遍整个"记忆库"。

实验结果令人鼓舞。在各种测试场景中,使用锚定状态记忆的AI系统比传统方法的成功率提高了5%到30%不等。特别是在那些需要跨应用协作的复杂任务中,改进效果更加明显。这就像给一个健忘的助手配备了一个智能笔记本,不仅记录关键信息,还能在需要时快速翻到正确的页面。

这项研究的意义远不止于技术改进。随着我们越来越依赖AI助手来处理日常事务,从简单的查询到复杂的多步骤操作,这种"记忆力"的提升将直接影响用户体验。试想,未来你可以对手机说:"帮我订一张下周末去上海的高铁票,选择下午2点后的班次,如果没有座位就改订飞机票,然后把行程分享给我的家人。"而AI助手真的能一步步完成,而不是在中途"断片"。

当然,这项技术目前还处于研究阶段,距离大规模应用还有一段距离。研究团队也坦诚地指出了当前方法的局限性:比如它主要针对单次任务设计,还无法处理跨越数天的长期任务,也没有充分考虑应用界面变化或内容更新对任务执行的影响。但是,这项工作为AI系统的"记忆机制"研究开辟了新的方向,为我们提供了一个理解和改进AI长期任务执行能力的新视角。

从更广阔的角度来看,这项研究触及了人工智能发展的一个核心问题:如何让机器具备类似人类的认知能力。记忆不仅仅是信息存储,更是智能行为的基础。当AI系统能够像人类一样选择性地记住关键信息,并在需要时灵活调用,它们就向真正的智能助手又迈进了一大步。正如研究团队所说,他们希望这项工作能够为构建可靠、可扩展的长期AI助手奠定基础,让人工智能真正成为我们日常生活中不可或缺的智能伙伴。

Q&A

Q1:什么是锚定状态记忆技术?

A:锚定状态记忆是香港科技大学团队提出的一种AI记忆机制,它让AI系统像人类一样只记住任务中的关键节点信息,比如查到的价格、完成的步骤等重要状态,而不是试图记住所有细节。这些关键信息像锚一样固定在记忆中,并建立相互关联,帮助AI在长任务中做出正确决策。

Q2:现在的AI手机助手为什么完成不了复杂任务?

A:主要问题是记忆障碍。当任务步骤超过20-30步时,AI会出现四种典型问题:重要信息丢失、信息关联错误、忘记当前任务目标、无法确认步骤是否完成。这就像患了健忘症,能看懂当前屏幕但记不住之前的关键信息,导致后续决策出错。

Q3:锚定状态记忆技术什么时候能用到我们的手机上?

A:目前这项技术还处于研究阶段,距离商用还需要时间。研究团队目前主要验证了技术可行性,提升了AI长任务成功率5%-30%,但要真正应用到日常手机助手中,还需要解决跨天任务、应用界面变化等实际问题。预计未来几年内会有相关应用出现。

来源:https://www.163.com/dy/article/KP9LVKMU0511DTVV.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
聚焦AI文创与跨境,“数智苏豪”新街口OPC社区启幕

聚焦AI文创与跨境,“数智苏豪”新街口OPC社区启幕

3月30日,南京新街口核心商圈,苏豪大厦一楼广场上机器人迎宾起舞,充满科技感。由苏豪资产运营集团与南京新街口金融商务区管理委员会(以下简称“新街口管委会”)共同打造的“数智苏豪”新街口OPC社区揭牌

时间:2026-03-30 22:55
极兔牵手顺丰真相:合作细节与市场影响深度解析

极兔牵手顺丰真相:合作细节与市场影响深度解析

今年1月中旬,物流圈上演了备受瞩目的一幕:当国内快递行业因增速放缓而步入存量整合期时,主导中高端市场的老牌物流服务商顺丰控股,与主打电商件的极兔速递联合宣布达成了一项投资交易金额达83亿港元的相互持

时间:2026-03-30 22:55
力箭二号遥一运载火箭成功发射空间试验飞船

力箭二号遥一运载火箭成功发射空间试验飞船

记者从公司获悉,3月30日19时00分,中科宇航力箭二号遥一运载火箭·国际纺都号在东风商业航天创新试验区成功发射,将新征程01卫星、新征程02卫星和天视卫星01星精准送入预定轨道,发射任务取得圆满成

时间:2026-03-30 22:55
1.9亿年薪背后:又一位车企CEO薪酬为何大幅上涨?

1.9亿年薪背后:又一位车企CEO薪酬为何大幅上涨?

电 动 知 家消 息,近日,据外媒报道,据福特汽车日前发布的一份文件,该公司首席执行 官吉姆·法利2025年的总薪酬大幅增长了11%,达到约2752万美元(约1 9亿元人民币),这是其自2020年末

时间:2026-03-30 22:55
美议员为何急于拉黑中国机器人却暗留后门?

美议员为何急于拉黑中国机器人却暗留后门?

白宫里,一台人形机器人缓步走入东厅,与美国“第一夫人”并肩亮相,动作仍带着明显的机械感;仅仅一天后,国会山上,这种“会走路的机器”却被划为潜在安全威胁,写进立法提案。这是上周美国上演的荒诞一幕。两党

时间:2026-03-30 22:55
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程