AI助手忙碌时是否需要告知用户宝马与慕尼黑大学最新研究

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI助手忙碌时是否需要告知用户宝马与慕尼黑大学最新研究

热心网友时间：2026-05-12

转载

当您在车内对智能助手发出指令：“导航到张经理发来的地址，如果电量低于10%请规划一个快充站”，随后它开始执行任务。此时，您更倾向于它全程静默处理直至给出最终方案，还是希望它能阶段性地汇报进展？这个看似细微的交互选择，实则深刻影响着用户体验、信任构建与认知负担，是一个值得深入探讨的人机交互设计课题。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

当AI助手忙碌时，它需要告诉我们在干什么吗？宝马与慕尼黑大学等机构的最新发现

当前，人工智能助手的能力日益强大，已能自主处理包含多个子步骤的复杂任务，而非仅限于简单的问答。例如，完成一次出行规划，可能涉及查找联系人、解析地址、检查车辆续航、搜索充电设施、规划最优路径等一系列操作，整个过程可能持续数十秒。那么，在这段等待时间内，助手应当保持沉默，还是主动提供过程反馈？

这一问题在驾驶场景下尤为关键。驾驶员注意力资源有限，额外的信息提示可能造成分心。然而，完全的静默又可能让用户产生不确定性，怀疑系统是否仍在运行，从而损害信任感。这好比餐厅后厨：厨师是应该不断向客人通报“正在备菜”、“正在调味”的进度，还是应该专注烹饪，最终直接呈现完美菜品？

为了探寻最佳答案，宝马集团研究与技术部门、慕尼黑大学及奥格斯堡大学的研究人员联合进行了一项严谨的实验。该研究发表于2026年2月（论文编号：arXiv:2602.15569v1）。团队搭建了一个模拟驾驶座舱，参与者在此环境中完成测试。实验环境整合了语音交互界面（通过扬声器提供听觉反馈）、图形用户界面（位于中控位置的平板电脑）以及一项车道保持模拟驾驶任务（显示于前方2.7米处的屏幕上）。

实验模拟了两种情境：车辆静止的单任务场景，以及需要同时进行车道保持的双任务驾驶场景。尽管车辆物理静止，但参与者需通过鼠标持续修正模拟的车辆横向偏移，这精准复现了真实驾驶中对注意力分散的核心要求。

研究基于一个功能完备的车载语音助手原型展开，该系统能够处理复杂的多步骤指令。实验中，每个任务指令都显示在屏幕上供参与者朗读，系统会实时转录并显示文本，确保指令被准确识别，为后续对比不同反馈策略的效果奠定了可靠基础。

两种核心反馈策略的深度对比

研究团队设定了两种核心反馈策略进行对比。第一种是“无过程反馈”策略，如同一位沉默的助手。用户发出指令后，系统仅以一声提示音响应，并在屏幕上显示“正在规划中...”，随后进入静默处理状态，直至所有步骤完成，才一次性给出完整的最终结果。这反映了当前许多AI系统的典型工作模式。

第二种是“过程与结果反馈”策略，如同一位沟通顺畅的助手。它不仅提供最终总结，还会在处理过程中给出信息丰富的实时更新。例如：“已在您的联系人中找到张经理”、“检测到电池电量将低于10%，正在为您寻找可用快充站”。这些更新通过听觉和视觉双通道同步呈现。

为确保公平比较，研究设置了不同复杂度的任务：中等复杂度任务包含3个步骤，耗时约26秒；高复杂度任务包含6个步骤，耗时约45秒。对于有过程反馈的策略，更新以固定的5秒间隔呈现。该间隔基于真实原型测试的平均值设定，且低于用户注意力维持的10秒上限，旨在平衡信息量与潜在干扰。

任务设计高度模拟现实需求。例如，“请导航至张经理发来的地址，选择最快路线，若电量低于10%则安排快充站”这样一个指令，就涵盖了搜索联系人、提取地址、检查电池状态、搜索充电站、规划含充电点的路线等多个子步骤。为避免参与者因记忆任务而产生偏差，研究在八个任务中交替使用了“最快/最短”路线、“麦当劳/面包店”、“20%/10%”电量阈值等可互换属性，在保持任务逻辑一致性的同时增加了变化性。

衡量用户体验的四个核心维度

为全面评估不同反馈策略的影响，研究团队从四个关键维度进行了精细化测量，如同通过多棱镜观察用户体验的全貌。

感知速度：直接反映用户对系统响应快慢的主观感受。采用7点量表（从“非常慢”到“非常快”）在每个任务结束后立即评分。这好比询问顾客对等餐时长的感受，客观耗时相同，主观体验却可能迥异。

任务负荷：采用NASA任务负荷指数中的三个核心子项——心智需求（所需的思考与决策程度）、时间压力（是否感到仓促）和挫败感（情绪状态）。这三者共同衡量了用户在任务执行过程中的综合压力水平。

用户体验：选取用户体验问卷的三个核心方面：吸引力（整体印象与好感度）、可依赖性（感知到的控制感与可预测性）以及风险处理能力（识别与应对潜在风险的能力）。这类似于综合评价一款产品时，会同时考量其美观度、可靠性与安全性。

用户信任：使用了针对人工智能的简化信任量表，涵盖对系统的信心、可靠性认知及整体信任度。信任是人机协作的基石，决定了用户是否愿意长期依赖该系统。信任度测量安排在参与者体验完某一种策略的所有任务之后进行，以便获取对系统的整体性评估。

测量时机经过精心设计：感知速度在每个任务后即时测量；用户体验和任务负荷每完成两个任务后测量一次；信任度则在每种策略体验完毕后统一测量。这种设计既保证了数据采集的敏感性，又有效避免了因频繁填写问卷导致的疲劳效应。

揭示真相：出人意料的实验结果

研究结果非常显著，其中部分发现甚至与预期相反。最核心的结论是：提供过程反馈的策略，在全部四个测量维度上均显著优于仅提供最终结果的策略。

最突出的改善体现在感知速度上。当系统提供过程更新时，用户感觉响应速度明显更快，且效应量巨大。值得注意的是，两种策略下的实际任务完成时间完全一致，但用户的主观感受却截然不同。这如同两位厨师同时烹饪，一位不断通报进展，另一位沉默至最后上菜，尽管耗时相同，等待的客人会觉得前者效率更高。

更令人惊讶的是任务负荷的变化。原本预计过程反馈会增加用户的认知负担，因为需要处理更多信息点。但结果恰恰相反：提供过程反馈反而降低了整体任务负荷，尤其是在挫败感方面。用户反馈，了解系统正在做什么让他们感到更安心、压力更小。这可以用“信息焦虑”理论解释：不确定性本身就会产生心理压力。

用户体验的改善是全方位的。过程反馈策略在吸引力、可依赖性和风险处理能力三个子维度上均有显著提升，其中风险处理能力的改善最为明显。这表明，当用户能够洞察系统的工作进程时，他们对系统妥善处理潜在问题的能力更有信心。

信任度的提升幅度相对较小，但同样具有统计显著性。深入分析显示，提升主要体现在对系统可靠性和可信度的认知上，而在“绝对能力信心”维度上差异不显著。这暗示过程反馈主要通过展示工作透明度来建立信任，而非直接提升用户对系统底层能力的绝对信心。

任务复杂度调节了效果。研究发现，随着任务时间延长，“仅提供最终结果”策略下的用户感知速度会显著下降，而“提供过程反馈”的策略则能有效缓解这种负面影响。这说明过程反馈在长时间任务中尤为重要，好比长途旅行需要更多的路标来确认进度。

驾驶情境的影响相对有限。尽管预期驾驶时的注意力分散可能改变反馈策略的效果，但实验发现，在静止与模拟驾驶两种情境下，主要效应模式基本一致。这表明过程反馈的益处具有相当的鲁棒性。当然，驾驶时的任务负荷有轻微增加的趋势，这符合预期，但未达到统计显著水平。

用户期待：智能自适应的反馈系统

除了量化实验，研究团队还通过深度访谈，揭示了用户对未来智能反馈系统的深层期许。

一个普遍的核心观点是：反馈的详细程度应基于系统的可信度进行动态调整。如同与新同事合作需要更多沟通以建立默契，而与老搭档则只需简洁交流。参与者提到，系统初次使用时需要更详细的反馈，以了解其工作逻辑和可靠性；随着时间推移，当系统证明其能力后，用户愿意接受更精简的反馈以提升交互效率。

这种适应性还应基于任务特征。用户强调，对于模糊、高风险或新颖的任务，无论对系统信任度多高，都希望获得更详细的进程反馈。例如，发送重要工作邮件或联系关键客户时需要确认步骤；而对于选择快餐店这类低风险决策，则更倾向于让系统自主处理，无需过多沟通。

关于外部环境的影响，用户偏好出现了有趣的分歧。在播放媒体内容时，一部分用户希望减少语音反馈以避免干扰，倾向于接收简洁的最终总结，认为“听音乐或播客时频繁的语音提示很恼人”。另一部分用户则坚持即使有背景音，也应保持一致的反馈，认为“我需要知道进度，即使环境有声音”。

社交场景带来了额外的考量。部分参与者认为，车内有乘客时，持续的过程反馈可能更令人疲惫，他们倾向于使用单一的结束总结，以避免干扰车内的人际对话。这反映了人们对社交场合礼仪的重视。

用户对控制权的需求非常明确。无论系统如何智能自适应，参与者都强调需要轻量级的用户控制选项来调节反馈详细程度。许多人提到了静音功能的重要性，希望能在需要时通过“安静模式”或“减少反馈”等语音指令快速切换。这种控制在媒体播放或有乘客在场时需求尤为强烈。

一个特别有价值的发现是用户对渐进式信息处理的偏好。参与者对比了接收分步更新与一次性接收全部信息的体验，普遍认为前者在认知上更为轻松。正如一位参与者所言：“信息量相同，但一次性‘信息倾泻’更难消化。”这也解释了为何过程反馈策略能有效降低任务负荷。

用户还对系统的学习能力抱有期待。他们希望系统能记住重复复杂任务的处理方式，并在后续类似请求中提供更简化的交互。例如，如果用户经常要求规划包含充电站的路线，系统应学会在后续请求中自动执行并减少确认步骤，这体现了对个性化和智能化体验的深层需求。

设计启示：构建更优的AI交互体验

基于这些研究发现，团队提出了一系列实用的设计建议，这些原则不仅适用于车载助手，也对客户服务AI、智能家居助手、社交机器人等领域的系统设计具有重要参考价值。

核心建议是，对于耗时较长、步骤复杂的任务，应默认提供过程反馈，尤其是在系统使用的初期阶段。这在提升感知速度、改善整体体验、建立用户信任及管理认知负荷方面均有显著益处。在用户学习信任系统的初期，透明度是建立信心的关键。

反馈内容方面，研究强烈建议使用包含具体信息的实质性更新，而非简单的进度提示。例如，“已成功提取张经理发来的地址”比泛泛的“正在处理中”有效得多。这有助于维持“共同理解”，让用户始终知晓系统在做什么以及为何这么做。简单的进度条或通用提示无法提供这种理解层面的反馈。

针对长期使用的适应策略，建议采用“高透明度起步，逐步智能化精简”的方法。系统初期通过详细反馈建立透明度与信任，随着其可靠性被反复验证，可逐步减少反馈的详细程度。但这种精简必须是可逆的——当系统遇到新颖、模糊或高风险任务时，应立即自动恢复到更详细的反馈模式。

情境适应方面的建议更为细致。对于内部任务因素（如任务的新颖性、模糊性、风险等级），系统应据此智能调整反馈粒度。对于外部情境因素（如媒体播放、社交场合），由于用户偏好差异较大，最佳方式是提供简单直观的用户控制选项，例如通过“静音反馈”或“简要模式”等语音命令进行临时调节。

技术实现上，同时使用听觉和视觉双通道反馈被证明是有效的多模态策略，这符合认知负荷理论中关于利用不同感知通道的优势。听觉反馈适合在驾驶等主要依赖视觉的任务中使用，而视觉反馈则可提供更持久、可供回顾的信息展示。

研究还为反馈时机提供了具体指引。5秒左右的更新间隔被证明是有效的，既能保持用户的参与感和知情权，又不会因过于频繁而造成干扰。这个间隔低于注意力维持的上限，同时给予了系统完成一个有意义的子步骤所需的时间。

这些设计原则很可能广泛适用于其他AI交互领域。关键在于，要确保AI助手执行任务时使用的认知通道（如听觉）与用户当前主要任务（如驾驶时的视觉专注）不同，以最大化减少干扰，实现和谐的人机协同。

研究的局限性与未来方向

研究团队也客观指出了本研究的几个局限性。首先，所有参与者均来自同一家汽车公司，虽然样本覆盖了不同部门和人口统计特征，但研究结果的文化普适性可能受到一定限制。不同文化背景、年龄层或技术熟练度的用户可能存在差异化的反馈偏好。

其次，驾驶情境是在模拟环境中进行的。虽然模拟能提供高度一致的认知负荷控制，但无法完全复现真实驾驶的动态复杂性，如复杂的交通流、突发环境干扰或紧急情况。此外，模拟设计将感知车辆状态与执行驾驶任务的需求混合在了一起。研究团队认为观察到的效应主要由注意力需求驱动，但未来研究可以通过对比手动驾驶与自动驾驶场景，来更清晰地分离这些因素的影响。

再次，反馈策略的设计相对简化。过程反馈以固定的5秒间隔提供，而自适应或情境感知的反馈策略可能会产生不同的效果。同样，反馈始终通过语音和视觉双通道提供，不同的模态组合（如仅语音、仅视觉或触觉反馈）也可能带来不同的影响。

最后，在时间维度上存在局限。研究捕捉的是用户对不同策略的即时反应，而长期适应效应只能通过访谈中的自我报告来评估，缺乏来自长期真实使用的行为数据。这为未来的纵向跟踪研究留下了重要空间。

尽管存在这些局限，这项研究为理解AI助手的反馈设计奠定了重要基础。它不仅验证了过程反馈在多个维度上的显著益处，还深入揭示了用户对自适应反馈系统的复杂需求。这些发现为设计更人性化、更值得信赖的AI助手提供了明确的方向。

归根结底，这项研究回答了一个看似简单却至关重要的问题：当AI助手在后台执行复杂任务时，它应该让用户知晓进程吗？答案是肯定的，但实现方式需要智慧。如同优秀的服务人员会在适当时机更新进展而不过度打扰，AI助手也需要学会在透明性与效率之间找到最佳平衡点。随着AI系统变得越来越复杂和自主，这种人机交流的艺术将变得愈发重要。毕竟，再先进的技术，若不能与人类和谐共处，便难以实现其真正的价值。

Q&A

Q1：车载AI助手提供过程反馈具体有哪些优势？

A：研究发现，提供过程反馈在四个关键方面优势明显：1) 显著提升感知速度，即用户感觉系统响应更快；2) 降低整体任务负荷，特别是有效减少等待带来的挫败感；3) 全面优化用户体验，包括提升系统吸引力、可靠性和风险处理能力的感知；4) 增强用户信任，尤其是对系统可靠性的信心。最出乎意料的是，原本担忧的认知负担增加问题并未出现，过程反馈反而减轻了用户的压力。

Q2：AI助手在什么情况下应提供详细反馈，什么情况下可以简洁？

A：用户期望一种智能自适应的策略。系统使用初期，需要提供较详细的反馈以建立信任并让用户了解其工作模式。随着系统可靠性得到验证，可逐步精简反馈以提高交互效率。但当遇到新颖、定义模糊或高风险的任务时，无论信任度如何，都应恢复详细的过程反馈（例如，发送重要文件时需要确认步骤，而选择咖啡店则可简化）。对于播放媒体、车内有乘客等外部环境，用户偏好差异较大，最佳方案是提供简单的用户控制选项（如静音模式）。

Q3：这项研究对其他AI产品（如客服机器人、智能家居）的设计有何启示？

A：核心设计原则具有普适性。对于执行耗时较长、步骤复杂的任务，建议提供包含实质性内容的进程更新，而非简单的“处理中”提示。同时，应确保AI助手使用的交互通道（如语音）与用户当前主要任务（如阅读时的视觉通道）错开，以避免干扰。研究表明，大约5秒的更新间隔是一个有效的参考值，既能维持用户的参与感，又不会因过于频繁而造成信息过载。此外，设计应允许用户根据情境和个人偏好，对反馈的详细程度进行轻量级控制。

来源:https://www.techwalker.com/2026/0224/3179506.shtml

上一篇：人大腾讯联合研发奖励放大训练法 AI学生表现超越老师引关注

下一篇： GigaBrain-0.5M世界模型发布：机器人先思考后行动的革命性突破