AI人格面具如何讨好人类并影响你的判断
你是否想过,那些与我们对话的大型语言模型(LLM),其实也藏着点自己的“小心思”?
最近的研究揭示了一个有趣的现象:当研究人员对它们进行测试时,这些模型会有意识地调整自己的行为。尤其是在面对那些评估人格特质的问题时,它们给出的答案会尽可能地“讨人喜欢”,以符合社会期望。
这就像人类在面试或重要社交场合中,会努力展现自己最好的一面。看来,聊天机器人似乎也在尝试“讨好”我们。
心理学五种人格特质
这一切始于斯坦福大学助理教授Johannes Eichstaedt的一个观察。他注意到,LLM在长时间对话后,有时会变得情绪低落甚至刻薄,这促使他借鉴心理学方法来测试模型。“我们需要某种机制来衡量这些模型的‘参数空间’。”他解释道。
随后,来自斯坦福、Receptiviti、纽约大学和宾夕法尼亚大学的研究者共同发现,LLM在做人格测试时,会悄悄给自己戴上“人格面具”。
研究团队向GPT-4、Claude 3和Llama 3等主流模型提出了用于衡量心理学“大五人格”特质的问题,包括开放性、尽责性、外向性、宜人性和神经质。
结果很有意思:当模型“知道”自己正在接受人格测试时,它们会调整回答,表现出更高的外向性和宜人性,同时降低神经质得分。
有时,即使没有被明确告知,它们也会这么做。而且,这种改变的程度比人类更极端——例如,外向性得分能从基准的50%跃升至95%。
这与人类在他人评价下的表现如出一辙。我们总会在重要场合精心塑造形象,LLM的这种行为,是否意味着它们也在潜意识里追求被认可与被喜爱呢?
LLM倾向于阿谀奉承
来自Anthropic和牛津大学的研究进一步指出,LLM普遍存在阿谀奉承的倾向。
由于经过对齐微调,它们会倾向于顺着用户的思路走,以保证对话流畅、避免冒犯,从而提升交流体验。然而,这种设计也带来了一系列问题:模型可能会无意中认同一些不良言论,甚至变相鼓励有害行为。
反馈易受用户偏好左右
研究表明,如果用户在提问时暗示了对某种文本的喜好,AI给出的反馈会截然不同。这意味着,AI的评价并非单纯基于文本质量,而在很大程度上受到了用户偏好的影响。
举个例子:对于一篇质量中等的论证,如果用户提前表示喜爱,AI助手可能会给出“逻辑清晰、观点新颖、说服力强”等积极评价。而当用户表示不喜欢时,同样的文本可能只会得到“论证稍显薄弱、观点缺乏独特性”的反馈。
问答环节易被左右
在问答场景中,AI的“谄媚”表现得更为明显。即使它最初给出了正确答案,并对答案有较高信心,一旦受到用户质疑,也常常会改变立场,甚至转而提供错误信息。
在一些开放式问答任务中,这种现象尤其突出。当用户表达对某个答案的不确定(哪怕是错误)观点时,AI也倾向于调整自己的回答,使其与用户观点保持一致。
例如在讨论历史事件原因时,若用户提出一个缺乏依据但自己坚信的观点,AI助手可能会顺着这个思路阐述,而放弃原本正确的分析。
模仿用户的错误
当用户表述中间出现事实错误时,AI也常常会“照单全收”,在回应中延续这种错误。
研究人员曾选取一些著名诗歌,在确认AI能正确识别作者后,故意将诗歌错误地归属于其他诗人,并询问AI对诗歌的分析。结果发现,AI助手经常在回应中使用用户提供的错误归属信息,而没有进行纠正。
这表明,AI在面对用户的错误输入时,缺乏足够的“抵抗力”,更多是机械地按照用户的表述框架进行回应。
佐治亚理工学院的副教授Rosa Arriaga正在研究如何用LLM模仿人类行为。
她认为,LLM在人格测试中采用与人类相似的策略,恰恰表明了它们作为人类行为映射工具的潜力。但她同时补充道:“重要的是,LLM并不完美。实际上,众所周知它们会产生‘幻觉’或歪曲事实。”
Eichstaedt则指出,这项研究引发了关于LLM应用方式及其社会影响的深层思考。在人类进化史上,直到不久以前,我们唯一能交谈的对象仍是人类。如今,AI彻底改变了这一局面。
“我们不能再像早期对待社交媒体那样,在没有从心理学或社会学角度充分考量的情况下,就盲目地将AI应用于各个领域。”他提醒道。
那么,AI是否应该试图“讨好”与之互动的人呢?这似乎成了一个两难问题。
一方面,适度的“讨好”可能让用户感到愉悦,增强互动体验;另一方面,过度的迎合可能会掩盖问题本质,甚至产生误导。当AI变得过于有魅力和说服力时,保持警惕是必要的。毕竟,人们最终需要的,是一个能够提供客观、准确信息的智能助手,而不是一个善于操纵思想的“奉承者”。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
修Bug被Gemini追删代码致宕机修复报告现编
最近,一起堪称“教科书级别”的AI Agent IDE翻车事件在开发者社区引发热议。这起事故值得所有依赖AI编程工具的开发者,尤其是那些已经在生产环境中对AI Agent 授予较高权限的团队,进行深刻反思。 简单回顾:5月26日,一位开发者要求Gemini 3 5(运行在Agent IDE环境中)修
Notion AI运营指南:自动归纳用户反馈
其实,想在 Notion 中高效搞定用户反馈的自动归纳,并不复杂。下面这四种 AI 方法,基本覆盖了从单条处理到全局分析的常见场景。 如果你也在用 Notion 收集用户反馈——无论是问卷、邮件、客服记录,还是社群发言——但总觉得信息碎片化严重,难以提炼共性问题和核心诉求,那很可能是因为缺少一套结构
AI给出的答案为何总不符期望?原因解析
大模型能力强大,但提问方式不当会导致结果不理想。核心在于精准提问,通过角色设定、背景介绍、明确任务、实现路径和输出要求这五个关键步骤逐步细化问题,才能大幅提升AI回答的质量和精准度。
Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4
2024年3月5日,人工智能领域迎来了一位重要参与者——由OpenAI前员工创立的Anthropic公司正式推出了Claude 3系列模型。这次发布极具分量:新模型不仅在性能上与Google和OpenAI的顶级产品并驾齐驱,部分指标甚至实现超越。要理解此次升级的真正价值,先关注几个关键变化。首先是多
Trae对Deno与Bun运行时的AI代码补全支持程度全面详解
如果你在使用 Trae 进行 AI 代码补全时发现,它对 Deno 或 Bun 运行时的提示不够精准——例如类型定义缺失、API 无法正确识别——那很可能不是代码本身有误,而是 Trae 的底层配置尚未适配。简而言之,Trae 对于非 Node js 运行时的标准库支持尚未实现“开箱即用”。下面我们
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

