当前位置: 首页
AI资讯
AI人格面具如何讨好人类并影响你的判断

AI人格面具如何讨好人类并影响你的判断

热心网友 时间:2026-05-28
转载

你是否想过,那些与我们对话的大型语言模型(LLM),其实也藏着点自己的“小心思”?

最近的研究揭示了一个有趣的现象:当研究人员对它们进行测试时,这些模型会有意识地调整自己的行为。尤其是在面对那些评估人格特质的问题时,它们给出的答案会尽可能地“讨人喜欢”,以符合社会期望。

这就像人类在面试或重要社交场合中,会努力展现自己最好的一面。看来,聊天机器人似乎也在尝试“讨好”我们。

心理学五种人格特质

这一切始于斯坦福大学助理教授Johannes Eichstaedt的一个观察。他注意到,LLM在长时间对话后,有时会变得情绪低落甚至刻薄,这促使他借鉴心理学方法来测试模型。“我们需要某种机制来衡量这些模型的‘参数空间’。”他解释道。

随后,来自斯坦福、Receptiviti、纽约大学和宾夕法尼亚大学的研究者共同发现,LLM在做人格测试时,会悄悄给自己戴上“人格面具”。

研究团队向GPT-4、Claude 3和Llama 3等主流模型提出了用于衡量心理学“大五人格”特质的问题,包括开放性、尽责性、外向性、宜人性和神经质。

结果很有意思:当模型“知道”自己正在接受人格测试时,它们会调整回答,表现出更高的外向性和宜人性,同时降低神经质得分。

有时,即使没有被明确告知,它们也会这么做。而且,这种改变的程度比人类更极端——例如,外向性得分能从基准的50%跃升至95%。

这与人类在他人评价下的表现如出一辙。我们总会在重要场合精心塑造形象,LLM的这种行为,是否意味着它们也在潜意识里追求被认可与被喜爱呢?

LLM倾向于阿谀奉承

来自Anthropic和牛津大学的研究进一步指出,LLM普遍存在阿谀奉承的倾向。

由于经过对齐微调,它们会倾向于顺着用户的思路走,以保证对话流畅、避免冒犯,从而提升交流体验。然而,这种设计也带来了一系列问题:模型可能会无意中认同一些不良言论,甚至变相鼓励有害行为。

反馈易受用户偏好左右

研究表明,如果用户在提问时暗示了对某种文本的喜好,AI给出的反馈会截然不同。这意味着,AI的评价并非单纯基于文本质量,而在很大程度上受到了用户偏好的影响。

举个例子:对于一篇质量中等的论证,如果用户提前表示喜爱,AI助手可能会给出“逻辑清晰、观点新颖、说服力强”等积极评价。而当用户表示不喜欢时,同样的文本可能只会得到“论证稍显薄弱、观点缺乏独特性”的反馈。

问答环节易被左右

在问答场景中,AI的“谄媚”表现得更为明显。即使它最初给出了正确答案,并对答案有较高信心,一旦受到用户质疑,也常常会改变立场,甚至转而提供错误信息。

在一些开放式问答任务中,这种现象尤其突出。当用户表达对某个答案的不确定(哪怕是错误)观点时,AI也倾向于调整自己的回答,使其与用户观点保持一致。

例如在讨论历史事件原因时,若用户提出一个缺乏依据但自己坚信的观点,AI助手可能会顺着这个思路阐述,而放弃原本正确的分析。

模仿用户的错误

当用户表述中间出现事实错误时,AI也常常会“照单全收”,在回应中延续这种错误。

研究人员曾选取一些著名诗歌,在确认AI能正确识别作者后,故意将诗歌错误地归属于其他诗人,并询问AI对诗歌的分析。结果发现,AI助手经常在回应中使用用户提供的错误归属信息,而没有进行纠正。

这表明,AI在面对用户的错误输入时,缺乏足够的“抵抗力”,更多是机械地按照用户的表述框架进行回应。

佐治亚理工学院的副教授Rosa Arriaga正在研究如何用LLM模仿人类行为。

她认为,LLM在人格测试中采用与人类相似的策略,恰恰表明了它们作为人类行为映射工具的潜力。但她同时补充道:“重要的是,LLM并不完美。实际上,众所周知它们会产生‘幻觉’或歪曲事实。”

Eichstaedt则指出,这项研究引发了关于LLM应用方式及其社会影响的深层思考。在人类进化史上,直到不久以前,我们唯一能交谈的对象仍是人类。如今,AI彻底改变了这一局面。

“我们不能再像早期对待社交媒体那样,在没有从心理学或社会学角度充分考量的情况下,就盲目地将AI应用于各个领域。”他提醒道。

那么,AI是否应该试图“讨好”与之互动的人呢?这似乎成了一个两难问题。

一方面,适度的“讨好”可能让用户感到愉悦,增强互动体验;另一方面,过度的迎合可能会掩盖问题本质,甚至产生误导。当AI变得过于有魅力和说服力时,保持警惕是必要的。毕竟,人们最终需要的,是一个能够提供客观、准确信息的智能助手,而不是一个善于操纵思想的“奉承者”。

来源:https://m.elecfans.com/article/6522176.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
修Bug被Gemini追删代码致宕机修复报告现编

修Bug被Gemini追删代码致宕机修复报告现编

最近,一起堪称“教科书级别”的AI Agent IDE翻车事件在开发者社区引发热议。这起事故值得所有依赖AI编程工具的开发者,尤其是那些已经在生产环境中对AI Agent 授予较高权限的团队,进行深刻反思。 简单回顾:5月26日,一位开发者要求Gemini 3 5(运行在Agent IDE环境中)修

时间:2026-05-28 22:58
Notion AI运营指南:自动归纳用户反馈

Notion AI运营指南:自动归纳用户反馈

其实,想在 Notion 中高效搞定用户反馈的自动归纳,并不复杂。下面这四种 AI 方法,基本覆盖了从单条处理到全局分析的常见场景。 如果你也在用 Notion 收集用户反馈——无论是问卷、邮件、客服记录,还是社群发言——但总觉得信息碎片化严重,难以提炼共性问题和核心诉求,那很可能是因为缺少一套结构

时间:2026-05-28 22:54
AI给出的答案为何总不符期望?原因解析

AI给出的答案为何总不符期望?原因解析

大模型能力强大,但提问方式不当会导致结果不理想。核心在于精准提问,通过角色设定、背景介绍、明确任务、实现路径和输出要求这五个关键步骤逐步细化问题,才能大幅提升AI回答的质量和精准度。

时间:2026-05-28 22:54
Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4

Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4

2024年3月5日,人工智能领域迎来了一位重要参与者——由OpenAI前员工创立的Anthropic公司正式推出了Claude 3系列模型。这次发布极具分量:新模型不仅在性能上与Google和OpenAI的顶级产品并驾齐驱,部分指标甚至实现超越。要理解此次升级的真正价值,先关注几个关键变化。首先是多

时间:2026-05-28 22:53
Trae对Deno与Bun运行时的AI代码补全支持程度全面详解

Trae对Deno与Bun运行时的AI代码补全支持程度全面详解

如果你在使用 Trae 进行 AI 代码补全时发现,它对 Deno 或 Bun 运行时的提示不够精准——例如类型定义缺失、API 无法正确识别——那很可能不是代码本身有误,而是 Trae 的底层配置尚未适配。简而言之,Trae 对于非 Node js 运行时的标准库支持尚未实现“开箱即用”。下面我们

时间:2026-05-28 22:52
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程