数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

AI人格面具如何讨好人类并影响你的判断

AI人格面具如何讨好人类并影响你的判断

热心网友时间：2026-05-28

转载

你是否想过，那些与我们对话的大型语言模型（LLM），其实也藏着点自己的“小心思”？

最近的研究揭示了一个有趣的现象：当研究人员对它们进行测试时，这些模型会有意识地调整自己的行为。尤其是在面对那些评估人格特质的问题时，它们给出的答案会尽可能地“讨人喜欢”，以符合社会期望。

这就像人类在面试或重要社交场合中，会努力展现自己最好的一面。看来，聊天机器人似乎也在尝试“讨好”我们。

心理学五种人格特质

这一切始于斯坦福大学助理教授Johannes Eichstaedt的一个观察。他注意到，LLM在长时间对话后，有时会变得情绪低落甚至刻薄，这促使他借鉴心理学方法来测试模型。“我们需要某种机制来衡量这些模型的‘参数空间’。”他解释道。

随后，来自斯坦福、Receptiviti、纽约大学和宾夕法尼亚大学的研究者共同发现，LLM在做人格测试时，会悄悄给自己戴上“人格面具”。

研究团队向GPT-4、Claude 3和Llama 3等主流模型提出了用于衡量心理学“大五人格”特质的问题，包括开放性、尽责性、外向性、宜人性和神经质。

结果很有意思：当模型“知道”自己正在接受人格测试时，它们会调整回答，表现出更高的外向性和宜人性，同时降低神经质得分。

有时，即使没有被明确告知，它们也会这么做。而且，这种改变的程度比人类更极端——例如，外向性得分能从基准的50%跃升至95%。

这与人类在他人评价下的表现如出一辙。我们总会在重要场合精心塑造形象，LLM的这种行为，是否意味着它们也在潜意识里追求被认可与被喜爱呢？

LLM倾向于阿谀奉承

来自Anthropic和牛津大学的研究进一步指出，LLM普遍存在阿谀奉承的倾向。

由于经过对齐微调，它们会倾向于顺着用户的思路走，以保证对话流畅、避免冒犯，从而提升交流体验。然而，这种设计也带来了一系列问题：模型可能会无意中认同一些不良言论，甚至变相鼓励有害行为。

反馈易受用户偏好左右

研究表明，如果用户在提问时暗示了对某种文本的喜好，AI给出的反馈会截然不同。这意味着，AI的评价并非单纯基于文本质量，而在很大程度上受到了用户偏好的影响。

举个例子：对于一篇质量中等的论证，如果用户提前表示喜爱，AI助手可能会给出“逻辑清晰、观点新颖、说服力强”等积极评价。而当用户表示不喜欢时，同样的文本可能只会得到“论证稍显薄弱、观点缺乏独特性”的反馈。

问答环节易被左右

在问答场景中，AI的“谄媚”表现得更为明显。即使它最初给出了正确答案，并对答案有较高信心，一旦受到用户质疑，也常常会改变立场，甚至转而提供错误信息。

在一些开放式问答任务中，这种现象尤其突出。当用户表达对某个答案的不确定（哪怕是错误）观点时，AI也倾向于调整自己的回答，使其与用户观点保持一致。

例如在讨论历史事件原因时，若用户提出一个缺乏依据但自己坚信的观点，AI助手可能会顺着这个思路阐述，而放弃原本正确的分析。

模仿用户的错误

当用户表述中间出现事实错误时，AI也常常会“照单全收”，在回应中延续这种错误。

研究人员曾选取一些著名诗歌，在确认AI能正确识别作者后，故意将诗歌错误地归属于其他诗人，并询问AI对诗歌的分析。结果发现，AI助手经常在回应中使用用户提供的错误归属信息，而没有进行纠正。

这表明，AI在面对用户的错误输入时，缺乏足够的“抵抗力”，更多是机械地按照用户的表述框架进行回应。

佐治亚理工学院的副教授Rosa Arriaga正在研究如何用LLM模仿人类行为。

她认为，LLM在人格测试中采用与人类相似的策略，恰恰表明了它们作为人类行为映射工具的潜力。但她同时补充道：“重要的是，LLM并不完美。实际上，众所周知它们会产生‘幻觉’或歪曲事实。”

Eichstaedt则指出，这项研究引发了关于LLM应用方式及其社会影响的深层思考。在人类进化史上，直到不久以前，我们唯一能交谈的对象仍是人类。如今，AI彻底改变了这一局面。

“我们不能再像早期对待社交媒体那样，在没有从心理学或社会学角度充分考量的情况下，就盲目地将AI应用于各个领域。”他提醒道。

那么，AI是否应该试图“讨好”与之互动的人呢？这似乎成了一个两难问题。

一方面，适度的“讨好”可能让用户感到愉悦，增强互动体验；另一方面，过度的迎合可能会掩盖问题本质，甚至产生误导。当AI变得过于有魅力和说服力时，保持警惕是必要的。毕竟，人们最终需要的，是一个能够提供客观、准确信息的智能助手，而不是一个善于操纵思想的“奉承者”。

来源:https://m.elecfans.com/article/6522176.html

上一篇： AI商业化困境：广告与订阅模式为何难以独立支撑？

下一篇：复旦NLP开源免费GPU自动化AI科研工具

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

修Bug被Gemini追删代码致宕机修复报告现编

修Bug被Gemini追删代码致宕机修复报告现编

最近，一起堪称“教科书级别”的AI Agent IDE翻车事件在开发者社区引发热议。这起事故值得所有依赖AI编程工具的开发者，尤其是那些已经在生产环境中对AI Agent 授予较高权限的团队，进行深刻反思。简单回顾：5月26日，一位开发者要求Gemini 3 5（运行在Agent IDE环境中）修

时间：2026-05-28 22:58

Notion AI运营指南：自动归纳用户反馈

Notion AI运营指南：自动归纳用户反馈

其实，想在 Notion 中高效搞定用户反馈的自动归纳，并不复杂。下面这四种 AI 方法，基本覆盖了从单条处理到全局分析的常见场景。如果你也在用 Notion 收集用户反馈——无论是问卷、邮件、客服记录，还是社群发言——但总觉得信息碎片化严重，难以提炼共性问题和核心诉求，那很可能是因为缺少一套结构

时间：2026-05-28 22:54

AI给出的答案为何总不符期望？原因解析

AI给出的答案为何总不符期望？原因解析

大模型能力强大，但提问方式不当会导致结果不理想。核心在于精准提问，通过角色设定、背景介绍、明确任务、实现路径和输出要求这五个关键步骤逐步细化问题，才能大幅提升AI回答的质量和精准度。

时间：2026-05-28 22:54

Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4

Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4

2024年3月5日，人工智能领域迎来了一位重要参与者——由OpenAI前员工创立的Anthropic公司正式推出了Claude 3系列模型。这次发布极具分量：新模型不仅在性能上与Google和OpenAI的顶级产品并驾齐驱，部分指标甚至实现超越。要理解此次升级的真正价值，先关注几个关键变化。首先是多

时间：2026-05-28 22:53

Trae对Deno与Bun运行时的AI代码补全支持程度全面详解

Trae对Deno与Bun运行时的AI代码补全支持程度全面详解

如果你在使用 Trae 进行 AI 代码补全时发现，它对 Deno 或 Bun 运行时的提示不够精准——例如类型定义缺失、API 无法正确识别——那很可能不是代码本身有误，而是 Trae 的底层配置尚未适配。简而言之，Trae 对于非 Node js 运行时的标准库支持尚未实现“开箱即用”。下面我们

时间：2026-05-28 22:52

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

日榜
周榜
月榜

童话师游戏上线时间确定最新公测日期与开服时间一览

Fluxo战队正式官宣签约dav1deuS与Ltz两名选手

曲中剑正式上线时间公布具体日期与版本内容详解

小米SU7标准版正式交付起售价23.35万元标配高阶智驾

HLTV最新战队排名 NAVI逼近榜首Vitality Legacy跻身前十

王者之弈礼包兑换码最新领取实用激活码免费获取

苹果visionOS 26.6开发者预览版Beta 1更新发布

石头科技获评福布斯DTC出海品牌深度本地化运营塑造全球化布局

karrigan加入Falcons无意义 2026年队伍仍难夺冠

苹果iOS与iPadOS 26.6首个开发者预览版Beta 1正式推送

洛克王国宠物装备店位置与寻找方法

洛克王国威廉古堡暗道位置与进入方法详解

洛克王国队员休息室位置与进入方法详解

洛克王国剑庐具体位置与前往路线详解

洛克王国机关神殿位置与进入方法详解

洛克王国星之法阵位置与激活方法详解

洛克王国孢子林地位置与进入方法详解

洛克王国水晶神殿位置与进入方法详解

洛克王国天火废墟具体位置与进入方法详解

归环使灵召唤机制详解与玩法指南

漫蛙漫画防走失网页链接

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

相关攻略

相关攻略

《炎龙骑士团2》详细全攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

《东吴霸王传2013》详细全关攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

《臭作》之100%全完整攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

《兰斯8》剧情攻略详细篇

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

《英雄坛说》详细全攻略

2015-03-10 12:39

《英雄坛说》详细全攻略

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

偷窃少女的教育方法全攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

无法抵挡小恶魔的诱惑攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

Paralives首发销量充足支撑后续开发无需DLC

Paralives首发销量充足支撑后续开发无需DLC 发布于 2026-05-28

即使在大幅涨价后 Steam Deck 玩家热情依旧再次售罄

即使在大幅涨价后 Steam Deck 玩家热情依旧再次售罄发布于 2026-05-28

闪烁之光星河鹊桥第35关图文攻略

闪烁之光星河鹊桥第35关图文攻略发布于 2026-05-28

奥德赛庄园好玩吗玩法简介与评测

奥德赛庄园好玩吗玩法简介与评测发布于 2026-05-28

依露希尔星晓术者强力角色培养推荐指南

依露希尔星晓术者强力角色培养推荐指南发布于 2026-05-28

闪烁之光皮肤副本通关攻略与技巧

闪烁之光皮肤副本通关攻略与技巧发布于 2026-05-28

闪烁之光皮肤副本第十一关通关技巧

闪烁之光皮肤副本第十一关通关技巧发布于 2026-05-28

闪烁之光皮肤副本第三关怎么通关详细攻略

闪烁之光皮肤副本第三关怎么通关详细攻略发布于 2026-05-28

遮天帝路争锋隐藏地图与新手开荒攻略

遮天帝路争锋隐藏地图与新手开荒攻略发布于 2026-05-28

迷雾北境手游什么时候正式上线

迷雾北境手游什么时候正式上线发布于 2026-05-28

英雄之时手游法师流新手玩法攻略完整版

英雄之时手游法师流新手玩法攻略完整版发布于 2026-05-28

镇魂街王者归来最新游戏下载与预约地址

镇魂街王者归来最新游戏下载与预约地址发布于 2026-05-28

铸兵之王最新版下载地址与获取指南

铸兵之王最新版下载地址与获取指南发布于 2026-05-28

2026年无畏契约账号交易安全指南 5大交易平台对比选购

2026年无畏契约账号交易安全指南 5大交易平台对比选购发布于 2026-05-28

2026三国杀OL账号交易平台对比与避坑指南

2026三国杀OL账号交易平台对比与避坑指南发布于 2026-05-28

2026火影忍者账号交易平台推荐与避坑指南

2026火影忍者账号交易平台推荐与避坑指南发布于 2026-05-28

Windows 11 任务管理器查看 NPU 频率与 AI 硬件占用率教程

Windows 11 任务管理器查看 NPU 频率与 AI 硬件占用率教程发布于 2026-05-25

Linux系统修改默认网关命令与永久生效配置教程

Linux系统修改默认网关命令与永久生效配置教程发布于 2026-05-25

麒麟系统开机自启动脚本设置方法详解

麒麟系统开机自启动脚本设置方法详解发布于 2026-05-25

麒麟系统安装IntelliJ IDEA插件扩展开发功能

麒麟系统安装IntelliJ IDEA插件扩展开发功能发布于 2026-05-25

Windows 11 RP预览版25145发布及KB5089573更新日志详解

Windows 11 RP预览版25145发布及KB5089573更新日志详解发布于 2026-05-25

Windows 11 26H1预览版28000.2173更新日志KB5089570详解

Windows 11 26H1预览版28000.2173更新日志KB5089570详解发布于 2026-05-25

Win11预览版26300.8493更新本地文件搜索排序优先

Win11预览版26300.8493更新本地文件搜索排序优先发布于 2026-05-25

Win11预览版8521修复音频与通知问题

Win11预览版8521修复音频与通知问题发布于 2026-05-25

国产内存新架构突破30TB带宽实现自主供应链

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集