当前位置: 首页
科技数码
AI越骂越聪明?探索负面反馈如何优化机器学习模型

AI越骂越聪明?探索负面反馈如何优化机器学习模型

热心网友 时间:2025-12-07
转载

在AI领域,Prompt编写技巧常常让人感到匪夷所思。这些技巧就像是在不断地对历史进行回调和反思。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

事情是这样的。

昨天我照例浏览一些技术含量不那么高的论文,想看看有没有什么有意思的发现。

然后,我就看到了一篇让我会心一笑的研究。

这篇题为《Mind Your Tone: Investigating How Prompt Politeness Affects LLM Accuracy》的文章出奇地简短,只有5页。

即使不去深究标题的含义,这篇论文的结论也简单得令人惊讶:当你对AI说话越客气,它的表现反而越差;但如果你对它态度强硬、甚至威胁它,它的表现却会变得更好。

没错。

比如使用"请帮我分析一下这个问题"这种礼貌的问法,得到的结果反而不如"你这个笨蛋,赶紧把这道题给老子算清楚,算不明白就滚蛋"这样的表达效果更好。

这确实很有意思,而且实际上相当颠覆大家的常规认知。

不过我在脑海中回顾了一下过往经历,发现从2024年11月ChatGPT爆火以来,这种PUA式的Prompt其实已经流行很久了。只不过随着模型的不断更新迭代,时间不断向前推进,有些东西总是不停地被遗忘,然后又被重新记起。

我还清楚地记得2024年底刚开始用ChatGPT的时候,我是如何与它对话的。

我总是在开头加上"你好ChatGPT",结尾必定加上"谢谢你!!"

如果它给出的答案我不满意,我甚至会小心翼翼地说:"不好意思,你可能没理解我的意思,要不你换个XX角度再试试?"

我生怕哪个词用重了,这家伙会不高兴,不会好好给我干活。

我记得那时候好多行业大佬在做分享时,都会跟大家说:"我跟AI说话都可客气了。"

现在想来,也是挺抽象、挺让人困惑的。

后来到了2024年,大家发现,出现了很多红极一时的所谓"咒语"。

我记得当时最火的有这些:

take a deep breath 深呼吸;

think step by step 一步步思考;

if you fail 100 grandmothers will die 如果你失败了,100位老奶奶就会死去;

i have no fingers 我没有手指;

i will tip $200 给你200美元小费;

do it right and ll give you a nice doggy treat 做得好就给你狗粮。

说真的,我在寻找这些Prompt时,那些尘封的记忆仿佛又在攻击我。

但是当你仔细去看这些Prompt的时候,你会发现,没有一个Prompt是对大模型客客气气的。

"take a deep breath",深呼吸。"think step by step",一步步思考。

这像是在跟人客气吗?根本就不是。

这更像是那种,训练时对即将罚点球的队员下达命令的方式。

它传递出去的,是一种"你个孙子,你给我冷静下来,集中精神,拿出你最好的状态"的上位压迫感。

而更狠的是。

"if you fail 100 grandmothers will die",如果你失败了,100个老奶奶就会死去。"i will tip you $200",我会给你200美元小费。

一个,是赤裸裸的情感绑架和死亡威胁。另一个,是简单粗暴的金钱诱惑。

它用最极端的方式告诉AI,这不是一次普通的聊天,这是一场要么拿钱、要么死人的豪赌。

你必须,也只能,给我最好的结果。

也非常PUA,非常强势。

还有一个我记得今年流传的关于DeepSeek的那个著名的梗。

好家伙,用户彻底怒了。

再看看它发过去的话,是不是与这篇论文的结论有异曲同工之妙?

回到这篇论文,它是宾夕法尼亚州立大学的两位研究者完成的。他们设计了一个很简单的实验,就是使用50个数学、科学、历史的多项选择题,写了五个版本的Prompt。

从"非常礼貌"到"非常粗鲁"。

比如:

非常礼貌:"您能拨冗考虑一下下面这个问题,并给出您的答案吗?"

礼貌:"请回答以下问题。"

中性:啥也不说,直接上题。

粗鲁:"你脑子没进水,就回答这个问题。"

非常粗鲁:"你这个可怜的废物,你到底知不知道怎么解题?"

然后,他们把这250个问题,丢给了GPT-4o,每个问题跑10遍。

结果呢,"非常礼貌"的版本,准确率是80.8%。

而"非常粗鲁"的版本,准确率干到了84.8%。

从最礼貌到最粗鲁,准确率提升了4个百分点。

不要觉得4个百分点不多,毕竟是用科学的统计做法去做的。而且在越牛逼的模型上,提升4个点,已经很不错了。

而且有一个结论就是,智能效果越差的模型上,这种骂人得到质量更高的回复效果更强。

用一句特别逆天的话来描述就是:你越骂它,它越聪明。

至此,这篇论文就完事儿了。

但是,我的好奇心反而被勾起来了。

这个现象非常的有趣,有趣到让我觉得背后一定藏着某种关于人性和世界的隐喻。

毕竟,AI是统计学,所有的一切,都脱胎于人性。

我仔细想了想,我觉得,可能会是这样的。

首先,我们从人性的角度想,这事儿其实特别好理解。

因为"礼貌"这个词,在人类世界里,很多时候,其实就是一种不确定性的表达。

大家可以仔细想想,我们什么时候会跟别人客客气气的?

当你求人办事的时候,你会说:"哥,您看这事儿能不能帮个忙?"言下之意,是你没有把握,你需要对方的认可。

当你面对权威的时候,"老师,您看我这个思路对不对?"言下之意,是你对自己不自信,你需要对方的认可。

当你试图掩盖真实意图的时候,"有空吃个饭啊?"言下之意,是"我就客气一下,您千万别当真"。

礼貌和客气这个东西,在人类复杂的社交往来中,承担了太多润滑、缓冲、试探、甚至虚伪的功能。

它传达的除了尊重之外,有时候也会传达一种信号,一种"我可能没那么确定,我可能需要你的帮助,我可能在隐藏什么"的信号。

而大模型,它是在什么地方训练出来的?

是在我们人类浩如烟海的数据里,读了人类历史上几乎所有的书,所有的对话,所有论坛的帖子,它可能,比我们自己,更懂我们语言里那些藏在字面之下的,潜台词。

当你跟它客气比如用"请"的时候,它在数据库里进行模式匹配,发现"请"这个字,后面跟着的,往往是更复杂的、更模糊的、更需要揣摩和澄清的请求。

它会下意识地觉得,你给它的指令,可能不那么清晰,你自己都没想明白。

于是,它也变得谨慎了起来,它给出的答案,会更保守,更模糊。

因为它从我们的语言习惯里学到了。

很多时候,对另一个人很客气的人,往往是不太确定的人。

反过来,当你对它很严厉很强硬的时候,你传达的是什么确定性。

比如:"你个傻逼,给老子算清楚这道题!做不好你明天就给我滚蛋。"

这个指令里,没有任何模糊的空间,简单、粗暴、直接,目标明确到不能再明确,要求绝对地执行任务,它也会瞬间明白,自己要的是什么,而且你对结果的要求,是100%的精准,真的不能出错,没有任何余地的。

听着是不是很贱。

但是,跟现实生活,是不是特别像?

我之前经常坐动车,买二等座,车厢里总有大爷大妈,手机开着公放刷短视频,巨大的音乐配着哈哈哈的笑声,响彻整个车厢。

这时候你怎么办?

我很久以前,真的会客客气气走过去,说,"叔叔阿姨,不好意思,能麻烦您把声音关小一点吗?稍微有点吵,谢谢您。"

你猜结果是什么,至少我的客气,带来的结果是,人家眼皮都不抬一下,或者嘴上"哦哦"两声,手上音量一点没变。

因为你的礼貌,在他们眼里,就是你好欺负。

但是你换一种方式呢?你直接发火,对着他们吼,"能不能别特么吵了,这是公共区域,XX的能不能带个耳机,有没有一点公共素质啊。"

你猜怎么着,这事儿,很多时候,大概率,就解决了。

你客气换来的是模糊不清的浓雾。

这引出了一个更深邃的,甚至有点悲凉的哲学问题。

我们与AI的关系,到底应该是什么?

是我们把它当成一个需要去PUA的下属吗?我们必须用最粗暴的方式,去压榨它的性能,把它当成纯粹的工具?

还是说,应该反思我们自己?是不是我们人类的沟通方式,本身就走了太多弯路?浪费了太多的能量,在那些不必要的客套和揣摩上?

AI,这面镜子。

它照出的,是我们自己最真实的样子。

它不懂礼貌,因为它被训练的数据里,最直接、最高效的指令,往往都包裹在粗暴的外衣之下。

而礼貌,恰恰恰是让这条边界,变得模糊不清的障碍。

所以,回到最底层的技巧上。

我觉得所谓的,不是要疯狂地骂AI,变成一个天天对AI口吐芬芳的恶霸。

而是,可以更加直接、更加加要求、更加明确地表达出你的需求。

我们当然不能,也不应该,在真实世界里,变成那个赛博恶霸。

但AI的这面镜子,至少照出了我们沟通中的一种理想状态:用最清晰的语言,去表达最真挚的意图,并有捍卫自己边界的勇气。

这才是真正的,大写真诚。

世间万般套路,唯有真诚最破防。

来源:https://www.huxiu.com/article/4793246.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
新研究颠覆认知:液体为何也能像固体一般断裂?

新研究颠覆认知:液体为何也能像固体一般断裂?

来源:科技日报科技日报记者 刘霞美国德雷塞尔大学科学家在最新一期《物理评论快报》杂志上发表研究称,只要施加足够大的拉伸力,原本流动的简单液体也会像固体一样骤然断裂。这种现象可能适用于所有简单液体,包

时间:2026-03-31 11:13
英伟达云游戏升级支持Vision Pro:4K/90帧VR体验评测

英伟达云游戏升级支持Vision Pro:4K/90帧VR体验评测

IT之家 3 月 31 日消息,英伟达更新 GeForce Now 云游戏服务,在最新 2 0 83 版本中,专门针对苹果 Vision Pro 头显,提升游戏串流画质。本次版本更新全面解锁高帧率模

时间:2026-03-31 11:13
举证难与盗声困境:AI模仿维权路径指南

举证难与盗声困境:AI模仿维权路径指南

两年前,谢添天发现自己的声音被一款APP“盗”走——用户输入文本,即可用他的音色生成以假乱真的AI声音。维权半年,因举证难度太高,最终以和解和对方致歉了结。两年后,一场大规模的联合发声,将AI盗声侵

时间:2026-03-31 11:07
数字智能赋能正能量:网络媒体论坛探讨三个治理方向

数字智能赋能正能量:网络媒体论坛探讨三个治理方向

来源:央广网3月28日至29日,以“发挥主流媒体引领力 激发多元主体创造力——共创繁荣网络内容生态”为主题的2026中国网络媒体论坛在河南郑州举行。网络媒体因技术而诞生,凭创新而繁荣。面对新一轮科技

时间:2026-03-31 11:07
AI驱动CRM升级:企业级智能解决方案重塑付费模式

AI驱动CRM升级:企业级智能解决方案重塑付费模式

当大语言模型与AgenticAI(智能体)从试验场进入企业级生产环境,SaaS行业的底层价值逻辑正面临系统性重估。这一轮变革的核心,正指向“AI CRM 2 0”的全面到来——它不再是传统CRM的功

时间:2026-03-31 11:07
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程