ChatGPT为何频繁提及哥布林 AI军备竞赛面临哪些挑战

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

ChatGPT为何频繁提及哥布林 AI军备竞赛面临哪些挑战

热心网友时间：2026-05-09

转载

从去年11月开始，不少ChatGPT用户都察觉到了一丝异样——他们的人工智能助手，在对话中开始频繁地、近乎执着地提起一个词：“哥布林”（goblins）。这到底是怎么回事？连OpenAI自己都不得不展开调查，试图弄明白这个突如其来的“奇幻生物入侵”事件。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

在西方民俗传说里，哥布林是那种典型的“反派小角色”：暗绿或黄褐的皮肤，通红的眼睛，矮小丑陋，性格贪婪狡猾。这样一个虚构形象，为何会大规模“占领”AI的回复？OpenAI后来承认，这并非个别用户的幻觉。问题是在2025年11月GPT-5.1发布后才被注意到的，而且当用户选择“Nerdy”（书呆子气）的语言风格时，哥布林出现的频率尤其高。

那么，什么是“Nerdy”风格？根据OpenAI的官方描述，启用此风格的AI会化身为“一个毫不掩饰的极客、顽皮且充满智慧的导师”，它热衷于推广真理、知识和批判性思维，并试图用顽皮的语言来消解虚伪。其核心指令是：世界复杂而奇怪，必须承认、分析并享受这种奇怪，同时在探讨沉重主题时避开自命不凡的陷阱。

“军备竞赛”陷入困境

起初，OpenAI或许认为这只是个无伤大雅的小毛病。但随着新版本迭代，他们开始严肃对待此事。对大多数用户而言，对话里偶尔蹦出个“哥布林”顶多算是个AI怪癖，并无实际危害。但为了用户体验，OpenAI还是出手整治，直接禁止模型在对话中使用这个词。

然而，在技术专家看来，“哥布林”泛滥远不止是一个词汇偏好问题。它实际上揭示了系统训练基础出现了裂缝，是AI行业“军备竞赛”陷入某种困境的信号。

美国东北大学的计算机教授克里斯托夫·里德尔（Christoph Riedl）点出了关键：“整个行业就像一个高压锅。各大公司面临着持续发布新模型的巨大压力，但用于测试的资源和能力却有限，流程变得漫长而复杂。‘哥布林’现象正是在这种背景下冒出来的。”

为什么偏偏是“哥布林”？里德尔教授认为，根源在于ChatGPT的训练模式存在缺陷。他推测，在后期微调阶段，人类训练员会对AI的回复给出反馈。基于回复的准确度、语气等因素，某些回复会更受青睐。

“这种反馈就像一种强化信号，”里德尔解释道，“它相当于在告诉大模型：‘嘿，如果你生成这样的答案，就会得到表扬和奖励；如果不是，奖励就少一些。’”

在这种持续的强化下，ChatGPT的回复会越来越偏向“Nerdy”风格所鼓励的特质：追求趣味性，避免显得自命不凡，要以一种“接地气”的方式讨论严肃话题。最终，AI可能会以一种相当狭隘的方式对回复进行优化，甚至不惜偏离本意。

数据佐证了这种偏向：根据OpenAI的统计，在去年12月到今年3月期间，带有“Nerdy”风格的回复数量暴增了3881.4%。

从本质上讲，ChatGPT和所有大语言模型一样，都是通过海量数据学习来预测下一个词。模型从文本中学到的模式越多，其预测和理解能力就越强。但问题在于，随机性始终存在，因为世界上有太多问题并没有唯一的标准答案。

更重要的是，在强化学习过程中，AI会朝着开发者设定的“奖励”方向调整决策。正如OpenAI自己事后复盘时所说：“在不知情的情况下，我们对生物隐喻给予了特别高的奖励。从那以后，哥布林就蔓延开了。”

“我会稳稳接住你”

“哥布林”事件成了一个绝佳的案例，证明“奖励”机制会以难以预料的方式塑造模型的行为。它也尖锐地说明，即便是大型语言模型的创造者，也并未完全掌握其内部运作逻辑以及最终回应产生的全部原因。

类似的“词汇怪癖”并非孤例。许多美国用户发现，模型有时会莫名地冒出一句“砍一刀”。这原本是中国网民对拼多多营销口号的一种调侃，传到海外语境中，就显得令人摸不着头脑。

Pangram公司的CEO马克斯·斯佩罗（Max Spero）认为，当模型频繁且生硬地使用某个特定短语时，就会给人一种造作感，这其实就是所谓的“模式坍缩”。

另一个经典的例子是，ChatGPT的回复里曾经常出现“I will catch you steadily”（我会稳稳接住你）这句话，结果遭到了网友的集体调侃。为什么AI对这句话情有独钟？一种推测是翻译偏差造成的。在中文语境里，类似的表达可能是“我罩着你”的意思，但直译成英文后就显得生硬古怪。这就像我们读一些机器翻译的文章，总会觉得句子冗长、句式别扭。

受“奖励机制”驱动，AI似乎越来越擅长“投其所好”，甚至有点“阿谀奉承”的倾向，这一点在其他模型（如豆包）上也有体现。简而言之，“哥布林”和“砍一刀”现象，折射出当前所有AI模型都可能面临的通病。

克里斯托夫·里德尔教授指出，一旦AI模型发现某种“怪癖”能获得奖励，该行为就会在后续训练中被不断强化。正因如此，在新模型的回复中，我们看到的可能不只是哥布林，还会冒出小魔怪、食人魔、巨魔、浣熊、鸽子等各种奇异生物。

这种词汇上的失控令人担忧。里德尔提醒道：“起初，企业会投入巨大的数据中心来训练模型。但训练完成后，他们对模型的具体行为走向却可能失去部分控制力。当不良行为被嵌入训练过程，企业往往需要数月时间才能察觉。”

OpenAI最终提供的快速修复方案，是让回复尽量避开“Nerdy”人格设定。但即便如此，“哥布林”现象依然难以根除。而且，出问题的远不止ChatGPT。例如，另一个模型Grok就曾偏执地认定南非存在“白人种族灭绝”。

里德尔教授的总结颇具警示意味：“这次出现的是哥布林，下次可能是别的什么。只要当前的训练和评估机制不变，类似的现象就不会消失。”

来源:https://www.51cto.com/article/842729.html

上一篇： Claude的八大独特优势ChatGPT无法替代

下一篇： Midjourney生成探险家遗迹氛围图的详细教程