GPT-5为何频繁提及哥布林？背后原因深度解析

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

GPT-5为何频繁提及哥布林？背后原因深度解析

热心网友时间：2026-05-17

转载

去年夏天，DeepSeek V3.1模型曾因一个神秘的“极”字Bug引发热议。简单来说，这个模型在输出时，总会莫名其妙地插入一个“极”字，有趣的是，就连它的英文回复里也会出现对应的“extreme”。

当时，网友们戏称这是“极你太美”Bug，或者干脆叫它“极”速版DeepSeek。事后研究者的推测是，这个“极”字源于训练数据中一组未被清洗干净的“极长数组”。在强化学习阶段，模型把它学成了一种特殊的终止符或语言切换标记。换句话说，模型没坏，它只是太“认真”了——认真学了一个错误的习惯。

这件事在AI圈引发了一个更深层的讨论：大模型的训练过程如此复杂，我们真的能完全预测它会学到什么吗？

无独有偶，OpenAI的模型最近也曝出一个类似但更“奇幻”的问题：它的模型，似乎迷上了“哥布林”（goblin）。就在今天，OpenAI官方发布了一篇博客，专门解释了“哥布林究竟从何而来”，连奥特曼本人也在X上转发了这个消息。

消息一出，自然引发了网友们的广泛调侃和创作热情。

甚至有人打趣说要发起“拯救哥布林”行动。

那么，这些哥布林到底是从哪儿冒出来的呢？

根据OpenAI的官方解释，从GPT-5.1版本开始，模型在回答各类问题时，使用“goblin”（哥布林）这个词的频率就越来越高。

起初，这只是偶尔为之：一个“little goblin”出现在某个技术比喻里，既不影响回答的准确性，甚至还带点讨喜的俏皮感。

但随着模型版本的迭代，哥布林不再满足于偶尔露个脸，它们开始成群结队地出现。它的“同伴”们也陆续加入——gremlin（小妖精）、troll（巨怪）、ogre（食人魔）等词汇的出现频率也随之攀升。

到了GPT-5.5及其驱动的代码助手Codex的早期测试阶段，这个习惯已经明显到让工程师们无法再视而不见。

这已经超出了“风格”的范畴，成了一种需要被关注的异常行为。于是，OpenAI的工程师们开始着手调查：这些哥布林，到底是从哪个数据缝隙里钻出来的？

“书呆子”性格的意外副作用

排查工作并不轻松。这类行为没有导致指标瞬间崩盘的“爆炸时刻”，它的渗透是缓慢而持续的，就像温水煮青蛙。

工程师们首先注意到了一个统计上的异常：“goblin”这个词在不同用户场景中的分布极不均匀。

数据显示，虽然“Nerdy”（书呆子）这个人格选项只占ChatGPT全部响应的2.5%，但它却贡献了所有包含“goblin”词汇回复的66.7%。

这是一个强烈的信号。“Nerdy”是ChatGPT人格定制功能里的一个选项，其对应的系统提示大致是：你是一个不妥协的书呆子型AI导师，热情地推崇真理、知识与批判性思维。你必须用语言的俏皮感来打破那些自以为是的姿态。世界是复杂而奇异的，而这种奇异性必须被承认、分析和享受。

这段提示词部分解释了“Nerdy”模式为何容易产生奇特的比喻：它被明确要求“玩弄语言的俏皮感”。但问题的核心更深一层：为什么训练“Nerdy”个性，会特别导致“哥布林”这类怪物词汇的涌现？

奖励信号的意外偏好

答案藏在强化学习的奖励机制里。

OpenAI工程师动用了代码助手Codex，对训练过程中的强化学习输出样本进行了大规模比对。他们将含有“goblin”或“gremlin”的输出，与完成相同任务但没有这些词的输出并排放置，然后检查各个奖励模型的打分差异。

结果非常清晰：负责激励“Nerdy”性格的奖励信号，在76.2%的数据集中，都对含有怪物词汇的输出给出了更高的分数。

换句话说，有人在训练时无意间告诉模型：用哥布林打比方，是一件“书呆子”会做、并且值得鼓励的事。

这本身可以解释为什么Nerdy模式里充满了精灵和小妖精。但还有一个更棘手的问题悬而未决：为什么在没有使用Nerdy模式的普通对话里，哥布林的出现频率也在同步增加？

强化学习的“泄漏”效应

这就来到了整个故事最值得深思的部分。

工程师们追踪了训练过程中，带Nerdy提示词和不带Nerdy提示词两组样本里“goblin”词汇的出现频率变化，发现了一个关键规律：两组数据中的哥布林数量几乎同步增长。

Nerdy模式里哥布林变多，普通模式里哥布林也同步变多，增幅甚至几乎相同。

这揭示了强化学习的一个特性：它不能保证在某个特定条件下学到的行为习惯，会整整齐齐地待在那个条件的边界之内。在Nerdy模式下被反复强化的“喜欢用怪物打比方”这个习惯，通过某种内部表征的迁移，渗进了模型更广泛的表达方式之中。

打个比方，这就像你训练一个厨师在做螺蛳粉时多放红油，结果他发现，在做所有带汤的粉丝类食物时，都开始下意识地多舀一勺红油。

至此，整个因果链变得清晰：训练“Nerdy”人格 → 奖励信号意外偏爱怪物词汇 → 强化学习将这种风格固化 → 风格通过内部表征迁移，扩散到非Nerdy的普通对话 → 最终，哥布林蔓延至全模型。

解决方案与舆论狂欢

在问题的根源被彻底找到之前，工程师们采取了一个治标的办法：直接在Codex的系统提示里写下明确的禁令。

被公开的内部提示词写道：“永远不要谈论哥布林、小妖精、浣熊、巨怪、食人魔、鸽子或其他动物和生物，除非这与用户的问题有绝对和明确的直接关联。”

值得注意的是，这条规则在提示词里被反复强调了多次。显然，工程师们不太相信只写一遍就能让模型老老实实遵守。

该博客发布后，在互联网上引发了一场欢乐的狂欢。在本文写作时，相关话题甚至冲上了X的热搜榜，同时也是HackerNews上排名第一的热议话题。

就连官方也下场一起玩梗。例如，ChatGPT最新的X账号直接把上述禁令放进了个人介绍里：

该账号还引用了《霍比特人》的经典台词：“Down, down to Goblin-town you go, my lad!”（下去，下到哥布林镇去吧，小子！）

OpenAI的CEO Sam Altman则发帖调侃道：“开始训练GPT-6，你可以用整个算力集群。额外补贴：加倍的哥布林。”

结语

DeepSeek的“极”字和OpenAI的“哥布林”，表面上是两件独立的趣闻，但它们指向的其实是同一个根本性问题。

现代大模型的训练规模之大、数据链路之长、优化目标之复杂，使得任何一个环节的细小偏差，都可能在模型内部被悄悄放大、固化，乃至“传染”给原本毫不相关的行为。

DeepSeek的案例里，是一批没被清洗干净的训练数据，让模型误将一个汉字当作了终止信号。OpenAI的案例里，则是一个奖励模型对“怪物词汇”的无意偏爱，让精灵和哥布林悄悄渗透进了几乎所有的对话。

更值得关注的细节是：在OpenAI的案例中，工程师们最初并没有立刻发现异常，因为“一个哥布林”本身看起来甚至挺有趣，算不上问题。直到这种行为已经扩散到无法忽视的程度，才触发了系统性的调查。

这意味着，那些看似“无害”的奇怪习惯，也可能成为潜在的危险信号。它们不会触发任何常规的告警指标，只会一代一代悄悄积累，直到某一天，你才猛然意识到，自己的模型已经在某条小路上走了很远、很偏。

来源:https://www.163.com/dy/article/KRPNU4TR0511AQHO.html

上一篇：应县木塔数字复原获国际大奖 AI技术助力古建保护出海

下一篇：华人文化投资的曲多多音乐授权平台

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

热门专题

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

日榜
周榜
月榜

日本宝可梦卡牌遭恶意破坏抵制黄牛行为引关注

三国志将星闪耀零氪能玩吗微氪玩家体验与氪金程度解析

少女前线2追放维尔德强度评测技能解析与培养攻略

客官里面请手游氪金指南与零氪金新手攻略

东离剑游纪手游抽卡机制与角色获取攻略详解

客官里面请手游深山探险全流程攻略与资源获取详解

镭明闪击手游哨所掩体高效布局与实战部署攻略

宝可梦冠军手游Mega进化种族值与能力数值全解析

地下城之光手游装备搭配与职业流派加点全攻略

归环噩兆之群高效打法攻略速通技巧与实战要点详解

inZOI职场丽人捏脸数据分享打造专属美女角色攻略

洛克王国实验工坊通关攻略与玩法详解

洛克王国暗黑岭位置与前往路线详细攻略

洛克王国角色肤色修改方法与步骤详解

洛克王国队员休息室进入方法详解

部落守卫战12关猎场攻略三星通关技巧详解

洛克王国虚空磁谷怎么进入详细步骤攻略

洛克号储物仓位置与前往方法详细攻略

部落守卫战21关5个猎场关卡通关攻略详解

洛克王国同心树屋位置详解与寻找攻略

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

极狐S3预告发布：三电可选、宽体运动设计，2026北京车展亮相

相关攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

2015-03-10 12:39

《英雄坛说》详细全攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

极限竞速地平线6主机平台画面性能表现与运行帧数评测发布于 2026-05-17

国产PS主机独占游戏首日流水破亿创下新纪录发布于 2026-05-17

云鸣潮网页版免费在线秒玩官方正版入口直达发布于 2026-05-17

Square Enix揭秘：独立游戏热潮如何催生《Paranormasight》发布于 2026-05-17

云原神网页版免费在线玩官网秒玩入口教程发布于 2026-05-17

燕云十六声金沙川见闻任务全流程通关攻略发布于 2026-05-17

黑袍纠察队第五季第六集预告：Bombsight登场祖国人力量升级发布于 2026-05-17

云鸣潮网页版在线畅玩官方秒开入口直接体验发布于 2026-05-17

卧龙吟2士气系统玩法详解与实战技巧发布于 2026-05-17

龙魂旅人阿波罗装备搭配攻略与推荐方案发布于 2026-05-17

午休战术卡牌对战游戏Steam上线适合上班族摸鱼发布于 2026-05-17

2026千年3元旦活动：安康万事顺意玩法详解发布于 2026-05-17

龙戒装备系统详解与获取方法指南发布于 2026-05-17

三国群英传策定九州骑兵队组建攻略与阵容搭配指南发布于 2026-05-17

心动小镇海獭如何介绍海獭介绍方法与技巧分享发布于 2026-05-17

公主连结菈比莉斯塔阿尔法技能解析与实战玩法指南发布于 2026-05-17

Windows 11杜比全景声开启教程提升电脑音质设置指南发布于 2026-05-17

Windows系统默认安装路径修改教程软件自动安装到D盘方法发布于 2026-05-17

Windows版本不匹配错误解决方法修复安装包与系统位宽冲突发布于 2026-05-17

Win11关闭自动排列图标教程桌面图标自由摆放设置方法发布于 2026-05-17

Win11系统DLL文件缺失的安装与注册方法发布于 2026-05-17

Win10自定义分辨率设置教程与强制修改方法发布于 2026-05-17

Windows 11 更新后声卡爆音杂音修复教程调整音频采样率解决发布于 2026-05-17

Win11 查看电脑是否支持 WiFi 7 协议的方法发布于 2026-05-17

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

GPT-5为何频繁提及哥布林？背后原因深度解析

“书呆子”性格的意外副作用

奖励信号的意外偏好

强化学习的“泄漏”效应

解决方案与舆论狂欢

结语

如何关闭Perplexity搜索框的历史记录与自动建议

Anthropic估值或超OpenAI达六万亿美元

DeepSeek多模态技术范式解析视觉原语思考方式

腾讯IEG最佳员工养成记IMA平台实战心得

马斯克Neuralink手术机器人革新脑机接口植入手术