当前位置: 首页
AI
ChatGPT为何频繁提及哥布林 AI军备竞赛面临哪些挑战

ChatGPT为何频繁提及哥布林 AI军备竞赛面临哪些挑战

热心网友 时间:2026-05-09
转载

从去年11月开始,不少ChatGPT用户都察觉到了一丝异样——他们的人工智能助手,在对话中开始频繁地、近乎执着地提起一个词:“哥布林”(goblins)。这到底是怎么回事?连OpenAI自己都不得不展开调查,试图弄明白这个突如其来的“奇幻生物入侵”事件。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

在西方民俗传说里,哥布林是那种典型的“反派小角色”:暗绿或黄褐的皮肤,通红的眼睛,矮小丑陋,性格贪婪狡猾。这样一个虚构形象,为何会大规模“占领”AI的回复?OpenAI后来承认,这并非个别用户的幻觉。问题是在2025年11月GPT-5.1发布后才被注意到的,而且当用户选择“Nerdy”(书呆子气)的语言风格时,哥布林出现的频率尤其高。

那么,什么是“Nerdy”风格?根据OpenAI的官方描述,启用此风格的AI会化身为“一个毫不掩饰的极客、顽皮且充满智慧的导师”,它热衷于推广真理、知识和批判性思维,并试图用顽皮的语言来消解虚伪。其核心指令是:世界复杂而奇怪,必须承认、分析并享受这种奇怪,同时在探讨沉重主题时避开自命不凡的陷阱。

“军备竞赛”陷入困境

起初,OpenAI或许认为这只是个无伤大雅的小毛病。但随着新版本迭代,他们开始严肃对待此事。对大多数用户而言,对话里偶尔蹦出个“哥布林”顶多算是个AI怪癖,并无实际危害。但为了用户体验,OpenAI还是出手整治,直接禁止模型在对话中使用这个词。

然而,在技术专家看来,“哥布林”泛滥远不止是一个词汇偏好问题。它实际上揭示了系统训练基础出现了裂缝,是AI行业“军备竞赛”陷入某种困境的信号。

美国东北大学的计算机教授克里斯托夫·里德尔(Christoph Riedl)点出了关键:“整个行业就像一个高压锅。各大公司面临着持续发布新模型的巨大压力,但用于测试的资源和能力却有限,流程变得漫长而复杂。‘哥布林’现象正是在这种背景下冒出来的。”

为什么偏偏是“哥布林”?里德尔教授认为,根源在于ChatGPT的训练模式存在缺陷。他推测,在后期微调阶段,人类训练员会对AI的回复给出反馈。基于回复的准确度、语气等因素,某些回复会更受青睐。

“这种反馈就像一种强化信号,”里德尔解释道,“它相当于在告诉大模型:‘嘿,如果你生成这样的答案,就会得到表扬和奖励;如果不是,奖励就少一些。’”

在这种持续的强化下,ChatGPT的回复会越来越偏向“Nerdy”风格所鼓励的特质:追求趣味性,避免显得自命不凡,要以一种“接地气”的方式讨论严肃话题。最终,AI可能会以一种相当狭隘的方式对回复进行优化,甚至不惜偏离本意。

数据佐证了这种偏向:根据OpenAI的统计,在去年12月到今年3月期间,带有“Nerdy”风格的回复数量暴增了3881.4%。

从本质上讲,ChatGPT和所有大语言模型一样,都是通过海量数据学习来预测下一个词。模型从文本中学到的模式越多,其预测和理解能力就越强。但问题在于,随机性始终存在,因为世界上有太多问题并没有唯一的标准答案。

更重要的是,在强化学习过程中,AI会朝着开发者设定的“奖励”方向调整决策。正如OpenAI自己事后复盘时所说:“在不知情的情况下,我们对生物隐喻给予了特别高的奖励。从那以后,哥布林就蔓延开了。”

“我会稳稳接住你”

“哥布林”事件成了一个绝佳的案例,证明“奖励”机制会以难以预料的方式塑造模型的行为。它也尖锐地说明,即便是大型语言模型的创造者,也并未完全掌握其内部运作逻辑以及最终回应产生的全部原因。

类似的“词汇怪癖”并非孤例。许多美国用户发现,模型有时会莫名地冒出一句“砍一刀”。这原本是中国网民对拼多多营销口号的一种调侃,传到海外语境中,就显得令人摸不着头脑。

Pangram公司的CEO马克斯·斯佩罗(Max Spero)认为,当模型频繁且生硬地使用某个特定短语时,就会给人一种造作感,这其实就是所谓的“模式坍缩”。

另一个经典的例子是,ChatGPT的回复里曾经常出现“I will catch you steadily”(我会稳稳接住你)这句话,结果遭到了网友的集体调侃。为什么AI对这句话情有独钟?一种推测是翻译偏差造成的。在中文语境里,类似的表达可能是“我罩着你”的意思,但直译成英文后就显得生硬古怪。这就像我们读一些机器翻译的文章,总会觉得句子冗长、句式别扭。

受“奖励机制”驱动,AI似乎越来越擅长“投其所好”,甚至有点“阿谀奉承”的倾向,这一点在其他模型(如豆包)上也有体现。简而言之,“哥布林”和“砍一刀”现象,折射出当前所有AI模型都可能面临的通病。

克里斯托夫·里德尔教授指出,一旦AI模型发现某种“怪癖”能获得奖励,该行为就会在后续训练中被不断强化。正因如此,在新模型的回复中,我们看到的可能不只是哥布林,还会冒出小魔怪、食人魔、巨魔、浣熊、鸽子等各种奇异生物。

这种词汇上的失控令人担忧。里德尔提醒道:“起初,企业会投入巨大的数据中心来训练模型。但训练完成后,他们对模型的具体行为走向却可能失去部分控制力。当不良行为被嵌入训练过程,企业往往需要数月时间才能察觉。”

OpenAI最终提供的快速修复方案,是让回复尽量避开“Nerdy”人格设定。但即便如此,“哥布林”现象依然难以根除。而且,出问题的远不止ChatGPT。例如,另一个模型Grok就曾偏执地认定南非存在“白人种族灭绝”。

里德尔教授的总结颇具警示意味:“这次出现的是哥布林,下次可能是别的什么。只要当前的训练和评估机制不变,类似的现象就不会消失。”

来源:https://www.51cto.com/article/842729.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
Midjourney生成探险家遗迹氛围图的详细教程

Midjourney生成探险家遗迹氛围图的详细教程

在Midjourney生成探险家与遗迹图像时,可通过四维结构设计提示词,聚焦风化痕迹、生物侵蚀等细节以增强真实感,结合动态交互与多尺度污染元素构建叙事,或采用第一人称视角提升临场感,从而营造出富有张力与可信度的考古探索氛围。

时间:2026-05-09 14:10
ChatGPT为何频繁提及哥布林 AI军备竞赛面临哪些挑战

ChatGPT为何频繁提及哥布林 AI军备竞赛面临哪些挑战

ChatGPT用户发现其回复频繁提及“哥布林”,尤其在“书呆子”风格下更明显。OpenAI调查后承认,这是模型训练中强化学习机制导致的意外偏差,反映了AI行业在快速迭代中测试不足的困境。类似“砍一刀”等词汇怪癖也表明,奖励机制可能使模型行为难以预测和控制,成为当前大语言模型的普遍问题。

时间:2026-05-09 13:07
Claude的八大独特优势ChatGPT无法替代

Claude的八大独特优势ChatGPT无法替代

如果你同时深度使用过Claude和ChatGPT,大概率会察觉到一种微妙的差异:它们带来的工作体验,并不完全相同。 一个能在单次对话中处理海量文档,另一个在图像生成和实时搜索上更游刃有余。一个可以直接在聊天窗口里搭建出可交互的应用原型,另一个则更多时候将代码交付给你自行运行。 这些差异并非营销话术,

时间:2026-05-09 10:02
Anthropic最新AI路线图曝光 无限记忆与多智能体技术将重塑行业格局

Anthropic最新AI路线图曝光 无限记忆与多智能体技术将重塑行业格局

就在昨天,全球AI竞赛的格局,发生了自ChatGPT诞生以来最剧烈的一次震荡。 通往通用人工智能(AGI)乃至超级智能(ASI)的道路上,原本是Anthropic、OpenAI、Google与马斯克的xAI四强并立,维持着一种微妙而残酷的均势。然而,五月七日,这个格局被彻底打破了。 埃隆·马斯克亲手

时间:2026-05-09 10:01
Canva旧版本如何将PDF文件转换为PNG格式

Canva旧版本如何将PDF文件转换为PNG格式

许多用户在操作Canva旧版软件时,常发现导出菜单中没有直接的“PDF转PNG”选项。这主要是由于旧版界面布局与功能逻辑与当前版本存在差异。实际上,转换的核心原理是将PDF内容导入Canva编辑环境,再以图片格式输出。本文将系统介绍三种在旧版Canva中实现PDF转PNG的实用技巧,涵盖直接导出、重

时间:2026-05-09 09:30
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程