谷歌AI摘要频现低级拼写错误大语言模型缺陷难根治

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

谷歌AI摘要频现低级拼写错误大语言模型缺陷难根治

热心网友时间：2026-05-28

转载

来，先分享一个今天最新鲜的网络段子。

5月28日，有用户用“Google”这个单词去测试谷歌的人工智能：其中包含几个字母p？你猜结果如何？谷歌自己给出的答案是——两个。

谷歌 AI 摘要频现低级拼写错误，大语言模型固有缺陷难根治

有趣的是，这并非个例。人工智能摘要（AI Overview）紧接着又声称，“poop”一词里含有一个字母r——这明显与事实不符。此外，“journalism”被它错误拼写为“j-o-u-r-n-a-d-i-s-m”，硬生生多塞了一个字母d。至于美国总统的姓氏？它倒是推测出里面有一个字母p，可实际拼出来的却是“t-r-p-u-m”。

说实话，谷歌这次高调推进搜索改版，将AI摘要推向前台，出现一些纰漏并不令人意外。类似的翻车事件此前早已上演：AI摘要曾引用恶搞帖子，教用户“吃石头”“往披萨上涂胶水”，让人哭笑不得。

谷歌给TechCrunch的邮件声明也非常坦诚：“大语言模型在单词字母计数方面一直存在困难，我们正在努力解决这个具体问题。”

这类低级拼写错误，业内同行早已见怪不怪。驱动聊天机器人及各类文本生成工具的大语言模型，其设计初衷本来就不是为了识别拼写。多年来，科技圈一直流传着一个梗：任何一家公司发布新AI模型，第一件事就是用“strawberry”这个单词去考验它，问问其中到底有几个字母r。结果呢？这些模型能几秒钟写出一套应用程序，能解开困扰数学家几十年的难题，可在拼写这件事上，和幼儿园小朋友几乎半斤八两。

不过，谷歌AI摘要暴露出的问题远不止这些滑稽的拼写梗。上周还出现了一个更离谱的漏洞：用户搜索“disregard”（忽视）时，页面本该给出该词的词典释义，结果AI直接回复了一句“收到。你随时可以提出新指令或问题。”谷歌事后修复了这个漏洞，但层出不穷的拼写错误依然天天刷屏，成了观众喜闻乐见的吐槽素材——因为从根本上讲，这类问题几乎无法根治。

研究人员对此早有解释。人工智能根本不像人类那样，把文字看成由字母和单词组成的单元。绝大多数大语言模型基于Transformer架构搭建，它们处理文本的方式是先将文字拆分成“词元”（token）。不同模型切分词元的粒度各不相同，可能是完整单词、音节，甚至单个字母。人工智能不是靠“读”来理解文本的，它会先把文本转换成数字表征，再根据上下文进行推理分析，最后生成看起来合乎逻辑的回复。

阿尔伯塔大学人工智能研究员、助理教授马修・古兹迪亚尔接受TechCrunch采访时说得非常直白：“大语言模型依托Transformer架构运行，它本质上不是在阅读文本。你输入指令后，内容先被转成编码。比如它认出了单词‘the’，只会对应一个专属编码，却根本无法区分组成这个单词的字母T、H、E。”

说到底，谷歌AI摘要这类大语言模型所依赖的“词元”架构，本身就带着天生的局限。研究人员普遍不看好它能彻底摆平拼写问题。

波士顿东北大学专攻大语言模型可解释性的在读博士谢里丹・福伊希特表示：“对语言模型来说，如何准确定义‘单词’本身就是个难题。即便行业专家能设计出一套完美的词元词汇表，模型大概率还是会继续合并或拆分文本片段。依我看，受这种模糊性的影响，根本不存在绝对完美的词元分词器。”

对研究人员而言，拼写问题其实排不上优先级——大语言模型的核心价值本来就不是拼写。但这些一眼就能看穿的失误，倒是给了我们一个很好的提醒：就算AI有时看起来无所不知、高深莫测，它也远远谈不上完美无缺。面对它给出的结果，别急着崇拜，更别盲目信从——核实，永远是第一道防线。

来源:https://www.ithome.com/0/956/579.htm

上一篇：全民养虾热潮背后的原因与价值解析

下一篇：易控智驾获中国煤炭工业协会科学技术一等奖