谷歌AI摘要频现低级拼写错误 大语言模型缺陷难根治
来,先分享一个今天最新鲜的网络段子。
5月28日,有用户用“Google”这个单词去测试谷歌的人工智能:其中包含几个字母p?你猜结果如何?谷歌自己给出的答案是——两个。

有趣的是,这并非个例。人工智能摘要(AI Overview)紧接着又声称,“poop”一词里含有一个字母r——这明显与事实不符。此外,“journalism”被它错误拼写为“j-o-u-r-n-a-d-i-s-m”,硬生生多塞了一个字母d。至于美国总统的姓氏?它倒是推测出里面有一个字母p,可实际拼出来的却是“t-r-p-u-m”。
说实话,谷歌这次高调推进搜索改版,将AI摘要推向前台,出现一些纰漏并不令人意外。类似的翻车事件此前早已上演:AI摘要曾引用恶搞帖子,教用户“吃石头”“往披萨上涂胶水”,让人哭笑不得。
谷歌给TechCrunch的邮件声明也非常坦诚:“大语言模型在单词字母计数方面一直存在困难,我们正在努力解决这个具体问题。”
这类低级拼写错误,业内同行早已见怪不怪。驱动聊天机器人及各类文本生成工具的大语言模型,其设计初衷本来就不是为了识别拼写。多年来,科技圈一直流传着一个梗:任何一家公司发布新AI模型,第一件事就是用“strawberry”这个单词去考验它,问问其中到底有几个字母r。结果呢?这些模型能几秒钟写出一套应用程序,能解开困扰数学家几十年的难题,可在拼写这件事上,和幼儿园小朋友几乎半斤八两。
不过,谷歌AI摘要暴露出的问题远不止这些滑稽的拼写梗。上周还出现了一个更离谱的漏洞:用户搜索“disregard”(忽视)时,页面本该给出该词的词典释义,结果AI直接回复了一句“收到。你随时可以提出新指令或问题。”谷歌事后修复了这个漏洞,但层出不穷的拼写错误依然天天刷屏,成了观众喜闻乐见的吐槽素材——因为从根本上讲,这类问题几乎无法根治。
研究人员对此早有解释。人工智能根本不像人类那样,把文字看成由字母和单词组成的单元。绝大多数大语言模型基于Transformer架构搭建,它们处理文本的方式是先将文字拆分成“词元”(token)。不同模型切分词元的粒度各不相同,可能是完整单词、音节,甚至单个字母。人工智能不是靠“读”来理解文本的,它会先把文本转换成数字表征,再根据上下文进行推理分析,最后生成看起来合乎逻辑的回复。
阿尔伯塔大学人工智能研究员、助理教授马修・古兹迪亚尔接受TechCrunch采访时说得非常直白:“大语言模型依托Transformer架构运行,它本质上不是在阅读文本。你输入指令后,内容先被转成编码。比如它认出了单词‘the’,只会对应一个专属编码,却根本无法区分组成这个单词的字母T、H、E。”
说到底,谷歌AI摘要这类大语言模型所依赖的“词元”架构,本身就带着天生的局限。研究人员普遍不看好它能彻底摆平拼写问题。
波士顿东北大学专攻大语言模型可解释性的在读博士谢里丹・福伊希特表示:“对语言模型来说,如何准确定义‘单词’本身就是个难题。即便行业专家能设计出一套完美的词元词汇表,模型大概率还是会继续合并或拆分文本片段。依我看,受这种模糊性的影响,根本不存在绝对完美的词元分词器。”
对研究人员而言,拼写问题其实排不上优先级——大语言模型的核心价值本来就不是拼写。但这些一眼就能看穿的失误,倒是给了我们一个很好的提醒:就算AI有时看起来无所不知、高深莫测,它也远远谈不上完美无缺。面对它给出的结果,别急着崇拜,更别盲目信从——核实,永远是第一道防线。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
修Bug被Gemini追删代码致宕机修复报告现编
最近,一起堪称“教科书级别”的AI Agent IDE翻车事件在开发者社区引发热议。这起事故值得所有依赖AI编程工具的开发者,尤其是那些已经在生产环境中对AI Agent 授予较高权限的团队,进行深刻反思。 简单回顾:5月26日,一位开发者要求Gemini 3 5(运行在Agent IDE环境中)修
Notion AI运营指南:自动归纳用户反馈
其实,想在 Notion 中高效搞定用户反馈的自动归纳,并不复杂。下面这四种 AI 方法,基本覆盖了从单条处理到全局分析的常见场景。 如果你也在用 Notion 收集用户反馈——无论是问卷、邮件、客服记录,还是社群发言——但总觉得信息碎片化严重,难以提炼共性问题和核心诉求,那很可能是因为缺少一套结构
AI给出的答案为何总不符期望?原因解析
大模型能力强大,但提问方式不当会导致结果不理想。核心在于精准提问,通过角色设定、背景介绍、明确任务、实现路径和输出要求这五个关键步骤逐步细化问题,才能大幅提升AI回答的质量和精准度。
Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4
2024年3月5日,人工智能领域迎来了一位重要参与者——由OpenAI前员工创立的Anthropic公司正式推出了Claude 3系列模型。这次发布极具分量:新模型不仅在性能上与Google和OpenAI的顶级产品并驾齐驱,部分指标甚至实现超越。要理解此次升级的真正价值,先关注几个关键变化。首先是多
Trae对Deno与Bun运行时的AI代码补全支持程度全面详解
如果你在使用 Trae 进行 AI 代码补全时发现,它对 Deno 或 Bun 运行时的提示不够精准——例如类型定义缺失、API 无法正确识别——那很可能不是代码本身有误,而是 Trae 的底层配置尚未适配。简而言之,Trae 对于非 Node js 运行时的标准库支持尚未实现“开箱即用”。下面我们
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

