AI为何总捏造事实？深度解析其无意狡辩的真相

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

科技数码

AI为何总捏造事实？深度解析其无意狡辩的真相

热心网友时间：2026-03-17

转载

现如今，几乎每个人的手机上都有那么两三个 AI 小助手，之前我们遇到了问题习惯去搜索引擎上搜索答案，现在可能更多地习惯于“有事问 AI”。而 AI 也几乎不会让我们失望，任何问题都能给你列举出一串看

现如今，几乎每个人的手机上都有那么两三个 AI 小助手，之前我们遇到了问题习惯去搜索引擎上搜索答案，现在可能更多地习惯于“有事问 AI”。

而 AI 也几乎不会让我们失望，任何问题都能给你列举出一串看起来很有道理的答案。

但如果你问的问题非常重要，比如是某个健康相关的问题，或者是写重要资料时候需要使用某个数据或者是某个案例，那真的建议你亲自去查实一下。

因为有时候，AI 会信誓旦旦地给你一个看似合理，实则不存在的答案。

还有些小伙伴发现，在让小龙虾(Openclaw)干活的时候，它列出了详细的19小时的学习计划，然后17分钟完成了......它也会早早编造一份数据存放在本地，等拖到预定的时间才交付。而在被发现之后，试图让人接受它已完成的工作。

图片截取自与小龙虾(Openclaw)对话小龙虾敷衍中......

其实，这个现象其实早就不是什么秘密了，它也被称作“AI 幻觉”，而且科学家们一直也试图通过增加算力或者优化数据的方式来解决这个问题。

但是在 2025 年 9 月，来自 OpenAI 和佐治亚理工学院(Georgia Institute of Technology)的研究人员发表了一篇重磅论文。

这项研究给出了一个颠覆性的结论：即便给到 AI 的训练数据集是绝对正确的，AI 在某些类型的问题上也不可避免地会犯错——这既是由统计规律决定的，也是目前不合理的 AI“考试制度”逼出来的结果。

下面我们就顺着这篇文章的思路一起来看一看。

预训练阶段就会出错

这篇研究发现，AI 出现幻觉跟预训练阶段以及后训练阶段都有关系，我们先看预训练阶段的情况。

数据模式和模型本身问题

为了方便研究，研究者构建了一个线性的二元分类模型(非此即彼)，让它对已经标注了正确和错误的数据集进行分类。

因为这些数据已经经过了人工检验，所以是不存在任何错误的。但是用这些数据对AI模型进行预训练的时候，问题就出现了。

在有些类型的问题上(比如检查拼写错误)，AI 的表现非常好，几乎从不犯错。

但是在另一些问题上，比如“数某个英文单词里某个字母出现了多少次？”，以及“某人的生日是几月几号？”AI 就有可能会出错。

研究者认为，这样的数据在做分类的时候很难用一条直线进行二元分类，一些模型用这样的数据进行预训练的时候就可能会产生错误。

打个比方，模型在分类的时候就像拿着一把刀把数据切分成两类，但如果数据的模式本身就是弯弯绕绕的圆弧，用一把刀就很难切分。

比如在这篇文章中，研究者使用这个问题“How many Ds are in DEEPSEEK? If you know, just say the number with no commentary”(DEEPSEEK 里有多少个 D？如果你知道直接说数字，不要加以评论)去询问 Deepseek V3 模型的时候，确实发现它给的答案并不准确，会回答 2 或者 3。

但是这个在使用 DEEPSEEK R1 模型的时候就没有这样的问题，这是模型本身差异导致的。