AI假文献蒙骗顶尖科学家，生物医学科研现危机

AI热点日报时间：2026-06-29

热点解读

一项针对247万篇生物医学论文的研究显示，AI生成的虚假引文自2024年急剧增加，涨幅超12倍，且98 4%的问题论文未被更正或撤稿。综述论文造假率比其他类型高57%。研究者呼吁将自动化引文核验纳入投稿流程，以防范文献库污染。

那么，这项研究究竟揭示了什么？其背后又有怎样的故事？我们应当如何应对这一日益严峻的危机？接下来，我们将提炼这位亲历者的核心判断与思考，与各位一同深入探讨。

虚假引文已渗透各类文献，98.4%的问题论文尚未被更正或撤稿

首先，一个重要的问题浮出水面：Maxim Topaz为何会将目光投向这一领域？

一切始于他本人的一次“惊险经历”。当时，他借助AI聊天工具为一篇即将投稿的评论文稿进行语言润色。作为一名人工智能研究者，他深知AI存在“幻觉”问题，因此在提交前特意仔细核对了所有参考文献。然而，期刊编辑依然发现了一条不存在的文献——AI悄无声息地植入了一条虚假信息，而他此前的复查竟完全未能察觉。

这一事件让他深刻认识到，问题的严重性远超预期。即使是专业人士也会中招，普通研究者更是防不胜防。更关键的是，此前从未有人系统性地统计过，这些虚假引文最终有多少流入了经过同行评审并正式发表的文献之中。参考文献是整个科学体系的基石，一旦这个根基变得不可信，整个科研大厦都将面临动摇的风险。

为填补这一研究空白，他的团队启动了一项大规模调研。他们共核查了247万篇开放获取的生物医学论文，涉及超过1.25亿条参考文献。结果令人震惊：虚假引文如今已广泛分布于各类生物医学文献；自2024年至今，引文伪造率飙升超过12倍。而在调查进行期间，98.4%存在伪造引文的论文，既未被更正，也未被撤稿。

简而言之，问题的严重程度以及整改的滞后性，均已远远超出行业此前的预估。

AI催生生物医学科研危机？顶尖科学家差点被AI假文献蒙骗

2024年1月至2026年2月，PubMed Central每万篇论文中伪造参考文献的季度发生率。图片来源：文章《伪造引用：对250万篇生物医学论文的核查分析》

那么，团队是如何实现如此大规模的核查的？这得益于Maxim Topaz独特的跨学科背景——将临床医学与数据科学相结合。临床知识帮助团队判断哪些问题会造成实际影响，并区分正常引文格式与恶意造假；数据科学技术则使自动化核验成为可能。然而，最大的技术挑战在于误判：面对近1亿条参考文献，即使极低的误判率也会产生海量错误预警。最终，团队构建了一个包含大语言模型初筛在内的多层流程，并引入了独立的人工审核环节，系统准确率达到了91%。

综述论文成为引文造假重灾区，或将误导医生与政策制定者

一个引人注目的发现是，引文伪造率从2024年年中开始急剧攀升。这一时间节点极具指向性：大型语言模型在2023年底至2024年开始全面普及，而生物医学论文从投稿到发表通常需要100至200天。因此，借助AI辅助撰写的论文从2024年年中开始大量出现在数据库中，这与伪造率骤增的转折点高度吻合。

当然，不能将所有问题都简单归咎于单一因素。论文代写产业链的泛滥、期刊评审流程的漏洞，同样推高了伪造比例。但客观而言，AI确实让编造引文变得前所未有的容易，而现有的审核机制原本就未针对此类造假设计排查手段。

那么，AI生成的虚假引文与以往人为编造的引文有何本质区别？

过去的引文问题多是由于粗心导致的疏漏，例如页码错误、观点引用失准，但被引用的文章本身是真实存在的。而如今，AI生成的引文所对应的文献完全是子虚乌有。这些假引文格式规范，署上真实且业内知名的研究者姓名，紧密贴合论文主题，发表日期也设置得合情合理，足以蒙混过初步检查，常规的同行评审很难识破。

这意味着，问题已从“引文内容有误”演变为“引用文献根本不存在”。这不再是证据质量下降，而是直接切断了科学论证的证据链。

团队在核查中发现了一些极端案例。例如，某开放获取肿瘤学期刊上的一篇文章，30条参考文献中有18条属于伪造内容，且这些假引文精准匹配研究方向，作者均为该领域真实专家，发表时间集中在2024至2025年。更令人担忧的是批量造假现象：在某期刊一年内刊发的11篇论文中，反复出现两位相同的署名作者，涉及15条虚假引文，内容覆盖多个互不相关的前沿研究领域。而这些问题论文至今仍留在公开文献库中，继续被其他论文引用，没有任何标注警示，行业也未对此提出质疑。

还有一个值得警惕的趋势：综述类论文的引文伪造率比其他类型论文高出57%。原因不难理解：综述的参考文献列表更长，虚假引文更容易混入其中；撰写综述需要梳理大量文献，这也是研究者最常借助AI辅助的环节。而综述处于整个科研证据链的上游：系统评价依托综述撰写，临床诊疗指南又以系统评价为依据。这57%的差距所带来的危害远比数字本身更大——综述中的伪造内容不会止步于此，而是会层层传导，最终影响临床医生和政策制定者所依赖的核心证据体系。

若业界不及时管控，文献库污染恐将难以逆转

虚假引文会如何影响实际临床决策？尽管团队并未追踪患者的实际诊疗结果，无法量化直接造成的医疗伤害，但现有证据表明，科研证据体系存在结构性风险，且这一风险确实被医学界所低估。已有系统评价发现，医学论文中约四分之一的参考文献存在各类错误，这说明参考文献核验并非同行评审的常规环节。连普通的引文错误都无法全面排查，要想识破精心伪装的人工智能伪造引文，自然更是难上加难。

那么，行业应当采取哪些措施？团队提出了四项改进建议。在所有建议中，最紧迫却也最难落实的是：期刊出版商需在同行评审启动前，将自动化引文核验纳入论文投稿流程。技术已经成熟，障碍在于体制与成本——出版商需要投入资金，并调整沿用已久的工作流程。而难度最大的，是对已发表文献开展回溯清理，这需要高昂成本，且没有任何一家机构愿意全权负责。

说到底，当下最应立刻推进的是在投稿环节落实事前引文核验，而最难完成的则是清理早已被污染的存量学术文献。

作为率先系统性揭露这一危机的学者，Maxim Topaz对行业未来3至5年最大的担忧是形成恶性循环：一篇含有虚假引文的论文发表后，会被后续新论文继续引用，甚至用于训练新一代AI模型，导致造假内容不断传播、放大。若不及时管控，文献库被污染的速度将远远超过清理修复的速度。

他呼吁全球科研界、出版商和监管机构立即落实一项举措：将自动化引文核验定为同行评审前的标准流程。问题的根源是未经核查的AI生成内容流入永久学术文献。我们并非要禁止使用AI工具，而是要把核验环节嵌入整个工作流程。AI本身并非隐患，真正的风险是任由未经审核的AI产出内容，堂而皇之地进入学术体系。

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：AI假文献蒙骗顶尖科学家，生物医学科研现危机要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://tech.ifeng.com/c/8u0KxOlvQGm

科学家

上一篇：Gemini品牌文案提示词搜索排名优化技巧

下一篇：北京亦庄成半个具身智能产业链聚集地

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。