当前位置: 首页
AI
NeurIPS论文造假曝光,揭秘AI研究员如何伪造开源项目

NeurIPS论文造假曝光,揭秘AI研究员如何伪造开源项目

热心网友 时间:2026-02-04
转载

闻乐 发自 凹非寺
量子位 | 公众号 QbitAI

较真还得是程序员。

2025已经过去,2026已经到了……但也有较真的科研、程序员,决定站出来整治一下业内的不正之风。

啥事儿呢?

AI学术界的假开源问题。

就是发论文的时候说开源,还像模像样挂了GitHub链接,结果后来就没有后来了。

这不,一位匿名AI研究员,直接拿着AI领域最顶的NeurIPS 2024来检验,看看那些被接收的论文,白纸黑字写上了开源的项目,最后究竟有多少是兑现了的。

不统计不知道,一查锤出大窟窿了——



从NeurIPS 2024收录的4035篇论文数据来看,其中真实开源的论文有2404篇;

除了没有提供链接的1533篇之外,有98篇论文明确表示了开源,也给出了链接,结果代码仓库点进去不是烂尾就是待建状态。

当然,可能也有错漏,因为这个工作是AI来查的。

但这个“项目”,堪称对事也对人了,有图有真相,有统计有数据,指名道姓把单位都放上了……

太太太刺激了。

较真的AI研究员

据说一切的一切,是因为这位程序员怀着学习之心点开开源链接,结果被一个又一个404和“Code coming soon”浪费时间,直接怒了。

于是,当他再次被空仓库摆了一道之后,终于决定不忍了。

直接扒了一遍NeurIPS 2024这个已经结束了一年多的AI领域顶会,截至目前还没填上坑的,Coming Soon大概率也已经是Coming Never了。



用来爬代码仓库的系统只用了一个晚上就Vibe Coding出来。

作者表示,在Agentic AI崛起的时代,深度核查学术诚信的成本将趋近于零,谁脚踏实地,谁投机取巧,在大数据下一览无余

用来核查的AI系统融合了OpenReview/GitHub API以及PDF解析技术,也就是说,直接从论文PDF上查地址,然后一个个去验证这个链接里到底有没有真东西。

当然了,这位研究员也强调了,系统基于自动化爬取与启发式逻辑,难免存在误判(假阳性/假阴性)。统计结果仅供参考,还请自行核验。

从检索的结果来看,这份检索数据公开了各个机构(横轴)的论文录用数量、真实开源数量、未标明链接文章数和最重磅的假开源数。



以及,98份明确承诺开源,挂了代码地址,链接里却只有空仓库的假开源名单,把学术鸽王们真实了一波。



看完之后只能说震惊,麻了,真麻了……

会议结束已经一年多,这些Coming Soon为啥就成了Coming Never呢?

为啥出现这种“假开源”?

直接原因还是审稿。

从2024年起,NeurIPS等顶会强制要求填写可复现性检查表(Reproducibility Checklist);

2024年的要求更严格,不光要填的内容更细,连没法开源的理由也得写明白,这些因素都会直接影响论文审稿打分。

在这种机制下,勾选“愿意开源”几乎成了录用的潜规则加分项,代码仓库里的Coming Soon也开始盛行起来。

顶会虽然强制提交Checklist,但均不强制验证可复现性,于是不免有一些模糊空间。



当然,现实情况可能也比纯粹的偷懒更复杂。

有些来自工业界的论文,代码发布需要经过漫长的合规审批流程,于是团队干脆先往仓库里丢个占位符,给idea占坑;

还有一些项目复现门槛太高,训练一次烧几百块卡,用的数据可能还是内部的,基本上没人能跑通,反而会引来复现质疑,索性也就不放了;

再加上一些人生意外,比如课题组转向或者专利卡壳,许多本能放出来的代码,最终也都不了了之……

其实,代码仓库放鸽子这事儿也不只是私下牢骚,前Stability AI研究总监Tanishq Mathew Abraham就直接公开diss过这种现象。



不少网友也苦空仓库久矣。



况且AI圈里还有卡帕西大神这样的开源模范,论文一出代码立刻跟上,甚至还能顺便出个保姆级视频教程。

正因如此,难怪大家看多了404和Coming Soon之后会破防。



One More Thing

这个AI研究员匿名留言说:

“没时间”永远不是违背承诺的借口。若无力开源,便不该在论文中画饼。
菜不是原罪;但当贪欲超出了能力的边界,迫使你献祭学术道德来换取虚名时,这就是罪。
我不是针对谁,只想给圈子提个醒。

AI领域如今飞速发展,各种新想法新技术新产品层出不穷,但科研诚信或许是最该被“Fork”和“Star”的东西。

由于打击面太具体,也不符合作者初衷,完整名单和链接我们就不公开了吧…

希望AI研究都越来越好。

— 完 —

来源:https://www.163.com/dy/article/KKUBP4IJ0511DSSR.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
大模型与CodeQL代码审计解决方案、技术栈及前沿方向分析

大模型与CodeQL代码审计解决方案、技术栈及前沿方向分析

代码审计的格局,正在被大模型悄然重塑。从最初的辅助分析,到如今的规则自主生成、告警智能过滤,乃至专用模型的构建,大型语言模型(LLM)与CodeQL这类传统静态分析工具的结合,正变得前所未有的紧密和高效。 引言 随着软件系统日益复杂,安全漏洞的检测与修复已成为开发过程中的核心挑战。以CodeQL为代

时间:2026-05-16 21:29
AI全栈开发实践:基于Harness与SDD的多仓库管理模式详解

AI全栈开发实践:基于Harness与SDD的多仓库管理模式详解

Harness思维的核心,是引导AI基于现有范例进行模仿与复刻,而非要求其进行无约束的自由创造。这就像指导一位新同事时,最有效的方式是明确指示:“请参考隔壁团队已上线的XX模块,按照其代码风格和架构实现一个类似功能”,而不是模糊地说“你来处理一下”。前者能显著提升产出代码与团队既有规范和项目整体风格

时间:2026-05-16 21:29
Claude 迁移至 Codex 技能编排实践与经验总结

Claude 迁移至 Codex 技能编排实践与经验总结

从Claude迁移到Codex,本应是一次平滑的技术切换,却意外演变成一场关于智能体工作流实战的深度逻辑考验。这背后揭示的行业趋势,远比一次简单的模型选型更值得深入探讨。 在AI工程实践中,我们常有一种误解:只要大模型足够强大,就能自动理解开发者的复杂意图。然而,当你在生产环境中部署一个多阶段、有状

时间:2026-05-16 21:28
包车收费模式转变从成果付费到用量付费引争议

包车收费模式转变从成果付费到用量付费引争议

曾几何时,我们乐观地认为,AI将沿着成熟SaaS的价值路径演进,最终实现公平合理的按效果付费。如今看来,这一愿景已然破灭。当AI行业发现自己无法复制SaaS那套稳固的商业模式基础时,便果断放弃了最初的承诺,转而投身于另一个早已预设好的商业轨道。 近期的行业动态,想必大家已有感知。多家头部AI公司相继

时间:2026-05-16 21:28
马斯克宣布xAI并入SpaceX并更名为SpaceXAI

马斯克宣布xAI并入SpaceX并更名为SpaceXAI

今天科技界迎来重磅战略调整。埃隆·马斯克在其社交平台X上正式宣布,旗下人工智能公司xAI将结束独立运营,全面整合进入SpaceX体系,并更名为SpaceXAI。这一举措标志着AI与航天技术的深度融合迈出关键一步。 此次决策源于马斯克对人工智能未来发展的核心判断。他认为,当前地面数据中心面临日益严峻的

时间:2026-05-16 21:28
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程