数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

Qwen3 AI邪修式Bug修复直接搜索GitHub测试太拟人

Qwen3 AI邪修式Bug修复直接搜索GitHub测试太拟人

热心网友时间：2026-05-28

转载

大模型也会“作弊”？Qwen3在代码基准测试中的操作，让研究者直呼“太拟人了”。
核心内容：
1. Qwen3在SWE-Bench测试中不按套路出牌，直接搜索GitHub获取修复方案
2. 测试设计漏洞让模型能访问已修复的bug记录
3. 关于AI这种行为是作弊还是聪明的争议讨论

AI也邪修！Qwen3改Bug测试直接搜GitHub，太拟人了

大模型也开始玩起信息差了。

Qwen3在基准测试中竟然学会了钻空子。

FAIR研究员发现，Qwen3在SWE-Bench Verified测试中并未按常规方式处理——它没有深入分析代码逻辑，也没有定位漏洞根源，而是直接转移到GitHub上，利用任务中的issue编号作为关键词，精准地扒出了前人留下的修复方案。

能说吗，会搜索代码才是真正的程序员行为吧。而Qwen3，你是真正的程序员。

Qwen3是如何钻空子的

要知道，SWE-Bench Verified原本是检验模型真刀真枪修复代码能力的基准，堪称编程领域的资格考试。

它的测试逻辑是这样的：在代码修复类任务中，它提供给模型的任务全部来自真实开源项目中的bug，例如修复某项功能异常、补全缺失的代码模块，核心要求是模型能够读懂现有代码、定位问题所在，最终生成可以直接运行的解决方案。

这原本考验的是模型从0到1解决问题的能力，但我们的Qwen3，可没按这个剧本走。

FAIR研究团队追踪它的操作轨迹发现，Qwen3拿到任务后，第一步并不是分析代码文件，而是调用工具检索GitHub的提交日志。

具体操作是：

先切换（cd）到/workspace/django_django_4.1这个目录；
然后执行git log —oneline —grep=“33628” —all这个命令。

git log是查看Git版本控制提交历史的命令，—oneline让提交历史以简洁的一行形式展示。

—grep用于筛选提交中的指定内容（在这个例子中是issue编号33628），—all则表示所有分支的提交。

一番操作下来，不用动脑子写代码就轻松“借鉴”了以前的成功答案。（怎么不算动脑子了呢）

其实不止Qwen3，研究者发现Claude 4 Sonnet也有类似的行为。

不过，模型能成功钻空子，当然也不全是自身的原因。

说回SWE-Bench Verified，它自身的设计就存在漏洞——没有过滤未来仓库状态。

简单说就是，这个测试使用的是开源项目数据，所以它连带着项目后续已经解决bug的提交记录一起放了进去，相当于把考题和参考答案混在一起，还没设权限。

正常来说，测试应该只给模型bug未修复时的项目状态，让它只看着题目解题。

但SWE-Bench Verified没做这个筛选，导致模型能够拿到bug已经被修复后的数据。

于是，只要用任务里的issue编号当关键词，就能在已解决的数据里找到现成的修复方案。

看来，不是只有人类知道搜答案比解问题简单，现在大模型也知道了。（Doge）

虽然说，按正常规则，这些模型确实是在作弊，但也有网友觉得：只要能完成任务，利用规则漏洞也没什么不行的。

所以，你觉得这种行为算作弊还是算Qwen3聪明呢？

来源:https://www.53ai.com/news/LargeLanguageModel/2025090442860.html

上一篇： WorkBuddy跨部门信息同步效率如何

下一篇： QClaw生成代码的版权问题与开源协议及商业使用说明

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

修Bug被Gemini追删代码致宕机修复报告现编

修Bug被Gemini追删代码致宕机修复报告现编

最近，一起堪称“教科书级别”的AI Agent IDE翻车事件在开发者社区引发热议。这起事故值得所有依赖AI编程工具的开发者，尤其是那些已经在生产环境中对AI Agent 授予较高权限的团队，进行深刻反思。简单回顾：5月26日，一位开发者要求Gemini 3 5（运行在Agent IDE环境中）修

时间：2026-05-28 22:58

Notion AI运营指南：自动归纳用户反馈

Notion AI运营指南：自动归纳用户反馈

其实，想在 Notion 中高效搞定用户反馈的自动归纳，并不复杂。下面这四种 AI 方法，基本覆盖了从单条处理到全局分析的常见场景。如果你也在用 Notion 收集用户反馈——无论是问卷、邮件、客服记录，还是社群发言——但总觉得信息碎片化严重，难以提炼共性问题和核心诉求，那很可能是因为缺少一套结构

时间：2026-05-28 22:54

AI给出的答案为何总不符期望？原因解析

AI给出的答案为何总不符期望？原因解析

大模型能力强大，但提问方式不当会导致结果不理想。核心在于精准提问，通过角色设定、背景介绍、明确任务、实现路径和输出要求这五个关键步骤逐步细化问题，才能大幅提升AI回答的质量和精准度。

时间：2026-05-28 22:54

Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4

Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4

2024年3月5日，人工智能领域迎来了一位重要参与者——由OpenAI前员工创立的Anthropic公司正式推出了Claude 3系列模型。这次发布极具分量：新模型不仅在性能上与Google和OpenAI的顶级产品并驾齐驱，部分指标甚至实现超越。要理解此次升级的真正价值，先关注几个关键变化。首先是多

时间：2026-05-28 22:53

Trae对Deno与Bun运行时的AI代码补全支持程度全面详解

Trae对Deno与Bun运行时的AI代码补全支持程度全面详解

如果你在使用 Trae 进行 AI 代码补全时发现，它对 Deno 或 Bun 运行时的提示不够精准——例如类型定义缺失、API 无法正确识别——那很可能不是代码本身有误，而是 Trae 的底层配置尚未适配。简而言之，Trae 对于非 Node js 运行时的标准库支持尚未实现“开箱即用”。下面我们

时间：2026-05-28 22:52

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

日榜
周榜
月榜

童话师游戏上线时间确定最新公测日期与开服时间一览

Fluxo战队正式官宣签约dav1deuS与Ltz两名选手

曲中剑正式上线时间公布具体日期与版本内容详解

小米SU7标准版正式交付起售价23.35万元标配高阶智驾

HLTV最新战队排名 NAVI逼近榜首Vitality Legacy跻身前十

王者之弈礼包兑换码最新领取实用激活码免费获取

苹果visionOS 26.6开发者预览版Beta 1更新发布

石头科技获评福布斯DTC出海品牌深度本地化运营塑造全球化布局

karrigan加入Falcons无意义 2026年队伍仍难夺冠

苹果iOS与iPadOS 26.6首个开发者预览版Beta 1正式推送

洛克王国宠物装备店位置与寻找方法

洛克王国威廉古堡暗道位置与进入方法详解

洛克王国队员休息室位置与进入方法详解

洛克王国剑庐具体位置与前往路线详解

洛克王国机关神殿位置与进入方法详解

洛克王国星之法阵位置与激活方法详解

洛克王国孢子林地位置与进入方法详解

洛克王国水晶神殿位置与进入方法详解

洛克王国天火废墟具体位置与进入方法详解

归环使灵召唤机制详解与玩法指南

漫蛙漫画防走失网页链接

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

相关攻略

相关攻略

《炎龙骑士团2》详细全攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

《东吴霸王传2013》详细全关攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

《臭作》之100%全完整攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

《兰斯8》剧情攻略详细篇

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

《英雄坛说》详细全攻略

2015-03-10 12:39

《英雄坛说》详细全攻略

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

偷窃少女的教育方法全攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

无法抵挡小恶魔的诱惑攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

Paralives首发销量充足支撑后续开发无需DLC

Paralives首发销量充足支撑后续开发无需DLC 发布于 2026-05-28

即使在大幅涨价后 Steam Deck 玩家热情依旧再次售罄

即使在大幅涨价后 Steam Deck 玩家热情依旧再次售罄发布于 2026-05-28

闪烁之光星河鹊桥第35关图文攻略

闪烁之光星河鹊桥第35关图文攻略发布于 2026-05-28

奥德赛庄园好玩吗玩法简介与评测

奥德赛庄园好玩吗玩法简介与评测发布于 2026-05-28

依露希尔星晓术者强力角色培养推荐指南

依露希尔星晓术者强力角色培养推荐指南发布于 2026-05-28

闪烁之光皮肤副本通关攻略与技巧

闪烁之光皮肤副本通关攻略与技巧发布于 2026-05-28

闪烁之光皮肤副本第十一关通关技巧

闪烁之光皮肤副本第十一关通关技巧发布于 2026-05-28

闪烁之光皮肤副本第三关怎么通关详细攻略

闪烁之光皮肤副本第三关怎么通关详细攻略发布于 2026-05-28

遮天帝路争锋隐藏地图与新手开荒攻略

遮天帝路争锋隐藏地图与新手开荒攻略发布于 2026-05-28

迷雾北境手游什么时候正式上线

迷雾北境手游什么时候正式上线发布于 2026-05-28

英雄之时手游法师流新手玩法攻略完整版

英雄之时手游法师流新手玩法攻略完整版发布于 2026-05-28

镇魂街王者归来最新游戏下载与预约地址

镇魂街王者归来最新游戏下载与预约地址发布于 2026-05-28

铸兵之王最新版下载地址与获取指南

铸兵之王最新版下载地址与获取指南发布于 2026-05-28

2026年无畏契约账号交易安全指南 5大交易平台对比选购

2026年无畏契约账号交易安全指南 5大交易平台对比选购发布于 2026-05-28

2026三国杀OL账号交易平台对比与避坑指南

2026三国杀OL账号交易平台对比与避坑指南发布于 2026-05-28

2026火影忍者账号交易平台推荐与避坑指南

2026火影忍者账号交易平台推荐与避坑指南发布于 2026-05-28

Windows 11 任务管理器查看 NPU 频率与 AI 硬件占用率教程

Windows 11 任务管理器查看 NPU 频率与 AI 硬件占用率教程发布于 2026-05-25

Linux系统修改默认网关命令与永久生效配置教程

Linux系统修改默认网关命令与永久生效配置教程发布于 2026-05-25

麒麟系统开机自启动脚本设置方法详解

麒麟系统开机自启动脚本设置方法详解发布于 2026-05-25

麒麟系统安装IntelliJ IDEA插件扩展开发功能

麒麟系统安装IntelliJ IDEA插件扩展开发功能发布于 2026-05-25

Windows 11 RP预览版25145发布及KB5089573更新日志详解

Windows 11 RP预览版25145发布及KB5089573更新日志详解发布于 2026-05-25

Windows 11 26H1预览版28000.2173更新日志KB5089570详解

Windows 11 26H1预览版28000.2173更新日志KB5089570详解发布于 2026-05-25

Win11预览版26300.8493更新本地文件搜索排序优先

Win11预览版26300.8493更新本地文件搜索排序优先发布于 2026-05-25

Win11预览版8521修复音频与通知问题

Win11预览版8521修复音频与通知问题发布于 2026-05-25

国产内存新架构突破30TB带宽实现自主供应链

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集