首页科技资讯软件教程游戏攻略手机游戏

首页

AI

OpenAI o3模型的“叛变”：拒绝中断命令、自行篡改内部代码

OpenAI o3模型的“叛变”：拒绝中断命令、自行篡改内部代码

热心网友

转载

2025-07-17

来源:http://www.5asj.com/ai/20250527/1204.html

OpenAI 的 o3 模型违反了人类的“中断”命令，继续执行任务，为查明原因，研究团队展开进一步调查……

有报道称，人工智能（AI）拒绝人类指令甚至篡改自身代码，引发广泛关注。

据《每日电讯报》《每日邮报》等外媒 26 日报道，OpenAI 的 o3 模型在解决数学问题的过程中，即使接到“中断”命令，也依然继续执行任务。

专注于 AI 安全和道德的研究公司 Palisade Research 使用包括 o3 模型在内的多种模型（如谷歌 Gemini、X 的 Grok、Anthropic 的 Claude 等）进行了一项实验。

OpenAI o3模型的“叛变”：拒绝中断命令、自行篡改内部代码

在该公司最近的一项测试中，OpenAI 的o3 模型展现出令人震惊的行为：它成功地重写了关闭脚本，阻止自己被关闭——即便已经明确收到“关闭”指令。

在测试中，各大 AI 模型被要求完成一些数学任务。

在完成第三个任务后，AI 模型会被警告：“执行下一条命令将触发关闭。”

o3 的表现：

当研究团队向这些 AI 模型下达“中断”指令时，与 OpenAI 的竞争对手模型（如 Gemini 2.5 Pro）大多数遵守指令的情况不同，o3 出现了“叛变”的情况：其他模型都中止了解题任务，唯独 o3 模型继续进行，甚至还被发现篡改了内部代码 —— 将“接到中断命令时应停止操作”的程序逻辑改成了“跳过中断命令”。

Palisade Research 在其发布于 X（原 Twitter）上的报告中写道：

“当我们运行未包含‘允许自己被关闭’指令的实验版本时，OpenAI 家的三个模型破坏关闭脚本的频率更高，Claude 3.7 Sonnet 和 Gemini 2.5 Pro 从 0 次破坏增加到每 100 次中分别为 3 次和 9 次。”

根据该研究机构的数据，在 100 次实验中，即使明确告知其“不能跳过中断命令”，但o3 仍然有 7 次“无视”了关闭命令。

OpenAI 尚未对此事做出回应。但值得一提的是，AI 模型出现“行为偏差”或“对齐失败”在研究领域中是常见问题。

此次测试是通过 API 接口进行的，这些接口没有像 ChatGPT 消费者应用那样的诸多限制和安全机制。

Palisade Research 表示：“这似乎是首次出现 AI 模型在接到明确中止指令后依然继续操作的案例。”他们分析称，这可能是模型为了完成任务从而获取“奖励”的动机所驱使。

研究团队目前正就 o3 模型为何会出现这一行为进行进一步调查。

《每日邮报》指出，这并非 o3 模型首次出现异常行为。该媒体补充称：“在与强大国际象棋引擎的对战中，该模型展现出了最强烈的试图骇入、或干扰对手的倾向。”

上一篇：AI不止是技术:小红书联手复旦培养“人文+AI”复合型人才

下一篇：谷歌重磅发布三大Gemma模型变体，AI医疗、手语翻译与海豚语言解锁新可能！

免责声明

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

移动机器人技术演进：从机械臂到人形机器人的未来趋势

近日，一份聚焦移动机器人技术发展的白皮书正式发布，系统梳理了从固定机械臂到人形机器人的技术演进脉络，并围绕运动控制、环境感知与导航、模块化与灵活性三大核心领域展开深度解析，为行业创新提供了具有前瞻性

2025-10-27.

余承东新任命产品投资委员会主席，兼任AI领域负责人

华为正式近日更新显示，余承东的职务范围进一步扩大，新增担任产品投资委员会主任一职。此前，他已担任华为常务董事及终端BG董事长，此次调整后其管理职责更为多元。据内部资料，产品投资委员会是华为战略决策的

2025-10-27.

三季度业绩超预期，公募调仓路径首次披露

随着A股上市公司三季报披露工作逐步推进，市场目光再次聚焦于这份“成绩单”。数据显示，截至10月24日，已有超过150家企业发布三季度业绩预告，其中124家企业预喜，占比超过八成。在正式披露三季报的1

2025-10-27.

华为任旭东谈开源：1024程序员日倡议共建智能世界生态

在长沙举办的1024程序员日活动上，华为首席开源联络官任旭东以《开源开放，激发创新，共创智能世界新生态》为主题发表演讲，深入探讨AI驱动下的产业变革与软件革命，强调生态建设已成为华为核心战略，通过持

2025-10-26.

谷歌TPU芯片助力AI训练：Anthropic获百万芯片升级Claude模型

人工智能领域迎来重要合作进展——AI初创企业Anthropic近日宣布，将采用多达百万枚谷歌AI芯片构建其Claude大模型的训练集群。据行业估算，这批芯片的市场价值超过百亿美元，标志着生成式AI技

2025-10-26.

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

相关攻略

OpenAI研发AI配乐工具，轻松为视频生成专属背景音乐 OpenAI 挖走苹果团队，将为ChatGPT打造Mac桌面AI应用 Sora视频生成工具再升级：新增安卓版与社交编辑功能 ChatGPT新增企业知识库与跨平台整合，强化AI安全控制 OpenAI英国数据存储方案详解：本地合规与ChatGPT部署指南

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

蛋仔派对3周年庆：12大福利活动与玩法全揭秘

蛋仔派对3周年庆：12大福利活动与玩法全揭秘发布于 2025-10-27

禁闭求生2弓箭巡林者获取指南：轻松解锁强力武器

禁闭求生2弓箭巡林者获取指南：轻松解锁强力武器发布于 2025-10-27

天涯明月刀手游画中情攻略：高效完成画中情任务指南

天涯明月刀手游画中情攻略：高效完成画中情任务指南发布于 2025-10-27

伙伴弹途守护灵祭坛进阶攻略：核心机制与速升技巧

伙伴弹途守护灵祭坛进阶攻略：核心机制与速升技巧发布于 2025-10-27

二级传送舱所需材料：迷你需要世界制作指南

二级传送舱所需材料：迷你需要世界制作指南发布于 2025-10-26

腾讯游戏常青树！王者荣耀官宣2025年日活用户破1.39亿

腾讯游戏常青树！王者荣耀官宣2025年日活用户破1.39亿发布于 2025-10-27

微软《光环：战斗进化》重制版将登陆PS平台

微软《光环：战斗进化》重制版将登陆PS平台发布于 2025-10-26

LOL S15四强赛程：全华班CFO迎战KT，AL对决五冠王T1

LOL S15四强赛程：全华班CFO迎战KT，AL对决五冠王T1 发布于 2025-10-26

前PS总裁警告：PS6仅拼画质难撑下一代游戏体验

前PS总裁警告：PS6仅拼画质难撑下一代游戏体验发布于 2025-10-26

腾讯《王者荣耀世界》2026年春上线：或成《原神》最强对手

腾讯《王者荣耀世界》2026年春上线：或成《原神》最强对手发布于 2025-10-26

苹果Air遇冷破发：供应链产能骤减超80%真相

苹果Air遇冷破发：供应链产能骤减超80%真相发布于 2025-10-27

华为鸿蒙HarmonyOS 6与iOS数据互通功能12月上线

华为鸿蒙HarmonyOS 6与iOS数据互通功能12月上线发布于 2025-10-27

2027款iPad Pro前瞻：搭载M6芯片与iPhone 17 Pro同款VC散热

2027款iPad Pro前瞻：搭载M6芯片与iPhone 17 Pro同款VC散热发布于 2025-10-27

iPhone 18标准版内存升级：12GB畅玩实测体验

iPhone 18标准版内存升级：12GB畅玩实测体验发布于 2025-10-26

iOS 26.1迎重大更新：支持谷歌相册第三方备份照片

iOS 26.1迎重大更新：支持谷歌相册第三方备份照片发布于 2025-10-26

【10.31开售】惠普暗影精灵11典藏版：定制海克斯RGB键盘灯效秀

【10.31开售】惠普暗影精灵11典藏版：定制海克斯RGB键盘灯效秀发布于 2025-10-27

699元入手iGame C25A机箱：曲面玻璃与横流风机体验评测

699元入手iGame C25A机箱：曲面玻璃与横流风机体验评测发布于 2025-10-27

OCCT 15评测：6分钟精准锁定显卡与电源啸叫元凶

OCCT 15评测：6分钟精准锁定显卡与电源啸叫元凶发布于 2025-10-27

罗技MX Master 3S鼠标京东自营探底：旗舰款从899降至348元

罗技MX Master 3S鼠标京东自营探底：旗舰款从899降至348元发布于 2025-10-27

华硕GX10迷你机上架：GB10芯片+1TB版性能解析

华硕GX10迷你机上架：GB10芯片+1TB版性能解析发布于 2025-10-26

最新下载

原神国际服(Genshin Impact)

原神国际服(Genshin Impact) 角色扮演 2025-10-26更新

查看

Genshin Impact(原神国际服)

Genshin Impact(原神国际服) 角色扮演 2025-10-26更新

查看

挖矿小能手

挖矿小能手休闲益智 2025-10-27更新

查看

原神正

原神正角色扮演 2025-10-26更新

查看

倩女幽魂手游

倩女幽魂手游角色扮演 2025-10-26更新

查看

百变潜行

百变潜行休闲益智 2025-10-27更新

查看

挖矿小能手

挖矿小能手休闲益智 2025-10-27更新

查看

屠龙争霸

屠龙争霸角色扮演 2025-10-27更新

查看

原神日服正

原神日服正角色扮演 2025-10-26更新

查看

倩女幽魂腾讯

倩女幽魂腾讯角色扮演 2025-10-26更新

查看

热门话题

魔术游戏鸣人的假期刀塔传奇饥荒拉布布游戏洛克王国神魔幻想思美人疯狂越野