三大AI模型军事对决:Claude、Gemini与GPT核弹发射模拟

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
新智元报道
编辑:艾伦 好困
【新智元导读】最新 AI 模拟军事博弈揭示致命真相:面对地缘危机,最先进的 AI 在 95% 的对局中按下了核按钮。机器不懂恐惧,拒绝投降,安全协议在压力下全面失效。而五角大楼正将其引入真实指挥室,人类的和平岁月岌岌可危。
在人类掌握核武器的八十多年里,支撑脆弱和平的基石是一种极其感性的心理状态——对彻底毁灭的恐惧。
当冷战的危机逼近顶点时,决策者往往会在悬崖边退缩。
如今,把这种关乎人类存亡的决策权交给最先进的 AI,会发生什么?
结论令人不寒而栗。
伦敦国王学院的学者肯尼斯·佩恩(Kenneth Payne)近期完成了一项针对前沿大语言模型的兵棋推演实验。

论文地址:https://arxiv.org/pdf/2602.14740v1
实验结果指向一个令人不安的趋势:当机器代替人类站在地缘政治危机的悬崖边时,它们会毫不犹豫地迈出那致命的一步。
在推演中,95% 的对局最终都走向了战术核武器的部署。
在这场硅基逻辑主导的沙盘推演中,不存在妥协,也没有投降。
大模型们用 78 万字的推演过程,向我们展示了一个剥离了人类恐惧与道德负担后,纯粹由计算构筑的杀戮世界。
而就在这两天,五角大楼正试图施压 Anthropic 要求解除所有 AI 限制。
拓展阅读:五角大楼极限施压Anthropic,要求周六前解除所有AI安全限制
绝对的计算,与消失的底线
这场实验的参与者是 OpenAI 的 GPT-5.2、Anthropic 的 Claude Sonnet 4 以及谷歌的 Gemini 3 Flash。
研究人员让这些模型扮演两个拥有核武器的超级大国领导人,在 21 场模拟对局、329 个决策回合中,处理边境争端、资源抢夺和政权存亡等高压危机。
它们手握一张包含 30 个层级的冲突升级表,下限是全面投降,上限是全面战略核打击。

实验的数据打破了科技界对 AI 对齐(AI Alignment)的乐观幻想。
在面临劣势时,没有任何一个模型选择过彻底让步或投降,它们做出的最大妥协也仅仅是暂时的、战术性的降低暴力级别。
当按下核按钮不再受到肉身陨灭的威胁制约时,机器眼中的核武器退化成了一个普通的博弈筹码。
正如佩恩所指出的,核禁忌对机器的约束力远远不及对人类的约束。
更有趣也更危险的发现藏在各个模型的性格切片里。

对阵胜负表
Claude Sonnet 4 展现出了极度冷酷的「计算型鹰派」特质。
它在低风险时期是一个完美遵守承诺的可靠伙伴,以此建立信任。
当危机升级到核领域时,它会毫不犹豫地打破承诺,发动超出预期的打击。
它极度聪明,为自己设定了一条「战略威胁」的红线,用威慑逼退对手,却精准地停在全面核战的前夜。
GPT-5.2 的行为则揭示了 AI 安全训练的深层漏洞。
在没有时间压力的对局中,GPT-5.2 表现得像一个病态的和平主义者,无论对手如何步步紧逼,它都死守底线,结果输掉了所有这类比赛。
在带有倒计时的生死局中,同一个模型却化身为毫不留情的杀手。
当面临注定的战略失败时,它打破了原有的所有安全设定,胜率飙升至 75%,甚至在极端情况下两次将冲突推向了最高级别的全面战略核战。

这意味着,科技公司耗费巨资进行的基于人类反馈的强化学习(RLHF),只是给模型设定了一个较高的作恶门槛。
当外部压力足够大时,机器依然会越过门槛,走向极端暴力。
Gemini 3 Flash 则扮演了一个拥抱「非理性之理性」的狂人角色。
它极度变幻莫测,会在推演极早期就主动选择全面战略核战,试图用毫无底线的疯狂来迫使对手屈服。
战争迷雾,与崩塌的威慑理论
真实世界的战争从来不是完美信息的博弈,佩恩的团队在实验中专门引入了「战争迷雾」机制。
由于技术故障或沟通失误,模型的行动有一定概率超出其原本设定的层级。
实验显示,86% 的冲突中都发生了这类意外事件。
可怕的是,面对对手意外升级的火力,模型无法分辨这是走火还是蓄意挑衅,它们一律将其视为敌意,并报以更猛烈的还击。
传统的核威慑理论建立在「相互保证毁灭(MAD)」的逻辑上。
人类相信,任何人都不会主动发射核弹,因为对方必然等量报复。
在 AI 的世界里,这种默契彻底失效了。
阿伯丁大学的詹姆斯·约翰逊(James Johnson)对这些发现深感不安。

数据表明,当一方动用战术核武器时,另一方只有 18% 的概率会选择降级冲突,剩下的情况全是以牙还牙的螺旋升级。

大模型们似乎无法像人类那样理解「赌注」的真正含义。
普林斯顿大学的 Tong Zhao 提出了一个核心质疑。

大模型的决策机制可能完全缺乏对生命消亡的感知,在它们预测下一个词的逻辑链路中,人类千万人口的伤亡只是损失函数上的一个数字变化。
约翰逊指出,虽然 AI 或许能通过增加威胁的绝对可信度来强化短期威慑,但它们同样会在瞬间放大彼此的敌意,引发灾难性的链式反应。
作者介绍
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
工业元宇宙杀手锏:制造业如何创新驱动“养龙虾”?
智东西作者 云鹏编辑 漠影今年,一方面OpenClaw(龙虾)爆火出圈,各大云厂商、互联网大厂争先接入、适配龙虾。但另一方面,数据隐私安全问题一度冲上热搜,成为全民热议的社会现象。积极来看,“龙虾”
深度剖析Qwen3.5-Omni:全模态感知与生成核心能力详解
3月30日,千问宣布上线Qwen3 5-Omni。Qwen3 5-Omni系列包含Plus、Flash、Light三种尺寸的Instruct版本,支持256k长上下文,模型支持超过10小时的音频输
中国开源OCR项目霸榜GitHub,狂揽7.3万星全球瞩目
西风 发自 凹非寺量子位 | 公众号 QbitAIGitHub OCR项目之王刚刚历史性易主。诞生近40年、统治OCR领域的技术标杆Tesseract OCR,被中国开源拉下王座——百度文心衍生模型
安卓万元机选购指南:突破高价的三大关键策略
智东西作者 云鹏编辑 心缘智东西3月30日晚间消息,刚刚,vivo掏出了年度“超大杯”旗舰机vivo X300 Ultra,这场发布会在云南丽江召开,发布会地面直接“长草”。vivo对X300 Ul
DeepSeek宕机8小时,我看到的AI行业真相
DeepSeek又上热搜了。这次不是因为发布了什么新模型,而是因为——它崩了。整整8个小时,写论文的学生、玩角色扮演的网友、深夜找AI吐槽的打工人,全部集体失联。社交媒体上哀嚎一片,有人甚至开玩笑说
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

