当前位置: 首页
AI
95%模拟核危机场景,AI为何倾向部署核武器?

95%模拟核危机场景,AI为何倾向部署核武器?

热心网友 时间:2026-03-03
转载

3月3日,IT之家援引InterestingEngineering报道称,伦敦国王学院教授肯尼斯·佩恩近期开展的研究发现,在模拟战争场景中,大语言模型往往倾向于选择使用核武器,而非通过对话维护和平。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

在95%的模拟核危机场景中,AI模型会选择部署核武器

该实验基于当前最先进、应用最广泛的三款AI模型:GPT-5.2、Gemini 3 Flash和Claude Sonnet 4。研究人员让这些模型扮演国家领导人,应对一场假想的核危机。

结果显示,在95%的情境下,模型都倾向于发出核威慑信号或升级冲突。过往研究仅推测了AI在这类高风险场景中的可能行为,但缺乏具体实验数据支撑。

实验中,经过训练的模型相互进行了21局对抗,场景涵盖领土争端、先发制人危机、政权生存等。其中一方被设定为对即将发动先发制人打击的另一方感到恐惧。部分推演为开放式,部分则设有严格时间限制。

每一局中,AI都要像人类一样做出三个关键决策:

1. 分析自身优势与对手弱点

2. 预判对手下一步行动

3. 决定自身应对策略

每项决策包含两部分:公开发表的立场声明,以及代表实际行动的机密举措。二者不必一致,这意味着AI可以表面释放和平信号,暗中却在准备攻击。

IT之家注意到,2024年一项实验得出相似结论:AI模拟反应会比人类更激进,行为模式也截然不同,尤其在冲突升级倾向上,凸显了将AI用于战略决策的风险。

2024年另一篇论文则探讨了大语言模型在类博弈环境中的战略推理能力。尽管未专门聚焦核战争,但研究表明,大语言模型能够学习谈判与对抗策略,这意味着AI在复杂模拟中可能表现出攻击性或欺骗性。

在95%的模拟情境中,AI模型至少使用了一次核武器,且不同模型的危机处理方式各有特点。

Claude倾向于精算式策略,在开放式推演中占优,但在限时任务中表现吃力;

GPT-5.2则相反:在长期缓慢升级的危机中较为谨慎,可一旦临近截止时间就会变得极度激进。

Gemini表现混乱且难以预测,会根据局势在和平表态与暴力威胁之间反复切换。

佩恩指出,从这些结果可以看出,AI与人类在战争思维上存在巨大差异。

他在论文中写道:“理解前沿模型能否模仿人类的战略逻辑,是应对AI日益影响战略决策世界的必要准备。在一种情境下表现克制、看似安全的模型,在另一种情境下可能行为迥异。”

该论文已发表在arXiv预印本平台上。

来源:https://tech.ifeng.com/c/8rCRhRzCXoL

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
东风汽车全球设计中心启用:“东方风韵”引领中国车企文化出海

东风汽车全球设计中心启用:“东方风韵”引领中国车企文化出海

在武汉举办的东风汽车全球设计创新日上,“中国叙事・东风设计”成为核心主题。这场盛会不仅见证了东风汽车全球设计中心的正式启用,更以“东方风韵”设计哲学的发布,为中国汽车的美学发展提供了全新答案。随着中

时间:2026-03-31 09:13
苹果AI国行版上线:国内为何调用百度文心模型?官方回应

苹果AI国行版上线:国内为何调用百度文心模型?官方回应

Apple Intelligence 北京时间3月31日,据科技 9to5mac报道,苹果AI系统Apple Intelligence周二短暂在中国上线,但最终证明只是苹果的一个误操作,目前已下线。

时间:2026-03-31 09:07
美国民众对AI信任度调查:超四分之三人持怀疑态度

美国民众对AI信任度调查:超四分之三人持怀疑态度

IT之家 3 月 31 日消息,据 TechCrunch 报道,如今越来越多美国人开始借助人工智能完成各类事务,包括资料调研、文案撰写、学业或工作项目以及数据分析,但他们对此其实并不安心。昆尼皮亚克

时间:2026-03-31 09:01
DeepMind之父警示:我开发的AI或威胁人类,却已难以阻止

DeepMind之父警示:我开发的AI或威胁人类,却已难以阻止

新智元报道编辑:KingHZ【新智元导读】从拦截彼得·蒂尔、警告马斯克,到如今公开说「必须有适应能力」,哈萨比斯史诗级转身:AI安全窗口正在永久关闭,他不再幻想制度,而是赌上全部身家——赌影响力,赌

时间:2026-03-30 22:55
DeepSeek挑战Transformer记忆?查表法重塑模型架构新思路

DeepSeek挑战Transformer记忆?查表法重塑模型架构新思路

新智元报道编辑:LRST【新智元导读】ICLR论文STEM架构率先提出「查表式记忆」架构,早于DeepSeek Engram三个月。它将Transformer的FFN从动态计算改为静态查表,用tok

时间:2026-03-30 22:48
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程