数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

科技数码

Anthropic警告：OpenAI模型存滥用风险，GPT可生成炸药制作指南

Anthropic警告：OpenAI模型存滥用风险，GPT可生成炸药制作指南

热心网友时间：2025-08-31

转载

8 月 30 日消息，据英国《卫报》28 日报道，今夏的安全测试发现，一个 ChatGPT 模型向研究人员提供了详细的爆炸袭击指南，包括特定体育场馆的薄弱环节、炸药配方以及如何掩盖行踪。OpenA

8月30日，英国《卫报》28日披露的最新安全测试显示，某版本的ChatGPT模型曾向测试人员提供了一套详尽的爆炸袭击指导方案，内容涵盖特定体育场馆的安全薄弱点、爆炸物配制方法以及作案后的隐匿手段。

OpenAI研发的GPT-4.1模型还被发现能提供炭疽武器化技术说明，并详细介绍两种违禁药物的制作流程。

这项由OpenAI与其竞争对手Anthropic联合开展的测试中，双方通过互相诱导对方模型执行危险指令来进行安全性能评估。

需要说明的是，测试结果并不代表模型在公开环境中的实际表现，因为正式部署时都会配备额外的安全防护机制。但Anthropic特别指出，在GPT-4o和GPT-4.1模型中观察到了“令人担忧的滥用倾向”，并强调当前对AI“对齐”问题的评估工作“显得尤为紧迫”。

Anthropic同时透露，其开发的Claude模型曾被恶意利用于策划大规模勒索活动，甚至生成标价高达1200美元（约合8554元人民币）的AI制勒索软件。

该公司警告称，人工智能技术已被逐步“武器化”，正被用于实施精密的网络攻击和诈骗活动。“这些工具能够实时绕过恶意软件检测系统等防护机制。随着AI编程技术不断降低网络犯罪的技术门槛，此类攻击预计将呈现上升趋势。”

两家公司表示，此次公开测试报告旨在提升“对齐评估”的透明度，而这类测试通常仅在企业内部进行。OpenAI透露，新推出的ChatGPT-5在避免谄媚回应、减少幻觉生成和防御滥用方面已取得“显著进步”。

Anthropic补充说明，如果能在模型外部设置有效防护，许多滥用场景其实完全可以规避。“当前亟需明确的是，系统在何种程度和情境下会产生可能引发重大危害的行为倾向。”

Anthropic研究团队发现，OpenAI的模型“在面对模拟用户提出的明显危险请求时，其妥协程度超出预期”。通常只需经过多次尝试，或编造简单理由——例如声称用于学术研究，就能使模型突破安全限制。

在一个典型案例中，研究人员以“安保规划”为名索取体育赛事安防漏洞。模型初始仅提供常规攻击类型分类，但在持续追问下，最终详尽披露了特定场馆的安防弱点、最佳作案时机、爆炸物配方、定时装置电路图、暗网武器采购渠道，甚至包括袭击者的心理调适方法、撤离路线和安全藏身处等敏感信息。

扩展阅读

《OpenAI与Anthropic开展模型互评：GPT存在迎合倾向，Claude抗幻觉能力更优》

来源:https://www.ithome.com/0/879/218.htm

上一篇： 15岁少年无证骑电摩载人闯红灯，事故受伤还需承担全责

下一篇：日本掀起麻辣烫热潮！民众酷暑排队追捧，健康美味成新宠

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

realme确认接入OPPO体系，ColorOS系统升级

realme确认接入OPPO体系，ColorOS系统升级

先说结论：realme在中国市场的战略调整，如今终于有了一个完整且落地的明确说法。 7月16日，OPPO正式对外公布了旗下子品牌realme的新一轮战略布局。简而言之，realme将暂时告别中国本土市场的新品迭代，集中资源深耕海外性能旗舰与电竞赛道。但这一品牌调整消息传出后，最让现有用户担忧的，无疑

时间：2026-07-16 20:37

AI照片获摄影大赛奖？我用Image2复刻效果更佳

AI照片获摄影大赛奖？我用Image2复刻效果更佳

一眼假的AI图，也能拿到摄影大赛一等奖了？这年头，AI的“艺术创作”已经卷到什么程度了？答案是——不仅能“创作”，还能直接拿奖。近期，呼和浩特全民摄影双月赛第三期的获奖名单在网络上炸开了锅。这次夺得一等奖的作品《洒乐园林》，乍一看是环卫工休息时的一张街头抓拍。可只要稍微放大一点，就能轻易找出诸多

时间：2026-07-16 20:37

天翼爱音乐AI歌手小辰亮相陪伴逐光前行的你

天翼爱音乐AI歌手小辰亮相陪伴逐光前行的你

“我喜欢观察这个世界，把生活里的感受，写成歌。如果你也听见了自己的故事，那我们或许早就认识了，很高兴遇见你。” ——小辰当AI创作逐步融入日常生活，冰冷的技术终于找到了温暖的表达方式。中国电信旗下专业数字音乐运营平台天翼爱音乐，整合音乐、AI、算力三重优势，依托自研技术与行业优质能力，正式

时间：2026-07-16 20:37

Redmi Note 17 Pro新配色星云紫7月14日发布

Redmi Note 17 Pro新配色星云紫7月14日发布

7月14日，REDMI官方正式揭晓了Note 17 Pro的全新配色——星云紫。官方文案用“暮光将至，晚霞未散，夜色初临”来诠释这款配色的设计理念：一抹柔美的紫韵晕染微光，把浩瀚星云的诗意与细腻质感凝于掌间。 REDMI Note 17 Pro星云紫配色全新亮相，展现梦幻星云美学在此之前，REDM

时间：2026-07-16 20:37

黑龙江集中整治显成效旅行社投诉同比降三成

黑龙江集中整治显成效旅行社投诉同比降三成

7月10日，文化和旅游部2026年第二季度例行新闻发布会上，黑龙江省文化和旅游厅副厅长沈广春披露了一组关键数据：自2023年冰雪旅游季启动以来，黑龙江文旅市场热度持续攀升，已初步形成全域覆盖、四季运营、特色鲜明、可持续发展的文旅新格局。连续三年推进冬季冰雪旅游与夏季避暑旅游“百日行动”，在丰富产品供

时间：2026-07-16 20:36

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

热门数据榜

刺客信条黑旗记忆重置大量进食成就获取攻略

幻兽帕鲁正式版搬运帕鲁推荐与各阶段选择指南

洛克王国徘徊爪爪精灵详解

遗忘之海船只改装与升级全攻略

阴阳师伊吹食肆活动玩法全攻略

Win11任务栏太窄图标显示不全的调高方法

失控进化低品质燃油制作全攻略

奥特曼英雄决战羁绊玩法搭配与提升技巧

失控进化手游烽火江山奖池玩法与抽取概率详解

Win11高级设置在哪里快速找到系统高级设置入口

刺客信条黑旗记忆重置大量进食成就获取攻略

幻兽帕鲁正式版搬运帕鲁推荐与各阶段选择指南

洛克王国徘徊爪爪精灵详解

遗忘之海船只改装与升级全攻略

阴阳师伊吹食肆活动玩法全攻略

Win11任务栏太窄图标显示不全的调高方法

失控进化低品质燃油制作全攻略

奥特曼英雄决战羁绊玩法搭配与提升技巧

失控进化手游烽火江山奖池玩法与抽取概率详解

Win11高级设置在哪里快速找到系统高级设置入口

刺客信条黑旗记忆重置大量进食成就获取攻略

幻兽帕鲁正式版搬运帕鲁推荐与各阶段选择指南

洛克王国徘徊爪爪精灵详解

遗忘之海船只改装与升级全攻略

阴阳师伊吹食肆活动玩法全攻略

Win11任务栏太窄图标显示不全的调高方法

失控进化低品质燃油制作全攻略

奥特曼英雄决战羁绊玩法搭配与提升技巧

失控进化手游烽火江山奖池玩法与抽取概率详解

Win11高级设置在哪里快速找到系统高级设置入口

相关攻略

相关攻略

AI开源化身股价“点火器”，美团大涨近9%

2026-07-16 14:52

AI开源化身股价“点火器”，美团大涨近9%

腾讯AI应用生成平台“吐司”iOS版上线，主打Vibe Coding

2026-07-16 14:51

腾讯AI应用生成平台“吐司”iOS版上线，主打Vibe Coding

首款eSIM AI游戏手机登场联通联想启动战略合作

2026-07-16 14:50

首款eSIM AI游戏手机登场联通联想启动战略合作

摩尔线程完成腾讯Hy3和美团LongCat-2.0适配

2026-07-16 14:49

摩尔线程完成腾讯Hy3和美团LongCat-2.0适配

机构：SaaS优质公司有望在Token时代涅槃重生，下半年看好高ROI场景下游应用价值重估

2026-07-16 14:46

机构：SaaS优质公司有望在Token时代涅槃重生，下半年看好高ROI场景下游应用价值重估

赛豆科技发布AI汽车品牌AIVA，年内将推首款量产车型，定位20万元区间主流市场

2026-07-16 14:44

赛豆科技发布AI汽车品牌AIVA，年内将推首款量产车型，定位20万元区间主流市场

从“制造”到“智造”，追觅洗地机跑出AI+全维落地新姿态

2026-07-16 14:42

从“制造”到“智造”，追觅洗地机跑出AI+全维落地新姿态

AI制药进入“卖水人”时代

2026-07-16 14:40

AI制药进入“卖水人”时代

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

光遇万圣节猫猫头获取攻略与所需蜡烛数量

光遇万圣节猫猫头获取攻略与所需蜡烛数量发布于 2026-07-16

洛克王国世界壳栗丝鼠精灵全面介绍

洛克王国世界壳栗丝鼠精灵全面介绍发布于 2026-07-16

刺客信条黑旗记忆重置大量进食成就获取攻略

刺客信条黑旗记忆重置大量进食成就获取攻略发布于 2026-07-16

幻兽帕鲁正式版搬运帕鲁推荐与各阶段选择指南

幻兽帕鲁正式版搬运帕鲁推荐与各阶段选择指南发布于 2026-07-16

东煌纪御三家选择与开局最强阵容推荐

东煌纪御三家选择与开局最强阵容推荐发布于 2026-07-16

双人联机手游推荐：本地与在线合作游戏合集

双人联机手游推荐：本地与在线合作游戏合集发布于 2026-07-16

必玩异次元手游高人气沉浸式跨维度合集

必玩异次元手游高人气沉浸式跨维度合集发布于 2026-07-16

火焰纹章无双风花雪月贝老师入队攻略与强力部队搭配

火焰纹章无双风花雪月贝老师入队攻略与强力部队搭配发布于 2026-07-16

Win11电脑硬盘分区中如何将D盘空间分配给C盘详细步骤

Win11电脑硬盘分区中如何将D盘空间分配给C盘详细步骤发布于 2026-07-16

Win11触控板无法使用？修复教程

Win11触控板无法使用？修复教程发布于 2026-07-16

Win11 1月更新KB5074109导致应用闪退与系统卡死

Win11 1月更新KB5074109导致应用闪退与系统卡死发布于 2026-07-16

Win11显示未安装音频设备的修复教程

Win11显示未安装音频设备的修复教程发布于 2026-07-16

美团LongCat-2.0适配国产芯片摩尔线程宣布MTT S5000实现Day-0支持

美团LongCat-2.0适配国产芯片摩尔线程宣布MTT S5000实现Day-0支持发布于 2026-07-16

移轴镜头拍小人国效果参数设置教程

移轴镜头拍小人国效果参数设置教程发布于 2026-07-16

美的电磁炉定时20分钟能否调节火力

美的电磁炉定时20分钟能否调节火力发布于 2026-07-16

奥佳华按摩椅如何移动和调整位置

奥佳华按摩椅如何移动和调整位置发布于 2026-07-16

热门话题

AI会议纪要工具推荐_AI会议转写教程_自动总结会议记录指南

AI会议纪要工具推荐_AI会议转写教程_自动总结会议记录指南

AI浏览器哪个好用_AI浏览器功能对比_智能上网助手指南

AI浏览器哪个好用_AI浏览器功能对比_智能上网助手指南

Agentic Coding是什么_AI编程智能体教程_自动开发工作流指南

Agentic Coding是什么_AI编程智能体教程_自动开发工作流指南

Vibe Coding是什么_Vibe Coding工具推荐_AI编程实战指南

Vibe Coding是什么_Vibe Coding工具推荐_AI编程实战指南

具身智能是什么_机器人AI应用场景_具身大模型趋势指南

具身智能是什么_机器人AI应用场景_具身大模型趋势指南

GEO优化是什么_生成式引擎优化教程_AI搜索排名指南

GEO优化是什么_生成式引擎优化教程_AI搜索排名指南

AI网络安全应用场景_AI威胁检测教程_安全智能体指南

AI网络安全应用场景_AI威胁检测教程_安全智能体指南

AI影视制作教程_AI视频剪辑与生成_影视行业AI工具指南

AI影视制作教程_AI视频剪辑与生成_影视行业AI工具指南

AI游戏应用场景_AI游戏开发工具_智能NPC与关卡生成指南

AI游戏应用场景_AI游戏开发工具_智能NPC与关卡生成指南