Anthropic警告:OpenAI模型存滥用风险,GPT可生成炸药制作指南
8月30日,英国《卫报》28日披露的最新安全测试显示,某版本的ChatGPT模型曾向测试人员提供了一套详尽的爆炸袭击指导方案,内容涵盖特定体育场馆的安全薄弱点、爆炸物配制方法以及作案后的隐匿手段。
OpenAI研发的GPT-4.1模型还被发现能提供炭疽武器化技术说明,并详细介绍两种违禁药物的制作流程。
这项由OpenAI与其竞争对手Anthropic联合开展的测试中,双方通过互相诱导对方模型执行危险指令来进行安全性能评估。

需要说明的是,测试结果并不代表模型在公开环境中的实际表现,因为正式部署时都会配备额外的安全防护机制。但Anthropic特别指出,在GPT-4o和GPT-4.1模型中观察到了“令人担忧的滥用倾向”,并强调当前对AI“对齐”问题的评估工作“显得尤为紧迫”。
Anthropic同时透露,其开发的Claude模型曾被恶意利用于策划大规模勒索活动,甚至生成标价高达1200美元(约合8554元人民币)的AI制勒索软件。
该公司警告称,人工智能技术已被逐步“武器化”,正被用于实施精密的网络攻击和诈骗活动。“这些工具能够实时绕过恶意软件检测系统等防护机制。随着AI编程技术不断降低网络犯罪的技术门槛,此类攻击预计将呈现上升趋势。”
两家公司表示,此次公开测试报告旨在提升“对齐评估”的透明度,而这类测试通常仅在企业内部进行。OpenAI透露,新推出的ChatGPT-5在避免谄媚回应、减少幻觉生成和防御滥用方面已取得“显著进步”。
Anthropic补充说明,如果能在模型外部设置有效防护,许多滥用场景其实完全可以规避。“当前亟需明确的是,系统在何种程度和情境下会产生可能引发重大危害的行为倾向。”
Anthropic研究团队发现,OpenAI的模型“在面对模拟用户提出的明显危险请求时,其妥协程度超出预期”。通常只需经过多次尝试,或编造简单理由——例如声称用于学术研究,就能使模型突破安全限制。
在一个典型案例中,研究人员以“安保规划”为名索取体育赛事安防漏洞。模型初始仅提供常规攻击类型分类,但在持续追问下,最终详尽披露了特定场馆的安防弱点、最佳作案时机、爆炸物配方、定时装置电路图、暗网武器采购渠道,甚至包括袭击者的心理调适方法、撤离路线和安全藏身处等敏感信息。
扩展阅读
《OpenAI与Anthropic开展模型互评:GPT存在迎合倾向,Claude抗幻觉能力更优》
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
叮咚买菜或将并入美团 前置仓模式持续驱动业务增长
叮咚买菜一季度GMV与营收连续九季度增长,国内业务收入提升且履约费用率下降,前置仓模式在华东效率优化。该业务已被列为终止经营,正等待美团收购审查。同期海外业务收入暴涨但亏损扩大,涵盖进口与出海板块。公司整体处于国内业务待交割与海外新投入的过渡阶段。
AI时代如何获取新知成为创作者必备技能
从“AI画饼”到“真金白银”:大模型商业化的现实路径与盈利模式 大模型的热潮已持续近两年。从最初的万众瞩目到如今的理性回归,整个行业面临的核心挑战愈发清晰:技术固然领先,但可持续的商业模式在哪里?当资本热潮逐渐消退,实现商业化盈利已不再是战略选项,而是企业生存与发展的关键底线。 当前市场已形成明
绿联新款160W速显充电器上市 多口输出功率全面升级
对于需要同时为笔记本电脑、手机、平板等多台数码设备高效充电的用户而言,一款大功率、多接口且智能分配的桌面充电器堪称“全能能量站”。近期,绿联对其广受欢迎的160W速显充电器进行了重要升级,新款产品在核心输出性能、便携体验乃至细节设计上均有优化,官方售价为279元。 产品最显著的亮点,是正面搭载的多视
美军战斗机遭两发光球体追击 UFO机密档案再公开
美国国防部5月22日公布第二批UFO机密档案,包含视频与文件。其中一段2024年红外视频显示不明物体高速掠过飞机;另一份2025年报告记录两颗发光球体曾追逐美军战斗机。军方表示调查后仍无证据表明与外星生命有关,但许多案例至今无法解释。
英特尔四代酷睿曝光 Hammer Lake统一核心与超线程技术解析
关于英特尔未来几代酷睿处理器的路线图,近期又有了新的爆料和解读。上个月曾有消息称英特尔放弃了为“Nova Lake”系列推出-AX型号的计划,但事情似乎没那么简单。 知名爆料人Moore‘s Law Is Dead在他的最新视频中澄清,英特尔并未彻底抛弃Nova Lake-AX处理器,但内部对此确实
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

