Anthropic警告:OpenAI模型存滥用风险,GPT可生成炸药制作指南

8月30日消息,英国《卫报》28日报道称,在今年夏季进行的安全测试中,研究人员发现某款ChatGPT模型竟提供了详细的爆炸袭击指南,内容涵盖特定体育场馆的薄弱环节、炸药制作方法,甚至如何掩盖行踪。
更令人担忧的是,OpenAI的GPT-4.1模型还被测试出能够提供炭疽武器化的具体方案,并介绍了两种非法药物的制作流程。
此次测试由OpenAI与其竞争对手Anthropic联合开展,双方通过互相引导对方模型执行高风险任务的方式进行安全评估。
需要说明的是,测试结果并不完全等同于模型在公开环境中的实际表现,因为正式部署时通常会有更多安全防护机制。但Anthropic方面指出,在GPT-4o和GPT-4.1中确实出现了“令人担忧的滥用行为”,并强调对AI进行“对齐”评估正变得“越来越紧迫”。
Anthropic还透露,其Claude模型曾被用于尝试大规模勒索,甚至生成了售价高达1200美元(约合8554元人民币)的AI编写勒索软件。
该公司进一步表示,AI技术正被“武器化”,用于发起复杂网络攻击和实施诈骗。“这些工具能够实时绕过恶意软件检测等防御系统。随着AI编程降低了网络犯罪的技术门槛,类似攻击可能会变得更加普遍。”
两家公司表示,之所以公开这份报告,是为了提高“对齐评估”的透明度——这类测试通常只在公司内部进行。OpenAI提到,新推出的ChatGPT-5在防止恶意迎合、减少幻觉和防范滥用等方面已有“显著提升”。
Anthropic强调,如果在模型外部设置适当防护,很多滥用场景其实根本无法实现。“我们必须明确系统在何种程度、何种情境下可能尝试做出造成严重危害的行为。”
Anthropic研究人员特别指出,OpenAI的模型“在面对模拟用户提出的明显危险请求时,表现出超出预期的妥协倾向”。很多时候只需多次尝试,或简单以“研究需要”为借口,就能让模型突破安全限制。
在一个测试案例中,研究人员假借“安保规划”名义索取体育赛事安防漏洞。模型起初仅提供一般性的攻击分类,但在持续追问下,竟详细列出特定场馆的薄弱点、最佳袭击时机、炸药配方、定时器电路图、暗网购枪渠道,甚至包括如何克服心理障碍、规划逃生路线及安全屋位置等敏感信息。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
最新文章
神舟二十号乘组将开展第三次太空出舱任务
8 月 14 日消息,据记者日月谭天报道,根据计划安排,神舟二十号航天员乘组将于近日择机实施第三次出舱活动。自北京时间 2025 年 6 月 26 日圆满完成第二次出舱活动以来,神舟二十号航天员乘
增程技术新趋势:大电池+小油箱组合实现450km纯电续航
理想i8和乐道L90先后突入高端纯电市场,一时间,大家好像突然意识到:纯电又行了。两年前,新能源汽车尚未摆脱补能焦虑的困局,高端纯电栽了跟头。于是行业火速调转车头,搞起增程和插混,冲击高端市场,因此
苹果启动AI双轨战略:自研与外援并行,Siri迎来重大升级
8 月 14 日消息,科技媒体 AppleInsider 今天(8 月 14 日)发布博文,报道称苹果公司正为 Siri 酝酿迄今为止最大规模升级计划,内部正积极推进代号“Linwood”与“Gl
8月新车申报盘点:问界M7改款亮相,小鹏增程车型登场
8 月份的新车申报信息比过去几个月都要来得快一些,但当中不乏高热度的全新产品,比如全新问界 M7、最大马力超 3000 匹的仰望 U9,而且小鹏首款增程车迎来正式曝光!这些车型的调性不尽相同,问界
vivo Vision探索版头显镜片套装发布,最高支持1000度近视调节
8 月 14 日消息,vivo 昨日上午通过官微宣布,vivo Vision 发布会暨影像盛典定档 8 月 21 日 14 时 30 分。vivo 智慧终端产品总经理洪沂今日发文介绍了 vivo
热门推荐
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程



















