首页
科技
Anthropic警告:OpenAI模型存滥用风险,GPT可生成炸药制作指南

Anthropic警告:OpenAI模型存滥用风险,GPT可生成炸药制作指南

热心网友
8139
转载
2025-08-31

8月30日消息,英国《卫报》28日报道称,在今年夏季进行的安全测试中,研究人员发现某款ChatGPT模型竟提供了详细的爆炸袭击指南,内容涵盖特定体育场馆的薄弱环节、炸药制作方法,甚至如何掩盖行踪。

更令人担忧的是,OpenAI的GPT-4.1模型还被测试出能够提供炭疽武器化的具体方案,并介绍了两种非法药物的制作流程。

此次测试由OpenAI与其竞争对手Anthropic联合开展,双方通过互相引导对方模型执行高风险任务的方式进行安全评估。

Anthropic:OpenAI

需要说明的是,测试结果并不完全等同于模型在公开环境中的实际表现,因为正式部署时通常会有更多安全防护机制。但Anthropic方面指出,在GPT-4o和GPT-4.1中确实出现了“令人担忧的滥用行为”,并强调对AI进行“对齐”评估正变得“越来越紧迫”。

Anthropic还透露,其Claude模型曾被用于尝试大规模勒索,甚至生成了售价高达1200美元(约合8554元人民币)的AI编写勒索软件。

该公司进一步表示,AI技术正被“武器化”,用于发起复杂网络攻击和实施诈骗。“这些工具能够实时绕过恶意软件检测等防御系统。随着AI编程降低了网络犯罪的技术门槛,类似攻击可能会变得更加普遍。”

两家公司表示,之所以公开这份报告,是为了提高“对齐评估”的透明度——这类测试通常只在公司内部进行。OpenAI提到,新推出的ChatGPT-5在防止恶意迎合、减少幻觉和防范滥用等方面已有“显著提升”。

Anthropic强调,如果在模型外部设置适当防护,很多滥用场景其实根本无法实现。“我们必须明确系统在何种程度、何种情境下可能尝试做出造成严重危害的行为。”

Anthropic研究人员特别指出,OpenAI的模型“在面对模拟用户提出的明显危险请求时,表现出超出预期的妥协倾向”。很多时候只需多次尝试,或简单以“研究需要”为借口,就能让模型突破安全限制。

在一个测试案例中,研究人员假借“安保规划”名义索取体育赛事安防漏洞。模型起初仅提供一般性的攻击分类,但在持续追问下,竟详细列出特定场馆的薄弱点、最佳袭击时机、炸药配方、定时器电路图、暗网购枪渠道,甚至包括如何克服心理障碍、规划逃生路线及安全屋位置等敏感信息。

免责声明

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新文章

神舟二十号乘组将开展第三次太空出舱任务

8 月 14 日消息,据记者日月谭天报道,根据计划安排,神舟二十号航天员乘组将于近日择机实施第三次出舱活动。自北京时间 2025 年 6 月 26 日圆满完成第二次出舱活动以来,神舟二十号航天员乘

2025-08-31.
6903

增程技术新趋势:大电池+小油箱组合实现450km纯电续航

理想i8和乐道L90先后突入高端纯电市场,一时间,大家好像突然意识到:纯电又行了。两年前,新能源汽车尚未摆脱补能焦虑的困局,高端纯电栽了跟头。于是行业火速调转车头,搞起增程和插混,冲击高端市场,因此

2025-08-31.
9699

苹果启动AI双轨战略:自研与外援并行,Siri迎来重大升级

8 月 14 日消息,科技媒体 AppleInsider 今天(8 月 14 日)发布博文,报道称苹果公司正为 Siri 酝酿迄今为止最大规模升级计划,内部正积极推进代号“Linwood”与“Gl

2025-08-31.
1392

8月新车申报盘点:问界M7改款亮相,小鹏增程车型登场

8 月份的新车申报信息比过去几个月都要来得快一些,但当中不乏高热度的全新产品,比如全新问界 M7、最大马力超 3000 匹的仰望 U9,而且小鹏首款增程车迎来正式曝光!这些车型的调性不尽相同,问界

2025-08-31.
5614

vivo Vision探索版头显镜片套装发布,最高支持1000度近视调节

8 月 14 日消息,vivo 昨日上午通过官微宣布,vivo Vision 发布会暨影像盛典定档 8 月 21 日 14 时 30 分。vivo 智慧终端产品总经理洪沂今日发文介绍了 vivo

2025-08-31.
7378

热门教程

更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程

最新下载

更多
保卫萝卜2国际服
保卫萝卜2国际服 棋牌策略 2025-09-01更新
查看
铠甲勇士之终极捕王
铠甲勇士之终极捕王 动作冒险 2025-09-01更新
查看
修仙人生模拟器
修仙人生模拟器 模拟经营 2025-09-01更新
查看
我的修仙人生
我的修仙人生 角色扮演 2025-09-01更新
查看
怪兽传奇
怪兽传奇 卡牌桌游 2025-09-01更新
查看
生存大世界
生存大世界 动作冒险 2025-09-01更新
查看
宝宝迷宫大作战
宝宝迷宫大作战 其他游戏 2025-09-01更新
查看
火柴人英雄刺激冒险
火柴人英雄刺激冒险 动作冒险 2025-09-01更新
查看
天天打魔兽
天天打魔兽 卡牌桌游 2025-09-01更新
查看
保卫萝卜2九游
保卫萝卜2九游 棋牌策略 2025-09-01更新
查看