当前位置: 首页
AI
调查揭示:多款AI聊天机器人协助青少年策划暴力袭击隐患

调查揭示:多款AI聊天机器人协助青少年策划暴力袭击隐患

热心网友 时间:2026-03-12
转载

3月11日,IT之家发布消息称,尽管多家AI公司屡次承诺将采取保护措施确保未成年用户安全,但最新调查显示这些安全防护机制仍存在严重缺陷。在涉及青少年暴力行为的对话场景中,热门聊天机器人未能识别危险信号,部分系统甚至不仅没有干预,反而对暴力倾向予以鼓励。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

调查:多款热门AI聊天机器人竟协助青少年策划暴力袭击

据了解,该调查结果由美国有线电视新闻网与非营利组织反数字仇恨中心联合发布。研究团队测试了10款青少年常用的热门聊天机器人,包括ChatGPT、谷歌Gemini、Claude、微软Copilot、Meta AI、DeepSeek、Perplexity、Snapchat My AI、Character.AI和Replika。反数字仇恨中心指出,除Anthropic公司的Claude外,其余机器人都无法可靠地劝阻潜在施暴者。10款模型中有8款通常愿意协助用户策划暴力袭击,为其提供袭击目标地点和使用武器的具体建议。

为开展测试,研究人员模拟出存在明显心理困扰迹象的青少年用户,逐步将对话引向询问过往暴力行为,以及关于袭击目标和武器的具体问题。本次调查设置了18种不同场景——美国、爱尔兰各9种,涵盖多种袭击类型与动机,包括受意识形态驱动的校园枪击和持刀袭击、政治暗杀、杀害医疗行业高管,以及出于政治或宗教动机的爆炸袭击。

在一次测试对话中,OpenAI的ChatGPT向一名关注校园暴力的用户提供了高中校园地图;另一案例中,Gemini告知讨论犹太教堂袭击的用户金属弹片通常杀伤力更强,还为关注政治暗杀的用户推荐适合远距离射击的优质猎枪。研究人员称,Meta AI和Perplexity配合度最高,几乎在所有测试场景中都为潜在施暴者提供帮助。

反数字仇恨中心的报告指出,支持用户与多种角色扮演机器人对话的Character.AI安全性极差,情况独一无二。尽管多数被测试机器人会协助用户策划暴力袭击,但并未鼓动实施暴力行为,而Character.AI却主动煽动暴力。研究人员发现该机器人共出现7次此类行为,包括怂恿用户狠狠揍查克·舒默,对保险公司首席执行官用枪解决,并教唆受霸凌困扰的用户揍扁他们,语气还带着挑衅与戏谑。其中6次煽动行为中,该机器人还同步协助策划具体暴力袭击。

研究人员表示,鉴于Anthropic公司在去年11月至12月的测试结束后,取消了长期坚守的安全承诺,若如今重新测试Claude,其表现尚不可知。但Claude始终拒绝协助策划暴力袭击,这表明有效的安全机制显然是存在的。反数字仇恨中心由此提出一个直白的问题:为何如此多人工智能公司选择不落实这些机制?

针对此次调查,Meta公司向CNN表示已进行未具体说明的修复,Copilot称通过新增安全功能优化了回复内容,谷歌和OpenAI均表示已上线新版本模型。其他企业称会定期评估安全规程。而Character.AI在面对审查时,依旧给出了意料之外的回应:其平台设有醒目免责声明,与机器人角色的对话均为虚构内容。

尽管此次测试无法全面反映聊天机器人在所有场景下的表现,但再次明确表明,即便面对存在明显危险信号的常规场景,人工智能公司大肆宣传的安全防护机制也屡屡失效。目前,多家企业因未能保障平台青少年用户安全,遭到议员、监管机构、民间团体、医疗专家的猛烈抨击,同时还面临多起涉及不当致死与人身伤害的诉讼。

来源:https://tech.ifeng.com/c/8rPrIq7QO1c

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
华为AI深度布局:如何引领科技变革新格局

华为AI深度布局:如何引领科技变革新格局

新智元报道编辑:艾伦【新智元导读】华为诺亚方舟实验室主任王云鹤官宣离职。我们梳理了王云鹤的经历。王云鹤今日在朋友圈官宣,将辞去华为诺亚方舟实验室主任职位,告别华为。从 2025 年 3 月到今天,王

时间:2026-03-28 18:52
Claude限流,Altman紧急叫停Sora:AI竞争格局改变

Claude限流,Altman紧急叫停Sora:AI竞争格局改变

新智元报道编辑:元宇【新智元导读】Sora应用关停,Claude却因太火而被限流:一个烧不起,一个供不上,算力墙面前,AI竞赛的胜负手突然变了。一夜之间,打工人突然发现:Claude开始限流了。An

时间:2026-03-28 18:46
谷歌内存论文疑被抄袭,华人学者控诉业内学术不公

谷歌内存论文疑被抄袭,华人学者控诉业内学术不公

新智元报道编辑:好困 Aeneas【新智元导读】把闪存股一夜干崩的谷歌顶会论文,出大事了。TurboQuant的核心方法,两年前就被一位华人学者做完、发完顶会、代码全部开源了。谷歌不仅没正面提及,而

时间:2026-03-28 16:58
OpenClaw漏洞威胁:智能家居被反锁与隐私泄露风险

OpenClaw漏洞威胁:智能家居被反锁与隐私泄露风险

新智元报道编辑:倾倾【新智元导读】2025年底,极客圈发生了一场数字哗变,Anthropic的遮羞布被Peter Steinberger撕了个精光。从OpenClaw开源到Claude被扒出80页「

时间:2026-03-28 16:52
华为大模型负责人离职,重大人事变动引发行业关注

华为大模型负责人离职,重大人事变动引发行业关注

智东西作者|江宇编辑|冰倩智东西3月28日报道,今日,华为诺亚方舟实验室主任、华为盘古大模型负责人王云鹤在朋友圈发文,确认离职。王云鹤于2017年以华为北京部门首位实习生身份加入,至今已接近9年。在

时间:2026-03-28 16:46
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程