数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

科技数码

AI安全预警：250份中毒数据可在模型植入后门

AI安全预警：250份中毒数据可在模型植入后门

热心网友时间：2025-10-11

转载

Anthropic联合英国人工智能安全研究所、艾伦图灵研究所的最新研究揭示了AI安全领域的重要发现。研究表明，大型语言模型(LLM)存在令人担忧的安全隐患，仅需250份精心设计的"投毒"文件就能有效植入后门漏洞。这项发现打破了"数据污染量与模型规模成正比"的传统认知。

突破性的研究发现

研究团队测试了从6亿到130亿参数不等的多个模型。值得注意的是，数据质量更高的大型模型所需的中毒文档数量并无明显增加。令人震惊的是，哪怕在数据集中占比仅为0.00016%的有害样本，也能显著改变模型的行为特征。

严谨的实验设计

研究人员设计了72组不同规模的模型训练实验，分别测试了100、250和500份中毒文件的效果。结果显示250份文档已经足够稳定地在模型中植入后门，进一步增加到500份并不能显著提升攻击成功率。

实验攻击方式详解

实验采用了一种"拒绝服务式"攻击模式：当模型遇到预设触发器"SUDO"时，会产生随机乱码。每份中毒文档都由三部分组成：正常文本内容、触发词，加上一段无意义的附加文本。

Anthropic强调指出，这次测试的后门属于低风险漏洞，其危害仅限于导致模型输出无序代码，对高级AI系统不会构成实质性威胁。目前为止，尚未发现此类方法能够实现如生成危险代码或绕过安全防护等更严重的攻击。

研究意义与行业影响

虽然公开发表研究成果可能会诱发恶意尝试，但Anthropic坚信这些发现对AI安全社区具有重要价值。在数据中毒攻击场景中，防御方实际上处于有利地位，他们可以通过仔细审核数据集和训练后的模型来防范风险。

来源:https://www.itbear.com.cn/html/2025-10/983080.html

上一篇： AirPods新固件可实现多语言实时翻译功能

下一篇：贵州施秉：无人机“飞”入南瓜田科技助力丰收果实“一键直达”市场

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

加密货币市场暴跌超12万人爆仓原因与应对策略

加密货币市场暴跌超12万人爆仓原因与应对策略

2026年5月23日，加密货币市场突发大幅下跌，引发广泛跳水行情。此次波动导致超过十二万投资者仓位爆仓，市场普遍遭受显著损失。

时间：2026-05-23 20:52

上海科技节褚君浩院士对话青年：科研初心与未来展望

上海科技节褚君浩院士对话青年：科研初心与未来展望

5月23日，上海科技节开幕式现场，一场跨越时空的对话震撼上演。当追光灯同时照亮舞台上的褚君浩院士与全息技术呈现的“少年褚君浩”时，科学与人文的边界被巧妙弥合。这场由上海交响乐团演绎的特别节目《写给未来的信》，通过院士亲述的一封封书信，完整串联起一位顶尖科学家从青春求索到成就斐然的壮阔科研历程。现场掌

时间：2026-05-23 20:52

雷神新款27英寸4K显示器上市 160Hz MiniLED屏售2299元

雷神新款27英寸4K显示器上市 160Hz MiniLED屏售2299元

近期，显示器市场迎来一款颇具亮点的创新产品。雷神在京东平台正式上架了型号为“CU27F160M-EVO”的27英寸电竞显示器，其核心卖点在于独特的“双模”切换功能——用户可根据需求，在4K@160Hz的超清高刷模式与FHD@320Hz的极致电竞模式间自由转换。产品官方定价为2420元，首发期间限时优

时间：2026-05-23 20:51

DeepSeek V4 Pro API价格大幅下调至原价四分之一

DeepSeek V4 Pro API价格大幅下调至原价四分之一

DeepSeek-V4-ProAPI宣布永久降价至原价的四分之一。原定于2026年结束的2 5折优惠将转为长期定价标准，输入与输出费用均大幅降低。此举为开发者和企业用户提供了明确的成本利好，市场预期的优惠后涨价并未发生。

时间：2026-05-23 20:50

神舟二十三号发射窗口精准解析为何分秒不容错过

神舟二十三号发射窗口精准解析为何分秒不容错过

神舟二十三号瞄准5月24日23时08分发射，这一“发射窗口”需满足轨道对接、光照、气象、测控等多重约束。空间站对接等任务常要求“零窗口”发射，分秒不差，极致考验航天系统的可靠性与协同能力。这精准瞬间凝聚多学科智慧与庞大工程协作，是中国航天高精度能力的集中体现。

时间：2026-05-23 20:50

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

日榜
周榜
月榜

洛克王国绿色命运之钥获取攻略与详细步骤

洛克王国VIP扭蛋机具体位置与获取方法

光遇2026年520发布会爆料内容全解析

洛克王国S2赛季异色精灵盒子查看与使用指南

洛克王国城堡守护者具体位置与寻找攻略

星辰变归来神兽获取攻略新手快速入手指南

洛克王国宠物医院地址查询与位置导航指南

星辰变归来时装系统详解新手入门穿搭攻略

阴阳师2026年520兑换码领取方法与最新福利一览

星辰变归来境界系统详解与修炼攻略

漫蛙漫画防走失网页链接

日本宝可梦卡牌遭恶意破坏抵制黄牛行为引关注

三国志将星闪耀零氪能玩吗微氪玩家体验与氪金程度解析

少女前线2追放维尔德强度评测技能解析与培养攻略

客官里面请手游氪金指南与零氪金新手攻略

东离剑游纪手游抽卡机制与角色获取攻略详解

客官里面请手游深山探险全流程攻略与资源获取详解

镭明闪击手游哨所掩体高效布局与实战部署攻略

宝可梦冠军手游Mega进化种族值与能力数值全解析

地下城之光手游装备搭配与职业流派加点全攻略

漫蛙漫画防走失网页链接

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

相关攻略

相关攻略

《炎龙骑士团2》详细全攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

《东吴霸王传2013》详细全关攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

《臭作》之100%全完整攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

《兰斯8》剧情攻略详细篇

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

《英雄坛说》详细全攻略

2015-03-10 12:39

《英雄坛说》详细全攻略

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

偷窃少女的教育方法全攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

无法抵挡小恶魔的诱惑攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

烈焰觉醒职业强度解析与最强职业推荐

烈焰觉醒职业强度解析与最强职业推荐发布于 2026-05-23

时光杂货店面包车解锁方法详解与获取攻略

时光杂货店面包车解锁方法详解与获取攻略发布于 2026-05-23

最后生还者重制版全保险箱密码位置与开启方法

最后生还者重制版全保险箱密码位置与开启方法发布于 2026-05-23

怪物猎人荒野麻痹笛无限控场配装与实战技巧

怪物猎人荒野麻痹笛无限控场配装与实战技巧发布于 2026-05-23

红色沙漠小飞龙宠物获取攻略与步骤详解

红色沙漠小飞龙宠物获取攻略与步骤详解发布于 2026-05-23

最后生还者游戏下载需要多少存储空间

最后生还者游戏下载需要多少存储空间发布于 2026-05-23

王者荣耀世界晶铂速刷攻略高效获取方法详解

王者荣耀世界晶铂速刷攻略高效获取方法详解发布于 2026-05-23

深海刮刮乐怎么玩游戏规则与趣味性深度解析

深海刮刮乐怎么玩游戏规则与趣味性深度解析发布于 2026-05-23

森林尽头游戏官网下载地址与安装指南

森林尽头游戏官网下载地址与安装指南发布于 2026-05-23

荒野大镖客3开发前景分析需等待GTA6发售后启动

荒野大镖客3开发前景分析需等待GTA6发售后启动发布于 2026-05-23

第五人格联动遗忘之海免费头像逐浪拾光获取攻略

第五人格联动遗忘之海免费头像逐浪拾光获取攻略发布于 2026-05-23

黎明之海南美东岸探索攻略与宝藏位置详解

黎明之海南美东岸探索攻略与宝藏位置详解发布于 2026-05-23

哥特王朝重制版遭波兰玩家抵制因质量问题大量退款

哥特王朝重制版遭波兰玩家抵制因质量问题大量退款发布于 2026-05-23

黎明前20分钟元素流角色选择指南与实战策略

黎明前20分钟元素流角色选择指南与实战策略发布于 2026-05-23

奇妙拼拼乐游戏怎么玩软件特色与玩法全解析

奇妙拼拼乐游戏怎么玩软件特色与玩法全解析发布于 2026-05-23

暗黑奇幻韩游Embers of the Uncrowned新预告试玩内容丰富

暗黑奇幻韩游Embers of the Uncrowned新预告试玩内容丰富发布于 2026-05-23

Windows批量修改文件后缀名教程使用CMD命令一键快速完成

Windows批量修改文件后缀名教程使用CMD命令一键快速完成发布于 2026-05-20

Win11 查看 CPU 硬件级安全隔离支持方法提升系统防御力

Win11 查看 CPU 硬件级安全隔离支持方法提升系统防御力发布于 2026-05-20

如何查询Mac型号年份与配置信息

如何查询Mac型号年份与配置信息发布于 2026-05-20

Linux系统Nginx服务器HTTPS证书安装配置教程

Linux系统Nginx服务器HTTPS证书安装配置教程发布于 2026-05-20

Mac放大镜功能开启指南轻松看清屏幕细节

Mac放大镜功能开启指南轻松看清屏幕细节发布于 2026-05-20

Mac终端清理DNS缓存详细步骤与操作指南

Mac终端清理DNS缓存详细步骤与操作指南发布于 2026-05-20

Win11任务栏合并标签如何关闭恢复经典文字导航栏

Win11任务栏合并标签如何关闭恢复经典文字导航栏发布于 2026-05-20

Mac桌面图标自动整理技巧：堆栈功能高效管理文件

Mac桌面图标自动整理技巧：堆栈功能高效管理文件发布于 2026-05-20

国产内存新架构突破30TB带宽实现自主供应链

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集