数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI

250份恶意文档可攻破AI模型，艾伦・图灵研究所研究警示

250份恶意文档可攻破AI模型，艾伦・图灵研究所研究警示

热心网友时间：2025-10-12

转载

10月11日最新研究显示，国际AI安全领域传来重要警示——Anthropic公司与英国AI安全研究院、艾伦·图灵研究所的联合研究表明，即便是参数规模最大的AI模型，仅需250份左右被篡改的训练文档就可能遭受入侵。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

艾伦・图灵研究所等最新研究：只需

当前主流大语言模型依赖网络公开数据进行训练，这种方式虽然能快速扩充知识储备、提升自然语言处理能力，却也带来了严重的数据安全隐患。

以往业界普遍存在一个认知误区：认为模型参数规模越大，数据投毒风险就会被稀释。按照这个逻辑，污染巨型AI模型需要海量恶意样本才能见效。然而这项发表在arXiv预印本平台的研究彻底推翻了这种假设——攻击者实施有效入侵所需的恶意数据量惊人地少。

为验证这一发现，研究团队专门开发了多组对照模型，参数规模从6亿到130亿不等。所有模型均采用标准流程训练，研究人员仅在训练数据中植入100至500份精心设计的恶意文档。

团队随后进行了全方位测试：既改变了恶意数据在训练集中的分布方式，也尝试在不同训练阶段注入数据，还在模型微调环节重复实验。

最终结果令人警醒：模型规模几乎不影响攻击效果。在所有测试模型中，平均250份恶意文档就足以成功植入"后门"机制（这种隐秘控制能让AI在特定触发条件下执行危险指令）。更惊人的是，训练数据量比最小模型多20倍的超大型模型，其脆弱程度竟然如出一辙。研究人员证实，追加正常数据既不能降低风险，也无法阻止入侵。

研究人员强调，这一发现表明AI安全问题远比预期更严峻。业界不该盲目追求模型参数的提升，而应将研发重心转向安全防御体系构建。研究论文明确指出："我们的数据显示，针对大型语言模型的数据投毒攻击所需样本量并非随规模增加而递增，这意味着防御技术研究必须提速。"

论文链接： [2510.07192] Poisoning Attacks on LLMs Require a Near-constant Number of Poison Samples

来源:https://www.ithome.com/0/888/723.htm

上一篇： "成都造"机器人创新登场：仿生恐龙与智能巡游引热议

下一篇： EleutherAI携手英国AI安全研究所共建危险知识防护体系

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

AI食谱生成器

AI食谱生成器

AI食谱生成器是什么简单说，它是一种能帮你“凭空变出”菜谱的智能助手。这工具由多个技术团队合力开发，核心目标很明确：让每个人，无论是经常下班的上班族，还是爱钻研美食的厨艺爱好者，都能根据手边有的食材和个人口味，快速获得一份专属的烹饪方案。它让做饭这件事，从“今晚吃什么”的难题，变得轻松、个性，甚至

时间：2026-04-18 22:57

Anki Decks

Anki Decks

Anki Decks是什么说到高效学习，Anki闪卡无疑是许多人的利器，但手动制卡的过程往往耗时费力。那么，有没有一种方法能把我们从机械劳动中解放出来呢？一个名为Anki Decks的工具，或许就是答案。它由同名团队开发，核心任务就是帮你把各种格式的笔记——无论是PDF、PPT、Word还是Epu

时间：2026-04-18 22:56

GeniusSheets AI

GeniusSheets AI

GeniusSheets AI数据助手是什么在数据驱动的商业世界中，效率往往决定一切。今天要探讨的这款工具——GeniusSheets AI数据助手，正是为提升效率而生。它由Genius Sheets团队开发，核心目标很明确：为企业用户，尤其是销售、运营、财务这类需要处理海量数据的团队，提供一个既

时间：2026-04-18 22:54

IntelliMail

IntelliMail

IntelliMail是什么在撰写邮件这件日常小事上，你是否也感到过一丝疲惫？一封邮件既要得体又要高效，反复措辞确实占用精力。正因如此，一个创新的解决方案——IntelliMail应运而生。它是一款专注于Chrome浏览器的扩展工具，其核心使命就是帮你“写好”电子邮件。说穿了，这就是一个将AI能力

时间：2026-04-18 22:54

InnovAIte

InnovAIte

Innovaite是什么说到AI驱动的产品创新工具，有一个名字最近在圈内被频繁提及，那就是Innovaite。它出自一家颇具声望的科技公司，核心使命很明确：帮助企业和个人大幅提升创新能力，并让产品开发过程变得更高效、更系统。无论是初创团队苦于寻找市场突破口，还是成熟公司的产品经理需要优化方案，抑或

时间：2026-04-18 22:53

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

日榜
周榜
月榜

ALERTJS 基础入门：替换原生 alert 的简单方法

《AC黑旗RE》发售日已定？权威外媒直指7月9日

centos 6.5 常见问题：报错原因与处理办法

实战案例：在电商项目中应用 number_format 展示价格

中国临床循证智能能力建设计划启动，医渡智循亮相中关村论坛年会

centos 6.5 和常见方案有什么区别

如何使用 ALERTJS 创建自定义浏览器弹窗

解决 ALERTJS 在移动端样式兼容性问题

以每月1美元的价格获取两个月的Paramount+ Premium无广告订阅服务

centos 6.5 实战：从示例到项目落地

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

极狐S3预告发布：三电可选、宽体运动设计，2026北京车展亮相

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

极狐S3预告发布：三电可选、宽体运动设计，2026北京车展亮相

相关攻略

相关攻略

《炎龙骑士团2》详细全攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

《东吴霸王传2013》详细全关攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

《臭作》之100%全完整攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

《兰斯8》剧情攻略详细篇

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

《英雄坛说》详细全攻略

2015-03-10 12:39

《英雄坛说》详细全攻略

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

偷窃少女的教育方法全攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

无法抵挡小恶魔的诱惑攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

大航海时代起源WhatIstheEnglishNameofDaHaiYangShiDaiQiYuan

大航海时代起源WhatIstheEnglishNameofDaHaiYangShiDaiQiYuan 发布于 2026-04-18

《王者荣耀世界》云缨角色介绍

《王者荣耀世界》云缨角色介绍发布于 2026-04-18

崩坏星穹铁道狼尊值不值得抽崩铁狼尊培养与抽取建议

崩坏星穹铁道狼尊值不值得抽崩铁狼尊培养与抽取建议发布于 2026-04-18

风之国世界试炼神殿风之国世界试炼神殿玩法机制与通关攻略详解

风之国世界试炼神殿风之国世界试炼神殿玩法机制与通关攻略详解发布于 2026-04-18

案件大师追踪小丑关卡怎么通关

案件大师追踪小丑关卡怎么通关发布于 2026-04-18

《红色沙漠》暴击齿轮获得攻略-暴击齿轮获取方法详解

《红色沙漠》暴击齿轮获得攻略-暴击齿轮获取方法详解发布于 2026-04-18

燕云十六声烧饼相关成就怎么达成

燕云十六声烧饼相关成就怎么达成发布于 2026-04-18

明末渊虚之羽离火爆燃流构筑怎么分享

明末渊虚之羽离火爆燃流构筑怎么分享发布于 2026-04-18

xbox one 游戏教程：常见用法与操作步骤

xbox one 游戏教程：常见用法与操作步骤发布于 2026-04-18

xbox one 游戏常见问题与处理办法汇总

xbox one 游戏常见问题与处理办法汇总发布于 2026-04-18

热门格斗手游推荐 2026爆火的格斗游戏分享

热门格斗手游推荐 2026爆火的格斗游戏分享发布于 2026-04-17

xbox one 游戏实际使用记录与经验整理

xbox one 游戏实际使用记录与经验整理发布于 2026-04-17

功夫熊猫神龙大侠武功秘籍玩法详解:全角色招式、连招技巧与隐藏成就攻略

功夫熊猫神龙大侠武功秘籍玩法详解:全角色招式、连招技巧与隐藏成就攻略发布于 2026-04-17

ps4 xbox one 是什么？基础说明与使用场景

ps4 xbox one 是什么？基础说明与使用场景发布于 2026-04-17

《空之轨迹 the 2nd》发售日公布！预约即送前作下载码！

《空之轨迹 the 2nd》发售日公布！预约即送前作下载码！发布于 2026-04-17

识质存在角色设计引争议：AI少女形象被误读，玩家呼吁理性看待艺术表达

识质存在角色设计引争议：AI少女形象被误读，玩家呼吁理性看待艺术表达发布于 2026-04-17

ios12正式版是什么？基础说明与使用场景

ios12正式版是什么？基础说明与使用场景发布于 2026-04-18

ios12正式版常见问题与处理办法汇总

ios12正式版常见问题与处理办法汇总发布于 2026-04-18

ios12正式版使用前要了解哪些关键差异

ios12正式版使用前要了解哪些关键差异发布于 2026-04-18

centos下载怎么下载和安装？完整入门说明

centos下载怎么下载和安装？完整入门说明发布于 2026-04-18

centos下载教程：安装、配置与使用步骤

centos下载教程：安装、配置与使用步骤发布于 2026-04-18

centos下载不同版本有什么区别

centos下载不同版本有什么区别发布于 2026-04-18

centos下载实操记录：从安装到正常使用

centos下载实操记录：从安装到正常使用发布于 2026-04-18

ssdtrim 是什么？基础说明与使用场景

ssdtrim 是什么？基础说明与使用场景发布于 2026-04-18

苹果11怎么开机好难开是没电了吗

苹果11怎么开机好难开是没电了吗发布于 2026-04-18

苹果11怎么开机好难开要按多久

苹果11怎么开机好难开要按多久发布于 2026-04-18

喷墨打印机喷头不堵怎么保养？

喷墨打印机喷头不堵怎么保养？发布于 2026-04-18

台式机主板支持sas接口硬盘吗

台式机主板支持sas接口硬盘吗发布于 2026-04-18

直饮机排水口为什么会有水流出？

直饮机排水口为什么会有水流出？发布于 2026-04-18

VisualStudio怎么打开工具箱查看控件-打开工具箱查看控件的详细步骤分享

VisualStudio怎么打开工具箱查看控件-打开工具箱查看控件的详细步骤分享发布于 2026-04-18

车载吸尘器怎么安装使用方法能吸水吗？

车载吸尘器怎么安装使用方法能吸水吗？发布于 2026-04-18

微软听劝！Windows 11初始设置不用等了：终于可以跳过强制更新

微软听劝！Windows 11初始设置不用等了：终于可以跳过强制更新发布于 2026-04-18

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集