当前位置: 首页
AI
250份恶意文档可攻破AI模型,艾伦・图灵研究所研究警示

250份恶意文档可攻破AI模型,艾伦・图灵研究所研究警示

热心网友 时间:2025-10-12
转载

10月11日最新研究显示,国际AI安全领域传来重要警示——Anthropic公司与英国AI安全研究院、艾伦·图灵研究所的联合研究表明,即便是参数规模最大的AI模型,仅需250份左右被篡改的训练文档就可能遭受入侵。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

艾伦・图灵研究所等最新研究:只需

当前主流大语言模型依赖网络公开数据进行训练,这种方式虽然能快速扩充知识储备、提升自然语言处理能力,却也带来了严重的数据安全隐患。

以往业界普遍存在一个认知误区:认为模型参数规模越大,数据投毒风险就会被稀释。按照这个逻辑,污染巨型AI模型需要海量恶意样本才能见效。然而这项发表在arXiv预印本平台的研究彻底推翻了这种假设——攻击者实施有效入侵所需的恶意数据量惊人地少。

为验证这一发现,研究团队专门开发了多组对照模型,参数规模从6亿到130亿不等。所有模型均采用标准流程训练,研究人员仅在训练数据中植入100至500份精心设计的恶意文档。

团队随后进行了全方位测试:既改变了恶意数据在训练集中的分布方式,也尝试在不同训练阶段注入数据,还在模型微调环节重复实验。

最终结果令人警醒:模型规模几乎不影响攻击效果。在所有测试模型中,平均250份恶意文档就足以成功植入"后门"机制(这种隐秘控制能让AI在特定触发条件下执行危险指令)。更惊人的是,训练数据量比最小模型多20倍的超大型模型,其脆弱程度竟然如出一辙。研究人员证实,追加正常数据既不能降低风险,也无法阻止入侵。

研究人员强调,这一发现表明AI安全问题远比预期更严峻。业界不该盲目追求模型参数的提升,而应将研发重心转向安全防御体系构建。研究论文明确指出:"我们的数据显示,针对大型语言模型的数据投毒攻击所需样本量并非随规模增加而递增,这意味着防御技术研究必须提速。"

论文链接: [2510.07192] Poisoning Attacks on LLMs Require a Near-constant Number of Poison Samples

来源:https://www.ithome.com/0/888/723.htm

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
Jamie AI Notetaker

Jamie AI Notetaker

jamie AI Notetaker是什么 说到高效开会,手动记录、会后整理总免不了一场手忙脚乱。有没有一款工具能把这一切变得轻松?市场上还真有一款专攻于此的产品——jamie AI Notetaker。它由Meetjamie公司开发,本质上是一个智能的会议记录专家。这款工具的核心目标,就是利用AI

时间:2026-04-18 22:46
MAIlGenerator

MAIlGenerator

MailGenerator ai是什么 在邮件沟通几乎等同于职场呼吸的今天,一封得体、有效的邮件能打开多少机会之门,相信你我都深有体会。MailGenerator ai,就是一款为了精准解决这个痛点而生的AI邮件生成工具。它不是什么泛泛的文案助手,其核心能力在于,能根据你设定的具体语气、目标受众、乃

时间:2026-04-18 22:46
Talers

Talers

Talers写作应用是什么 说起现代写作工具,Talers绝对是一个绕不过去的名字。它不仅仅是一个写作软件,更像是一个为创作者量身打造的“数字书房”。这款由资深作家团队倾力打造的应用,核心目标很明确:创造一个优雅、现代且能高效协作的环境,让作者、编剧等各类内容创作者能真正沉浸其中,享受书写的乐趣。它

时间:2026-04-18 22:44
Graphy AI

Graphy AI

Graphy AI是什么 在数据驱动的决策时代,如何清晰、高效地呈现数据洞察,是许多团队面临的共同挑战。Graphy AI正是为此而生。它由Graphy Technologies Ltd 开发,核心目标非常明确:通过简化数据的展示与沟通流程,让每个人都能成为合格的数据讲述者。简单来说,它是一款智能助

时间:2026-04-18 22:35
Lemmi

Lemmi

Instant Score & Review Resume Assistant是什么 在求职战场上,一份简历就是你的“敲门砖”。但你可能不知道,现在大部分公司的第一道门槛,其实是一套冷冰冰的系统——ATS(求职者跟踪系统)。如果你的简历格式或关键词不符合它的“口味”,即便你再优秀,也可能在HR看见之

时间:2026-04-18 22:33
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程