仅需250份文件实现AI“洗脑”,看黑客如何操纵ChatGPT

10月19日消息,Anthropic、英国AI安全研究所与艾伦·图灵研究所最近发布联合研究,揭示了一个令人担忧的现象:像Claude、ChatGPT和Gemini这样的大语言模型,对数据投毒攻击的防御能力远低于预期。研究发现,攻击者只需使用极少量恶意文件,就能在模型中成功植入"后门"程序。
这项研究对参数规模从60万到130亿不等的多个AI模型进行了训练测试,结果显示无论模型规模如何扩展,攻击者仅需插入约250份被污染的训练文件,就能有效操控模型的响应行为。这一发现彻底颠覆了业界长期持有的"模型越大、攻击难度越高"的传统认知。
在被测试的最大模型(130亿参数)中,250份恶意文件仅占训练数据总量的0.00016%,然而当模型遇到特定的"触发短语"时,就会按照植入的后门指令执行,输出毫无意义的文本,而非正常的连贯回应。
研究人员还尝试通过持续的"净数据"训练来消除后门,结果显示这些后门程序仍在一定程度上持续存在,表现出较强的顽固性。
虽然本次研究主要针对简单的后门行为,且测试模型规模尚未达到商业旗舰级水平,但研究团队强烈呼吁业界必须尽快改进现有的安全实践方案。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
贾跃亭新车FX Super One年底交付,量产里程碑达成
10月20日消息,今年7月,由贾跃亭创立的Faraday Future(简称FF)旗下第二品牌Faraday X首款MPV车型Super One发布。今日,贾跃亭宣布,Super One生产交付达成
崔东树:2025年9月新能源车均价下降,渗透率持续攀升
乘联分会秘书长崔东树近日发布分析报告指出,2025年9月乘用车市场延续强劲增长态势,尽管面临高基数压力,仍实现6%的同比增幅。市场结构呈现明显分化特征:15万元以下价格区间需求活跃,其中小型电动车表
音箱手机支架选购指南:实力厂商开发周期优势解析
在移动设备与音频体验深度融合的当下,兼具手机支撑与音箱功能的复合型支架正成为消费电子市场的新宠。这类产品通过创新设计,既解决了手持设备的疲劳问题,又通过集成音响系统提升了视听体验。面对市场上琳琅满目
iPhone 17系列销量观察:中美开售10天增长14%,标准版与Pro Max需求最旺
根据Counterpoint Research最新发布的市场数据,iPhone 17系列在美国及中国市场的首销表现显著优于前代产品。数据显示,该系列机型在上市后的前10天内,销量较iPhone 16
揭秘OpenAI变现迷局:为何从理想转向现实利益?
10月15日消息,Sam Altman 在X上官宣将于12月推出成 人内容。奥特曼写道:“随着我们更全面地推行年龄限制,并践行‘像对待成年人一样对待成年用户’的原则,我们将允许更多内容,例如允许经过
相关攻略
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程



















