数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

科技数码

仅需250份文件实现AI“洗脑”，看黑客如何操纵ChatGPT

仅需250份文件实现AI“洗脑”，看黑客如何操纵ChatGPT

热心网友时间：2025-10-20

转载

10月19日消息，Anthropic、英国AI安全研究所与艾伦·图灵研究所最近发布联合研究，揭示了一个令人担忧的现象：像Claude、ChatGPT和Gemini这样的大语言模型，对数据投毒攻击的防御能力远低于预期。研究发现，攻击者只需使用极少量恶意文件，就能在模型中成功植入"后门"程序。

这项研究对参数规模从60万到130亿不等的多个AI模型进行了训练测试，结果显示无论模型规模如何扩展，攻击者仅需插入约250份被污染的训练文件，就能有效操控模型的响应行为。这一发现彻底颠覆了业界长期持有的"模型越大、攻击难度越高"的传统认知。

在被测试的最大模型（130亿参数）中，250份恶意文件仅占训练数据总量的0.00016%，然而当模型遇到特定的"触发短语"时，就会按照植入的后门指令执行，输出毫无意义的文本，而非正常的连贯回应。

研究人员还尝试通过持续的"净数据"训练来消除后门，结果显示这些后门程序仍在一定程度上持续存在，表现出较强的顽固性。

虽然本次研究主要针对简单的后门行为，且测试模型规模尚未达到商业旗舰级水平，但研究团队强烈呼吁业界必须尽快改进现有的安全实践方案。

AI模型也能被

来源:https://m.mydrivers.com/newsview/1081047.html

上一篇：马斯克邀卡帕西编程对决被拒：互动背后或为重归团队

下一篇：红米K90 Pro Max深度评测：挑战小米17的旗舰配置

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元

泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元

泰坦军团“战魂KG277VPLUS”27英寸显示器发售，支持4K165Hz与FHD520Hz双模切换，定价1888元。采用FastIPS面板，97%DCI-P3色域，配备升降支架及双HDMI2 1和双DP1 4接口。

时间：2026-07-03 12:53

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%

迈入2026年，DRAM与NAND闪存的供应持续紧张及价格不断攀升，正逐步传导至终端消费市场。可以预见，下半年市场环境将更加严峻。上半年多家PC厂商已陆续上调产品定价，最终连苹果也不得不跟进，宣布提升iPad、Mac及家居设备的价格，以应对存储成本的快速上涨。 TrendForce分析指出，苹果全面

时间：2026-07-03 12:53

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波

苹果自研C2芯片仅支持Sub-6GHz，不支持5G毫米波。因此，美版iPhone18Pro继续采用高通基带方案以支持毫米波，而其他地区版本则搭载苹果自研C2芯片。这一差异将导致在毫米波覆盖的市场中，用户峰值速率可能显著低于美版用户。

时间：2026-07-03 12:53

纳睿雷达推出睿宸超精细化短时临近AI气象大模型

纳睿雷达推出睿宸超精细化短时临近AI气象大模型

纳睿雷达近日释放了一项重磅成果。2026年7月1日，公司正式对外发布了两款自主研发的全新产品：一款是“WDSPT0152型”S波段全极化多功能有源相控阵雷达，另一款则是名为“睿宸”的超精细化短时临近AI气象大模型。从产品战略来看，此次发布直指气象监测与灾害预警领域的技术制高点。先来看这款S波段雷达

时间：2026-07-03 12:53

南航国际创新港一期交付四大专业园区打造空天产业强磁场

南航国际创新港一期交付四大专业园区打造空天产业强磁场

近日，南京航空航天大学与六合区深度合作的标杆项目——南航国际创新港一期正式交付投用。两个地块陆续启用，成功串联起高校科研能量、地方产业载体与市场创新主体，为南京打造全国领先的航空航天产业创新中心、助力江苏布局商业航天全产业链，提供了坚实的物理支撑。该创新港一期位于六合区雄州街道，分为3号和4号两个

时间：2026-07-03 12:52

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

日榜
周榜
月榜

豆包专业版输出格式与文风固定设置教程

快对AI网页版智能问答助手在线入口

马斯克抽调星舰星链精英全力攻坚Grok大模型

火币HTX交易所官方APP下载 v8.9.5安卓iOS最新版

优必选50余款超仿生人形机器人首发预售订单超1.1万

Kimi估值达315亿美元收入曲线类似Anthropic早期

AI洗牌后职场只剩5类人，Claude Code之父版MBTI解读

Meta脑机接口重大进展登Nature子刊实现高实时解码准确率

小米澎湃OS3升级超级岛常驻世界杯比分相册AI修图更便捷

人工智能黑客猖獗苹果破例提前发布iOS安全更新

豆包专业版输出格式与文风固定设置教程

快对AI网页版智能问答助手在线入口

马斯克抽调星舰星链精英全力攻坚Grok大模型

火币HTX交易所官方APP下载 v8.9.5安卓iOS最新版

优必选50余款超仿生人形机器人首发预售订单超1.1万

Kimi估值达315亿美元收入曲线类似Anthropic早期

AI洗牌后职场只剩5类人，Claude Code之父版MBTI解读

Meta脑机接口重大进展登Nature子刊实现高实时解码准确率

小米澎湃OS3升级超级岛常驻世界杯比分相册AI修图更便捷

人工智能黑客猖獗苹果破例提前发布iOS安全更新

豆包专业版输出格式与文风固定设置教程

快对AI网页版智能问答助手在线入口

马斯克抽调星舰星链精英全力攻坚Grok大模型

火币HTX交易所官方APP下载 v8.9.5安卓iOS最新版

优必选50余款超仿生人形机器人首发预售订单超1.1万

Kimi估值达315亿美元收入曲线类似Anthropic早期

AI洗牌后职场只剩5类人，Claude Code之父版MBTI解读

Meta脑机接口重大进展登Nature子刊实现高实时解码准确率

小米澎湃OS3升级超级岛常驻世界杯比分相册AI修图更便捷

人工智能黑客猖獗苹果破例提前发布iOS安全更新

相关攻略

相关攻略

泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元

2026-07-03 12:53

泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%

2026-07-03 12:53

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波

2026-07-03 12:53

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波

纳睿雷达推出睿宸超精细化短时临近AI气象大模型

2026-07-03 12:53

纳睿雷达推出睿宸超精细化短时临近AI气象大模型

南航国际创新港一期交付四大专业园区打造空天产业强磁场

2026-07-03 12:52

南航国际创新港一期交付四大专业园区打造空天产业强磁场

美股半导体芯片股盘前出现集体下跌行情

2026-07-03 12:52

美股半导体芯片股盘前出现集体下跌行情

诺兰《奥德赛》终极中字预告每帧均为IMAX胶片拍摄

2026-07-03 12:52

诺兰《奥德赛》终极中字预告每帧均为IMAX胶片拍摄

华硕ROG新音频硬件产品曝光或即将发布

2026-07-03 12:52

华硕ROG新音频硬件产品曝光或即将发布

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

光与影33号远征队全收集标注地图完整版

光与影33号远征队全收集标注地图完整版发布于 2026-07-03

鸣潮丽贝卡声骸套装选择推荐

鸣潮丽贝卡声骸套装选择推荐发布于 2026-07-03

鸣潮丽贝卡武器选择攻略

鸣潮丽贝卡武器选择攻略发布于 2026-07-03

鸣潮丽贝卡值得抽取吗

鸣潮丽贝卡值得抽取吗发布于 2026-07-03

机器人角斗场手机版弓箭挑战玩法攻略

机器人角斗场手机版弓箭挑战玩法攻略发布于 2026-07-03

梦幻西游落宝金钱有什么用效果详细解析

梦幻西游落宝金钱有什么用效果详细解析发布于 2026-07-03

年男生女生互动小游戏推荐，增进感情精选合集

年男生女生互动小游戏推荐，增进感情精选合集发布于 2026-07-03

愤怒的小鸟经典归来与耐玩归来冠军小鸟玩法教程

愤怒的小鸟经典归来与耐玩归来冠军小鸟玩法教程发布于 2026-07-03

Win11频繁断网提示默认网关不可用怎么办

Win11频繁断网提示默认网关不可用怎么办发布于 2026-07-03

Mac如何取消正在进行的系统备份任务

Mac如何取消正在进行的系统备份任务发布于 2026-07-03

电脑显示器刷新率锁死60Hz无法调整的解决方法

电脑显示器刷新率锁死60Hz无法调整的解决方法发布于 2026-07-03

Linux系统下Systemd服务管理从零开始方法步骤详解完整教程

Linux系统下Systemd服务管理从零开始方法步骤详解完整教程发布于 2026-07-03

AIDA64压力测试结果查看教程

AIDA64压力测试结果查看教程发布于 2026-07-03

Camtasia电脑录屏没有声音的解决方法与步骤详解

Camtasia电脑录屏没有声音的解决方法与步骤详解发布于 2026-07-03

翻译狗翻译时关闭广告弹窗的设置方法

翻译狗翻译时关闭广告弹窗的设置方法发布于 2026-07-03

亿图图示流程图插入Word文档详细步骤

亿图图示流程图插入Word文档详细步骤发布于 2026-07-03

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集