程学旗团队提出随机剪枝策略提升对抗样本通用攻击力

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

程学旗团队提出随机剪枝策略提升对抗样本通用攻击力

热心网友时间：2026-05-16

转载

深度学习在计算机视觉领域的突破，已经让智能系统无处不在。从自动驾驶汽车识别路况，到安防摄像头进行人脸验证，再到医疗影像辅助诊断，这些背后都是神经网络在默默工作。然而，一个幽灵始终困扰着这些看似强大的模型：对抗样本。

你或许难以想象，只需在停车标志的图像上添加一些肉眼几乎无法察觉的细微扰动，就可能让自动驾驶系统将其误判为限速标志。同样，在人脸识别系统中，一点精心设计的噪声就足以让系统“张冠李戴”。这种由微小输入变化导致模型完全错误决策的现象，不仅揭示了神经网络决策边界的脆弱性，更对现实世界系统的安全性构成了严峻挑战。

在众多攻击手段中，迁移攻击因其高度的现实威胁性而备受关注。它不需要知道目标模型的具体内部结构，攻击者只需利用一个自己能够访问的“袋里”模型生成对抗样本，就有机会去攻击另一个未知的“黑盒”模型。这无疑大大降低了攻击门槛，提高了防御难度。

面对这一核心挑战，中国科学院计算技术研究所程学旗团队进行了深入探索，并在论文《RaPA: Enhancing Transferable Targeted Attacks via Random Parameter Pruning》中提出了一种新颖且高效的解决方案。

研究团队洞察到一个关键问题：现有的迁移攻击方法，其生成的对抗样本往往过度“依赖”袋里模型中少数特定的参数。这就好比一个人只习惯了走某一条特定的小路，一旦换条路就不会走了。这种依赖性严重限制了攻击样本在不同模型间的“泛化”能力。为此，他们创新性地在攻击过程中引入了“随机参数剪枝”策略。简单来说，就是在每次生成对抗样本时，都随机“关闭”模型中的一部分参数，从而动态地创造出许多结构略有差异的模型变体。让攻击样本在这个不断变化的“模型环境”中接受锤炼，最终使其能够适应更多样的模型结构，显著提升了攻击的迁移成功率。

攻击性能大幅提升，RaPA 优势明显

实验数据是最有力的证明。研究团队提出的随机参数剪枝攻击方法（RaPA），在提升对抗样本的迁移能力上表现突出。

在ImageNet数据集上的对比实验中，RaPA与当前主流的多种增强迁移攻击技术（如DI、SI、Admix、BSR等）同台竞技。结果发现，在大多数模型组合下，RaPA的攻击成功率都达到了最高或接近最高水平。

尤其值得一提的是跨架构攻击场景——即用卷积神经网络（CNN）生成的样本来攻击视觉Transformer（ViT）模型。由于两者结构和工作原理差异巨大，这被公认为是对抗攻击中的“硬骨头”。实验结果显示，在此场景下，现有最优方法的平均攻击成功率约为33%，而RaPA将这一数字提升到了约45%，提升幅度显著。

具体来看，当使用ResNet50作为袋里模型时，RaPA的平均攻击成功率提升了约11.7%；使用DenseNet121时，提升更是达到了约17.5%。反过来，用Transformer模型攻击CNN模型时，RaPA同样表现优异，平均成功率约51%，领先于所有对比方法。这充分证明了RaPA生成的对抗样本具有更强的通用性和鲁棒性。

光在“裸”模型上成功还不够，真正的考验在于能否突破各种防御机制。研究团队在对抗训练、JPEG压缩、随机化、图像降噪乃至新兴的扩散模型防御等多种防御条件下测试了RaPA。结果令人印象深刻：在所有防御场景中，RaPA的攻击成功率依然保持领先。例如，在面对经过对抗训练的强化模型时，RaPA仍能保持约88%的成功率，优势明显。

此外，研究还发现，当提供更多计算资源（如增加攻击迭代次数）时，RaPA的性能提升潜力也大于其他方法。例如在使用ResNet50的情况下，攻击成功率可额外提升约15.9%。这意味着在算力允许的条件下，RaPA能发挥出更强大的攻击效能。

多模型、多方法对比下的实验验证

为了确保结论的可靠性，这项研究设计了严谨且全面的实验。实验聚焦于“目标迁移攻击”，这比普通的非目标攻击（只要求模型分类错误）更难，因为它要求模型必须输出攻击者指定的错误类别。

实验基于经典的ImageNet-compatible数据集进行，并选取了极其丰富的模型库作为攻击目标和袋里模型，包括VGG、ResNet、DenseNet等经典CNN模型，ViT、LeViT等视觉Transformer模型，以及跨模态的CLIP模型。这种多样化的模型组合，确保了评估结果的广泛代表性。

对比基线几乎囊括了当前主流的迁移攻击增强技术，分为四大类：输入变换类（如DI、SIA）、梯度优化类（如MI-FGSM）、特征混合类（如Admix、FTM）以及模型集成类（如MUP）。所有方法都在统一的攻击参数和计算预算下进行公平比较。

那么，RaPA的具体流程是怎样的？其实它的核心思想清晰而巧妙：在每一次攻击迭代中，都对袋里模型的全连接层、归一化层等参数进行随机“剪枝”（即暂时置零），从而瞬时得到一个结构略有不同的新模型。在一次迭代中，可以生成多个这样的随机剪枝模型变体。然后，分别计算这些变体模型关于输入图像的梯度，并将这些梯度进行平均。最终，利用这个“集百家之长”的平均梯度来更新对抗样本。通过多次迭代，最终生成的对抗样本就不再依赖于任何一组固定参数，而是学会了在多种模型变体上都保持攻击性。