计算机工程与科学 ›› 2026, Vol. 48 ›› Issue (3): 500-511.
张新君,郭继发
ZHANG Xinjun,GUO Jifa
摘要: 随着人工智能的日益发展,它给人们的生活带来极大便利的同时也逐渐引发人类对其安全性的思考。图像分类是计算机视觉领域的重要研究工作,但深度神经网络的脆弱性使其易受对抗样本的攻击。对抗样本是人工智能安全领域的一个重要研究方向,关于对抗样本的生成和防御技术层出不穷。以ViT为基础进行改动,提出了可用于图像块相似度比较的新模型——SCViT。SCViT中,图像块经线性投射层和Transformer Encoder得到对应的表示向量,将这些向量进行余弦相似度比较即可判断图像块的相似程度。为了降低位置编码对相似度计算的影响,在SCViT的位置编码前添加了微小系数α。利用SCViT进行图像块相似度比较,使用干净样本的图像块逐块取代对抗样本的图像块,最后将所有取代完成的干净样本的图像块拼接成新的图像用于分类。在CIFAR-10数据集上的实验结果表明,对参数α进行恰当取值,可提升方法的防御效果;在Inception_v3和Inception_v4分类模型上的实验结果表明,所提方法在不同分类网络上具有良好的迁移性;与几种常用的图像重构防御方法进行对比,所提方法在取得优异防御效果的同时鲁棒性也更好,对4种攻击方法下的图像分类正确率均达到了80%以上;在CIFAR-100和ImageNet数据集上进行实验,对抗样本的分类准确率分别提高了54个百分点以上和46个百分点以上,体现了所提方法的通用性。