视频识别模型在安全、交通管理和医疗诊断等领域中举足轻重,但由于其易受对抗性攻击的影响,面临着重大挑战。现有的稀疏对抗性攻击方法往往欺骗率较低,且需要较大的扰动,导致攻击的隐蔽性较差。2025年6月9日,22级硕士研究生史小龙在夏辉教授的指导下发表论文Imperceptible Pixel-Precise Adaptive Multi-Level Sparse Adversarial Attacks on Video Recognition Models,成功被Knowledge-Based Systems期刊录用。该论文提出了一种自适应稀疏攻击方法。该方法首先融入类激活映射(CAM)技术,通过在反向传播过程中分析模型对输入帧的响应,来量化每个像素的重要性。此外,我们引入了一种动态调整机制,在攻击过程中为每个样本设定定制化的时空阈值。基于像素的重要性,我们利用空间阈值在视频层面自适应地识别关键区域,确保帧内的稀疏性。在这些空间选择结果的基础上,我们通过时间阈值进一步自适应地筛选关键帧。这种相互关联的层级选择过程,确保生成的 0-1 二进制稀疏掩码具有很强的时空相关性。再者,考虑到不同像素的重要性存在差异,我们提出了一种自适应重要性掩码。最后,我们利用扩展到视频领域的投影梯度下降(PGD)攻击,将对抗性扰动融入关键帧和关键区域,从而生成对抗样本。这项成果在提升稀疏对抗攻击的欺骗率、增强攻击隐蔽性等方面表现卓越,为深入探究视频识别模型的安全防护边界、推动攻防技术的迭代升级提供了全新的研究思路。