【黑盒对抗攻击】ICML 2021:SPADE: A Spectral Method for Black-Box Adversarial Robustness Evaluation

【黑盒对抗攻击】SPADE: A Spectral Method for Black-Box Adversarial Robustness Evaluation

  • 论文地址:
  • 代码地址:
  • 论文摘要:
  • 主要问题:
  • 主要思路:
  • 主要贡献:
  • 基本概念:
    • 谱图理论:
    • 对抗性鲁棒性的机器学习:
    • 对抗性鲁棒性评估:
  • 具体实现:
    • 整体框架:
    • 基于图的流形构造:
    • ML模型的 SPADE 分数:
      • 距离度量:
      • SPADE 分数:
    • 输入数据样本的 SPADE 分数:
    • SPADE 分数的应用:
      • SPADE-Guided Adversarial Training:
      • SPADE-Guided Robustness Evaluation:
  • 实验结果:

论文地址:

https://arxiv.org/abs/2102.03716

代码地址:

https://github.com/Feng-Research/SPADE

论文摘要:

这篇文章介绍了一种黑盒谱方法来评估给定机器学习模型的对抗性鲁棒性,作者将该方法方法命名为SPADE,该方法利用了输入/输出图之间的双射距离映射,其中这些图被构造为近似与输入/输出数据对应的流形

利用广义的考特-费舍尔定理(Courant-Fischer theorem),作者提出了一个评价给定模型对抗鲁棒性的 SPADE 分数,并证明了它是流形设置下最佳利普希茨常数(Lipschitz constant)的上界

为了揭示最容易受到对抗性攻击的非鲁棒数据样本,作者开发了一个利用优势广义特征向量的谱图嵌入算法,这个嵌入算法允许为每个数据样本分配一个鲁棒性评分,可以进一步用于更有效的对抗性训练

作者的实验表明,所提出的 SPADE 方法为使用MNIST和CIFAR-10数据集进行反向训练

你可能感兴趣的:(▶,深度学习-计算机视觉,对抗攻击,黑盒攻击,模型可解释性,人工智能,神经网络)