Adversarial Robustness by 刘思佳

2022-10-26 AISP 对抗鲁棒性 0 Comments Word Count: 409(words) Read Count: 1(minutes)

观后感

Source The 6th Lecture

深度神经网络的对抗鲁棒性

对于黑盒的对抗攻击，优化问题不能求导，便将其转化为一个零阶(ZO zero-order)优化问题，他们证明了收敛性。

但是存在收敛速度慢的问题：

相比于ZO-SGD，ZO-signSGD对估计的梯度取了正负。

效果：

但是同时也引入了新的问题：收敛精度下降，难以取得和ZO-SGD一样的最值。

sign减少估计的方差，而换一种思路，自适应的学习率adaptive learning rate也可以降低估计方差。因此可以采用ZO-Adam优化方法。

对抗攻击会修改图片的interpretation maps （CAM），造成了可解释性上的差异。

由此，刘思佳教授设计相应的可解释性上的距离度量，并证明了该距离大于图片对原本类和目标类的激活值之差。

将可解释性距离度量用于对抗训练，对有较大扰动的对抗攻击的鲁棒性提高效果很好，但是会使模型的精确性下降。

本文链接： https://cyccyyycyc.github.io/2022/10/26/Adversarial-Robustness-by刘思佳/

版权声明： 本博客所有文章除特别声明外，均采用 CC BY 4.0 CN协议许可协议。转载请注明出处！