Classifier Guidance Enhances Diffusion-based Adversarial Purification by   Preserving Predictive Information

Mingkun Zhang; Jianing Li; Wei Chen; Jiafeng Guo; Xueqi Cheng

arXiv:2408.05900·cs.CV·August 13, 2024

Classifier Guidance Enhances Diffusion-based Adversarial Purification by Preserving Predictive Information

Mingkun Zhang, Jianing Li, Wei Chen, Jiafeng Guo, Xueqi Cheng

PDF

Open Access

TL;DR

This paper introduces COUP, a diffusion-based adversarial purification method that uses classifier confidence guidance to preserve information and improve robustness against attacks.

Contribution

The paper proposes a novel classifier-confidence guided purification (COUP) method that prevents information loss during diffusion-based adversarial purification.

Findings

01

COUP improves adversarial robustness under strong attacks.

02

It effectively preserves sample information during denoising.

03

Experimental results outperform existing diffusion-based purification methods.

Abstract

Adversarial purification is one of the promising approaches to defend neural networks against adversarial attacks. Recently, methods utilizing diffusion probabilistic models have achieved great success for adversarial purification in image classification tasks. However, such methods fall into the dilemma of balancing the needs for noise removal and information preservation. This paper points out that existing adversarial purification methods based on diffusion models gradually lose sample information during the core denoising process, causing occasional label shift in subsequent classification tasks. As a remedy, we suggest to suppress such information loss by introducing guidance from the classifier confidence. Specifically, we propose Classifier-cOnfidence gUided Purification (COUP) algorithm, which purifies adversarial examples while keeping away from the classifier decision…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.

Taxonomy

TopicsAdversarial Robustness in Machine Learning · Anomaly Detection Techniques and Applications

MethodsDiffusion