DEFENSE-GAN: PROTECTING CLASSIFIERS AGAINST ADVERSARIAL ATTACKS USING GENERATIVE MODELS

概
主要内容

Samangouei P, Kabkab M, Chellappa R, et al. Defense-GAN: Protecting Classifiers Against Adversarial Attacks Using Generative Models.[J]. arXiv: Computer Vision and Pattern Recognition, 2018.

@article{samangouei2018defense-gan:,

title={Defense-GAN: Protecting Classifiers Against Adversarial Attacks Using Generative Models.},

author={Samangouei, Pouya and Kabkab, Maya and Chellappa, Rama},

journal={arXiv: Computer Vision and Pattern Recognition},

year={2018}}

概

本文介绍了一种针对对抗样本的defense方法, 主要是利用GAN训练的生成器, 将样本$x$投影到干净数据集上$\hat{x}$.

主要内容

我们知道, GAN的损失函数到达最优时, $p_{data}=p_G$, 又倘若对抗样本的分布是脱离于$p_{data}$的, 则如果我们能将$x$投影到真实数据的分布$p_{data}$(如果最优也就是$p_G$), 则我们不就能找到一个防御方法了吗?

对于每一个样本, 首先初始化$R$个随机种子$z_0^{(1)}, \ldots, z_0^{(R)}$, 对每一个种子, 利用梯度下降($L$步)以求最小化

\[\tag{DGAN}
\min \quad \|G(z)-x\|_2^2,
\]

其中$G(z)$为利用训练样本训练的生成器.

得到$R$个点$z_*^{(1)},\ldots, z_*^{(R)}$, 设使得(DGAN)最小的为$z^*$, 以及$\hat{x} = G(z^*)$, 则$\hat{x}$就是我们要的, 样本$x$在普通样本数据中的投影. 将$\hat{x}$喂入网络, 判断其类别.

另外, 作者还在实验中说明, 可以直接用$\|G(z^*)-x\|_2^2 \frac{<}{>} \theta$ 来判断是否是对抗样本, 并计算AUC指标, 结果不错.

注: 这个方法, 利用梯度方法更新的难处在于, $x \rightarrow \hat{x}$这一过程, 包含了$L$步的内循环, 如果直接反向传梯度会造成梯度爆炸或者消失.

DEFENSE-GAN: PROTECTING CLASSIFIERS AGAINST ADVERSARIAL ATTACKS USING GENERATIVE MODELS的更多相关文章

Mind the Box: $\ell_1$-APGD for Sparse Adversarial Attacks on Image Classifiers
目录概主要内容 Croce F. and Hein M. Mind the box: $\ell_1$-APGD for sparse adversarial attacks on image ...
Defending Adversarial Attacks by Correcting logits
目录概主要内容实验 Li Y., Xie L., Zhang Y., Zhang R., Wang Y., Tian Q., Defending Adversarial Attacks by C ...
Towards Deep Learning Models Resistant to Adversarial Attacks
目录概主要内容 Note Madry A, Makelov A, Schmidt L, et al. Towards Deep Learning Models Resistant to Adver ...
AT-GAN: A Generative Attack Model for Adversarial Transferring on Generative Adversarial Nets
目录概主要内容符号说明 Original Generator Transfer the Generator Wang X., He K., Guo C., Weinberger K., Hopc ...
论文阅读 | Real-Time Adversarial Attacks
摘要以前的对抗攻击关注于静态输入,这些方法对流输入的目标模型并不适用.攻击者只能通过观察过去样本点在剩余样本点中添加扰动. 这篇文章提出了针对于具有流输入的机器学习模型的实时对抗攻击. 1 介绍在 ...
KDD 2019放榜！录取率仅14%，强调可重现性
[导读]KDD 2019录取结果终于放榜了,今年Research和ADS两个 track共评审论文1900篇,其中Research track的录取率只有14%.今年也是KDD第一次采用双盲评审政策, ...
Distillation as a Defense to Adversarial Perturbations against Deep Neural Networks
目录概主要内容算法一些有趣的指标鲁棒性定义合格的抗干扰机制 Nicolas Papernot, Patrick McDaniel, Xi Wu, Somesh Jha, Ananthram ...
论文解读（GAN）《Generative Adversarial Networks》
Paper Information Title:<Generative Adversarial Networks>Authors:Ian J. Goodfellow, Jean Pouge ...
Generative Adversarial Nets[Wasserstein GAN]
本文来自<Wasserstein GAN>,时间线为2017年1月,本文可以算得上是GAN发展的一个里程碑文献了,其解决了以往GAN训练困难,结果不稳定等问题. 1 引言本文主要思考的是 ...

随机推荐

日常Java 2021/11/17
应用程序转换成Applet 将图形化的Java应用程序(是指,使用AWT的应用程序和使用java程序启动器启动的程序)转换成嵌入在web页面里的applet是很简单的.下面是将应用程序转换成.Appl ...
A Child's History of England.20
CHAPTER 7 ENGLAND UNDER HAROLD THE SECOND, AND CONQUERED BY THE NORMANS Harold was crowned King of E ...
day06 HTTP协议
day06 HTTP协议 HTTP协议什么是http? HTTP 全称:Hyper Text Transfer Protocol 中文名:超文本传输协议是一种按照URL指示,将超文本文档从一台主机 ...
【leetcode】952. Largest Component Size by Common Factor（Union find）
You are given an integer array of unique positive integers nums. Consider the following graph: There ...
Tomcat源码分析 | 一文详解生命周期机制Lifecycle
目录什么是Lifecycle? Lifecycle方法 LifecycleBase 增加.删除和获取监听器 init() start() stop() destroy() 模板方法总结前言 To ...
OC-copy，单例
总结编号主题内容一 NSFileManager NSFileManager介绍/用法(常见的判断)/文件访问/文件操作二集合对象的内存管理集合对象的内存管理/内存管理总结三 *copy ...
Servlet(1)：Servlet介绍
一. Servlet介绍 Servlet 是Java Servlet的简称,称为小服务程序或服务连接器,用Java编写的服务器端程序,具有独立于平台和协议的特性,主要功能在于交互式地浏览和生成数据,生 ...
第7章　使用性能利器——Redis
在现今互联网应用中,NoSQL已经广为应用,在互联网中起到加速系统的作用.有两种NoSQL使用最为广泛,那就是Redis和MongoDB.本章将介绍Redis和Spring Boot的结合.Redis ...
windows 显示引用账户已被锁定，且可能无法登录
今天遇到一个比较尴尬的事情,清理笔记本键盘时,在锁屏界面多次碰到enter键,在登录界面被锁定无法登录. 一开始慌了,因为没遇到过这样的问题.百度一看方法不少,便开始尝试, 有的说是重启进入安全模式, ...
了解C#的Expression
我们书接上文,我们在了解LINQ下面有说到在本地查询IEnumerbale主要是用委托来作为传参,而解析型查询 IQueryable则用Expression来作为传参: public static I ...

DEFENSE-GAN: PROTECTING CLASSIFIERS AGAINST ADVERSARIAL ATTACKS USING GENERATIVE MODELS

概

主要内容

DEFENSE-GAN: PROTECTING CLASSIFIERS AGAINST ADVERSARIAL ATTACKS USING GENERATIVE MODELS的更多相关文章

随机推荐

热门专题