论文信息

论文标题：Adversarial training methods for semi-supervised text classification
论文作者：Taekyung Kim
论文来源：ICLR 2017
论文地址：download
论文代码：download
视屏讲解：click

1 背景

1.1 对抗性实例（Adversarial examples）

通过对输入进行小扰动创建的实例，可显著增加机器学习模型所引起的损失
对抗性实例的存在暴露了机器学习模型的脆弱性和局限性，也对安全敏感的应用场景带来了潜在的威胁；

1.2 对抗性训练

　　训练模型正确分类未修改示例和对抗性示例的过程，使分类器对扰动具有鲁棒性

　　目的：

- 正则化手段，提升模型的性能（分类准确率），防止过拟合
- 产生对抗样本，攻击深度学习模型，产生错误结果（错误分类）
- 让上述的对抗样本参与的训练过程中，提升对对抗样本的防御能力，具有更好的泛化能力
- 利用 GAN 来进行自然语言生成有监督问题中通过标签将对抗性扰动设置为最大化

1.3 虚拟对抗性训练

　　将对抗性训练扩展到半监督/无标记情况

　　使模型在某实例和其对抗性扰动上产生相同的输出分布

2 方法

2.1 整体框架

　　基本思想：扩展对抗性训练/虚拟对抗性训练至文本分类任务和序列模型

　　基本思路：

对于文本分类任务，由于输入是离散的，且常表示为高维one-hot向量，不允许无穷小的扰动，因此将扰动施加于词嵌入中；由于受干扰的嵌入不能映射至某个单词，本文中训练策略仅作为通过稳定分类函数来正则化文本分类器的方法，不能防御恶意扰动；
施加扰动于规范化的词嵌入中，设置对抗性损失/虚拟对抗性损失，增强模型分类的鲁棒性；

2.2 方法介绍

　　将离散单词输入转化为连续向量，定义单词嵌入矩阵:

　　　　$\mathbb{R}^{(K+1) \times D}$

　　其中 $K$ 指代单词数量，第 $K+1$ 个单词嵌入作为序列结束($eos$)令牌

　　设置对应时间步长的离散单词为 $w^{(t)}$ ，单词嵌入为 $v^{(t)}$

　　针对文本分类问题使用 LSTM 模型或双向 LSTM 模型由于扰动为有界范数，模型在对抗性训练过程中可能通过 “学习具有较大范数的嵌入使扰动变得不重要” 的病态解决方案，因此需将嵌入进行规范化：

　　　　$\overline{\boldsymbol{v}}_{k}=\frac{\boldsymbol{v}_{k}-\mathrm{E}(\boldsymbol{v})}{\sqrt{\operatorname{Var}(\boldsymbol{v})}} \text { where } \mathrm{E}(\boldsymbol{v})=\sum_{j=1}^{K} f_{j} \boldsymbol{v}_{j}, \operatorname{Var}(\boldsymbol{v})=\sum_{j=1}^{K} f_{j}\left(\boldsymbol{v}_{j}-\mathrm{E}(\boldsymbol{v})\right)^{2}$

　　其中 $f_{i}$ 表示第 $i$ 个单词的频率，在所有训练示例中进行计算。

2.2.1 对抗性训练

　　对抗性训练尝试提高分类器对小的、近似最坏情况扰动的鲁棒性——使分类器预测误差最大

　　代价函数：

　　　　$-\log p\left(y \mid \boldsymbol{x}+\boldsymbol{r}_{\mathrm{zd} v} ; \boldsymbol{\theta}\right) \text { where } \boldsymbol{r}_{\mathrm{ud} v}-\underset{\boldsymbol{r}, \mid \boldsymbol{r} \| \leq \epsilon}{\arg \min } \log p(y \mid \boldsymbol{x}+\boldsymbol{r} ; \hat{\boldsymbol{\theta}})$

　　其中 $r$ 为扰动， $\widehat{\theta}$ 为分类器当前参数的常数集，即表明构造对抗性实例的过程中不应该进行反向传播修改参数

　　对抗性扰动 $r$ 的生成：通过线性逼近得到

　　　　$\boldsymbol{r}_{\mathrm{adv}}=-\epsilon \boldsymbol{g} /\|\boldsymbol{g}\|_{2} \text { where } \boldsymbol{g}=\nabla_{\boldsymbol{x}} \log p(y \mid \boldsymbol{x} ; \hat{\boldsymbol{\theta}})$

2.2.2 虚拟对抗性训练

　　将对抗性训练应用于半监督学习——使分类器预测的输出分布差距最大

　　额外代价：

　　　　$\begin{array}{l}\operatorname{KL}\left[p(\cdot \mid \boldsymbol{x} ; \hat{\boldsymbol{\theta}}) \mid p\left(\cdot \mid \boldsymbol{x}+\boldsymbol{r}_{\mathrm{v} \text {-adv }} ; \boldsymbol{\theta}\right)\right] \\\text { where } \boldsymbol{r}_{\mathrm{v} \text {-adv }}=\underset{\boldsymbol{r},\|\boldsymbol{r}\| \leq \ell}{\arg \max } \mathrm{KL}[p(\cdot \mid \boldsymbol{x} ; \hat{\boldsymbol{\theta}}) \| p(\cdot \mid \boldsymbol{x}+\boldsymbol{r} ; \hat{\boldsymbol{\theta}})]\end{array}$

　　对抗性扰动设置：

　　　　$\boldsymbol{r}_{\mathrm{adv}}=-\epsilon \boldsymbol{g} /\|\boldsymbol{g}\|_{2} \text { where } \boldsymbol{g}=\nabla_{\boldsymbol{s}} \log p(y \mid \boldsymbol{s} ; \hat{\boldsymbol{\theta}})$

　　对抗性损失：

　　　　$L_{\mathrm{adv}}(\boldsymbol{\theta})=-\frac{1}{N} \sum_{n=1}^{N} \log p\left(y_{n} \mid \boldsymbol{s}_{n}+\boldsymbol{r}_{\mathrm{adv}, n} ; \boldsymbol{\theta}\right)$

　　其中 $N$ 为标记样本的数量

　　虚拟对抗性扰动设置：

　　　　$\boldsymbol{r}_{\mathrm{v} \text {-adv }}=\epsilon \boldsymbol{g} /\|\boldsymbol{g}\|_{2} \text { where } \boldsymbol{g}=\nabla_{\boldsymbol{s}+\boldsymbol{d}} \mathrm{KL}[p(\cdot \mid \boldsymbol{s} ; \hat{\boldsymbol{\theta}}) \mid p(\cdot \mid \boldsymbol{s}+\boldsymbol{d} ; \hat{\boldsymbol{\theta}})]$

　　其中 $d$ 为小随机向量，实际通过有限差分法和幂迭代计算虚拟对抗性扰动

　　虚拟对抗性训练损失：

　　　　$L_{\mathrm{V} \text {-adv }}(\boldsymbol{\theta})=\frac{1}{N^{\prime}} \sum_{n^{\prime}=1}^{N^{\prime}} \mathrm{KL}\left[p\left(\cdot \mid \boldsymbol{s}_{n^{\prime}} ; \hat{\boldsymbol{\theta}}\right) \mid p\left(\cdot \mid \boldsymbol{s}_{n^{\prime}}+\boldsymbol{r}_{\mathrm{v}-\mathrm{ndv}, n^{\prime}} ; \boldsymbol{\theta}\right)\right]$

　　其中 $N$ 为标记/未标记样本的数量之和

3 总结

　　略

4 其他

基于梯度的攻击： FGSM（Fast Gradient Sign Method)　　PGD(Project Gradient Descent)　　MIM(Momentum Iterative Method)
基于优化的攻击： CW(Carlini-Wagner Attack)
基于决策面的攻击： DEEPFOOL

论文解读（ FGSM）《Adversarial training methods for semi-supervised text classification》的更多相关文章

论文解读（ARVGA）《Learning Graph Embedding with Adversarial Training Methods》
论文信息论文标题:Learning Graph Embedding with Adversarial Training Methods论文作者:Shirui Pan, Ruiqi Hu, Sai-f ...
论文阅读：《Bag of Tricks for Efficient Text Classification》
论文阅读:<Bag of Tricks for Efficient Text Classification> 2018-04-25 11:22:29 卓寿杰_SoulJoy 阅读数 954 ...
论文解读（ClusterSCL）《ClusterSCL: Cluster-Aware Supervised Contrastive Learning on Graphs》
论文信息论文标题:ClusterSCL: Cluster-Aware Supervised Contrastive Learning on Graphs论文作者:Yanling Wang, Jing ...
论文笔记 - Noisy Channel Language Model Prompting for Few-Shot Text Classification
Direct && Noise Channel 进一步把语言模型推理的模式分为了: 直推模式(Direct): 噪声通道模式(Noise channel). 直观来看: Direct ...
论文解读（SR-GNN）《Shift-Robust GNNs: Overcoming the Limitations of Localized Graph Training Data》
论文信息论文标题:Shift-Robust GNNs: Overcoming the Limitations of Localized Graph Training Data论文作者:Qi Zhu, ...
《C-RNN-GAN: Continuous recurrent neural networks with adversarial training》论文笔记
出处:arXiv: Artificial Intelligence, 2016(一年了还没中吗?) Motivation 使用GAN+RNN来处理continuous sequential data, ...
CVPR2020论文解读：CNN合成的图片鉴别
CVPR2020论文解读:CNN合成的图片鉴别 <CNN-generated images are surprisingly easy to spot... for now> 论文链接:h ...
论文解读（BYOL）《Bootstrap Your Own Latent A New Approach to Self-Supervised Learning》
论文标题:Bootstrap Your Own Latent A New Approach to Self-Supervised Learning 论文方向:图像领域论文来源:NIPS2020 论文 ...
论文解读第三代GCN《 Deep Embedding for CUnsupervisedlustering Analysis》
Paper Information Titlel:<Semi-Supervised Classification with Graph Convolutional Networks>Aut ...
itemKNN发展史----推荐系统的三篇重要的论文解读
itemKNN发展史----推荐系统的三篇重要的论文解读本文用到的符号标识 1.Item-based CF 基本过程: 计算相似度矩阵 Cosine相似度皮尔逊相似系数参数聚合进行推荐根据用户 ...

随机推荐

Verilog中的时间尺度与延迟
在Verilog的建模中,时间尺度和延迟是非常重要的概念,设置好时间尺度和延迟,可以充分模拟逻辑电路发生的各种情况和事件发生的时间点,来评估数字IC设计的各种要求,达到充分评估和仿真的作用.注意延迟语 ...
CSS 选择器-认识并应用选择器
在内嵌式和外部css中,要想将CSS样式应用于特定的HTML元素,首先需要找到该目标元素,这时需要用到CSS中的选择器. 选择器:选择要添加样式的 HTML 标签的一种方法.模式. 首先学习 css2 ...
如何简单使用Git
Git基本功能 Git基本功能在具体介绍Git能做什么之前,先来了解下Git里的四个角色: workspace: 本地的工作空间. index:缓存区域,临时保存本地改动. local reposi ...
jmeter性能测试小小实践
一.测试步骤测试计划 / 线程组 / http请求 / 监听器 / 运行脚本 / 查看报告二.线程组线程组:虚拟用户数 ramp up period:设置虚拟用户数需要多长的时间全部启动,如果线 ...
Tomcat源码部署
1.下载源码 https://dlcdn.apache.org/tomcat/tomcat-9/v9.0.54/src/apache-tomcat-9.0.54-src.zip 2.解压 3.在解压后 ...
CentOS 安装 jdk1.8
转自:https://www.cnblogs.com/yjlch1016/p/8900841.html 前置条件:不使用openjdk,若想使用openjdk.直接在centos下使用 yum 查 ...
python openpyxl 多个sheet vlookup
import pandas as pdimport openpyxlfrom openpyxl.styles import Border, Side,colorswb = openpyxl.load_ ...
windows远程linux桌面
TigerVNC是一个高性能.平台无关的虚拟网络计算(Virtual Network Computing,VNC)实现,是一个客户端/服务器应用程序,允许用户在远程机器上启动并与图形应用程序进行交互. ...
wmware桥接模式
配置思路(桥接模式) 准备一个与PC机同网段且未被占用的IP地址将虚拟机的网络模式修改为桥接模式(默认为NAT模式) 修改网卡配置文件,配置为准备好的IP地址,并重启网络服务. 配置DNS解析服务器 ...
element-ui el-tree 内容过多出现横向滚动条
/deep/ .el-tree>.el-tree-node { display: inline-block; min-width: 100%;}

论文解读（ FGSM）《Adversarial training methods for semi-supervised text classification》