《Generative Adversarial Networks for Hyperspectral Image Classification 》论文笔记

论文题目：《Generative Adversarial Networks for Hyperspectral Image Classification》

论文作者：Lin Zhu, Yushi Chen, Member, IEEE, Pedram Ghamisi, Member, IEEE, and Jó n Atli Benediktsson, Fellow, IEEE

论文发表时间：2018

网络简称：3D-GAN

发表期刊：IEEE Transactions on Geoscience and Remote Sensing

Contributions

　　1)本文首次探索了GAN在高光谱数据处理中的应用。通过精心设计的GAN生成了包含1D spectra 和 3D spectral-spatial patches的对抗样本。

　　2)提出了光谱分类器和光谱-空间分类器两种GANs框架用于HSIs分类。该框架使用精心设计的cnn对人机交互进行分类，并采用正则化技术进行对抗性训练。

　　3)首次采用对抗性样本进行HSIs分类，对上述GANs进行微调以提高分类性能。

　　4)在训练样本有限的情况下，在三个知名的高光谱数据集上对所提出的方法进行了测试。

　　Note:这种对抗性训练提高了判别CNN的泛化能力，这在训练样本有限的情况下非常重要。

GAN

　　GAN是一种新的模型，通常包含生成模型G和判别模型D。模型G和D以对抗性的方式进行训练，其中G试图生成尽可能真实的假输入，D试图对真实输入和假输入进行分类。在这个对抗性博弈中，双方都希望得到最优的结果(即D可以得到最好的分类结果，G可以生成与真实数据分布最相似的伪数据)。通过两个网络的对抗和竞争，在使用有限的训练样本时，鉴别器的训练过程将持续而有效地进行，而不会立即陷入过拟合的困境。此外，GAN生成的样本可以用作虚拟样本。合理使用虚拟样本可以提高分类性能。本文利用生成的样本来提高分类精度，实验结果证明了使用这些样本的有效性。下图为GAN的总体结构。

　　在训练过程中，给训练样本标号，来自真实数据的样本为1，来自生成数据的样本为0。鉴别器D被训练为最大化log(D(x))，这是将正确标签分配给正确源的概率。而生成器G被训练为最小化log(1-D(G(z)))。因此，优化的最终目的是解决极大极小问题:

　　但是通过计算和评估发现，当鉴别器D具有真实样本的高概率分布时，D中的梯度可能会消失，导致训练过程停止。因此，修改后的损失函数可以写成如下优化形式:

Related Work

　　为了解决GAN的稳定性问题，在G和D中使用深度卷积网络的深度卷积生成对抗网络(DCGAN)架构被提出。由于原始GAN不适合用于多类图像的分类，Semi-GAN被提出，将真实训练数据的标签导入判别器D。GAN的概念被扩展为一种带有半监督方法的条件模型。此外，Odena提出了可用于图像分类的辅助分类器GAN (AC-GAN)，将其鉴别器D修改为可输出多类标签概率的softmax分类器。我们的网络是基于AC-GAN理论而形成的，而目标函数是经过修改的。根据多分类损失对参数进行优化，使其比传统的GANs更合适地优化损失函数。

Proposed Method

　　提出该方法的总体结构：

　　为了可以做多分类任务，给输入噪声z和真实数据x加入真实数据分类标签。加入标签或其他条件，通过与原始GAN的输入进行共同作用，可以指导生成自己期望的数据。目标函数包含两个部分:正确输入数据S_L的对数似然和C_L的正确类标签的对数似然:

　　因此D被优化以最大化Ls + Lc，而G被优化以最大化Lc - Ls。当G能够生成与真实数据最相似的假数据，而D无法区分假数据和真实数据时，理论上G和D都会获得最优化的结果。这样，我们可以证明整个网络达到了纳什均衡条件。

　　我们设计了光谱矢量和光谱空间信息结合的两种框架，前者称为1D-GAN，后者称为3D-GAN。上述两个框架中的G和D都是卷积网络的形式。G采用分步卷积神经网络（转置卷积）的形式（因为是生成模型->需要上采样），D采用卷积神经网络。在鉴别器D之后，并行应用sigmoid分类器和softmax分类器，分别对真实/虚假样本和hsi进行分类。

1D-GAN:

　　由于原始HSI可获得数百个波段，这意味着输入具有高维，很难训练生成器G(即训练阶段不稳定)。也就是说，由于冗余度高，生成器无法有效地模拟真实数据。主成分分析(PCA）可以通过将光谱维数降至合适的尺度来压缩整个图像，因此，我们基于PCA提取HSIs的光谱特征，保留了10个主成分。在卷积网络中，任何池化层都被stride convolutions(鉴别器)和fractional-strided convolutions(生成器)取代。

　　噪音z发送到生成器中的大小是（1*1*1），通过生成器的卷积转换后，大小为（10*1*1）。在网络训练期间，假设原始数据集有N个类。首先，每个生成的样本通过网络向前传递，并通过取概率预测向量的最大值为其分配一个标签。因此，这些假样本可以用这些标签在网络中训练。此外，生成的样本不属于任何类别的真实样本。由于真实样本和生成样本的差异，因此创建一个新的类标签(即N+1)，每个假样本都被赋予这个新标签。1D-GAN中的生成器和判别器结构如下：

3D-GAN：

　　用PCA把数据将为3个主成分，并保留空间信息。对生成器和鉴别器都进行了批处理归一化处理，去除了全连通的隐含层。其余步骤与1D-GAN类似。输入噪声的大小为100*1*1，生成器将输入转换为大小为64*64*3的假样本。3D-GAN中的生成器和判别器结构如下：

　　实验结果（KSC）：

Conclusion

　　本文首次探讨了GAN在HSIs分类中的有效性和实用性。在GANs的帮助下，深度CNN在分类精度方面比传统CNN有更好的表现。

　　该算法缓解了CNN引起的过拟合问题。具体设计了两个框架:(1)基于光谱向量的一维GAN框架和(2)结合光谱和空间特征的三维GAN框架。与其他最先进的方法相比，这两种体系结构在特征提取和图像分类方面表现出了出色的能力。在提出的GANs中，使用PCA来降低输入的高维数，这对稳定训练过程非常重要。由于深度模型中存在大量的可学习参数(如权值)，深度CNN存在过拟合的问题，而GAN可以看作是一种正则化技术，可以缓解训练过程中的过拟合现象。此外，本文首次展示了GAN生成的HSI样本，这可能为高光谱数据生成打开了一个新的窗口。更重要的是，本文首次将生成的对抗样本作为HSIs分类的训练样本。这些样本显著提高了分类性能。上述技术显示了GANs在HSI分类方面的巨大潜力。

《Generative Adversarial Networks for Hyperspectral Image Classification 》论文笔记的更多相关文章

《Vision Permutator: A Permutable MLP-Like ArchItecture For Visual Recognition》论文笔记
论文题目:<Vision Permutator: A Permutable MLP-Like ArchItecture For Visual Recognition> 论文作者:Qibin ...
[place recognition]NetVLAD: CNN architecture for weakly supervised place recognition 论文翻译及解析（转）
https://blog.csdn.net/qq_32417287/article/details/80102466 abstract introduction method overview Dee ...
论文笔记系列-Auto-DeepLab:Hierarchical Neural Architecture Search for Semantic Image Segmentation
Pytorch实现代码:https://github.com/MenghaoGuo/AutoDeeplab 创新点 cell-level and network-level search 以往的NAS ...
论文笔记——Rethinking the Inception Architecture for Computer Vision
1. 论文思想 factorized convolutions and aggressive regularization. 本文给出了一些网络设计的技巧. 2. 结果用5G的计算量和25M的参数. ...
论文笔记：Fast Neural Architecture Search of Compact Semantic Segmentation Models via Auxiliary Cells
Fast Neural Architecture Search of Compact Semantic Segmentation Models via Auxiliary Cells 2019-04- ...
论文笔记：ProxylessNAS: Direct Neural Architecture Search on Target Task and Hardware
ProxylessNAS: Direct Neural Architecture Search on Target Task and Hardware 2019-03-19 16:13:18 Pape ...
论文笔记：DARTS: Differentiable Architecture Search
DARTS: Differentiable Architecture Search 2019-03-19 10:04:26accepted by ICLR 2019 Paper:https://arx ...
论文笔记：Progressive Neural Architecture Search
Progressive Neural Architecture Search 2019-03-18 20:28:13 Paper:http://openaccess.thecvf.com/conten ...
论文笔记：Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation
Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation2019-03-18 14:4 ...
论文笔记系列-DARTS: Differentiable Architecture Search
Summary 我的理解就是原本节点和节点之间操作是离散的,因为就是从若干个操作中选择某一个,而作者试图使用softmax和relaxation(松弛化)将操作连续化,所以模型结构搜索的任务就转变成了 ...

随机推荐

掌握CSS中的z-index
前言 z-index是一个用于控制文档中图层顺序的属性.具有较高z-index值的元素将会出现在具有较低值的元素之上.就像页面上的x轴和y轴决定一个元素在水平和垂直方向上的位置一样,z-index控制 ...
Node.js精进（11）——Socket.IO
Socket.IO 是一个建立在 WebSocket 协议之上的库,可以在客户端和服务器之间实现低延迟.双向和基于事件的通信. 并且提供额外的保证,例如回退到 HTTP 长轮询.自动重连.数据包缓冲. ...
Codeforces Round #796 (Div. 2)（A~E题题解）
文章目录原题链接: A.Cirno's Perfect Bitmasks Classroom 思路代码 B.Patchouli's Magical Talisman 思路代码 C.Manipul ...
JUC源码学习笔记3——AQS等待队列和CyclicBarrier,BlockingQueue
一丶Condition 1.概述任何一个java对象都拥有一组定义在Object中的监视器方法--wait(),wait(long timeout),notify(),和notifyAll()方法, ...
匿名对象和private关键字
匿名内部类没有名次的对象我们成为匿名对象 new Dog(); new Demo02().change(new Student("...")); 匿名对象的特点如果对象只会被使 ...
【原创】Magisk Root隐藏模块 Shamiko安装
本文所有教程及源码.软件仅为技术研究.不涉及计算机信息系统功能的删除.修改.增加.干扰,更不会影响计算机信息系统的正常运行.不得将代码用于非法用途,如侵立删! Root隐藏模块 Shamiko安装操 ...
就在明天，Apache DolphinScheduler Meetup 2021 如约而至！
点击上方蓝字关注我们社区的小伙伴们,Apache DolphinScheduler Meetup 2021 如约而至,就在明天,等你来玩! 在此次 Meetup 线上直播中,不仅将有来自 Bigo ...
win10下计算文件哈希值的方法
cmd下使用certutil命令使用方法: certutil -hashfile FILE_NAME ALGORITHM_NAME 支持的加密算法包括:MD2,MD4,MD5,SHA1,SHA256 ...
Luogu2580 于是他错误的点名开始了（Trie树）
复习\(Trie\),忘了用\(val[]\)表示每个节点权值,用\(vis[]\)水过了 #include <iostream> #include <cstdio> #inc ...
Linux 05 口令字文件
参考源 https://www.bilibili.com/video/BV187411y7hF?spm_id_from=333.999.0.0 版本本文章基于 CentOS 7.6 概述由于 /e ...

《Generative Adversarial Networks for Hyperspectral Image Classification 》论文笔记

《Generative Adversarial Networks for Hyperspectral Image Classification 》论文笔记的更多相关文章

随机推荐

热门专题