论文题目《3-D Deep Learning Approach for Remote Sensing Image Classification》

论文作者:Amina Ben Hamida, Alexandre Benoit , Patrick Lambert, and Chokri Ben Amar, Senior Member , IEEE

论文发表年份:2018

网络简称:3D-CNN

发表期刊:IEEE Transactions on geoscience and remote sensing

Motivation

  现有的方法仍然局限于当今大型数据集中丰富的空间光谱内容。然而,遥感数据集中光谱和空间内容共存所带来的特异性扩大了将DL方法应用于这些背景的挑战范围。因此,本文的目的是首先探索用于RS高光谱数据集分类的DL体系结构的性能,然后引入一种新的三维DL方法,使光谱和空间信息处理相结合。

Challenges

  1)高维数据:当处理高维数据时,DL方法的计算成本变得很高。这些高成本主要是由于学习数据抽象和建立从低层次到最高语义解释的有效表示需要缓慢的学习过程。

  2)重型模型:目前DL模型依靠深度和广度模型取得了显著的成果。因此,需要大量参数从数据本身学习复杂的特征和表示。此外,这种重模型在标记数据方面是贪婪的。这一要求很难建立,因为该领域严重缺乏丰富的高光谱标注数据。

  3)架构优化:今天支持使用DL的关键点是它能够处理大量的应用程序。然而,这导致建立深度模型的任务变得更加困难和复杂,而这些模型在处理数据时既便宜又有效。

Proposed 3-D Deep Architecture

  该体系结构使用真实的3-D卷积同时处理空间和光谱成分,从而在可训练参数较少的少数可用样本中获得更好的效果。该方案将问题分解为对图像的一系列体积表示的处理。因此,每个像素都与n × n个空间邻域和f个光谱波段相关联。因此,每个像素被视为n × n × f的体积块。通过三维卷积对原始输入数据(每个像素都包含n*n*f)进行特征提取,逐步转化为一维向量,再通过一维卷积对一维向量进行特征提取。最后通过全连接层和softmax进行分类处理。

  下图为每一层的特征形状(SizeOut)的演化(example):

Experiment

  本文设计了多种不同层次结构的网络来进行对比,以选择最优的网络结构。

  实验证明,八层网络架构取得最好的效果和计算性能,它不仅减少了参数的数量,而且提高了准确率。。原因:多的Conv层确保了数据的更高语义级表示,而Pooling层则保证了表示的降维。这样,FC层入口的向量维数显著降低,从而显著减少了参数的数量。随着准确率的提高,参数数量显著减少。这些测试还证明了空间邻域的选择高度依赖于数据内容。在拥有3 × 3邻域的Pavia Center数据集的情况下,同一模型可以优于中的结果,而在Pavia University的情况下,即使使用5 × 5邻域,它也不能达到最先进的方法结果。 下图为不同层数的网络的训练迭代次数等统计:

  本文还测试了高光谱图像分类迁移学习的可能,在帕维亚大学和帕维亚中心之间进行迁移学习(微调)实验:

  深度神经网络在进行微调和从零开始训练时,能够保持几乎相同的精度水平(98.4%对98.9%和90.4%对92.9%)。基本上,本文提出的预训练体系结构具有很强的泛化能力。

Conclusion

  一般来说,高光谱数据的处理是一个非常微妙的过程,需要有效地利用空间和光谱成分。本文所介绍的三维体系结构不仅能对高光谱数据进行准确的分类,而且能以较低的成本建立对图像的深度理解。最有价值的结果之一是能够高效地优化小型标注数据集上的深度网络,从而降低数据的成本。现在的主要关注点是研究如何创新和增强所创建的模型,以便处理更大更重的数据集。为了解决这一问题,残差网络和密集网络都能够融合不同的表示层次。因此,它们似乎是增强现有CNN体系结构的一个很有吸引力的解决方案。

《3-D Deep Learning Approach for Remote Sensing Image Classification》论文笔记的更多相关文章

  1. 《Vision Permutator: A Permutable MLP-Like ArchItecture For Visual Recognition》论文笔记

    论文题目:<Vision Permutator: A Permutable MLP-Like ArchItecture For Visual Recognition> 论文作者:Qibin ...

  2. [place recognition]NetVLAD: CNN architecture for weakly supervised place recognition 论文翻译及解析(转)

    https://blog.csdn.net/qq_32417287/article/details/80102466 abstract introduction method overview Dee ...

  3. 论文笔记系列-Auto-DeepLab:Hierarchical Neural Architecture Search for Semantic Image Segmentation

    Pytorch实现代码:https://github.com/MenghaoGuo/AutoDeeplab 创新点 cell-level and network-level search 以往的NAS ...

  4. 论文笔记——Rethinking the Inception Architecture for Computer Vision

    1. 论文思想 factorized convolutions and aggressive regularization. 本文给出了一些网络设计的技巧. 2. 结果 用5G的计算量和25M的参数. ...

  5. 论文笔记:Fast Neural Architecture Search of Compact Semantic Segmentation Models via Auxiliary Cells

    Fast Neural Architecture Search of Compact Semantic Segmentation Models via Auxiliary Cells 2019-04- ...

  6. 论文笔记:ProxylessNAS: Direct Neural Architecture Search on Target Task and Hardware

    ProxylessNAS: Direct Neural Architecture Search on Target Task and Hardware 2019-03-19 16:13:18 Pape ...

  7. 论文笔记:DARTS: Differentiable Architecture Search

    DARTS: Differentiable Architecture Search 2019-03-19 10:04:26accepted by ICLR 2019 Paper:https://arx ...

  8. 论文笔记:Progressive Neural Architecture Search

    Progressive Neural Architecture Search 2019-03-18 20:28:13 Paper:http://openaccess.thecvf.com/conten ...

  9. 论文笔记:Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation

    Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation2019-03-18 14:4 ...

  10. 论文笔记系列-DARTS: Differentiable Architecture Search

    Summary 我的理解就是原本节点和节点之间操作是离散的,因为就是从若干个操作中选择某一个,而作者试图使用softmax和relaxation(松弛化)将操作连续化,所以模型结构搜索的任务就转变成了 ...

随机推荐

  1. LNMP架构及DISCUZ论坛部署

    1)(5分)服务器IP地址规划:client:12.0.0.12/24,网关服务器:ens36:12.0.0.1/24.ens33:172.16.10.1/24,Web1:172.16.10.10/2 ...

  2. VIM编辑器的宏操作

    这两天看到一个小练习,要求如下: 在GVIM下,将下面这张图的内容 改成下面这样 并且指出,要用批量操作的方式,不能一行一行的键入 其实第一反应是利用正则表达式来操作,但是让用正则表达式以外的操作方式 ...

  3. DeiT:注意力也能蒸馏

    DeiT:注意力也能蒸馏 <Training data-efficient image transformers & distillation through attention> ...

  4. 86开关、家电、台扇等6键6路6感应通道高抗干扰触摸IC-VK3606D,稳定性好,抗干扰能力强

    概述: VK3606D SOP16具有6个触摸按键,可用来检测外部触摸按键上人手的触摸动作.该芯片具有较高的集成度,仅需极少的外部组件便可实现触摸按键的检测.提供了6路1对1直接输出低电平有效.最长输 ...

  5. [javaweb]javaweb中HttpServletResponse实现文件下载,验证码和请求重定向功能

    HttpServletResponse web服务器接受到客户端的http请求之后,针对这个请求,分别创建一个代表请求的httpServletRequest和代表响应的HttpServletRespo ...

  6. linux nginx启用php

    cd /usr/local/php/etc mv php-fpm.conf.default php-fpm.conf vi /usr/local/nginx/conf/nginx.conf # 删除如 ...

  7. 举重若轻流水行云,前端纯CSS3实现质感非凡的图片Logo鼠标悬停(hover)光泽一闪而过的光影特效

    原文转载自「刘悦的技术博客」https://v3u.cn/a_id_197 喜欢看电影的朋友肯定会注意到一个有趣的细节,就是电影出品方一定会在片头的Logo环节做一个小特效:暗影流动之间光泽一闪而过, ...

  8. NodeJS & Dapr Javascript SDK 官方使用指南

    Dapr 是一个可移植的.事件驱动的运行时,它使任何开发人员能够轻松构建出弹性的.无状态和有状态的应用程序,并可运行在云平台或边缘计算中,它同时也支持多种编程语言和开发框架.Dapr 确保开发人员专注 ...

  9. 【freertos】013-任务通知及其实现细节

    前言 参考: https://www.freertos.org/RTOS-task-notifications.html 原文:https://www.cnblogs.com/lizhuming/p/ ...

  10. 43%非常看好TypeScript…解读“2022前端开发者现状报告”

    摘要:近日,The Software House 发布了"2022前端开发者现状报告",笔者在此对报告内容进行解读,供大家参考. 本文分享自华为云社区<"2022前 ...