题目:Learning Deconvolution Network for Semantic Segmentation

作者:Hyeonwoo Noh, Seunghoon Hong, Bohyung Han

年份:2015

会议:ICCV

说面:

Segmantic Segmentation(语义分割)

简单来说就是对图像的每个像素都做分类。输入左边的图片会得到右边分割后后图片。

2.解决的问题

之前使用FCN(注:FCN是2015年发表的论文第一次将卷积神经网络用于语义分割,实现了端到端的语义分割图片的生成)由于要求输入的图片是固定的大小就会存在如下的几个问题(1)如果物体过大话,产生的标签不一致(2)一些小物体的大小会丢失。为此该论文在FCN的基础上进行改进,可以输入任意大小的图片,然后产生相应大小的图片语义分割图片,从而解决以上的问题。

3.研究点

如何将卷积神经网络用于图像语义分割;由于卷积层中的池化操作会使原来图片的大小变小,如何通过反卷积还原原来图片的大小;

4.研究假设

5.关键算法

由于是对图像进行处理,论文采用2014年ImageNet的冠军VGG进行前一部分卷积神经网络的构造。后一部分由红色矩形框圈出来的部分进行反卷积还原原来图片的大小,从而进行语义分割的训练与预测。

VGG网络中由于在卷积层使用池化操作(Max Pooling),图片的大小逐渐减少,论文在反卷积层使用UnPooling操作还原原来图片的大小。

UnPooling的操作如下

首先输入的大小为4*4,通过Max Pooling操作后得到2*2(每个矩形框取最大的数)。在Max UnPooling中输入的大小为2*2,通过UnPooling操作,还原为原来的4*4,它会记住原来取最大值的位置,在UnPooling中input的值填充到原来最大值的位置,其他位置填充为0。每一层的卷积后面都有对应的反卷积层。

UnConvolution操作如下:

为了简单说明这里以一维的例子作为说明

输入为{a,b},反卷积过滤器为{x,y,z},stride为1,在输出的时候会将重复的部分相加,因此得到UnConvolution的结果{ax,ay,az+bx,by,bz}

图片通过卷积层以及反卷积层后得到原来图片的大小,这样就可以将标注好的语义分割图片用于训练。

6.数据

7.优点

可以实现任意大小的图片输入用于语义分割

8.不足之处

 
 
 

Learning Deconvolution Network for Semantic Segme小结的更多相关文章

  1. 论文阅读笔记十六:DeconvNet:Learning Deconvolution Network for Semantic Segmentation(ICCV2015)

    论文源址:https://arxiv.org/abs/1505.04366 tensorflow代码:https://github.com/fabianbormann/Tensorflow-Decon ...

  2. Deep learning:五十(Deconvolution Network简单理解)

    深度网络结构是由多个单层网络叠加而成的,而常见的单层网络按照编码解码情况可以分为下面3类: 既有encoder部分也有decoder部分:比如常见的RBM系列(由RBM可构成的DBM, DBN等),a ...

  3. 论文笔记:A Review on Deep Learning Techniques Applied to Semantic Segmentation

    A Review on Deep Learning Techniques Applied to Semantic Segmentation 2018-02-22  10:38:12   1. Intr ...

  4. [论文阅读笔记] Adversarial Mutual Information Learning for Network Embedding

    [论文阅读笔记] Adversarial Mutual Information Learning for Network Embedding 本文结构 解决问题 主要贡献 算法原理 实验结果 参考文献 ...

  5. Learning a Discriminative Feature Network for Semantic Segmentation(语义分割DFN,区别特征网络)

    1.介绍 语义分割通常有两个问题:类内不一致性(同一物体分成两类)和类间不确定性(不同物体分成同一类).本文从宏观角度,认为语义分割不是标记像素而是标记一个整体,提出了两个结构解决这两个问题,平滑网络 ...

  6. 论文笔记(6):Weakly-and Semi-Supervised Learning of a Deep Convolutional Network for Semantic Image Segmentation

    这篇文章的主要贡献点在于: 1.实验证明仅仅利用图像整体的弱标签很难训练出很好的分割模型: 2.可以利用bounding box来进行训练,并且得到了较好的结果,这样可以代替用pixel-level训 ...

  7. 《Learning a Discriminative Feature Network for Semantic Segmentation》解读

    旷世18年的CVPR,论文链接:https://arxiv.org/abs/1804.09337 Motivation:针对分割中的“类内不一致”和“类间一致性”的两大问题,设计了结合Smooth n ...

  8. Learning Bayesian Network Classifiers by Maximizing Conditional Likelihood

    Abstract Bayesian networks are a powerful probabilistic representation, and their use for classifica ...

  9. [转]综述论文翻译:A Review on Deep Learning Techniques Applied to Semantic Segmentation

    近期主要在学习语义分割相关方法,计划将arXiv上的这篇综述好好翻译下,目前已完成了一部分,但仅仅是尊重原文的直译,后续将继续完成剩余的部分,并对文中提及的多个方法给出自己的理解. _论文地址:htt ...

随机推荐

  1. 织梦channel标签内调用子栏目内容

    文件:include\taglib\channel.lib.php 把代码 SELECT id,typename,typedir,isdefault,ispart,defaultname,nameru ...

  2. [选择排序] 时间复杂度O(n^2)

    思路:从未排序的序列中,找到最小的元素,放到序列的起始位置, 再从剩下没排序的里面,找到最小的,放到已经排序的末尾. 原地操作几乎是选择排序的唯一优点,当空间复杂度要求较高时,可以考虑选择排序:实际适 ...

  3. github入门之更改提交操作--6

    1.回溯历史版本 1.1.回溯到创建feature-A分支前 1.1.1.要让仓库的HEAD.暂存区.当前工作树回溯到指定状态,需要用到提供目标时间点的哈希值 1.1.2.回溯至未创建feature- ...

  4. JavaScript_2_实现

    1. HTML中的脚本必须位于<script>与</script>标签之间 JavaScript是所有现代浏览器以及HTML5中的默认脚本语言 2. 脚本可被放置在HTML页面 ...

  5. 正确配置Nginx+PHP

    对很多人而言,配置Nginx+PHP无外乎就是搜索一篇教程,然后拷贝粘贴.听上去似乎也没什么问题,可惜实际上网络上很多资料本身年久失修,漏洞百出,如果大家不求甚解,一味的拷贝粘贴,早晚有一天会为此付出 ...

  6. 团队作业——项目Alpha版本发布

    ---恢复内容开始--- https://edu.cnblogs.com/campus/xnsy/SoftwareEngineeringClass1   https://edu.cnblogs.com ...

  7. win10中打开SQL Server 2008 的SQL Server配置管理器方法

    win10找不到SQL Server配置管理器 搜索 SQLServerManager10.msc,或者运行文件:“C:\Windows\SysWOW64\SQLServerManager10.msc ...

  8. Java第十二次作业:继承与抽象类解决工人与学生的问题,抽象类实例。抽象类作用——为多态创造了可能。抽象类的作用总结

    继承与抽象类解决工人与学生的问题 抽象类实例 package com.swift; public abstract class Person { private String name; privat ...

  9. cocos2dx观察者模式EventListenerCustom的使用(代替NotificationCenter)

    在cocos2dx 3.x版本已经被弃用,改用EventDispatcher代替. 观察者模式是MVC模式的一种,一个model可以对应很多个观察者view,当model收到事件通知时,对应的view ...

  10. 【windows】win7 sp1 系统语言中英文切换

    注:Windows 7 Ultimate and Windows 7 Enterprise (旗舰版和企业版) 可以直接在控制面板/地区和语言中修改显示语言,其他系统不行 进入网站下载相关的MUI包安 ...