Why CNN for Image

图片是由像素点组成的，可以这样来解释深度神经网络对图片的处理。

第一层的layer是最基本的分类器，区分一些基本的特征，比如颜色、是否有斜线。

第二层的layer会检测更加复杂的东西，比如一些简单的组合线条；

后面的layer也会越来越复杂……

我们可以通过思考图像的特征来简化网络。

1.图片中一些特征通常比整个图片要小，比如要检测图像中是否有鸟嘴。

我们的neuron不需要看整个图像来发现某些特征，所以我们只需要把鸟嘴那一小部分的图片，用很少的参数跟neuron关联起来。

2.同样的特征可能出现在图片的不同位置。

我们不会为每个不同位置的特征单独训练一个neuron，因为它做的都是同样的事情，就是检测是否出现鸟嘴，只是出现的位置不一样罢了。

3.subsampling 可以使图片缩小，但不影响图片的表达。

每隔一行、一列删除一行pixel，就是subsampling，我们同样可以看到图片表达的信息，就是一只鸟。

由于图片缩小了，这样又可以减少参数了。

The whole CNN

来看看整个CNN的架构

从图片作为输入开始，经过多层的Convolution层+MaxPooling的组合，然后是Flatten层，最后经过一个Fully Connected network。

其中，上面讨论的关于图片的三个特点，在CNN的不同层中有相应处理。

Property1、2是小的特征和特征的不同位置，通过Convolution层进行处理；

Property3 Subsampling通过MaxPooling处理。

CNN – Convolution

这里需要提到的是Filter。Filter其实就是一个矩阵，它们是神经网络需要学习的参数。

每个Filter在图片中进行扫描，检测3*3的特征。

Filter从图片的左上角开始，以stride为步长进行图片扫描，图片中每3*3的子图会和Filter作内积，然后得到一个输出值。

上面就是FIlter1扫描整个6×6图片后得到的4×4的结果矩阵。

可以进一步理解的是，该Filter对角线全为1，表示检测图像是否出现类似的斜线，出现斜线的地方在结果矩阵中的值为最大。

对于一张图片，我们会同时检测很多特征，每个filter只做一件相同的事情，所以需要有很多的Filter，

它们放在一起就叫做Feature Map。

对于彩色图片，一个Filter是3维的，如上图，Filter是3×3×3的立方体(tensor).

下面将Convolution层和Fully Connected连接对应理解。

将图片拉直成一个列向量，上面的Filter连接的是1，2，3，7，8，9，13，14，15的输入单元，而不是全连接，Filter的每一个分量可以看作是全连接网络中的w和b。

这样相比于全连接的网络，就只需要更少的参数。

而且，之前讨论过，检测同一个特征只使用相同的Filter，所以每一个neuron共用相同的参数，这就是Shared weights。

这会使CNN的参数变得更少。

CNN – Max Pooling

将每一个Filter检测后的结果，划分成2×2的小块，在每一块中可以取均值或最大值，代替这四个值，这样就实现了Subsampling的功能。

取最大值的方法就是Maxpooling。

一副图像，经过Conv和Maxpooling后，会变成一幅小的新图像。可以再它之上继续进行Conv和Maxpooling。

经过MaxPooling处理后会产生和Filter数目相同的“新图像”，每一个Filter都可以看作是处理之前图像的一个channel。

Flatten

最后的Flatten就是将上一层Maxpooling得到的image拉直成列向量，作为全连接网络的输入。

以上就是一个CNN神经网络的所有模块简介。最后附一张全图。

Convolutional Neural Network的更多相关文章

论文阅读（Weilin Huang——【TIP2016】Text-Attentional Convolutional Neural Network for Scene Text Detection）
Weilin Huang--[TIP2015]Text-Attentional Convolutional Neural Network for Scene Text Detection) 目录作者 ...
卷积神经网络（Convolutional Neural Network，CNN）
全连接神经网络(Fully connected neural network)处理图像最大的问题在于全连接层的参数太多.参数增多除了导致计算速度减慢,还很容易导致过拟合问题.所以需要一个更合理的神经网 ...
Convolutional Neural Network in TensorFlow
翻译自Build a Convolutional Neural Network using Estimators TensorFlow的layer模块提供了一个轻松构建神经网络的高端API,它提供了创 ...
卷积神经网络(Convolutional Neural Network, CNN)简析
目录 1 神经网络 2 卷积神经网络 2.1 局部感知 2.2 参数共享 2.3 多卷积核 2.4 Down-pooling 2.5 多层卷积 3 ImageNet-2010网络结构 4 DeepID ...
HYPERSPECTRAL IMAGE CLASSIFICATION USING TWOCHANNEL DEEP CONVOLUTIONAL NEURAL NETWORK阅读笔记
HYPERSPECTRAL IMAGE CLASSIFICATION USING TWOCHANNEL DEEP CONVOLUTIONAL NEURAL NETWORK 论文地址:https:/ ...
A NEW HYPERSPECTRAL BAND SELECTION APPROACH BASED ON CONVOLUTIONAL NEURAL NETWORK文章笔记
A NEW HYPERSPECTRAL BAND SELECTION APPROACH BASED ON CONVOLUTIONAL NEURAL NETWORK 文章地址:https://ieeex ...
【论文阅读】ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices
ShuffleNet: An Extremely Efficient Convolutional Neural Network for MobileDevices
《ABCNN: Attention-Based Convolutional Neural Network for Modeling Sentence Pairs》
代码: keras:https://github.com/phdowling/abcnn-keras tf:https://github.com/galsang/ABCNN 本文是Wenpeng Yi ...
《Kalchbrenner N, Grefenstette E, Blunsom P. A convolutional neural network for modelling sentences》
Kalchbrenner’s Paper Kal的这篇文章引用次数较高,他提出了一种名为DCNN(Dynamic Convolutional Neural Network)的网络模型,在上一篇(Kim ...
论文笔记之《Event Extraction via Dynamic Multi-Pooling Convolutional Neural Network》
1. 文章内容概述本人精读了事件抽取领域的经典论文<Event Extraction via Dynamic Multi-Pooling Convolutional Neural Networ ...

随机推荐

在 App Store 三年學到的 13 件事（下）
博文转载至 http://blog.csdn.net/iunion/article/details/18959801 Steven Shen,曾經寫過一本書,也翻過一本書,開發 iOS app ...
hiho一下第109周《Tower Defense Game》
题目链接:传送门题目大意:给你一棵树,根节点为1,树上每一个节点都有一个花费值和收入值(花费值>=收入值),要访问一个节点需先支付花费值,访问该节点结束后得到收入值同时访问树时要求是有序的, ...
iOS 修改状态栏颜色
1.首先,苹果把UIViewControllerBasedStatusBarAppearance默认的值设为YES,是有他的道理的,新系统下,苹果希望我们的viewcontroller去控制statu ...
sql的case when then else end 的语法实现列转行
SELECT * FROM test5 ; RESOURCES DATETIME CNT ID1 0 2018-01-22 4 12 0 2018-01-24 10 23 0 2018-01-25 2 ...
锚点链接阻止a标签跳转
参考 http://blog.csdn.net/awe5566/article/details/22583699 href="#downJacket" 锚点链接必须写: 但又 ...
（转）HTTP
HTTP(Hyper Text Transfer Protocol)超文本传输协,是一个应用层协议,由请求和响应构成,是一个标准的客户端服务器模型. HTTP特点: 支持客户 / 服务器模式简单快速 ...
导出Excel功能的3种实现
项目中总会用到Excel的导出功能,接触过好几个项目,发现有个项目的导出实现特别值得学习.这里学习顺带总结一下. 一.三种方法我遇到的导出目前有3种处理: 每个功能一个导出方法: 写一个通用的Exp ...
Windows File 管理工具：junction And Subinacl
junction.exe 是 Sysinternals 出品的命令行工具.使用前建议将其复制到%SystemRoot%/system32目录下创建一个名为 D:/LINK 的[junction ...
2015-03-10——简析javascript对象
对于构造函数,它是Function对象的一个实例,可以定义自己的静态成员先实例化出对象,后执行function中内部代码静态成员: var abc = function () {}; //既是一 ...
django博客项目11
.....................

Convolutional Neural Network