1.概述

  卷积神经网络的参数,由一些可学习的滤波器集合构成的,每个滤波器在空间上都计较小,但是深度和输入数据的深度保持一致。在前向传播中,让每个滤波器都在输入数据的宽度和高度上滑动(卷积),然后计算整个滤波器和输入数据任意一处的内积。当滤波器沿着输入数据的宽度和高度滑动时,会生成一个二维的激活图,激活图上的每个空间位置表示了原图片对于该滤波器的反应。

2. 三种思想

2-1 局部性

  对于一张图片,需要检测图片中的特征来决定图片的类别,通常情况下这些特征都不是由整张图片决定的,而是由局部的区域决定。

2-2 相同性

  对于不同的图片,如果他们具有相同的特征,这些特征会出现在图片的不同位置,也就是说可以用同样的检测模型去检测不同图片的相同特征,只不过这些特征处于图片中不同的位置,但是特征检测所做的操作几乎一样。

2-3 不变性

  对于一张大图片,如果我们进行下采样,图片的性质基本保持不变。

3.全连接网络

  由一系列隐藏层构成,每个隐藏层中由若干个神经元构成,其中每个神经元都和前一层的所有神经元相关联,但是每一层中的神经元是相互独立的。

  存在的问题:比如在MNIST数据集,图片大小为28*28,那么第一个隐藏层的单个神经元的权重数目是28*28 = 784个(权重矩阵的一行为一个神经元,一行有784列)

4.卷积神经网络:一个滤波器就相当于一个神经元

卷积层:

  4.1 局部区域连接:

  是一个3D的容量神经元,也就是说神经元是以三个维度来排列的:宽度,高度,深度。

  主要的层结构:卷积层,池化层和全连接层,通过堆叠这些层结构形成了一个完整的卷积神经网络结构。卷积神经网络将原始图片转换成最后的类别得分,其中一些层包含参数,一些层没有包含参数,比如卷积层和全连接层有参数,激活层和池化层不含参数,这些参数通过梯度下降法来更新,最后使得模型尽可能正确的识别类别。

   与神经元连接的空间大小叫做神经元的感受野。它的大小是滤波器的宽和高。

  例如:输入的数据尺寸:32*32*3,感受野(滤波器尺寸):5*5,卷积层中每个神经元会有输入数据中5*5*3区域的权重,一共有75个权重。

  4.2 空间排列:

  卷积层的输出深度是一个超参数,与使用的滤波器数量一致,每种滤波器所做的就是输入数据中寻找一种特征。比如输入一张原始图片,卷积层输出的深度是20,这说明有20个滤波器对数据进行处理,每种滤波器寻找一种特征进行激活。

  4.3 边界填充:保证输入和输出再空间上的尺寸一致。

  一般的,当步长S =1,零填充的值为 P = (F-1)/2 (F为滤波器的宽度)

  4.4 参数共享

  输出数据再深度切片上所有的权重都是用同一个权重向量,那么卷积层在向前传播的过程中,每个深度切片都可以看成是神经元的权重对输入数据体做卷积

  卷积核的输出是一副修改后的图像,在深度学习中经常被称作feature map。对每个颜色通道都有一个feature map

池化层

  池化层和卷积层一样也有一个空间窗口,通常采用的是取这些窗口的最大值作为输出结果 ,然后不断滑动窗口,对输入的每个深度切片单独处理,减少它的空间尺寸。图片特征具有不变性,也就是通过下采样不会丢失图片拥有的特征,由于这种特性,我们可以将图片缩小再进行卷积处理,这样大大降低卷积运算的时间。

多通道的卷积:

  输入通道:

  每个输入通道的图片都是用同一个卷积核进行卷积操作,生成与输入通道匹配的feature map,然后再把这几张feature map相同位置的值加起来,生成一张feature map

  输出通道:

  想要输出几个feature map,就放几个卷积核,就是几个输出通道。

5 Pytorch卷积模块

5.1 nn.Conv2d():

  in_channels:输入数据体的深度

  out_channels:输出数据体的深度

  kernel_size:滤波器(卷积核)的大小,可以用一个数字来表示高和宽相同的卷积核,也可以用不同的数字

  stride:滑动的步长

  padding:=0表示四周不进行零填充,=1,表示四周进行1个像素点的零填充

  dilation 表示卷积对于输入数据体的空间间隔,默认 dilation =1

  groups 表示输出数据体深度上和输入数据体深度上的联系,默认 groups=l ,也就是所有的输入和输出都是相关联的,如果 groups=2 ,这表示输入的深度被分割成两份,输出的深度也被分割成两份,他们之间分别对应起来,所以要求输出和输入都必 要能被 groups 整除;

  bias:默认为True,表示使用偏置

6.代码实现简单的多层网络以及提取层结构

6.1模型层

1 """
2 torch.nn.sequential():一个时序容器,Model 会以他们传入的顺序被添加到容器中
3 add_module(name,module):将一个child module添加到当前model,被添加的module可以通过name属性来获取。
4 """
5 import torch.nn as nn
6
7
8 class SimpleCNN(nn.Module):
9 def __init__(self):
10 super(SimpleCNN,self).__init__()
11 layer1 = nn.Sequential()#时序容器
12 layer1.add_module('conv1',nn.Conv2d(3,32,3,1,padding=1))
13 layer1.add_module('relu1',nn.ReLU(True))
14 layer1.add_module('pool1',nn.MaxPool2d(2,2))
15 self.layer1 = layer1
16
17 layer2 = nn.Sequential() # 时序容器
18 layer2.add_module('conv2', nn.Conv2d(32, 64, 3, 1, padding=1))
19 layer2.add_module('relu2', nn.ReLU(True))
20 layer2.add_module('pool2', nn.MaxPool2d(2, 2))
21 self.layer2 = layer2
22
23 layer3 = nn.Sequential() # 时序容器
24 layer3.add_module('conv3', nn.Conv2d(64, 128, 3, 1, padding=1))
25 layer3.add_module('relu3', nn.ReLU(True))
26 layer3.add_module('pool3', nn.MaxPool2d(2, 2))
27 self.layer3 = layer3
28
29 layer4 = nn.Sequential()
30 # 第三层后的输入体为:4×4×128=2048
31 # 进入全连接层时,需要有2048个权重,输出的样本大小512
32 layer4.add_module('fc1',nn.Linear(2048,512))
33 layer4.add_module('fc_relu1',nn.ReLU(True))
34 layer4.add_module('fc2',nn.Linear(512,64))
35 layer4.add_module('fc_relu2',nn.ReLU(True))
36 layer4.add_module('fc3',nn.Linear(64,10))
37 self.layer4 = layer4
38
39 def forward(self, x):
40 conv1 = self.layer1(x)
41 conv2 = self.layer2(conv1)
42 conv3 = self.layer3(conv2)
43 fc_input = conv3.view(conv3.size(0),-1)#conv3.size(0)表示样本个数,对数据体4×4×128重新排列,进入全连接层
44 fc_output = self.layer4(fc_input)
45 return fc_output

6.2 named_children(),named_modules(),提取网络前两层

 model = SimpleCNN()
for name,module in model.named_children():
print('children module:',name) # 只输出,layer1,layer2,layer3,layer4
for name,module in model.named_modules():
print('module:',name) # layer1.conv1,layer1.relu1 layer1.pool1
# print('提取前两层')
# new_model = nn.Sequential(*list(model.children())[:2])
# print(new_model)

7.提取参数及定义初始化

  7.1 提取参数

  nn.Module中两个特别重要的关于参数的属性

  name_parameters():给出网络的名字和参数的迭代器

  parameters():给出一个网络的全部参数的迭代器

 for param in model.named_parameters():
print(param[0]) # layer1.conv1.weight layer1.conv1.bias layer2.conv2.weight layer2.conv2.bias
for param in model.parameters():
print(param) # 全部参数,具体的值

  7.2 参数初始化

  权重是一个Variable,所以只需要取出其中的data属性,然后对它进行需要的处理。

 #对变量进行初始化:
# 使用torch.nn.init
# import numpy as np
# import torch
for m in model.modules():
if isinstance(m,nn.Conv2d):
nn.init.normal_(m.weight.data)
print(m.weight.shape) # torch.Size([32, 3, 3, 3])
m.bias.data.fill_(0) # torch.Size([32, 3, 3, 3])
break
elif isinstance(m,nn.Linear):
m.weight.data.normal_()
break
#直接赋值
# param_shape = m.weight.shape
# m.weight.data = torch.from_numpy((np.random.uniform(3,5,size = param_shape))) # 在使用Sequential时直接对参数进行修改
net1 = nn.Sequential(
nn.Linear(30,40),
nn.ReLU(),
nn.Linear(40,50),
nn.ReLU(),
nn.Linear(50,10)
)
net1[0].weight.data = torch.from_numpy(np.random.uniform(3,5,size=(30,40)))

torch_06_卷积神经网络的更多相关文章

  1. 卷积神经网络提取特征并用于SVM

    模式识别课程的一次作业.其目标是对UCI的手写数字数据集进行识别,样本数量大约是1600个.图片大小为16x16.要求必须使用SVM作为二分类的分类器. 本文重点是如何使用卷积神经网络(CNN)来提取 ...

  2. tensorflow学习笔记五:mnist实例--卷积神经网络(CNN)

    mnist的卷积神经网络例子和上一篇博文中的神经网络例子大部分是相同的.但是CNN层数要多一些,网络模型需要自己来构建. 程序比较复杂,我就分成几个部分来叙述. 首先,下载并加载数据: import ...

  3. Deep Learning模型之:CNN卷积神经网络(一)深度解析CNN

    http://m.blog.csdn.net/blog/wu010555688/24487301 本文整理了网上几位大牛的博客,详细地讲解了CNN的基础结构与核心思想,欢迎交流. [1]Deep le ...

  4. [DL学习笔记]从人工神经网络到卷积神经网络_2_卷积神经网络

    先一层一层的说卷积神经网络是啥: 1:卷积层,特征提取 我们输入这样一幅图片(28*28): 如果用传统神经网络,下一层的每个神经元将连接到输入图片的每一个像素上去,但是在卷积神经网络中,我们只把输入 ...

  5. [DL学习笔记]从人工神经网络到卷积神经网络_1_神经网络和BP算法

    前言:这只是我的一个学习笔记,里边肯定有不少错误,还希望有大神能帮帮找找,由于是从小白的视角来看问题的,所以对于初学者或多或少会有点帮助吧. 1:人工全连接神经网络和BP算法 <1>:人工 ...

  6. lecture5-对象识别与卷积神经网络

    Hinton第五课 突然不知道object recognition 该翻译成对象识别好,还是目标识别好,还是物体识别好,但是鉴于范围性,还是翻译成对象识别吧.这一课附带了两个论文<Convolu ...

  7. Deep learning with Theano 官方中文教程(翻译)(四)—— 卷积神经网络(CNN)

    供大家相互交流和学习,本人水平有限,若有各种大小错误,还请巨牛大牛小牛微牛们立马拍砖,这样才能共同进步!若引用译文请注明出处http://www.cnblogs.com/charleshuang/. ...

  8. [转]Theano下用CNN(卷积神经网络)做车牌中文字符OCR

    Theano下用CNN(卷积神经网络)做车牌中文字符OCR 原文地址:http://m.blog.csdn.net/article/details?id=50989742 之前时间一直在看 Micha ...

  9. Caffe(卷积神经网络框架)介绍

    Caffe(卷积神经网络框架)Caffe,全称Convolution Architecture For Feature Extraction caffe是一个清晰,可读性高,快速的深度学习框架.作者是 ...

随机推荐

  1. mongodb复杂条件查询 (or与and)

    分类专栏: mongodb   版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/tjbsl/ ...

  2. Winforn中设置ZedGraph多条Y轴时曲线刻度不均匀问题解决

    场景 Winform中实现ZedGraph的多条Y轴(附源码下载): https://blog.csdn.net/BADAO_LIUMANG_QIZHI/article/details/1001322 ...

  3. 用maven对ssm进行整合

    网上有很多ssm整合的教程,这里给像我这样的初学的新手提供一个整合方法,同时也记录一下自己的学习进度. 同时推荐观看相关视频  https://www.bilibili.com/video/av536 ...

  4. linux 环境下部署 Asp.Net Core 项目 访问 oralce 数据库

    1.ASP.NET Core 是一个跨平台的高性能开源框架,可以部署到Linux上,那项目部署在Linux上有哪些好处呢? 1.linux硬件需求小,大部分版本免费,成本低. 2.linux的用户管理 ...

  5. maven Could not resolve dependencies

    错误语句 Could not resolve dependencies for project weiyinfu:poemqa:jar:1.0: The following artifacts cou ...

  6. maven 学习---Maven添加远程仓库

    默认情况下,Maven从Maven中央仓库下载所有依赖关系.但是,有些库丢失在中央存储库,只有在Java.net或JBoss的储存库远程仓库中能找到. 1. Java.net资源库 添加Java.ne ...

  7. 章节十四、5- web页面的截图

    一.以雅虎网站为例,当我们在登录时,输入错误的用户名然后点击“下一步”,用户名输入框会提示红色字体,这个时候我们就将页面进行截图. http://commons.apache.org/proper/c ...

  8. python3调用R语言干货

    R语言知识:https://www.w3cschool.cn/r/r_lists.html 1. 安装库rpy2 1. 下载与本地对应python版本模块,pip install rpy2是安装不上的 ...

  9. 关于VS2015 发布.net mvc 网站失败的问题

    问题:VS生成成功,发布失败,在“正在连接到***文件夹”处就不能继续了.. 项目开发告一段落,准备部署到服务器上进行最后测试,但是始终发布失败  生成成功,发布失败,没有任何提示信息 一开始以为是文 ...

  10. Linux 信号量之Posix基于内存的信号量

    信号量(semaphore),也和互斥锁一样提供了线程间或者进程间的同步功能. 信号量有三种: Posix有名字的信号量 Posix基于内存的信号量 System V信号量 信号量比互斥锁高级,互斥锁 ...