inception发展历程

v1

mlp多层感知器层

上面两个观看孔径，尺寸不一样，可以抽取不同分辨率，不同尺度的邻域范围的信息作为特征，这样就可以观察到输入数据的不同层次，不同分辨率的特征

因为这个1*1完了之后，就是做完内积以后，就在那一个点上，它是每个通道那一个点上做完内积，把所有通道的内积加起来，之后非线性激活函数，这里的conv里面都包含relu。

1*1卷积所连接的相关性是最高的，因为卷积核扩大以后呢，3*3他在不同通道的位置，可能会变得不一样，相关性就会减弱

v2:

传统的神经网络训练的时候，每一层输入的分布都在变化，就是网络的这个不同输入的分布，在不同的迭代过程中，变化特别剧烈，总是稳定不下来，这样就没法收敛，只能使用比较小的学习率，让他慢慢变化

V3:

最后用3*1的卷积核与1*3卷积之后的内容进行内积，可以处理更多、更丰富的空间特征，增加特征多样性

inception v3 详解：

要想卷积不改变空间尺寸（图像大小，不是通道数），必须要pad=kernelsize÷2（去掉余数）！！！

pad=0，卷积后空间尺寸会变小。

最后提取出了2048个特征，输入到线性输出层1000个units（相当于一个分类器，有1000个类），得到它属于1000个类的得分

注意第三个inception module 有3个模块，其中第二个和第三个相同。第二个module输出和第三个Module尺寸不一样，所以中间加了一个，所以是三个

线性logits是逻辑回归（线性分类），将这2048个特征进行逻辑回归，得到的是属于每个类的得分，最后soft是归一化概率

inception v3第一组modules

（1）

pad=same(在tensorflow中他会自己推导出来得到相同的尺寸，最后摞起来）

5*5替换成了3*3

（2）

（3）

inception v3第二组modules

（1）

（2）

（3）

（4）

这个既不改变空间分辨率（空间尺寸），又不改变特征通道数，作用是把不同通道的特征融合起来。

inception v3第三组modules

（1）

（2）

注：图中输出data 应该是 8*8*2048

inception v4

valid padding：pad=0，s默认为1

same padding：保证输入输出图像尺寸不变，默认pad=1，s=1

pool不改变通道数

注：最后的192V = 192,stride=2 V

branch1:

pool只是单独处理每一个通道的特征图，不会对通道之间做相关处理。

avg：相当于对每一个小特征图做一个空间的平均处理，统计平均值，平均滤波，相当于变得模糊了

branch1是再模糊了以后的特征图上做的，模糊了之后会把噪音去掉，模糊了去掉噪声之后

注：这里的conv都默认再带relu

branch2：

branch1模糊了去掉噪音的时候，有可能吧图像的微弱的边缘信息也给去掉了，这样就保留不了图像精确地信息，这时候就折中，模糊不模糊都处理一下。这样既去除了噪音，也保留下来了不同细节的信息特征

branch3：

融合的意思是每一个神经元都会伸向下一个卷积层的不同通道的，不同通道做内积，再加起来

branch1：

保留了原始特征通道的信息

卷积层神经元深度就是kernelsize

每一个分支都是为了保留输入数据不同的信息

branch3 最上面的是 7*1conv

3*3变成了两个1*3和3*1的两个非线性映射过程，可以提取特征图不同的纹理进行变换，让特征图的特征更加丰富，更加抽象。

每个分支对特征提取的层次不一样

1*1的卷积核作为第一个抽象层级，为了增加抽象深度（非线性映射的深度）。

1*1卷积核的作用：

进行升维与降维并减少网络参数。关于其降维并减少网络参数的特点在GooLeNet中表现得一览无遗，详情可以参见GooLeNet，关于其升维并减少网络参数的功能在ResNet中使用得非常突出。关于详情可以参考http://www.caffecn.cn/?/question/136。
提升跨通道的信息整合与信息交互。我们知道，1*1的卷积核的每一个filter可以实现跨通道的信息通信，因此虽然是简单的线性组合，但是却丰富了信息的表现形式，因此有利于特征的提取。

发现很多网络使用1×1的卷积核，实际就是对输入的一个比例缩放，因为1×1卷积核只有一个参数，这个核在输入上滑动，就相当于给输入数据乘以一个系数。（对于单通道和单个卷积核而言这样理解是可以的）

对于多通道和多个卷积核的理解，1×1卷积核大概有两方面的作用：
1.实现跨通道的交互和信息整合（具有线性修正特性，实现多个feature
map的线性组合，可以实现feature map在通道个数上的变化，想象成跨通道的pooling，(输入的多通道的feature
map和一组卷积核做卷积求和得到一个输出的feature map)
2.进行卷积核通道数的降维和升维（同时还具有降维或者升维功能）
3.在pooling层后面加入的1×1的卷积也是降维，使得最终得到更为紧凑的结构，虽然有22层，但是参数数量却只是alexnet的1/12.
4.最近大热的MSRA的resnet也利用了1×1的卷积，并且是在3×3卷积层的前后都使用了，不仅进行了降维，还进行了升维，使得卷积层的输入和输出的通道数都减小，数量进一步减少。如果1×1卷积核接在普通的卷积层后面，配合激活函数，就可以实现network
in network的结构了。
5.还有一个很重要的功能，就是可以在保持feature
map尺度不变的（即不损失分辨率）的前提下大幅增加非线性特性（利用后接的非线性激活函数），把网络做的很deep。（平均池化是针对每个feature
map的平均操作，没有通道间的交互，而1×1卷积是对通道的操作，在通道的维度上进行线性组合）

inceptionnet的更多相关文章

AI：IPPR的数学表示-CNN结构进化（Alex、ZF、Inception、Res、InceptionRes）
前言: 文章:CNN的结构分析-------: 文章:历年ImageNet冠军模型网络结构解析-------: 文章:GoogleLeNet系列解读-------: 文章:DNN结构演进Histor ...
AI：IPPR的数学表示-CNN结构/参数分析
前言:CNN迎接多类的挑战特定类型的传统PR方法特征提取的方法是固定的,模式函数的形式是固定的,在理论上产生了特定的"局限性" 的,分类准确度可以使用PAC学习理论的方法计算出来 ...
论文阅读笔记六十二:RePr: Improved Training of Convolutional Filters(CVPR2019)
论文原址:https://arxiv.org/abs/1811.07275 摘要一个训练好的网络模型由于其模型捕捉的特征中存在大量的重叠,可以在不过多的降低其性能的条件下进行压缩剪枝.一些skip/ ...
torch_07_卷积神经网络案例分析
1. LeNet(1998) """ note: LeNet: 输入体:32*32*1 卷积核:5*5 步长:1 填充:无池化:2*2 代码旁边的注释:卷积或者池化后的 ...
ubuntu之路——day19.1 深度CNN的探究
1.经典的CNN LeNet-5 1998的CNN鼻祖以前用的sigmoid和tanh 下图给的是relu和softmax AlexNet ImageNet2012的冠军 VGG-16 ImageN ...
tensorflow实战笔记（19）----使用freeze_graph.py将ckpt转为pb文件
一.作用: https://blog.csdn.net/yjl9122/article/details/78341689 这节是关于tensorflow的Freezing,字面意思是冷冻,可理解为整合 ...
【目标检测】：SPP-Net深入理解（从R-CNN到SPP-Net）
一. 导论 SPP-Net是何凯明在基于R-CNN的基础上提出来的目标检测模型,使用SPP-Net可以大幅度提升目标检测的速度,检测同样一张图片当中的所有目标,SPP-Net所花费的时间仅仅是RCNN ...
【DeepLearning】GoogLeNet
InceptionV1 论文原文:Going deeper with convolutions 中英文对照 InceptionBN 论文原文:Batch Normalization: Accel ...
tensorflow学习笔记——DenseNet
完整代码及其数据,请移步小编的GitHub地址传送门:请点击我如果点击有误:https://github.com/LeBron-Jian/DeepLearningNote 这里结合网络的资料和De ...

随机推荐

centos6.0 配置SVN
基本步骤: 1.安装必需的subversion 2.创建版本库 3.配置用户和权限 4.钩子和svn常用命令说明一.安装subversion 在这里我们使用yum来安装subversion,使用以下 ...
VC++基于CXImage库实现缩略图
一般的图像处理软件都对读入程序的图像文件建一个缩略图的列表,像ACDSee那样.笔者最近在做一个图像处理的项目,处理的原始数据就是图像文件.从项目一开始就想做一个缩略图,但一直苦于技术水平有限,且时间 ...
c:\Windows\System32\drivers\etc\hosts的作用
c:\Windows\System32\drivers\etc\hosts 是域名解析文件. 可以直接用记事本打开.将IP地址重定向. 格式为:ip地址-空格-域名可以将一个域名重新定向到一个IP ...
luogu 1941 飞扬的小鸟
这道题对于第13个数据点,不知为什么f数组第二位开到2000以下就不能过,求指教飞扬的小鸟传送门题目大意一个小鸟在\(n*m\)的方阵里,然后有许多管道你们玩过就不多介绍了,然后每一个位置,点 ...
SSRS故障排除
1.SSRS部署到本地出现错误:为用户“Jimmy-PC\Jimmy”授予的权限不足,无法执行此操作.用户“Jimmy-PC\Jimmy”不具有所需的权限.请验证授予了足够的权限并且解决了 Windo ...
jquery 几种类选择器方式
代码如下: <%@ Page Language="C#" AutoEventWireup="true" CodeBehind="TestClas ...
内部div自动扩张剩余宽度
<div id="container"> <div id="left">左边</div> <div id=" ...
[BeiJing2006]狼抓兔子 dijkstra+平面图最小割
一眼裸的最大流求最小割,然而数据范围过大,跑不下来. 我们可以将平面图转成对偶图,并进行连边. 这样,每条边的长度就对应原图中的割边长度. 起点到终点的最短路即为最小割. 别用SPFA,会死的很惨 C ...
linux 安装常用库
在CentOS安装软件的时候,可能缺少一部分支持库,而报错.这里首先安装系统常用的支持库.那么在安装的时候就会减少很多的错误的出现. [root@bogon 桌面]# yum install -y ...
尼克的任务 dp 洛谷1280
蒟蒻表示老久没看过dp题目了,,挺水的一道dp题目都没想出来,,, 首先设dp[i]表示从开始到i时间的最大空闲时间,用vector to[x] 表示从x点开始的任务结束时间,cnt[x]表示从x开始 ...

inceptionnet