Network in Network

NowGood 2024-10-16 18:23:34 原文

论文要点：

用更有效的非线性函数逼近器（MLP，multilayer perceptron）代替 GLM 以增强局部模型的抽象能力。抽象能力指的模型中特征是对于同一概念的变体的不变形。
使用 global average pooling 代替全连接层，提高模型的泛化能力。

GLM 与 MLP 的输入都是局部“像素”

全连接层可以替换成 1×1 卷积层

这个要好好想想！！！

Mlpconv layer

结合下图，来谈谈 Mlpconv layer 的要点：

从交叉通道（即交叉特征映射）池化的角度来看，上图中的网络结构等效于在正常卷积层上的级联交叉通道参数池化层。每个池化层都会在输入特征图（input feature map）上执行加权线性重组，然后通过整流线性单元。交叉通道池化所生成的特征图再作为下一交叉通道池化的输入，依次进行下去。这种级联的交叉通道参数池化结构允许交叉通道信息的进行复杂且可学习的交互。交叉通道参数化池层也等价于具有1x1卷积核的卷积层。

上面是论文中对 NiN 一个很重要的解释，下面解释一下：交叉通道参数池化层也等价于具有1x1卷积核的卷积层到底是何意？

我们就以上图 MLP 的第一层为例说明一下，我们看到上图中一个 patch 作为 MLP 得输入，MLP 第一层的神经元我们可以看成是传统 CNN 中的 filter，即我们在同一个 patch 上同时使用多个 filter（然后通过relu），并且在 MLP 中的第二层将这些 filter 的输出进行线性组合（然后通过 relu），然后通过第三层输出一个值。这与通过传统 CNN 卷积然后使用 1×1 卷积将一个 patch 上的多个 filter 加权线性组合的总体效果相同，比如一个3层 MLP 来可以通过两次 1×1 卷积（每次过 relu）来达到相同效果。

注意！！！一个 MLP filter 在一个 patch 上只输出一个值，一个 MLP filter在整个输入层上共享参数，所以和传统 filter 一样，这里使用多个MLP filter，而MLP filter 的个数就是下一层feature map的深度。举例如下，下图为使用 NiN 改进的 AlexNet 的网络结构

global average pooling

global average pooling 与 average pooling 的差别就在 "global" 这一个字眼上。global 与 local 在字面上都是用来形容 pooling 窗口区域的。 local 是取 feature map 的一个子区域求平均值，然后滑动这个子区域； global 显然就是对整个 feature map 求平均值了。因此，global average pooling 的最后输出结果仍然是 10 个 feature map，而不是一个，只不过每个 feature map 只剩下一个像素罢了，这个像素就是求得的平均值，10个feature map就变成一个10维的向量，然后直接输入到softmax中。

global average pooling 极大地减少了模型的参数个数，防止模型过拟合，自带正则化光环

Network in Network的更多相关文章

Deep Learning 24：读论文“Batch-normalized Maxout Network in Network”——mnist错误率为0.24%
读本篇论文“Batch-normalized Maxout Network in Network”的原因在它的mnist错误率为0.24%,世界排名第4.并且代码是用matlab写的,本人还没装caf ...
Deep Learning 25：读论文“Network in Network”——ICLR 2014
论文Network in network (ICLR 2014)是对传统CNN的改进,传统的CNN就交替的卷积层和池化层的叠加,其中卷积层就是把上一层的输出与卷积核(即滤波器)卷积,是线性变换,然后再 ...
Linux： service network／Network/NetworkManager
Linux:service network/Network/NetworkManager start 这三种有什么不同? 1.network service的制御网络接口配置信息改动后,网络服务必须从 ...
1×1卷积的用途（Network in Network）
1×1卷积,又称为Network in Network 如果卷积的输出输入都只是一个平面,那么1x1卷积核并没有什么意义,它是完全不考虑像素与周边其他像素关系. 但卷积的输出输入是长方体,所以1x1卷 ...
Network In Network学习笔记
Network In Network学习笔记原文地址:http://blog.csdn.net/hjimce/article/details/50458190 作者:hjimce 一.相关理论本篇 ...
Network in Network 2
<Network in Network>论文笔记 1.综述这篇文章有两个很重要的观点: 1×1卷积的使用文中提出使用mlpconv网络层替代传统的convolution层.mlp层实际 ...
Network In Network——卷积神经网络的革新
Network In Network 是13年的一篇paper 引用:Lin M, Chen Q, Yan S. Network in network[J]. arXiv preprint arXiv ...
论文《Network in Network》笔记
论文:Lin M, Chen Q, Yan S. Network In Network[J]. Computer Science, 2013. 参考:关于CNN中1×1卷积核和Network in N ...
NIN (Network In Network)
Network In Network 论文Network In Network(Min Lin, ICLR2014). 传统CNN使用的线性滤波器是一种广义线性模型(Generalized linea ...
[DeeplearningAI笔记]卷积神经网络2.5-2.7 Network in Network/1*1卷积/Inception网络/GoogleNet
4.2深度卷积网络觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考文献 Inception网络 --Szegedy C, Liu W, Jia Y, et al. Going deepe ...

随机推荐

【Luogu1291】百事世界杯之旅（动态规划，数学期望）
[Luogu1291]百事世界杯之旅(动态规划,数学期望) 题面洛谷题解设\(f[i]\)表示已经集齐了\(i\)个名字的期望现在有两种方法: 先说我自己的: \[f[i]=f[i-1]+1+ ...
关于html中图片上传预览的实现
本地图片预览第一种方法 <!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type& ...
Spring【依赖注入】就是这么简单
前言在Spring的第二篇中主要讲解了Spring Core模块的使用IOC容器创建对象的问题,Spring Core模块主要是解决对象的创建和对象之间的依赖关系,因此本博文主要讲解如何使用IOC容 ...
Oracle用户、授权、角色管理
创建和删除用户是Oracle用户管理中的常见操作,但这其中隐含了Oracle数据库系统的系统权限与对象权限方面的知识.掌握还Oracle用户的授权操作和原理,可以有效提升我们的工作效率. Oracle ...
linux学习之路－－（六）用户及权限详解
计算机资源用户用户的容器,用户组权限进程时用户访问计算机的代理,操作文件的时候,文件本身有权限,进程本身也有权限安全上下文(secure context) 权限: r, w, x 文件: r ...
Knowledge point
静态网页的特点:以htm.html.sbtml.xml.js.css等为后缀扩展名. 1)程序在客户浏览器端解析,不需要读取数据库,性能和效率较高: 2)后端没有数据库支持,所以和用户的交互性差,功能 ...
1-1hibernate数据库操作基础
一.纯原始数据库连接详见http://www.cnblogs.com/lukelook/p/7845757.html 1.Class.forName("oracle.jdbc.driver. ...
UnderScore.jsAPI记录
Collection Functions (Arrays or Objects) each _.each(list, iterator, [context]) 遍历list中的所有元素 ...
Dockerfile 指令 VOLUME 介绍
在介绍VOLUME指令之前,我们来看下如下场景需求: 1)容器是基于镜像创建的,最后的容器文件系统包括镜像的只读层+可写层,容器中的进程操作的数据持久化都是保存在容器的可写层上.一旦容器删除后,这些数 ...
打造Linux回收站
linux是没有回收站概念的,一旦误删除文件了是很难很难找回来的,对普通用户而言误删除文件就等于永久性不可逆丢失数据了:不过可以改造一下rm命令来变相实现回收站功能,实际上就是mv命令转移文件到指定路 ...