转载请注明出处：

https://www.cnblogs.com/darkknightzh/p/9410540.html

论文：

MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications

网址：

https://arxiv.org/abs/1704.04861?context=cs

非官方的pytorch代码：

https://github.com/marvis/pytorch-mobilenet

1. 深度可分离卷积

mobilenetV1使用的是深度可分离卷积（Depthwise Separable Convolution，DSC），DSC包含两部分：depthwise convolution（DWC）+ pointwise convolution（PWC）。DWC对输入的通道进行滤波，其不增加通道的数量，PWC用于将PWC不同的通道进行连接，其可以增加通道的数量。通过这种分解的方式，可以明显的减少计算量。

如下图所示，传统的卷积（a），卷积核参数为${{D}_{K}}\centerdot {{D}_{K}}\centerdot M\centerdot N$，其中${{D}_{K}}$为卷积核大小，M为输入的通道数，N为输出的通道数。DWC（b）中卷积核参数为${{D}_{K}}\centerdot {{D}_{K}}\centerdot 1\centerdot M$，其中M个${{D}_{K}}\centerdot {{D}_{K}}$的核和输入特征的对应通道进行卷积，如下式所示。PWC（c）中卷积核参数为$1\centerdot 1\centerdot M\centerdot N$，每个卷积核在特征维度上分别对输入的M个特征进行加权，最终得到N个特征（M≠N时，完成了升维或者降维）。

${{\mathbf{\hat{G}}}_{k,l,m}}=\sum\limits_{i,j}{{{{\mathbf{\hat{K}}}}_{k,l,m}}\centerdot {{\mathbf{F}}_{k+i-1,l+j-1,m}}}$

传统卷积的计算量为：

${{D}_{K}}\centerdot {{D}_{K}}\centerdot M\centerdot N\centerdot {{D}_{F}}\centerdot {{D}_{F}}$

DSC总共的计算量为：

${{D}_{K}}\centerdot {{D}_{K}}\centerdot M\centerdot {{D}_{F}}\centerdot {{D}_{F}}+M\centerdot N\centerdot {{D}_{F}}\centerdot {{D}_{F}}$

当使用3*3的卷积核时，DSC可将计算量降低为原来的1/8到1/9。

需要说明的是，DWC，PWC后面均有BN和ReLU。如下图所示，传统的卷积层为3*3conv+BN+ReLU，Depthwise Separable convolutions为3*3DWC+BN+ReLU+1*1conv+BN+ReLU。

2. 网络结构

mobileNetV1的网络结构如下图所示。其中第一个卷积层为传统的卷积；前面的卷积层均有bn和relu，最后一个全连接层只有BN，无ReLU。

mobileNetV1使用RMSprop训练；由于参数很少，DWC使用比较小的或者不使用weight decay（l2 regularization）。

3. 宽度缩放因子（width multiplier）

文中引入了$\alpha $作为宽度缩放因子，其作用是在整体上对网络的每一层维度（特征数量）进行瘦身。$\alpha $影响模型的参数数量及前向计算时的乘加次数。此时网络每一层的输入为$\alpha M$维，输出为$\alpha N$维。此时DSC的计算量变为：

${{D}_{K}}\centerdot {{D}_{K}}\centerdot \alpha M\centerdot {{D}_{F}}\centerdot {{D}_{F}}+\alpha M\centerdot \alpha N\centerdot {{D}_{F}}\centerdot {{D}_{F}}$

$\alpha \in (0,1]$，典型值为1，0.75，0.5，0.25。

4. 分辨率缩放因子（resolution multiplier）

该因子即为$\rho $，用于降低输入图像的分辨率（如将224*224降低到192*192，160*160，128*128）。

此时DSC的计算量变为：

${{D}_{K}}\centerdot {{D}_{K}}\centerdot \alpha M\centerdot \rho {{D}_{F}}\centerdot \rho {{D}_{F}}+\alpha M\centerdot \alpha N\centerdot \rho {{D}_{F}}\centerdot \rho {{D}_{F}}$

5. pytorch代码

pytorch代码见参考网址中benchmark.py

 class MobileNet(nn.Module):

     def __init__(self):

         super(MobileNet, self).__init__()

         def conv_bn(inp, oup, stride):    # 第一层传统的卷积：conv3*3+BN+ReLU

             return nn.Sequential(

                 nn.Conv2d(inp, oup, 3, stride, 1, bias=False),

                 nn.BatchNorm2d(oup),

                 nn.ReLU(inplace=True)

             )

         def conv_dw(inp, oup, stride):      # 其它层的depthwise convolution：conv3*3+BN+ReLU+conv1*1+BN+ReLU

             return nn.Sequential(

                 nn.Conv2d(inp, inp, 3, stride, 1, groups=inp, bias=False),

                 nn.BatchNorm2d(inp),

                 nn.ReLU(inplace=True),

                 nn.Conv2d(inp, oup, 1, 1, 0, bias=False),

                 nn.BatchNorm2d(oup),

                 nn.ReLU(inplace=True),

             )

         self.model = nn.Sequential(

             conv_bn(  3,  32, 2),   # 第一层传统的卷积

             conv_dw( 32,  64, 1),   # 其它层depthwise convolution

             conv_dw( 64, 128, 2),

             conv_dw(128, 128, 1),

             conv_dw(128, 256, 2),

             conv_dw(256, 256, 1),

             conv_dw(256, 512, 2),

             conv_dw(512, 512, 1),

             conv_dw(512, 512, 1),

             conv_dw(512, 512, 1),

             conv_dw(512, 512, 1),

             conv_dw(512, 512, 1),

             conv_dw(512, 1024, 2),

             conv_dw(1024, 1024, 1),

             nn.AvgPool2d(7),

         )

         self.fc = nn.Linear(1024, 1000)   # 全连接层

     def forward(self, x):

         x = self.model(x)

         x = x.view(-1, 1024)

         x = self.fc(x)

         return x

（原）MobileNetV1的更多相关文章

【原】谈谈对Objective-C中代理模式的误解
[原]谈谈对Objective-C中代理模式的误解本文转载请注明出处 —— polobymulberry-博客园 1. 前言这篇文章主要是对代理模式和委托模式进行了对比,个人认为Objective ...
【原】FMDB源码阅读（三）
[原]FMDB源码阅读(三) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言 FMDB比较优秀的地方就在于对多线程的处理.所以这一篇主要是研究FMDB的多线程处理的实现.而 ...
【原】Android热更新开源项目Tinker源码解析系列之一：Dex热更新
[原]Android热更新开源项目Tinker源码解析系列之一:Dex热更新 Tinker是微信的第一个开源项目,主要用于安卓应用bug的热修复和功能的迭代. Tinker github地址:http ...
多线程爬坑之路-学习多线程需要来了解哪些东西?(concurrent并发包的数据结构和线程池,Locks锁，Atomic原子类)
前言:刚学习了一段机器学习,最近需要重构一个java项目,又赶过来看java.大多是线程代码,没办法,那时候总觉得多线程是个很难的部分很少用到,所以一直没下决定去啃,那些年留下的坑,总是得自己跳进去填 ...
【原】FMDB源码阅读（二）
[原]FMDB源码阅读(二) 本文转载请注明出处 -- polobymulberry-博客园 1. 前言上一篇只是简单地过了一下FMDB一个简单例子的基本流程,并没有涉及到FMDB的所有方方面面,比 ...
【原】FMDB源码阅读（一）
[原]FMDB源码阅读(一) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言说实话,之前的SDWebImage和AFNetworking这两个组件我还是使用过的,但是对于 ...
【原】AFNetworking源码阅读（六）
[原]AFNetworking源码阅读(六) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言这一篇的想讲的,一个就是分析一下AFSecurityPolicy文件,看看AF ...
【原】AFNetworking源码阅读（五）
[原]AFNetworking源码阅读(五) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言上一篇中提及到了Multipart Request的构建方法- [AFHTTP ...
【原】AFNetworking源码阅读（四）
[原]AFNetworking源码阅读(四) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言上一篇还遗留了很多问题,包括AFURLSessionManagerTaskDe ...

随机推荐

《剑指offer》-中序遍历下一个节点
题目描述给定一个二叉树和其中的一个结点,请找出中序遍历顺序的下一个结点并且返回.注意,树中的结点不仅包含左右子结点,同时包含指向父结点的指针. /* struct TreeLinkNode { in ...
.net的架构模式
一:ADO.NET实现三层架构不用三层的普通的查询写法: string sql = string.Format("select * from Studnet where StuName l ...
DevExpress学习笔记之如何获取Repository Item的值
上一章我们看到了如何在TreeList的单元格中动态绑定不同的控件,此类控件被称为In_Place Control.所谓“In_Place”,我的理解为“内置”控件,既然有“内”就相对的会有“外”,其 ...
kuangbin 区间dp
A - Cake 题目大意:给你一个n个顶点(n<=100)的多边形和每两个点连边的消耗,让你求把这个多边形全部切成三角形所需要的最小消耗,如果这个多边形为凹多边形则输出无解. 思路:先求一个凸 ...
Linux使用netstat命令查看并发连接数
我们的网站部署在linux的服务器上,特别是web服务器,我们可能有时候做为运维人员,肯定是要查看网站的并发连接数是不是达到瓶颈等,所以在linux下,我们如何查看服务器的并发连接数呢?使用以下命令即 ...
maven添加插件，与maven打包
1.编译插件添加编译器插件来告诉 Maven 使用哪个 JDK 版本是用来编译项目. 2.pom <plugin> <groupId>org.apache.maven.plu ...
Reinforcement Learning 的那点事——强化学习（一）
引言最近实验室的项目需要用到强化学习的有关内容,就开始学习起强化学习了,这里准备将学习的一些内容记录下来,作为笔记,方便日后忘记了好再方便熟悉,也可供大家参考.该篇为强化学习开篇文章,主要概括一些有 ...
jooq实践
用法 sql语句 SELECT AUTHOR.FIRST_NAME, AUTHOR.LAST_NAME, COUNT(*) FROM AUTHOR JOIN BOOK ON AUTHOR.ID = B ...
Web大前端面试题-Day9
1. 请用至少3中方式实现数组去重? 方法一: indexOfvar arr1=[1,2,3,4,5,4,3,2,1]; function repeat1(arr){ for(var i=0, ...
SpringBoot-@PathVariable
URL变量在上一个博客中,学习了如何在@Controller中创建@RequestMapping(或者响应的简写)来处理不同的URL请求.但是在Web应用中URL通常不是一成不变的,例如微博两个不同 ...

（原）MobileNetV1