轻量级CNN模型mobilenet v1

mobilenet v1

论文解读

论文地址:https://arxiv.org/abs/1704.04861

核心思想就是通过depthwise conv替代普通conv.

有关depthwise conv可以参考https://www.cnblogs.com/sdu20112013/p/11759928.html

模型结构:

类似于vgg这种堆叠的结构.

每一层的运算量

可以看到,运算量并不是与参数数量绝对成正比,当然整体趋势而言,参数量更少的模型会运算更快.

代码实现

https://github.com/marvis/pytorch-mobilenet

网络结构:

class Net(nn.Module):

    def __init__(self):

        super(Net, self).__init__()

        def conv_bn(inp, oup, stride):

            return nn.Sequential(

                nn.Conv2d(inp, oup, 3, stride, 1, bias=False),

                nn.BatchNorm2d(oup),

                nn.ReLU(inplace=True)

            )

        def conv_dw(inp, oup, stride):

            return nn.Sequential(

                nn.Conv2d(inp, inp, 3, stride, 1, groups=inp, bias=False),

                nn.BatchNorm2d(inp),

                nn.ReLU(inplace=True),

                nn.Conv2d(inp, oup, 1, 1, 0, bias=False),

                nn.BatchNorm2d(oup),

                nn.ReLU(inplace=True),

            )

        self.model = nn.Sequential(

            conv_bn(  3,  32, 2),

            conv_dw( 32,  64, 1),

            conv_dw( 64, 128, 2),

            conv_dw(128, 128, 1),

            conv_dw(128, 256, 2),

            conv_dw(256, 256, 1),

            conv_dw(256, 512, 2),

            conv_dw(512, 512, 1),

            conv_dw(512, 512, 1),

            conv_dw(512, 512, 1),

            conv_dw(512, 512, 1),

            conv_dw(512, 512, 1),

            conv_dw(512, 1024, 2),

            conv_dw(1024, 1024, 1),

            nn.AvgPool2d(7),

        )

        self.fc = nn.Linear(1024, 1000)

    def forward(self, x):

        x = self.model(x)

        x = x.view(-1, 1024)

        x = self.fc(x)

        return x

参考论文中的结构,第一层是普通的卷积层,后面接的都是可分离卷积.

这里注意groups参数的用法. 当groups=输入channel数目时,即对每个channel分别做卷积.默认groups=1,此时即为普通卷积.

训练伪代码

# create model

model = Net()

# define loss function (criterion) and optimizer

criterion = nn.CrossEntropyLoss().cuda()

optimizer = torch.optim.SGD(model.parameters(), args.lr,

                            momentum=args.momentum,

                            weight_decay=args.weight_decay)

# load data

train_loader = torch.utils.data.DataLoader()

# train

for every epoch:

    input,target=get_from_data

    #前向传播得到预测值

    output = model(input_var)

    #计算loss

    loss = criterion(output, target_var)

    #反向传播更新网络参数

    optimizer.zero_grad()

    loss.backward()

    optimizer.step()

轻量级CNN模型mobilenet v1的更多相关文章

轻量级CNN模型之squeezenet
SqueezeNet 论文地址:https://arxiv.org/abs/1602.07360 和别的轻量级模型一样,模型的设计目标就是在保证精度的情况下尽量减少模型参数.核心是论文提出的一种叫&q ...
CNN 模型压缩与加速算法综述
本文由云+社区发表导语:卷积神经网络日益增长的深度和尺寸为深度学习在移动端的部署带来了巨大的挑战,CNN模型压缩与加速成为了学术界和工业界都重点关注的研究领域之一. 前言自从AlexNet一举夺得 ...
轻量级卷积神经网络——MobileNet
谷歌论文题目: MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications 其他参考: CNN ...
keras入门（三）搭建CNN模型破解网站验证码
项目介绍在文章CNN大战验证码中,我们利用TensorFlow搭建了简单的CNN模型来破解某个网站的验证码.验证码如下: 在本文中,我们将会用Keras来搭建一个稍微复杂的CNN模型来破解以上的 ...
总结近期CNN模型的发展(一)---- ResNet [1, 2] Wide ResNet [3] ResNeXt [4] DenseNet [5] DPNet [9] NASNet [10] SENet [11] Capsules [12]
总结近期CNN模型的发展(一) from:https://zhuanlan.zhihu.com/p/30746099 余俊计算机视觉及深度学习 1.前言好久没有更新专栏了,最近因为项目的原因接 ...
Farseer.net轻量级ORM开源框架 V1.x 入门篇：新版本说明
导航目录:Farseer.net轻量级ORM开源框架目录上一篇:没有了下一篇:Farseer.net轻量级ORM开源框架 V1.x 入门篇:数据库配置前言 V1.x版本终于到来了.本次 ...
经典分类CNN模型系列其五：Inception v2与Inception v3
经典分类CNN模型系列其五:Inception v2与Inception v3 介绍 Inception v2与Inception v3被作者放在了一篇paper里面,因此我们也作为一篇blog来对其 ...
从卷积拆分和分组的角度看CNN模型的演化
博客:博客园 | CSDN | blog 写在前面如题,这篇文章将尝试从卷积拆分的角度看一看各种经典CNN backbone网络module是如何演进的,为了视角的统一,仅分析单条路径上的卷积形式. ...
基于Pre-Train的CNN模型的图像分类实验
基于Pre-Train的CNN模型的图像分类实验 MatConvNet工具包提供了好几个在imageNet数据库上训练好的CNN模型,可以利用这个训练好的模型提取图像的特征.本文就利用其中的 “im ...

随机推荐

Flask中的路由、实例化参数和config配置文件
Flask中的路由 endpoint 别名不能重复,对应的视图函数,默认是视图函数名.endpoint 才是路由的核心.视图函数与路由的对应关系.可以通过url_for 反向创建url # metho ...
.Net Reactor混淆导致匿名类处理出现的问题处理分析
.Net Reactor 是一款比较不错的混淆工具,比VS自带的那个好用很多,一直以来也陪伴着我们的成长,虽然没有完美的混淆工具,不过也算还是不错的,至少能在一定程度上对DLL进行一定的保护处理. 不 ...
数位DP 详解
序天堂在左,战士向右引言数位DP在竞赛中的出现几率极低,但是如果不会数位DP,一旦考到就只能暴力骗分. 以下是数位DP详解,涉及到的例题有: [HDU2089]不要62 [HDU3652]B-n ...
Spring MVC-从零开始-@ResponseBody（未完待续）
Spring MVC-从零开始-@ResponseBody(未完待续)
Two progressions CodeForce 125D 思维题
An arithmetic progression is such a non-empty sequence of numbers where the difference between any t ...
springboot + thymeleaf静态资源访问404
在使用springboot 和thtmeleaf开发时引用静态资源404,静态资源结如下: index.html文件: <!DOCTYPE html> <html xmlns:th= ...
CMD的最佳“代替品”
让CMD成为历史 Windows用户大多都使用过"cmd",cmd被称为"阉割版"的DOS系统~ 很多用户除此之外,还喜欢Linux命令行~但是CMD的命令和L ...
JavaScript系列：函数式编程（开篇）
前言: 上一篇介绍了函数回调,高阶函数以及函数柯里化等高级函数应用,同时,因为正在学习JavaScript·函数式编程,想整理一下函数式编程中,对于我们日常比较有用的部分. 为什么函数式编程很重要? ...
vue.js入门代码
<!DOCTYPE html> <html> <head> <meta charset="utf-8" /> <title&g ...
FastEarth
1 概述 FastEarth(后文简称FE)是自主研发的跨平台三维地理信息可视化协作平台,内置完全自主研发的XDR渲染引擎,无缝对接主流地理信息平台数据.建筑BIM.工厂PIM以及多种三 ...