轻量级网络 - PVANet & SuffleNet

一. PVANet

论文：PVANET: Deep but Lightweight Neural Networks for Real-time Object Detection 【点击下载】

Caffe代码：【Github】

设计了一种轻量级的网络，取名叫 PVANet，特点是 Channel少、Layer多，在 VOC2007 和 VOC2012 精确度分别达到了 84.9% 和 84.2%，但计算量不到采用 ResNet-101 网络的 10%。

论文的核心要点：

1）改进的 C.ReLU

前面几层 用到了 CReLU，Concatenated Rectified Linear Units。

CReLU 来源于在 AlexNet 上的一个有趣的实验（参考论文【CReLU】）：低层的卷积层中的一些滤波器核存在着负相关程度很高的滤波器核，而层次越高的卷积层，这一现象越不明显。作者把这一现象称为 pairing phenomenon。

根据这种特性，通过 Negation 实现 Concatenation，在不损失精度的情况下可以减少一半计算量。

作者基于 CReLU 进行了改进，添加了 Scale/Bias 层（见下图左），允许每个channel（通道）的斜率和激活阈值与其相反的 Channel 不同。

2）使用 Inception Net

“Inception 没有广泛应用在现有网络中”，目前来看使用的确实也不少了，不纠结这个，Inception 的优点是通过不同尺度的卷积核对应不同大小的感受野，从而适应不同大小的目标。

上图右侧是 Inception 的网络结构，作者用两个 3*3 的 Conv 替代 5*5 的 Conv，其中 1*1 的 Conv保留特征尺度，直接连接定义残差。

3）深度网络训练

a）使用了 Residual Net 和 BN（Batch Norm），ResNet 与 Inception Layer 连接；

b）通过自定义策略 “Plateu” 动态调整学习率，如果 moving average of loss 在迭代周期内低于一个预设值，触发 “on-plateau”，将学习率动态减少一个常量。

从一般意义上来说，动态调整学习率可以有效避免震荡，提高训练精度。

4）整体设计

以表的形式给出各层的 Detail：

5）Hyper-feature concatenation

多尺度的特征组合在很多文献中都有大量应用，文中用在目标检测上，能够对多尺度的目标进行有效检测。

如下图所示，采用了三个不同 Scale 进行 Feature 联合。

PVA 是个轻量级网络，基本能够达到实时（Titan X），对于实时系统应用的童鞋可以考虑。

二. SuffleNet

论文：ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices 【点击下载】

这篇文章出自 Face++ 的孙剑大神组，主要目的是通过减少网络计算量，达到在移动端应用的目的。文章比较 MobileNet （State-of-the-art），在同样计算量的情况下有 6.7% 的提升。

SuffleNet 是属于模型优化的范畴，对于模型优化有很多种方法，这里先大致列一下，后面会有专门的总结介绍。

> Efficient Model Designs（高效的模型设计）

这里主要强调两种加速计算的方法，Group Convolution 和 Depthwise Convolution，也正是本文所采用的模型优化设计思路。

Group Convolution 最早来自于 AlexNet，经典的拓扑图展示了把 Channel 划分到不同 Group 进行卷积，原文是为了在两个 GPU 计算，这是最早的通道拆分概念；

Depthwise Separable Convolution 将 标准的Conv操作 分解成一个 Depthwise Conv（独立通道）和一个 PointWise Conv（1*1的卷积），以此减少计算量；

Depthwise 每个卷积核（Filter）只对一个 Channel 进行卷积计算，Pointwise Conv 执行通道合并，可以理解为：

Depthwise Separable Convolution = Depthwise Convolution + Pointwise Convolution

基于该思路设计的框架如 Xception，ResNeXt，我傻傻的分不太清， MobileNet 也是这个思路。

> Model Acceleration（模型加速）

Pruning（剪枝） 是最直观的一种加速方法，思路比较简单，即去除权值较小的 Connection，或者减少 Channel 数量，得到稀疏的网络连接。

Quantization（量化） 用于参数压缩，包括下面两个方向：

a）将 Float32 量化为 8bit 定点数或更少，减少模型计算量和参数存储大小（缺点是精度下降），同时借助 SIMD 等策略实现批量计算；二值化网络是参数量化的一个极端情况，比较典型的是 BinaryNet 和 Xnor-net。

b）权值共享－通过对权值进行压缩来得到共享权值，共享信息一般通过聚类来得到。

Factorization（因式分解） 主要用于降低全连接层的计算。

Distilling（知识迁移）将大模型训练的知识迁移到小模型。可以看一下 Hinton 的蒸馏模型 - Distilling the knowledge in a neural network。

● Channel Shuffle

Shuffle 是本文的核心概念，引入 Shuffle 是为了解决 Group Convolution 的问题：

（a）只用 GConv 来做的话，卷积只在 Group Channel 内部计算，Group 之间（下图颜色区分）相互独立；

问题在于不同 Group 之间没有信息Flow，缺乏 inter 信息，模型精度会比较差。

（b）不同 Group 之间的 Channel 重新分配，增加 Group 之间的信息 Flow；

重新分配与原始的 Conv 一样，都加入了 inter 信息，但计算量降低很多。

（c）作者加入的 Channel Shuffle，实现与（b）一样的功能；

专门提到通过 Shuffle 方式，两个 GConv（GConv1 & GConv2）之间的 Group 是可以不同的。

● ShuffleNet Unit

ShuffleNet 单元引入了上面的 Shuffle 层，先来看图：

图（a）是原始的 Bottle Neck Units，引入了 3*3 的 DepthWise Conv（比较重要），这里 Depthwise 是指在每个独立的通道进行计算，通道之间不交叠，Depthwise Conv 最大层度上减少计算量。前面讲过，采用这总结构的网络包括：ResNet、Xception 和 MobileNet。

可以看到，图（a）中的 1x1 Conv 并未做优化，可以认为全部计算的（full connection），根据作者统计这部分计算量占比达到 93.4%，这个比例相当惊人，不优化不足以平民愤，于是该 Channel Shuffle 出场了，参考上图（b）来看作者的改进包括哪些：

1）通过 1x1 的 GConv＋Shuffle 替代原来的 1x1部分，在不降低计算精度的情况下大大减少计算量；

2）去掉了 DWConv后面的 ReLU部分，这个可以自己看论证；

上图（c）给出了另一种结构：

1）在 ShortCut 添加了 Avg Pool 实现降采样，同时将 DWConv Stride 改为2，与之匹配；

2）用 Concat 替换原来的 Add，增加 Channel 数量；

● 网络架构

ShuffleNet 网络结构也比较清晰，如下图：

另外 Group 的 size 数量影响分类误差，对于固定计算量的情况，Group越多，对应的channel 通过也就越多，通常精度会提升，当然不会无限提升，在和 Filter 数量达到一定比例的情况下（可以理解为混淆比较均匀），精度最高。

作者通过 Scale 来控制 Filter 数量，Filter越少，计算量相应也就越少。

来看下图：

● 实验对比

采用ResNeXt 的方法进行训练，只做了两个小的改动：

1）将权值衰减从1e-4 减少为 4e-5；

2）只用了简单的 Scale 做数据增强；

这样做的依据是小网络通常容易欠拟合而不是过拟合，类似的 MobileNet 也采用了同样的策略进行训练。

Table3 对比了 Channel Shuffle 带来的作用：

下面给出了 ShuffleNet 与经典网络、轻量级MobileNet 之间的对比：

与经典网络的复杂度比较（在同样准确度的情况下）：

在 MS COCO 上测试 ShuffleNet 的泛化性能：

最后给出实测数据，相对于 AlexNet 有 13倍的提高：

轻量级网络 - PVANet & SuffleNet的更多相关文章

图像分类丨浅析轻量级网络「SqueezeNet、MobileNet、ShuffleNet」
前言深度卷积网络除了准确度,计算复杂度也是考虑的重要指标.本文列出了近年主流的轻量级网络,简单地阐述了它们的思想.由于本人水平有限,对这部分的理解还不够深入,还需要继续学习和完善. 最后我参考部分列 ...
SqueezeNet/SqueezeNext简述 | 轻量级网络
SqueezeNet系列是比较早期且经典的轻量级网络,SqueezeNet使用Fire模块进行参数压缩,而SqueezeNext则在此基础上加入分离卷积进行改进.虽然SqueezeNet系列不如Mob ...
ShuffleNetV1/V2简述 | 轻量级网络
ShuffleNet系列是轻量级网络中很重要的一个系列,ShuffleNetV1提出了channel shuffle操作,使得网络可以尽情地使用分组卷积来加速,而ShuffleNetV2则推倒V1的大 ...
MobileNetV1/V2/V3简述 | 轻量级网络
MobileNet系列很重要的轻量级网络家族,出自谷歌,MobileNetV1使用深度可分离卷积来构建轻量级网络,MobileNetV2提出创新的inverted residual with line ...
ESPNet/ESPNetV2：空洞卷积金字塔 | 轻量级网络
ESPNet系列的核心在于空洞卷积金字塔,每层具有不同的dilation rate,在参数量不增加的情况下,能够融合多尺度特征,相对于深度可分离卷积,深度可分离空洞卷积金字塔性价比更高.另外,HFF的 ...
轻量级网络库libevent初探
本文是关于libevent库第一篇博文,主要由例子来说明如何利用该库.后续博文再深入研究该库原理. libevent库简介就如libevent官网上所写的“libevent - an event n ...
『高性能模型』轻量级网络ShuffleNet_v1及v2
项目实现:GitHub 参考博客:CNN模型之ShuffleNet v1论文:ShuffleNet: An Extremely Efficient Convolutional Neural Netwo ...
轻量级网络库libevent概况
Libevent is a library for writing fast portable nonblocking IO. libevent是一个为编写快速可移植的非阻塞IO程序而设计的. lib ...
『高性能模型』轻量级网络MobileNet_v2
论文地址:MobileNetV2: Inverted Residuals and Linear Bottlenecks 前文链接:『高性能模型』深度可分离卷积和MobileNet_v1 一.Mobil ...

随机推荐

awk循环语句-【AWK学习之旅】
AWK中两种循环语句:if-else 和 while 控制流语句: 1.if-else 求总数,平均值: [root@monitor awkdir]# awk '$3>6 {n = n ...
解决 maven项目在eclipse中debug时看不到源码问题
第一步: 第二步:Configurations 里面的source里面是Default.把Defaul删除,选java project ,然后添加自己的项目第三步:选中,并用命令跑tomcat 这样 ...
bugfree登录后报错PHP Fatal error: Call-time pass-by-reference has been removed in
详细报错信息[Tue Apr 25 06:49:07.556316 2017] [:error] [pid 21799] [client *.*.*.*:55813] PHP Fatal error: ...
事后调试.ZC资料
1.查了一下,Delphi 程序可以生成 map文件,可以用来根据崩溃的内存报错定位出错的代码位置 2.但是,Delphi程序无法再崩溃的时候生成dump文件 (这个不一定,研究了再说.记得 ...
idea 2018注册码
原文:https://blog.csdn.net/zhw0596/article/details/81394870 (最新的看后面!!! 转载的请附上原文链接搜索不易!)百度的,上一个没用 ...
Eclipse 中从SVN下载的项目如何解除关联上传到另一SVN路径下
首先选中项目右击-->team-->断开连接选择第一个即可断开与上一个SVN关联然后上传到另一SVN路径下选中项目右击-->team-->Share Project ...
热备模式相关问题2.txt
--//上午测试热备模式相关问题,就是如果打开热备模式,如果中间的归档丢失,oracle在alter database end backup ;时并没有应用日志. --//虽然热备份模式文件头scn被 ...
CentOS 7添加应用快捷方式到桌面
以eclipse为例,编辑下面文件,复制到桌面即可. vi client.desktop [Desktop Entry]Encoding=UTF-8Name=eclipseExec=/home/clo ...
Linux命令详解-cal
cal命令可以用来显示公历(阳历)日历.公历是现在国际通用的历法,又称格列历,通称阳历."阳历"又名"太阳历",系以地球绕行太阳一周为一年,为西方各国所通用,故 ...
1004: [HNOI2008]Cards burnside定理
https://www.lydsy.com/JudgeOnline/problem.php?id=1004 输入数据保证任意多次洗牌都可用这 m种洗牌法中的一种代替,且对每种洗牌法,都存在一种洗牌法使 ...

轻量级网络 - PVANet & SuffleNet

轻量级网络 - PVANet & SuffleNet的更多相关文章

随机推荐

热门专题