IGC（Interleaved Group Convolutions）

　　深度学习被引起关注是在2012年，用神经网络训练的一个分类模型在ImagNet上取得了第一名，而且其分类精度比第二名高出10多个点，当时所使用的模型为AlexNet，现在看来其为一个比较简单的网络，而且只有比较浅的八层网络，但是在当时来讲已经很了不起了。这也就引发了后面对神经网络研究的两个方向，以提高网络的分类精度：1.网络变得更深更宽（Going Deeper）；2.减少网络中存在的冗余性（Eliminate the Redundancy）。

研究增加网络的深度（Going Deeper）。比如VGGNet，通过增加更多的卷积层和全连接层，变成了一个19层的网络，随着网络深度的加深，会发现带来的训练上的问题：过拟合、梯度消失、梯度爆炸等问题，使得后面的信息不能很好的反馈到前面。基于这些问题，出现了一些新的网络模型：

GoogLeNet提出了inception模块，该模块实现：使用1x1的卷积来进行升维度和降维；多尺寸同时卷积后聚合，并且用了中间层的监督信息，使得信息可以很快的进行反馈。

相继出现的还有Highway、ResNet（前后信息和交融起来）、DenseNet等等。

研究减少网络冗余（Eliminate the Redundancy）。随着网络模型的加深和更宽之后，计算量和memory会越来越大，而在实际的应用中，考虑更多的是如何可以应用一个小的model就可以达到好的分类效果，这就要研究如何减少网络中存在的冗余性。

神经网络中用的最多的操作是卷积，把输入信息设定为矩阵向量，卷积操作就相当于矩阵相乘，一种减少冗余的操作是采用核（kernels）操作，将高维度特征用低维度数据映射，来完成部分线性不可分问题，同时保持在低维度进行运算，从而提高了效率。例如用二值化，就会把矩阵的相乘变成矩阵相加减的运算，或者将其变成整型，通过一些量化的方式将一些相互接近的值采用同一个值来表示。另外一种就是把矩阵行或列减少，减少输入的channel。还有一种是把这个channel变成一个稀疏的（sparse）的矩阵，那么计算量和memory就会随之减少，其中现在很火IGC(Interleaved Group Convolutions)就是采用 structured sparse的结构。

对于一个传统的卷积，假设input channel是六个，然后output channel是六个，假若卷积为5x5，那么complexity为6x5x5x6，group convolution会将其分为两组，对每一组分别做卷积，那么每一组的complexity为3x5x5x3，总的complexity为2x(3x5x5x3)，这样计算量和memory就减少了，但是带来的问题是两组之间没有特征相融，所以需要考虑将特征融合加入进去，提出了第二个IGC，也就是IGCV1，希望第一个group convolution不同组的channel可以在第二个group convolution里融合在一组，这样对于每一个output channel与所有的input channel都是相连的。如果将一个传统的卷积替换为IGC的话，就可以获得相当于原来1/2的memory和计算量的更高精度结果。同时比较了ImageNet上的一个实验，用的18层的ResNets网络，将其卷积变成IGC，获得了在memory更少和计算量更少的情况下，训练误差和验证误差都得到了降低。

另外一个相关的工作是Xception，用一个1x1的卷积，再接一个channel 3x3的卷积，这是一个特例的IGC，把第一个group convolution的组数等于channel数，第二个group convolution的group数等于1。实验比较之后，发现不是在极端的第二个group convolution的group数等于1的情况分类精度最高，而是在第二个group convolution的group数等于2的时候分类精度最高，不过第二个group convolution的计算量还是比较大，所以又进一步的将其中的卷积用IGC来替换，也就是IGCV2，同样的中间网络中的所有output channel与所有的input channel都是相连的。

IGCV2实际上是由一连串的group convolution组成的，在设计的时候需要满足两点：1.矩阵的形式不变，核（kernel）操作矩阵依然是一个稠密（dense）矩阵；2.前后group convolution互补，也就是在前面group convolution里不同组的channel，在后面的group convolution要在同一个组里面，这样最终得到的卷积矩阵也会是一个dense的矩阵。

通过实验比较，在同样的参数量的情况下，通过变换不同的参数，实验表明的满足前后group convolution互补的情况下，最终的结果是最好的。

在模型宽度一样的情况下，如何去选择各种参数，使得模型的参数量最少，也就是Balance condition。当Balance condition满足的时候，可以通过公式计算出参数量。

经过比较，IGCV2能够比IGCV1有更好的提高性能。而且实验表明，IGCV2在小model的情况，对性能的提升是很明显的。

IGCV3

本质上解决了低秩矩阵解决和IGCV2的问题。

将传统的卷积通过group convolution，提出了IGC的单元，把传统的卷积替换为IGC，可以获得一个更小、更快、更准的model。

信息来自：CVPR 2018 中国论文分享会

报告人：张婷微软研究院

报告题目：Interleaved Structured Sparse Convolutional Neural Networks

论文 IGCV1：Interleaved Group Convolutions for Deep Neural Networks

论文 IGCV2：Interleaved Structured Sparse Convolutional Neural Networks

代码1：Deep Merge-and-Run Nets:https://github.com/zlmzju/fusenet

代码2：Interleaved group convolutions:https://github.com/hellozting/interleavedGroupConvolutons

IGC（Interleaved Group Convolutions）的更多相关文章

elasticsearch 多列聚合（sql group by）
文档数据格式 {"zone_id":"1","user_id":"100008","try_deliver_t ...
取出分组后每组的第一条记录（不用group by）按时间排序
--操作日志表 CREATE TABLE [dbo].[JobLog]( [JobLogId] [int] IDENTITY(1,1) NOT NULL, [FunctionId] [nvarchar ...
MMORPG大型游戏设计与开发（服务器 AI 概述）
游戏世界中我们拥有许多对象,常见的就是角色自身以及怪物和NPC,我们可以见到怪物和NPC拥有许多的行为,比如说怪物常常见到敌对的玩家就会攻击一样,又如一些NPC来游戏世界中走来走去,又有些怪物和NPC ...
【DC010沙龙年度合集】顶尖Hacking技术盛宴（文末福利）
岁末盘点,让我们一起回顾2017年DEFCON GROUP 010带来的那些最前端的Hacker技术,体验原汁原味的mini DEFCON黑客大会,满满的干货帮你开启Hacker技术大门 &g ...
介绍Oracle自带的一些ASM维护工具（kfod/kfed/amdu）
1.前言 ASM(Automatic Storage Management)是Oracle主推的一种面向Oracle的存储解决方式,它是一个管理卷组或者文件系统的软件.眼下已经被RAC环境广泛使用,可 ...
【ASM】介绍Oracle自带的一些ASM维护工具（kfod/kfed/amdu）
转自:http://blog.csdn.net/wenzhongyan/article/details/47043253 非常感谢作者的文章,很有价值!至此转载,非常感谢 1.前言 ASM(Autom ...
论文笔记-IGCV3：Interleaved Low-Rank Group Convolutions for Efficient Deep Neural Networks
论文笔记-IGCV3:Interleaved Low-Rank Group Convolutions for Efficient Deep Neural Networks 2018年07月11日 14 ...
Linux 组配置文件（/etc/group）
一.概述 Linux 组配置(/etc/group)文件分为4个字段,分别为: 组名.组密码.GID和组成员. 二.示例用户apple和banana的默认组为fruit. [root@titan ~ ...
APUE 2 - 进程组（process group）会话（session） job
进程组(process group) 进程组顾名思义是指一个或多个进程的集合.他们通常与同一个job(可以从同一个终端接收信号)相关联.每个进程组拥有一个唯一的Process Group Id.可以使 ...

随机推荐

24 AdminLTE 基础入门
1.AdminLTE介绍 AdminLTE是一款建立在bootstrap和jquery之上的开源的模板主题工具,它提供了一系列响应的.可重复使用的组件,并内置了多个模板页面:同时自适应多种屏幕分辨率, ...
vue中ref在input中详解
当我们在项目中遇见文本输入框的时候,获取时刻输入框中的值 1.v-model <template> <input type="text" v-model=&quo ...
'cross-env' 不是内部或外部命令，也不是可运行的程序或批处理文件。 npm ERR! code ELIFECYCLE npm ERR! errno 1
在建立vue项目时报的错误原因是缺少依赖,在此项目目录下下载依赖即可 cnpm install 发一次建立vue项目的完整顺序吧 //打开要创建的项目路径目录,创建项目 vue init webpa ...
springboot异步线程(二)
前言本篇文章针对上篇文章springboot异步线程,有一位大佬在评论中提出第一点是错误的,当时看到了这个问题,最近刚好有空,针对第一点的问题去搜索了不少的文章: 问题我在文章中第一点去验证:Sc ...
stm32f103c8串口USART1发送多一字节
用UART写了一段Bootloader代码,遇到了一个很奇怪的现象. 代码如下:简单介绍一下就是先统一配置MCU的IO端口,然后配置串口参数,然后循环发送‘0’和'\r’.16进制是0x30 0x0d ...
C++错题记录
D. 通俗讲 , 前置++ : 先自增,再赋值后置++: 先赋值,再自增从反汇编中,可以看出: 前置++效率比后置++高前置++: 自增后返回引用后置++: 拷贝一份临时变量,再自增 ...
DISPLAY FORMAT 語法
MacBook Pro配置汇编开发环境
配置开发环境方法一: 打开命令行,输入指令which nasm查看nasm的安装路径,Mac系统默认安装了nasm.一般默认返回的路径是/usr/bin/nasm 接着输入指令alias nasm= ...
git 学习笔记 --从远程库克隆
上次我们讲了先有本地库,后有远程库的时候,如何关联远程库. 现在,假设我们从零开发,那么最好的方式是先创建远程库,然后,从远程库克隆. 首先,登陆GitHub,创建一个新的仓库,名字叫gitskill ...
PHP的序列化、对象、反射、异常与错误
1. 怎么理解php里面的序列化与反序列化? 序列化是将对象转换为字节流.反序列化就是将流转换为对象. 这两个过程结合起来,可以轻松地存储和传输数据,在网络中可以做到跨平台.快速传输. 两种序列化方式 ...

IGC（Interleaved Group Convolutions）

IGC（Interleaved Group Convolutions）的更多相关文章

随机推荐

热门专题