Concat层解析

Concat层的作用就是将两个及以上的特征图按照在channel或num维度上进行拼接，并没有eltwise层的运算操作，举个例子，如果说是在channel维度上进行拼接conv_9和deconv_9的话，首先除了channel维度可以不一样，其余维度必须一致（也就是num、H、W一致），这时候所做的操作仅仅是conv_9 的channel k₁加上deconv_9的channel k₂，Concat 层输出的blob可表示为：N*（k₁+k₂）*H*W。通常情况下，考虑到Concat是希望将同大小的特征图拼接起来，那为什么会产生同大小的特征图呢？显然离不开上采样和下采样的操作，接下来，以Caffe为例，介绍一下这两种拼接的方式，如下：

选择axis=0，表示在num维度上进行拼接，可表示为：（k₁+k₂）*C*H*W；
选择axis=1，表示在channel维度上进行拼接，可表示为：N*（k₁+k₂）*H*W。

注意，卷积运算是三维的（不要想成二维的，当然这应该在学卷积的时候说过的），卷积核的数量就是feature map的channel，feature map的num通常是minibatch的数目。可问题是，这两种Concat的方式应该如何选择呢？（ps：如果自己不会用，很自然就是看看别人怎么用）

那么接下来我们就看看到底怎么用。

目前我见过的大都是在channel维度上进行拼接，其实也容易想到，因为我们说feature map 的num是minibatch的图片数目，比方我们的batch是32，但是我们有4张显卡同时训练，显然minibatch等于8，这个8表示的是每张显卡一次性处理的图片数目，这么说来，如果在num维度上拼接的意思就是将同一张显卡处理的feature map数目重复的加倍了，当然由于上下采样并不是严格的互逆运算，所以在重复的特征图上像素值还是存在差异。反之，如果是在channel 维度上拼接，此时channel 的数量增加了，也就是说同一个大小的特征图有了更多的特征表示，很多论文都已经证实其可以提高检测性能，但是如果不是cancat的方式，而是增加原有的卷积层的channel数目会导致显存占用增加，速度下降，这样一来concat的方式在不失速度的前提下，提高了精度，这也是其主要的贡献。当然光说不行，我把这两种方法都试验一下，供大家参考。

在试验之前介绍一下我的环境，我采用的是VGG模型加的改进，训练中用了4个TITAN X，minibatch等于8，在保证其它情况一致的情况下进行如下试验：

在num维度上进行拼接；显然，在num维度上拼接的话，concat层输出的num个数就变成16了，如下表统计的结果显示，此种操作的效果很差，出现missing GT position for label的warning，不建议使用。
在channel维度上进行拼接，在channel维度上的拼接分成无BN层和有BN层。

（1）无BN层：直接将deconvolution layer 和convolution layer concat。实验结果表明，该方式取得的结果精度较低，低于原有的VGG模型，分析主要的原因是漏检非常严重，原因应该是concat连接的两层参数不在同一个层级，类似BN层用在eltwise层上。

（2）有BN层：在deconvolution layer 和convolution layer 后面加batchnorm和scale层（BN）后再concat。实验结果表明，该方式取得了比原有VGG模型更好的检测效果（表中的迭代次数还没有完哦），增加了2%的精度，但是速度上慢了一些。

总结：concat层多用于利用不同尺度特征图的语义信息，将其以增加channel的方式实现较好的性能，但往往应该在BN之后再concat才会发挥它的作用，而在num维度的拼接较多使用在多任务问题上，将在后续的博客中介绍，总之concat层被广泛运用在工程研究中。

Concat层解析的更多相关文章

slice层解析
如果说之前的Concat是将多个bottom合并成一个top的话,那么这篇博客的slice层则完全相反,是把一个bottom分解成多个top,这带来了一个问题,为什么要这么做呢?为什么要把一个低层的切 ...
Eltwise层解析
Concat层虽然利用到了上下文的语义信息,但仅仅是将其拼接起来,之所以能起到效果,在于它在不增加算法复杂度的情形下增加了channel数目.那有没有直接关联上下文的语义信息呢?答案是Eltwise层 ...
json两层解析
public class Demo { public static void main(String[] args) { try { // 创建连接服务器的连接地址 URL url = new UR ...
Caffe_Scale层解析
Caffe Scale层解析前段时间做了caffe的batchnormalization层的解析,由于整体的BN层实现在Caffe是分段实现的,因此今天抽时间总结下Scale层次,也会后续两个层做合 ...
ASP.NET SignalR2持久连接层解析
越是到年底越是感觉浑身无力,看着啥也不想动,只期盼着年终奖的到来以此来给自己打一针强心剂.估摸着大多数人都跟我一样犯着这样浑身无力的病,感觉今年算是没挣到啥钱,但是话也不能这么说,搞得好像去年挣到钱了 ...
Euclideanloss_layer层解析
这里说一下euclidean_loss_layer.cpp关于该欧式loss层的解析,代码如下: #include <vector> #include "caffe/layers ...
Spring的Service层与Dao层解析
本文转载于网络,觉得写得很透彻. dao完成连接数据库修改删除添加等的实现细节,例如sql语句是怎么写的,怎么把对象放入数据库的.service层是面向功能的,一个个功能模块比如说银行登记并完成一次存 ...
Mybatis框架基础支持层——解析器模块（2）
解析器模块,核心类XPathParser /** * 封装了用于xml解析的类XPath.Document和EntityResolver */ public class XPathParser { / ...
TCP协议详解7层和4层解析(美团，阿里) 尤其是三次握手，四次挥手具体发送的报文和状态都要掌握
如果想了解HTTP的协议结构,原理,post,get的区别(阿里面试题目),请参考:HTTP协议结构,get post 区别(阿里面试) 这里有个大白话的解说,可以参考:TCP/IP协议三次握手和四 ...

随机推荐

python调用Sikuliapi
Sikuli是由MIT(麻省理工学院) 研究团队发布的一种图形化编程技术(编程小白的福音),使用Sikuli你只需要会写HelloWorld这种最基本的编程技能即可,用Sikuli不需要去写出一行行复 ...
Python 的 “Magic” 方法
在以前的文章中,我聊过了Python的 __getitem__ 和 __setitem__ 方法.这些方法被称为“魔法”方法.特殊方法或者dunger方法(译者:国内书籍用“魔法”一词较多).那么,什 ...
BZOJ3481 DZY Loves Math III（数论+Pollard_Rho）
考虑对于每一个x有多少个合法解.得到ax+by=c形式的方程.如果gcd(x,y)|c,则a在0~y-1范围内的解的个数为gcd(x,y).也就是说现在所要求的是Σ[gcd(x,P)|Q]*gcd(x ...
P3455 [POI2007]ZAP-Queries
题目描述 Byteasar the Cryptographer works on breaking the code of BSA (Byteotian Security Agency). He ha ...
Sort HDU - 5884(优先队列+二分)
Sort Time Limit: 3000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Submis ...
hbase 自定义过滤器
1.首先生成自定义过滤器,生成jar包,然后拷贝到服务器hbase目录的lib下. 1.1 自定义过滤器CustomFilter import com.google.protobuf.InvalidP ...
What?
What? 本文主要讲解一下kubernetes周边的概念,可以说是一小部分的生态圈,逐渐了解一下,走进kubernetes的世界.请读者在读的时候,带着批判的态度去读. 一张概览图: 云计算: 原文 ...
【算法】Tarjan大锦集
Task1 Description 一位冷血的杀手潜入 Na-wiat,并假装成平民.警察希望能在 N 个人里面,查出谁是杀手. 警察能够对每一个人进行查证,假如查证的对象是平民,他会告诉警察,他认识 ...
BZOJ3192：[JLOI2013]删除物品——题解
https://www.lydsy.com/JudgeOnline/problem.php?id=3192 箱子再分配问题需要解决如下问题: (1)一共有N个物品,堆成M堆. (2)所有物品都是一样的 ...
【Cf #503 C】Sergey's problem（有趣的构造）
感觉这种构造题好妙啊,可我就是想不到诶. 给出一张无自环的有向图,回答一个独立集,使得图中任意一点都可以被独立集中的某一点两步之内走到. 具体构造方案如下: 下标从小到大枚举点,如果该点没有任何标记, ...

Concat层解析

Concat层解析的更多相关文章

随机推荐

热门专题