论文阅读笔记四十九:ScratchDet: Training Single-Shot Object Detectors from Scratch(CVPR2019)

论文原址:https://arxiv.org/abs/1810.08425
github:https://github.com/KimSoybean/ScratchDet
摘要
当前较为流行的检测算法是在经典的大规模分类的数据集上进行微调,但这样做会存在两个问题:
(1)分类任务与检测任务二者之间对位置的敏感性差异较大,进而造成了优化目标之间存在偏差。
(2)目标检测的结构受制于分类模型,进而造成对模型修改上的不便。
为了应对上面的这两个问题,从头重新训练检测器是一种可行的方法。但这种方法又存在的一个问题是,相比预训练过的模型,此方法的性能要差一些,尤其是在训练时的收敛问题上。本文,采用从头重新训练网络的方法,分析了优化的方法发现,从头开始训练检测器所忽略的一个点时BatchNorm。利用BatchNorm的稳定及可预测的梯度,检测器可以从顶部开始进行稳定训练,同时在不同网络结构的基础上取得较好的性能。本文提出了Root-ResNet backbone网络,充分利用原始图片的信息。
介绍
本文研究了针对基于随机初始化网络的优化方法因素,发现BatchNorm重新调整了优化问题的参数分布,使其外形更加平滑同时减少了internal covariate shift。基于此,本文认为从头训练检测网络收敛性较差的主要原因是缺少BN操作。因此,本文在backbone及检测子网络的头部都添加了BN层,发现添加BN后,从头开始训练的检测网络要比预训练的效果要好,进而可以不依赖于预训练网络对网络结构进行调整。实验发现,第一层卷积的下采样stride也对目标检测的效果产生重要的影响。基于这一点,本文通过引入一个root block来设计检测器的结构。root block可以获得detector feature map中丰富的信息,提高了对小目标的准确率。
本文主要贡献:
(1)本文设计了基于scratch训练的single-shot目标检测网络-ScratchDet,该网络结合了BN操作有利于网络的收敛,此方法适用于任意类型的网络结构。
(2)引入了新的backbone Root-ResNet,提高了小目标的检测效果。
(3)ScratchDet的检测表现效果较为强劲。
ScratchDet
1.BatchNorm for Train-from-Scratch
本文在SSD上添加了BatchNorm,原生SSD中是不存在BN层的。在backbone的每一层中添加了BN层,然后,从头开始训练。发现提升了5.2%的mAP,同时使优化曲线更加的平滑,进而可以使用更大的学习率进行优化。
在检测网络的head子网络添加BatchNorm,本文经过实验发现,在原生SSD上基于大学习率进行训练,容易造成梯度爆炸。在网络的检测头的子网络添加BatchNorm可以使训练的loss的外形更加平滑。使mAP从67.6%提升至71.0%.
在整个网络中添加BN层,其实验结果比对如下。


2.BackBone Network
backbone为ResNet及VGG的性能:本文研究了backbone第一层卷积的downsampling操作的影响,实验发现,第一层的downsampling操作对小目标的检测造成了不利的影响。基于上述分析,本文重新设计了目标检测的backbone,为了克服Resnet中的不足并保留其分类的优秀性能。本文设计了Root-ResNet。结构如下:


本文移除了第一层卷积的下采样操作并将7x7的卷积核用几个3x3的卷积核进行替换。随着从Image中获得更丰富的输入信息,网络可以挖掘图像中的局部信息,进而可以检测小目标物体。此外,将SSD后用于获得不同尺寸大小信息的四个卷积blocks替换为四个残差块。每个残差块包含两个分支,一个为1x1 stride为2的卷积层,另两个为stride分别为2和1的3x3的卷积核.每个卷积核的输出通道数设置为128.
实验




Reference
[1] S. Bell, C. Lawrence Zitnick, K. Bala, and R. Girshick.Inside-outside net: Detecting objects in context with skip pooling and recurrent neural networks. In CVPR, 2016.
[2] K. Chen, J. Pang, J. Wang, Y. Xiong, X. Li, S. Sun,W. Feng, Z. Liu, J. Shi, W. Ouyang, C. C. Loy, and D. Lin.mmdetection. https://github.com/open-mmlab/mmdetection, 2018.
[3] B. Cheng, Y. Wei, H. Shi, R. Feris, J. Xiong, and T. Huang.Revisiting rcnn: On awakening the classification power of faster rcnn. In ECCV, 2018.
[4] J. Dai, Y. Li, K. He, and J. Sun. R-fcn: Object detection via region-based fully convolutional networks. In NIPS, 2016.
论文阅读笔记四十九:ScratchDet: Training Single-Shot Object Detectors from Scratch(CVPR2019)的更多相关文章
- 论文阅读笔记二十九:SSD: Single Shot MultiBox Detector(ECCV2016)
论文源址:https://arxiv.org/abs/1512.02325 tensorflow代码:https://github.com/balancap/SSD-Tensorflow 摘要 SSD ...
- 论文阅读笔记三十九:Accurate Single Stage Detector Using Recurrent Rolling Convolution(RRC CVPR2017)
论文源址:https://arxiv.org/abs/1704.05776 开源代码:https://github.com/xiaohaoChen/rrc_detection 摘要 大多数目标检测及定 ...
- 论文阅读笔记四十四:RetinaNet:Focal Loss for Dense Object Detection(ICCV2017)
论文原址:https://arxiv.org/abs/1708.02002 github代码:https://github.com/fizyr/keras-retinanet 摘要 目前,具有较高准确 ...
- 论文阅读笔记四十六:Feature Selective Anchor-Free Module for Single-Shot Object Detection(CVPR2019)
论文原址:https://arxiv.org/abs/1903.00621 摘要 本文提出了基于无anchor机制的特征选择模块,是一个简单高效的单阶段组件,其可以结合特征金字塔嵌入到单阶段检测器中. ...
- 论文阅读笔记四十八:Bounding Box Regression with Uncertainty for Accurate Object Detection(CVPR2019)
论文原址:https://arxiv.org/pdf/1809.08545.pdf github:https://github.com/yihui-he/KL-Loss 摘要 大规模的目标检测数据集在 ...
- 论文阅读笔记四十五:Region Proposal by Guided Anchoring(CVPR2019)
论文原址:https://arxiv.org/abs/1901.03278 github:code will be available 摘要 区域anchor是现阶段目标检测方法的重要基石.大多数好的 ...
- 论文阅读笔记(十九)【ITIP2017】:Super-Resolution Person Re-Identification With Semi-Coupled Low-Rank Discriminant Dictionary Learning
Introduction (1)问题描述: super resolution(SP)问题:Gallery是 high resolution(HR),Probe是 low resolution(LR). ...
- 论文阅读笔记四十二:Going deeper with convolutions (Inception V1 CVPR2014 )
论文原址:https://arxiv.org/pdf/1409.4842.pdf 代码连接:https://github.com/titu1994/Inception-v4(包含v1,v2,v4) ...
- 论文阅读笔记四十:Deformable ConvNets v2: More Deformable, Better Results(CVPR2018)
论文源址:https://arxiv.org/abs/1811.11168 摘要 可变形卷积的一个亮点是对于不同几何变化的物体具有适应性.但也存在一些问题,虽然相比传统的卷积网络,其神经网络的空间形状 ...
随机推荐
- C语言中结构体内存对齐
先写一个小程序: #include<stdio.h> struct student { int a; char k; short m; }; int main() { st ...
- 洛谷P2617 Dynamic Rankings
带修主席树模板题 主席树的单点修改就是把前缀和(大概)的形式改成用树状数组维护,每个树状数组的元素都套了一个主席树(相当于每个数组的元素root[i]都是主席树,且这个主席树维护了(i - lowbi ...
- 关于Vue修改默认的build文件存放的dist路径
原文地址:http://www.cnblogs.com/JimmyBright/p/7681086.html Vue默认build路径是项目的dist目录下,有时候我们可能希望build之后的文件自动 ...
- nsx-edge虚拟机抓包实践
Edge抓包 今天在客户端进行故障排除时,我需要在环境中的一个边缘服务网关上执行包捕获.在诊断一系列不同的问题时,执行包捕获通常非常有用. 要启动包捕获,您可以跳到ESG的控制台,或者像我在本例中所做 ...
- 01Design and Analysis Algorithm Using Python-程振波
1.(p14)比较两个数的大小 a = int(input('num:')) b = int(input('num:')) def getMax(a,b): if a>b : print('Th ...
- 洛谷 P1494 [国家集训队] 小Z的袜子
题目概述: 小Z把N只袜子从1到N编号,然后从编号L到R(L 尽管小Z并不在意两只袜子是不是完整的一双,甚至不在意两只袜子是否一左一右,他却很在意袜子的颜色,毕竟穿两只不同色的袜子会很尴尬. 你的任务 ...
- MVN TEST指定运行脚本
clean:表示将你上一次编译生成的一些文件删除 test:表示只执行测试代码 >mvn clean test -Dtest=[ClassName] 运行测试类中指定的方法:这个需要maven- ...
- 经典面试题-python函数之默认参数
1.可变的默认参数----list 示例: def add(a, mylist=[]): # print(id(mylist)) mylist.append(a) return mylist pri ...
- cocos2d windows游戏平台搭建
1. 安装VS2013 2. 下载cocos2d源代码(cocos2d-x-3.7.1) 3. 下载和安装python(2.7.10) 4. 安装完成后,将python安装路径设置到系统路径中(pat ...
- 编写高质量的Python代码系列(四)之元类及属性
元类(metaclass)及动态属性(dynamic attribute)都是很强大的Python特性,然后他们也可能导致及其古怪.及其突然的行为.本节讲解这些机制的常见用法,以确保各位程序员写出来的 ...