Rethinking Training from Scratch for Object Detection

一. 概述

正常训练目标检测的流程分为以下几种：

在imagenet上进行预训练，然后在特定数据集进行tune
直接在数据集上进行从头训练

两种方式各有千秋，前者可以很快收敛（在特定数据集收敛快），但是训练复杂（预训练实际长）。后者直接训练较为容易（尤其在修改模型结构时），但是训练周期较长（比tune阶段长很多）。这篇文章就是解决从头训练的时长问题，从而达到集成两者的优点（夸大其词的说法）。

二. 流程

论文比较简单，这里进行总结如下：

精度和 \(batchsize\) 有关，且在一定范围内，越大越好。
精度和图像的分辨率（大小）有关，且图像越大分辨率越好，图像过小对精度影响较小。
精度和缩放有关，按照分类的缩放进行，不仅提高速度，且精度也比正常缩放效果好。
精度和BN层有关，正相关。

按照上述的总结，论文进行改进的训练如下：

使用BN层（当前网络基础结构）
Pretrained先用小尺度图像进行训练，\(batchsize\)设置较大
数据处理部分-->先将图像缩放到 \((H,W)\times(1.0,1.2)\) ,随机RandomCrop-->\((H,W)\)，最后进行Padding到 \((h，W)\)
Finetune阶段按照正常训练即可

三. 总结

有一定使用意义，对于大数据集，直接使用此方法较好。
对于小的数据集，还是重新训练imagenet比较好
VOC的数据集太小，而且分布较为散乱，这里对比意义不大。
笔者会在实际数据集上尝试之后进行补充（TODO）

Rethinking Training from Scratch for Object Detection的更多相关文章

[Tensorflow] Object Detection API - prepare your training data
From: TensorFlow Object Detection API This chapter help you to train your own model to identify obje ...
（转）Awesome Object Detection
Awesome Object Detection 2018-08-10 09:30:40 This blog is copied from: https://github.com/amusi/awes ...
【尺度不变性】An Analysis of Scale Invariance in Object Detection – SNIP 论文解读
前言本来想按照惯例来一个overview的,结果看到1篇十分不错而且详细的介绍,因此copy过来,自己在前面大体总结一下论文,细节不做赘述,引用文章讲得很详细,另外这篇paper引用十分详细,如果做 ...
中文版 R-FCN: Object Detection via Region-based Fully Convolutional Networks
R-FCN: Object Detection via Region-based Fully Convolutional Networks 摘要我们提出了基于区域的全卷积网络,以实现准确和高效的目标 ...
object detection 总结
1.基础自己对于YOLOV1,2,3都比较熟悉. RCNN也比较熟悉.这个是自己目前掌握的基础2.第一步看一下2019年的井喷的anchor free的网络3.第二步看一下以往,引用多的网路4. ...
论文阅读之　DECOLOR: Moving Object Detection by Detecting Contiguous Outliers in the Low-Rank Representation
DECOLOR: Moving Object Detection by Detecting Contiguous Outliers in the Low-Rank Representation Xia ...
使用TensorFlow Object Detection API+Google ML Engine训练自己的手掌识别器
上次使用Google ML Engine跑了一下TensorFlow Object Detection API中的Quick Start(http://www.cnblogs.com/take-fet ...
[Arxiv1706] Few-Example Object Detection with Model Communication 论文笔记
p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 13.0px "Helvetica Neue"; color: #042eee } p. ...
论文学习-深度学习目标检测2014至201901综述-Deep Learning for Generic Object Detection A Survey
目录写在前面目标检测任务与挑战目标检测方法汇总基础子问题基于DCNN的特征表示主干网络(network backbone) Methods For Improving Object Rep ...

随机推荐

CTFHub-easy_search
easy_search 玩了好些天,今天做道题找找状态,明天开始肝了打开是一个登录框用amdin/admin尝试了一下,提示登陆失败这里肯定不会是暴力破解,我猜是sql注入,试了万能密码or 1 ...
mysql用户创建触发器权限不足跟参数log_bin_trust_function_creators
问题描述有业务反馈当前用户无法创建触发器和存储过程,让用户自己测试,该用户进行对表的增删改查等其他权限没有问题,这边用root用户查证,该用户拥有对当前库的所有权限,但是为什么就是创建不了触发器呢? ...
mysql 的查询操作语句---自动生成各种不同的序号
1.通过查询语句添加自动生成序号 SELECT m.id,(@a :=@a + 1) AS a FROM 表名 m, (SELECT @a := 0) t1 2.MySQL字符串前后补0 前补0(LP ...
【js】Leetcode每日一题-子数组异或查询
[js]Leetcode每日一题-子数组异或查询 [题目描述] 有一个正整数数组 arr,现给你一个对应的查询数组 queries,其中 queries[i] = [Li, Ri]. 对于每个查询 i ...
chemfig化学式转换为pdf
SMILES 与 chemfig 针对化学分子结构,可以用SMILES (用ASCII字符串明确描述分子结构的规范)来定义. SMILES(Simplified molecular input lin ...
HTML中的JavaScript
HTML中的JavaScript 1.<script>元素 defer:可选.表示脚本可以延迟到文档完全被解析和显示之后再执行.只对外部脚本文件有效. 脚本会被延迟到整个页面都解析完毕后再 ...
MindSpore模型验证
技术背景在前面一篇博客中,我们介绍了MindSpore在机器学习过程中保存和加载模型的方法.这种将模型存储为静态文件的做法,使得我们可以更灵活的使用训练出来的模型,比如用于各种数据集的验证,或者是迁 ...
[linux] Git基本概念&操作
1.基本概念版本控制系统:一种软体工程技巧,籍以在开发的过程中,确保由不同人所编写的同一项目代码都得到更新.并追踪.记录整个开发过程. 集中式(SVN)/ 分布式(GIT)版本控制系统:SVN的版本 ...
[BD] HBase
NoSQL数据库关系型数据库:用表格的行-列来保存数据,OLTP,写入多,行式存储非关系型数据库:只用来存储数据,业务逻辑由应用程序处理,OLAP,查询多,列式存储常见NoSQL数据库 Redi ...
xsos：一个在Linux上阅读SOSReport的工具
xsos:一个在Linux上阅读SOSReport的工具时间 2019-05-23 14:36:29 51CTO 原文 http://os.51cto.com/art/201905/596889 ...

Rethinking Training from Scratch for Object Detection

Rethinking Training from Scratch for Object Detection

一. 概述

二. 流程

三. 总结

Rethinking Training from Scratch for Object Detection的更多相关文章

随机推荐

热门专题