FoveaBox: Beyond Anchor-based Object Detector

Intro

本文是一篇one-stage anchor free的目标检测文章，大体检测思路为，网络分两路，一路预测k个channel的map，每个channel代表一个类别的概率，即输出为w×h×k，另一路预测位置，输出即为w×h×4。想法其实很容易想到，但是本文之所以work我认为很重要的一个trick是gt label的分配，positive area和negative area，回归是预测log偏移，。

我本来看了abstract之后以为是预测whk的label map，然后根据这个map上某个类别的分布去确定框，然后利用这里的信息去修正框的位置。然后看了图发现是两路预测，我直观感觉他可以合并成一路，其中cls map作为中间层输出，或者是回归支路利用上cls map的信息。

Method

Backbone是FPN，FPN的每层后面接一个subnet，subnet分为两路分别去预测cls map和回归位置。

如图所示就是大体结构：

这就是本文的想法，那么有了这个想法，下一个问题就是怎么训练，哪些位置我要分配为参与训练的样本，如何分配？

作者的想法就是，首先gt在特征图上映射了一个区域，这个区域向内缩放得到一个小box认为是正样本，对应一个类别，这个区域向外放大得到一个大box，大box和小box之内认为是困难样本不参与训练，大box之外认为就是负样本，所以正样本的数量往往是比较小的，可能就那么几个点被分为正样本，取决于缩放的系数。

公式为：

l是fpn的层index。公式3就是将gt映射到对应fpn层的feature map，然后求出映射后的box的中心c，公式4就是进行缩放和扩增的操作，以确定正负样本。

上面分类说完了，然后就是回归，

回归转换为根据feature map上一点对应层和对应的xy方向index映射到原图上，与gt做差之后变换，网络学习到的是一种变换。由公式5可见x、y其实是在特征图上的位置，然后除以尺度z取log使网路更容易学习到目标。

网络学习到的就是t。

加0.5可以防止出现log0.

思考

FoveaBox是两路预测的，如我上面说的，能否一路完成，假设我们先训练cls map，那么当cls map确定了，其实理论上可以帮助loc框定位的学习的。所以思考是否可以将cls map和feature同时作为loc层的输入，两个信息结合来帮助回归框的学习。
关于标签的分配作者是采用了一个系数进行缩放和放大划分，能否使用正态分布对label进行分配，靠近中间概率接近1，靠近旁边概率减小，一定阈值以外认为是负样本。
可否换一种回归方式，比如年龄识别中用的coarse-to-fine的stage-wise-regression方式来回归框，比如一个框的坐标值121 可以由三个不同粒度的值相加得到，121 = 100 + 20 + 1。

[论文理解] FoveaBox: Beyond Anchor-based Object Detector的更多相关文章

[论文理解] Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 简介 Faster R-CNN是很经典的t ...
[论文理解]Focal Loss for Dense Object Detection（Retina Net）
Focal Loss for Dense Object Detection Intro 这又是一篇与何凯明大神有关的作品,文章主要解决了one-stage网络识别率普遍低于two-stage网络的问题 ...
论文阅读 | FoveaBox: Beyond Anchor-based Object Detector
论文阅读——FoveaBox: Beyond Anchor-based Object Detector 概述这是一篇ArXiv 2019的文章,作者提出了一种新的anchor-free的目标检测框架 ...
论文阅读 | FCOS: Fully Convolutional One-Stage Object Detection
论文阅读——FCOS: Fully Convolutional One-Stage Object Detection 概述目前anchor-free大热,从DenseBoxes到CornerNet. ...
新文预览 | IoU-aware Single-stage Object Detector for Accurate Localization
论文基于RetinaNet提出了IoU-aware sinage-stage目标检测算法,该算法在regression branch接入IoU predictor head并通过加权分类置信度和IoU ...
[论文理解] CornerNet: Detecting Objects as Paired Keypoints
[论文理解] CornerNet: Detecting Objects as Paired Keypoints 简介首先这是一篇anchor free的文章,看了之后觉得方法挺好的,预测左上角和右下 ...
论文阅读之　DECOLOR: Moving Object Detection by Detecting Contiguous Outliers in the Low-Rank Representation
DECOLOR: Moving Object Detection by Detecting Contiguous Outliers in the Low-Rank Representation Xia ...
论文笔记之：Natural Language Object Retrieval
论文笔记之:Natural Language Object Retrieval 2017-07-10 16:50:43 本文旨在通过给定的文本描述,在图像中去实现物体的定位和识别.大致流程图如下 ...
[论文理解]关于ResNet的进一步理解
[论文理解]关于ResNet的理解这两天回忆起resnet,感觉残差结构还是不怎么理解(可能当时理解了,时间长了忘了吧),重新梳理一下两点,关于resnet结构的思考. 要解决什么问题论文的一大贡 ...

随机推荐

Action向视图传值的6种方式（转）
在使用ASP.NET MVC进行项目开发时,经常会碰到从Action向视图传值的问题,今天我就把我所知道的方式总结了一下,分成了以下六种: 1.使用ViewData进行传值在Action中,有如下代 ...
怎么处理Win7系统备份还原提示代码0x80042302的错误？
我们都知道Win7系统自带备份还原功能,可以在电脑遇到小问题时通过还原至之前备份的正常系统来解决,非常的方便.但是有些用户在使用备份还原功能时,系统会提示0x80042302错误,这该怎么办呢?下面好 ...
Scala（二）——基础语法（与Java的区分）和函数式编程
Scala快速入门(二) 一.键盘输入关于基本类型的运算,以及复制运算,条件运算,运算符等知识,均和Java语言一样,这里不过多叙述. val name = StdIn.readLine() Std ...
python 3.4.3 安装pygame
之前一直都是用的python3.5,后来接触了pygame,又被python3.5的打包折磨的死去活来,后来干脆用python 3.4.3. 我之前安装轮子都是直接打开cmd,然后 pip3 inst ...
javaWeb中的session和cookie
Cookie Cookie 是浏览器提供的一种技术,通过服务器的程序能将一些只须保存在客户端,或者在客户端进行处理的数据,放在本地的计算机上,不需要通过网络传输,因而提高网页处理的效率,并且能够减少 ...
BZOJ1030 [JSOI2007]文本生成器[DP+AC自动机]
我学到现在才是初三学弟的水平..哭这里相当于求长度为$m$的,字符集$\{A...Z\}$的且不包含任一模式串的文本串个数.这是一个典型的AC自动机匹配计数问题. 设$f_{i,j}$表示在AC自动 ...
curses is not supported on this machine：（curses 在pycharm（Windows）中的安装）
curse在Windows下的pycharm中安装,curse是不能直接在Windows下跑的.需要安装相关环境,要根据直接project的编译器版本来选择下载相关的whl. 找到project的Sc ...
keep running
一个人的心态,会支撑你一路的发展:一个人的眼界,会决定选择的方向:一个人的格局,会意味着你成就多大的规模:一个人的毅力,会支持你能够走多远:一个人的用心,会注定你做出多好的成效!你变好了,一切就变好 ...
消金ABS
对于持牌消金公司来说,发行ABS需满足至少3年经营期限的硬性规定,目前已开业的24家消金公司里,有15家符合此项规定. 2019年下半年以来,个人消费金融领域共发行了15个资产证券化产品,发行规模达4 ...
c语言结构体以及结构体指针的使用
结构体: 正常定义一个结构体: typedef struct node{ ]; int len; }Seq,*llink; 定义结构体指针: Seq *s;或者llink t;之后关于s与t的用法,其 ...

[论文理解] FoveaBox: Beyond Anchor-based Object Detector

FoveaBox: Beyond Anchor-based Object Detector

Intro

Method

思考

[论文理解] FoveaBox: Beyond Anchor-based Object Detector的更多相关文章

随机推荐

热门专题