Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

简介

Faster R-CNN是很经典的two-stage的目标检测方法，前面看了Selective Search以为在这里可以用到，但是作者在这篇文章里面没有采用Selective Search方法得到候选框，而是采用了Edge Boxes方法得到的候选框，好吧，再去看看这个方法到底快在哪里。Faster R-CNN分为两个过程，第一个过程是通过RPN网络得到候选框，第二个过程是利用Fast RCNN网络进行分类，普遍two-stage网络的准确度比one-stage的高，但是速度很慢。

Faster R-CNN

faster rcnn 大致流程图如下

网络结构

Region Proposal Network

RPN网络是用来获取proposals的网络，将任意size的图片输入到网络中，得到多组proposals，这些proposals包含中心点的位置x、y和宽高w、h来唯一确定一个框，而怎么得到这些proposals呢？

文中是先用一个小网络得到feature map，这个feature map是 13✖13✖256的，然后采用一个n✖n的滑窗去滑这个feature map，得到一个256-d的向量，而文章中是使用的n=3的滑窗去滑的。这个滑动过程其实是用一个3✖3✖256✖256的卷积核去卷积的过程。

anchors

在每个滑窗的区域，会同时预测多个region proposals，假定每个sliding window预测k种框，那么regression layer就输出4k个参数，很好理解，就是x、y、w、h；cls层输出2k个scores，即是背景还是不是背景。而文章中的anchor指的就是每个sliding window的中心，文章默认采用了3种scale和3种aspect ratio，也就是9种不同的长宽比放缩比，这样每个anchor对应的就是原图种的1种位置，也就是说一个feature map中的点对应9个anchor。假设feature map是W✖H的，那么我们会得到9WH个anchor。

文中方法最终要的一点就是anchors具有平移不变性。也就是说，如果图像中的某一个物体发生了平移，那么我们应该能够通过同样的方法也能够准确的预测到这个proposal，无论它在任何位置。

最终应该生成这九种anchor box

Loss Function

我们可以知道，输出的是两部分，一部分是是不是背景的分类loss，另一部分是预测的bbox的坐标宽高的regression loss，于是很容易去理解作者下图中的loss function。

参数解释在上图中。其中Ncls和Nreg是归一化的，λ是用来调整两个loss之间权重分配的，也很好理解。

作者在文中采用的是Ncls=256，Nreg约等于2400，这样他的λ设置成了10，这是为了使得两者权重大致相等。而下面又解释了公式中t也就是变换是怎么计算的：

参数解释当然也在图中。

之所以需要求这个t，是因为实际预测到的框和ground-truth box之间是有一定差距的，比如下面这张图：

所以我们通过求得一个线性变换使得A框能够尽可能接近G框，变换的结果就是G'框，这样可以使得结果更接近G。而上面公式的解释呢，我理解的就是分别计算anchor和预测的框之间的变换、anchor和ground truth 框之间的变换，通过这两个变换来计算loss，也就是上面那个公式里的Lreg部分。

标记anchor

我们知道，loss里面关于是不是背景也有个loss，标记规则很简单

超过1000✖600的anchor box去除
IOU最大，label=1
IOU＞0.7，label=1
IOU<0.3，label=0

训练

然后就是训练RPN了。在训练RPN的时候呢，一个Mini batch是我们在一张图中随机选取的256个proposal组成的，正负样本的比例应该是1比1，正样本不足128，就补负样本，负样本不足就补正样本（一般负样本不会不足）。

一个非常透彻的理解：Faster R-CNN中RPN网络的理解
论文原文：Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

[论文理解] Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks的更多相关文章

深度学习论文翻译解析（十三）：Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
论文标题:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 标题翻译:基于区域提议(Regi ...
中文版 Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 摘要最先进的目标检测网络依靠区域提出算法 ...
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks论文理解
一.创新点和解决的问题创新点设计Region Proposal Networks[RPN],利用CNN卷积操作后的特征图生成region proposals,代替了Selective Search ...
论文阅读笔记二十七：Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks（CVPR 2016）
论文源址:https://arxiv.org/abs/1506.01497 tensorflow代码:https://github.com/endernewton/tf-faster-rcnn 室友对 ...
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks（理解）
0 - 背景 R-CNN中检测步骤分成很多步骤,fast-RCNN便基于此进行改进,将region proposals的特征提取融合成共享卷积层问题,但是,fast-RCNN仍然采用了selectiv ...
目标检测（四）Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
作者:Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun SPPnet.Fast R-CNN等目标检测算法已经大幅降低了目标检测网络的运行时间. ...
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
将 RCN 中下面 3 个独立模块整合在一起,减少计算量: CNN:提取图像特征 SVM:目标分类识别 Regression 模型:定位不对每个候选区域独立通过 CN 提取特征,将整个图像通过 CN ...
【CV论文阅读】Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
由RCNN到FAST RCNN一个很重要的进步是实现了多任务的训练,但是仍然使用Selective Search算法来获得ROI,而FASTER RCNN就是把获得ROI的步骤使用一个深度网络RPN来 ...
[论文理解] Acquisition of Localization Confidence for Accurate Object Detection
Acquisition of Localization Confidence for Accurate Object Detection Intro 目标检测领域的问题有很多,本文的作者捕捉到了这样一 ...

随机推荐

Protobuf 文件生成工具 Prototool 命令详解
Protobuf 文件生成工具 Prototool 命令详解简介 Prototool 是 Protobuf 文件的生成工具, 目前支持go, php, java, c#, object c 五种语言 ...
MS SQL JSON类型type
在MS SQL Server 2016,已经支持JSON处理. 执行下面代码,将获取ms sql server对象类型以及其说明: IF OBJECT_ID('tempdb.dbo.#json_typ ...
shell初级-----构建基本脚本
使用多个命令如果想要多个命令同时运行,可以把它们放在一行,用分号隔开. date;who 创建shell脚本文件创建shell脚本时,必须在文件第一行指定要使用的shell #!/bin/bash ...
Swoole HTTP 的应用
目录概述代码小结扩展概述这是关于 Swoole 学习的第四篇文章:Swoole HTTP 的应用. 第三篇:Swoole WebSocket 的应用第二篇:Swoole Task 的应用 ...
SAP中对于获取订单的状态
在SAP中对于如何获取订单的状态,提供了至少两个函数,分别是 STATUS_READ 和 STATUS_TEXT_EDIT.下面简单介绍这两个函数 1.STATUS_READ 改函数的实现原理大 ...
浅谈css常用伪类用法
着重写一下after和before的用法: css样式搞定:标签元素+伪类after a.'class名':after{//我的样式名称是这个,可以写成你自己的样式名称 content: '已打包'; ...
《SQL 进阶教程》case :用一条 SQL 语句进行不同条件的统计
进行不同条件的统计是case表达式的著名用法之一 select name,sum(case when sex = 1 then population else 0 end) as cnt_m,sum( ...
Luogu P1955 [NOI2015]程序自动分析
又一次做了这道题,感慨万千. 记得寒假时,被cmd2001点起来讲这道题,胡言乱语..受尽鄙视(现在也是好吗)..后来下课想A掉,可是3天下来总是错...后来抄了分题解就咕咕了... 今天老师留了这道 ...
线程池（3）Executors.newCachedThreadPool
例子: ExecutorService es = Executors.newCachedThreadPool(); try { for (int i = 0; i < 20; i++) { Ru ...
练习三十二：用python实现:按相反的顺序输出列表的每一位值
用python实现:按相反的顺序输出列表的每一位值 1. 使用list[::-1] list1 = ["one","two","three" ...

[论文理解] Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks