论文笔记：Siamese Cascaded Region Proposal Networks for Real-Time Visual Tracking

Siamese Cascaded Region Proposal Networks for Real-Time Visual Tracking

2019-03-20 16:45:23

Paper：https://arxiv.org/pdf/1812.06148.pdf

Code：（尚无）

背景与动机：

本文提出一种级联的 RPN 网络结合到 Siamese RPN 网络中，然后取得了更好的跟踪效果。本文的动机如下：
1). 正负样本的比例，不一致，导致 Siamese Network 的训练不够有效；大部分的负样本都是简单样本，对最终的结果贡献很小，所以，在出现相似物体的时候，经常会出现跟踪混淆；

2). Low-level spatial features 并没有充分的被探索；

3). One-stage Siamese RPN 采用单个回归器进行物体的定位，但是实际上并没有很好的处理跟踪中物体的尺寸变换的问题。利用预先定义好的 Coarse anchor Box 不能很好的进行精确的定位；

于是，根据上述动机，作者引入多级的 RPN 网络，来解决定位问题；同时选择 hard negative samples 来改善网络的鲁棒性。此外，作者还引入了多层特征的融合，得到了更好的特征表达。

网络结构：

1. Siamese-RPN 的简介：

　　详见其原始 paper：High performance visual tracking with siamese region proposal network

2. Cascaded RPN:

前人的方法大部分都忽略了 class imbalance 的问题，导致在出现相似性物体的时候，效果不佳。此外，他们也仅用 high-level semantic features 来进行跟踪，而很少考虑 multi-level feature。为了解决上述这两个问题，本文提出多阶段的跟踪方法，细节如下：

对于每一个阶段的 RPN，其利用 FTB 模块来融合来自第 l 个 convolutional layer 的特征以及 high-level feature，融合后的特征可以用下面的公式进行表达：

其中 FTB 代表如下图所示的多特征融合模块。主要是对较低分辨率的图像利用 Deconvlutional layer 进行升分辨率处理，得到的特征卷积后，与另外一支进行元素集相加（element-wise summarize）得到最终的结果，细节见图 6。

对于，RPN-1 来说，

所以，stage l 中每一个 anchor 的分类得分和回归的偏执，计算如下：

我们用 A_l 表示在阶段 l 的 anchor set。根据分类的得分，我们可以过滤出该集合中的样本，当其 negative confidence 大于预先设定的阈值时。然后，剩下的那些样本就构成了新的 anchor 集合 A_l+1，并且用于训练 RPN_l+1。此外，为了提供更好的初始化，我们优化了 A_l+1 中 anchor 的 center location 以及 size，所以，产生了更加准确的定位。作者也提供了一个案例，来表明 BBox 的准确性提升。

RPN_l 的损失函数 $L_{RPN_l}$ 包含分类损失 $L_{cls}$ 以及回归损失 $L_{loc}$，其定义如下：

其中，$r_i^{l*}$ 表示 anchor i 和 gt 之间的真实距离。服从前人工作，作者也将 $r_i^{l*}$ 设置为 4d 的向量，如下所示：

其中，x, y, w, h 是 BBox 的中心点及其宽高。与常规的固定 anchor 不同，C-RPN 的 anchors 可以进行微调：

对于第一个阶段的 anchor，$x_a^1, y_a^1, w_a^1, h_a^1$ 是预先设定的。

【注】此处关于损失函数讲的不是特别清晰，关于回归损失函数的定义，可以参考 Faster RCNN。

上述过程构成了所提出的级联 RPN。其最终的损失函数 $L_{CRPN}$ 就是各个 RPN 损失函数的和：

实验结果：

论文笔记：Siamese Cascaded Region Proposal Networks for Real-Time Visual Tracking的更多相关文章

论文笔记：目标追踪-CVPR2014-Adaptive Color Attributes for Real-time Visual Tracking
基于自适应颜色属性的目标追踪 Adaptive Color Attributes for Real-Time Visual Tracking 基于自适应颜色属性的实时视觉追踪 3月讲的第一篇论文,个人 ...
论文阅读笔记二十七：Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks（CVPR 2016）
论文源址:https://arxiv.org/abs/1506.01497 tensorflow代码:https://github.com/endernewton/tf-faster-rcnn 室友对 ...
[论文理解] Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 简介 Faster R-CNN是很经典的t ...
深度学习论文翻译解析（十三）：Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
论文标题:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 标题翻译:基于区域提议(Regi ...
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks论文理解
一.创新点和解决的问题创新点设计Region Proposal Networks[RPN],利用CNN卷积操作后的特征图生成region proposals,代替了Selective Search ...
目标检测（四）Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
作者:Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun SPPnet.Fast R-CNN等目标检测算法已经大幅降低了目标检测网络的运行时间. ...
中文版 Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 摘要最先进的目标检测网络依靠区域提出算法 ...
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks（理解）
0 - 背景 R-CNN中检测步骤分成很多步骤,fast-RCNN便基于此进行改进,将region proposals的特征提取融合成共享卷积层问题,但是,fast-RCNN仍然采用了selectiv ...
Faster RCNN原理分析（二）：Region Proposal Networks详解
Faster RCNN原理分析(二):Region Proposal Networks详解 http://lib.csdn.net/article/deeplearning/61641 0814: A ...

随机推荐

scrapy学习笔记(1)
初探scrapy,发现很多入门教程对应的网址都失效或者改变布局了,走了很多弯路.于是自己摸索做一个笔记. 环境是win10 python3.6(anaconda). 安装 pip install sc ...
永久禁止floppy模块开机自动加载
环境:Red Hat Enterprise Linux Server release 7.4 (Maipo) 问题:执行fdisk -l后系统会抓到错误解决方案: https://access.re ...
支持向量机（SVM)
SVM 简介 SVM:Support Vector Machine , 支持向量机, 是一种分类算法. 同Logistic 分类方法目的一样,SVM 试图想寻找分割线或面,将平面或空间里的样本点一分为 ...
webpack.config.js配置遇到Error: Cannot find module '@babel/core'&&Cannot find module '@babel/plugin-transform-react-jsx' 问题
下文是网上找到的方法,是因为版本冲突的原因,参照后安装7版本解决 cnpm install -D babel-loader@ babel-core babel-preset-env 一. 问题描述在 ...
svg合并
假如页面有多个svg图标要加载,多次加载不利,可将多个svg合并为一个加载如下有两个svg <svg xmlns="http://www.w3.org/2000/svg" ...
LeetCode-7-反转整数-c# 版本
c# 版本 // 给定一个 32 位有符号整数,将整数中的数字进行反转. public class Solution { public int Reverse(int x) { / // 边界判断 / ...
python实现使用词云展示图片
记录瞬间首先,要安装一些第三方包 pip install scipyCollecting scipy Downloading https://files.pythonhosted.org/packa ...
docker运行jar文件
一.环境本地虚拟机安装的centos7 二.安装docker yum install docker-engine 三.开启阿里云加速 docker的镜像仓库在国外,下载会很慢,启用阿里云加速. 在/ ...
在Ubuntu16.04中python环境下实现tab键补全
1.编写tab.py的代码: 1 #!/usr/bin/env python 2 # python startup file 3 import sys 4 import readline 5 impo ...
详解PHP中foreach
foreach有两种语法: 第一种:遍历给定的数组语句 array_expression 数组.每次循环中,当前单元的值被赋给 $value 并且数组内部的指针向前移一步(因此下一次循环中将会得到下 ...

论文笔记：Siamese Cascaded Region Proposal Networks for Real-Time Visual Tracking

论文笔记：Siamese Cascaded Region Proposal Networks for Real-Time Visual Tracking的更多相关文章

随机推荐

热门专题