Visual Tracking with Fully Convolutional Networks

http://blog.csdn.net/carrierlxksuper/article/details/48918297

传统的跟踪方法依赖低维的人工特征，但这种特征对目标的外观变化等问题不够鲁棒。

与此相比，CNN从大量的数据中能够学到高级的信息，有较强的分类能力，这些特征有较好的泛化能力。

如果直接用CNN来跟踪的话，需要大量的数据来进行训练，这显然不合适。之前有人用DNN做在线跟踪并取得了不错的效果，但这个过程中，DNN被当做黑盒子来用。这篇文章从跟踪的角度研究了CNN特征的性质，发现了两个重要的性质：

首先，不同深度的CNN特征在跟踪时有不同的性质。顶层的卷积层获得了更抽象更高级的特征，这些特征能更好的区分不同种类的物体，处理形变遮挡时也更加鲁棒。

但如果是同类物体，这些特征的区分度并不好。更低卷积层提供了更细节的局部特征，这些特征能将具有相似外观的同类物体更好的区分开来。但在物体有较大形变时不够鲁棒。基于此，本文提出自动切换高低层进行跟踪。

其次，CNN的特征是从ImageNet上提前训练来区分物体的，但对于特定的物体来说，并不是所有特征都是有用于跟踪的，有些特征会被当做noise。如果把所有的特征图都用上的话，很难将目标与背景进行区分。可以通过特征选择来丢掉noise 特征，那么该如何进行特征选择呢？

这篇论文的主要贡献有：

1）分析CNN从大规模图像分类中学到的特征，找到适用于跟踪的那些特征。这有助于更好的理解CNN特征和设计适用于跟踪的特征。

2）提出新的跟踪方法，使用两层卷积网络，可以更好的处理物体形变和区分目标与背景。

3）提出能自动选择特征的方法，提高跟踪精度。

用于跟踪的深度特征分析

分析是基于16层的VGG网络的，VGG是在ImageNet上已经训练好的。其中有13个卷积层跟着3个全连接层。

分析1 尽管CNN特征图的感受野很大，激活特征图是稀疏并且局部的，激活区域和目标区域高度相关。

从图上可以看出特征图只有少量非0值，这些非0值是位置确定的且与目标区域有关。还得到了CNN 特征的语义图，语义图表明，输入的改变，导致目标区域的所选特征图大幅增长。因此，这些特征map获得了目标的可视化描述。这就表明，DNN学到的特征是有位置的且与目标相关的，因此，CNN的特征可用于确定目标位置。

分析2 很多CNN特征是noisy，或者与将目标与背景区分无关

用ImageNet训练的CNN特征能描述大量的目标，但当跟踪时，应当只关注小部分的目标，只需将目标与背景区分即可，这就要求我们选择好的特征。

分析3 不同层编码不同的特征，高层获得目标种类的语义概念，低层编码更多的区分特征来获得内部的种类变化。

因为特征图有大量冗余，故采用一种稀疏表示框架来更好的可视化。

Visual Tracking with Fully Convolutional Networks的更多相关文章

论文笔记之：Visual Tracking with Fully Convolutional Networks
论文笔记之:Visual Tracking with Fully Convolutional Networks ICCV 2015 CUHK 本文利用 FCN 来做跟踪问题,但开篇就提到并非将其看做 ...
论文笔记：SiamRPN++: Evolution of Siamese Visual Tracking with Very Deep Networks
SiamRPN++: Evolution of Siamese Visual Tracking with Very Deep Networks 2019-04-02 12:44:36 Paper:ht ...
中文版 R-FCN: Object Detection via Region-based Fully Convolutional Networks
R-FCN: Object Detection via Region-based Fully Convolutional Networks 摘要我们提出了基于区域的全卷积网络,以实现准确和高效的目标 ...
Fully Convolutional Networks for Semantic Segmentation 译文
Fully Convolutional Networks for Semantic Segmentation 译文 Abstract Convolutional networks are powe ...
论文阅读（Xiang Bai——【CVPR2016】Multi-Oriented Text Detection with Fully Convolutional Networks）
Xiang Bai--[CVPR2016]Multi-Oriented Text Detection with Fully Convolutional Networks 目录作者和相关链接方法概括 ...
论文学习：Fully Convolutional Networks for Semantic Segmentation
发表于2015年这篇<Fully Convolutional Networks for Semantic Segmentation>在图像语义分割领域举足轻重. 1 CNN 与 FCN 通 ...
『计算机视觉』R-FCN：Object Detection via Region-based Fully Convolutional Networks
一.网络介绍参考文章:R-FCN详解论文地址:Object Detection via Region-based Fully Convolutional Networks R-FCN是Faster ...
【Semantic Segmentation】 Instance-sensitive Fully Convolutional Networks论文解析(转)
这篇文章比较简单,但还是不想写overview,转自: https://blog.csdn.net/zimenglan_sysu/article/details/52451098 另外,读这篇pape ...
【Detection】R-FCN: Object Detection via Region-based Fully Convolutional Networks论文分析
目录 0. Paper link 1. Overview 2. position-sensitive score maps 2.1 Background 2.2 position-sensitive ...

随机推荐

【容斥原理，莫比乌斯反演】用容斥替代莫比乌斯反演第二种形式解决gcd统计问题
名字虽然很长.但是其实很简单,对于这一类问题基本上就是看你能不能把统计的公式搞出来(这时候需要一个会推公式的队友) 来源于某次cf的一道题,盼望上紫的我让潘学姐帮我代打一道题,她看了看跟我说了题解,用 ...
Shell颜色及显示git分支配置
# Ubuntu终端下命令行颜色配置 ## Parses out the branch name from .git/HEAD: find_git_branch () { local dir=. he ...
unity直连android真机在Profiler性能分析测试
基础步骤: 1.Unity打开你要测试的项目:File–Build Settings 2.如下图,按图顺序进行1.2.3.4.5操作,如果做过了,2就是灰色的,不能被点击,4和5需要相对应. 3.确保 ...
hashlib模块--加密
用于加密相关的操作,3.x里代替了md5模块和sha模块,主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ,MD5 算法 import hashlib m = ha ...
Lucene 查询分页技术
常用的Lucene查询代码如下所示,该代码的作用是将path路径下的所有索引信息返回 public String matchAll(String path) { try { Directory dir ...
树链剖分处理+线段树解决问题 HDU 5029
http://acm.split.hdu.edu.cn/showproblem.php?pid=5029 题意:n个点的树,m次操作.每次操作输入L,R,V,表示在[L,R]这个区间加上V这个数字.比 ...
Crash Consistency : FSCK and Journaling
现在开始今天的第三篇博客的撰写,不能扯淡了,好多任务啊.但是还是忍不住吐槽一下,之前选择这篇文章纯属是个意外,我把Crash看做了Cache,唉,要不然也就不用写这篇文章了. 1. 这篇博客讲什么? ...
How to ignore SSL certificate errors in Apache HttpClient 4.4
public static CloseableHttpClient acceptsUntrustedCertsHttpClient() throws KeyStoreException, NoSuch ...
搭建Elasticsearch5.6.8 分布式集群
集群搭建 1.master[192.168.101.175] 配置elasticsearch.yml #集群名称所有节点要相同 cluster.name: my-application #本节点名称 ...
javascript 获取函数形参
/** * 获取函数的形参个数 * @param {Function} func [要获取的函数] * @return {*} [形参的数组或undefind] */ function getFunc ...

Visual Tracking with Fully Convolutional Networks

Visual Tracking with Fully Convolutional Networks的更多相关文章

随机推荐

热门专题