http://blog.csdn.net/carrierlxksuper/article/details/48918297

传统的跟踪方法依赖低维的人工特征,但这种特征对目标的外观变化等问题不够鲁棒。

与此相比,CNN从大量的数据中能够学到高级的信息,有较强的分类能力,这些特征有较好的泛化能力。

如果直接用CNN来跟踪的话,需要大量的数据来进行训练,这显然不合适。之前有人用DNN做在线跟踪并取得了不错的效果,但这个过程中,DNN被当做黑盒子来用。这篇文章从跟踪的角度研究了CNN特征的性质,发现了两个重要的性质:

首先,不同深度的CNN特征在跟踪时有不同的性质。顶层的卷积层获得了更抽象更高级的特征,这些特征能更好的区分不同种类的物体,处理形变遮挡时也更加鲁棒。

但如果是同类物体,这些特征的区分度并不好。更低卷积层提供了更细节的局部特征,这些特征能将具有相似外观的同类物体更好的区分开来。但在物体有较大形变时不够鲁棒。基于此,本文提出自动切换高低层进行跟踪。

其次,CNN的特征是从ImageNet上提前训练来区分物体的,但对于特定的物体来说,并不是所有特征都是有用于跟踪的,有些特征会被当做noise。如果把所有的特征图都用上的话,很难将目标与背景进行区分。可以通过特征选择来丢掉noise 特征,那么该如何进行特征选择呢?

这篇论文的主要贡献有:

1)分析CNN从大规模图像分类中学到的特征,找到适用于跟踪的那些特征。这有助于更好的理解CNN特征和设计适用于跟踪的特征。

2)提出新的跟踪方法,使用两层卷积网络,可以更好的处理物体形变和区分目标与背景。

3)提出能自动选择特征的方法,提高跟踪精度。

用于跟踪的深度特征分析

      分析是基于16层的VGG网络的,VGG是在ImageNet上已经训练好的。其中有13个卷积层跟着3个全连接层。

分析1 尽管CNN特征图的感受野很大,激活特征图是稀疏并且局部的,激活区域和目标区域高度相关。

从图上可以看出特征图只有少量非0值,这些非0值是位置确定的且与目标区域有关。还得到了CNN 特征的语义图,语义图表明,输入的改变,导致目标区域的所选特征图大幅增长。因此,这些特征map获得了目标的可视化描述。这就表明,DNN学到的特征是有位置的且与目标相关的,因此,CNN的特征可用于确定目标位置。

分析2 很多CNN特征是noisy,或者与将目标与背景区分无关

用ImageNet训练的CNN特征能描述大量的目标,但当跟踪时,应当只关注小部分的目标,只需将目标与背景区分即可,这就要求我们选择好的特征。

分析3 不同层编码不同的特征,高层获得目标种类的语义概念,低层编码更多的区分特征来获得内部的种类变化。 

      因为特征图有大量冗余,故采用一种稀疏表示框架来更好的可视化。

Visual Tracking with Fully Convolutional Networks的更多相关文章

  1. 论文笔记之:Visual Tracking with Fully Convolutional Networks

    论文笔记之:Visual Tracking with Fully Convolutional Networks ICCV 2015  CUHK 本文利用 FCN 来做跟踪问题,但开篇就提到并非将其看做 ...

  2. 论文笔记:SiamRPN++: Evolution of Siamese Visual Tracking with Very Deep Networks

    SiamRPN++: Evolution of Siamese Visual Tracking with Very Deep Networks 2019-04-02 12:44:36 Paper:ht ...

  3. 中文版 R-FCN: Object Detection via Region-based Fully Convolutional Networks

    R-FCN: Object Detection via Region-based Fully Convolutional Networks 摘要 我们提出了基于区域的全卷积网络,以实现准确和高效的目标 ...

  4. Fully Convolutional Networks for Semantic Segmentation 译文

    Fully Convolutional Networks for Semantic Segmentation 译文 Abstract   Convolutional networks are powe ...

  5. 论文阅读(Xiang Bai——【CVPR2016】Multi-Oriented Text Detection with Fully Convolutional Networks)

    Xiang Bai--[CVPR2016]Multi-Oriented Text Detection with Fully Convolutional Networks 目录 作者和相关链接 方法概括 ...

  6. 论文学习:Fully Convolutional Networks for Semantic Segmentation

    发表于2015年这篇<Fully Convolutional Networks for Semantic Segmentation>在图像语义分割领域举足轻重. 1 CNN 与 FCN 通 ...

  7. 『计算机视觉』R-FCN:Object Detection via Region-based Fully Convolutional Networks

    一.网络介绍 参考文章:R-FCN详解 论文地址:Object Detection via Region-based Fully Convolutional Networks R-FCN是Faster ...

  8. 【Semantic Segmentation】 Instance-sensitive Fully Convolutional Networks论文解析(转)

    这篇文章比较简单,但还是不想写overview,转自: https://blog.csdn.net/zimenglan_sysu/article/details/52451098 另外,读这篇pape ...

  9. 【Detection】R-FCN: Object Detection via Region-based Fully Convolutional Networks论文分析

    目录 0. Paper link 1. Overview 2. position-sensitive score maps 2.1 Background 2.2 position-sensitive ...

随机推荐

  1. pthread的pthread_join()函数理解实验

    一.使用方式 pthread_t tid;pthread_create(&tid, NULL, thread_run,NULL);pthread_join(tid,NULL);创建线程之后直接 ...

  2. BZOJ3782 上学路线 【dp + Lucas + CRT】

    题目链接 BZOJ3782 题解 我们把终点也加入障碍点中,将点排序,令\(f[i]\)表示从\((0,0)\)出发,不经过其它障碍,直接到达\((x_i,y_i)\)的方案数 首先我们有个大致的方案 ...

  3. 【转载 save】vim键位图。

    留图,备用,copy from 网络

  4. python基础----元类metaclass

    1 引子 class Foo: pass f1=Foo() #f1是通过Foo类实例化的对象 python中一切皆是对象,类本身也是一个对象,当使用关键字class的时候,python解释器在加载cl ...

  5. django 自己编写admin

    继上次CRM项目之后 我们发现了django自带admin的强大之处以及灵活性,但是admin在企业中也一样很难做到完全的对接,因此编写自己的后台管理就显得至关重要. 本次自定义admin项目将接着上 ...

  6. python学习(十)元类

    python 可以通过`type`函数创建类,也可通过type判断数据类型 import socket from io import StringIO import sys class TypeCla ...

  7. libevent学习文档(二)eventbase相关接口和参数

    Setting up a default event_base The event_base_new() function allocates and returns a new event base ...

  8. vim 到文件开头 结尾

    gg:命令将光标移动到文档开头 G:命令将光标移动到文档末尾

  9. 集合框架小结-List

    List集合存储的元素是有序的,可重复的,有索引 List特有方法: 增加 add(index, element); addAll(index, Collection); 删除 remove(inde ...

  10. 【BZOJ】3052: [wc2013]糖果公园 树分块+带修改莫队算法

    [题目]#58. [WC2013]糖果公园 [题意]给定n个点的树,m种糖果,每个点有糖果ci.给定n个数wi和m个数vi,第i颗糖果第j次品尝的价值是v(i)*w(j).q次询问一条链上每个点价值的 ...