http://blog.csdn.net/carrierlxksuper/article/details/48918297

传统的跟踪方法依赖低维的人工特征,但这种特征对目标的外观变化等问题不够鲁棒。

与此相比,CNN从大量的数据中能够学到高级的信息,有较强的分类能力,这些特征有较好的泛化能力。

如果直接用CNN来跟踪的话,需要大量的数据来进行训练,这显然不合适。之前有人用DNN做在线跟踪并取得了不错的效果,但这个过程中,DNN被当做黑盒子来用。这篇文章从跟踪的角度研究了CNN特征的性质,发现了两个重要的性质:

首先,不同深度的CNN特征在跟踪时有不同的性质。顶层的卷积层获得了更抽象更高级的特征,这些特征能更好的区分不同种类的物体,处理形变遮挡时也更加鲁棒。

但如果是同类物体,这些特征的区分度并不好。更低卷积层提供了更细节的局部特征,这些特征能将具有相似外观的同类物体更好的区分开来。但在物体有较大形变时不够鲁棒。基于此,本文提出自动切换高低层进行跟踪。

其次,CNN的特征是从ImageNet上提前训练来区分物体的,但对于特定的物体来说,并不是所有特征都是有用于跟踪的,有些特征会被当做noise。如果把所有的特征图都用上的话,很难将目标与背景进行区分。可以通过特征选择来丢掉noise 特征,那么该如何进行特征选择呢?

这篇论文的主要贡献有:

1)分析CNN从大规模图像分类中学到的特征,找到适用于跟踪的那些特征。这有助于更好的理解CNN特征和设计适用于跟踪的特征。

2)提出新的跟踪方法,使用两层卷积网络,可以更好的处理物体形变和区分目标与背景。

3)提出能自动选择特征的方法,提高跟踪精度。

用于跟踪的深度特征分析

      分析是基于16层的VGG网络的,VGG是在ImageNet上已经训练好的。其中有13个卷积层跟着3个全连接层。

分析1 尽管CNN特征图的感受野很大,激活特征图是稀疏并且局部的,激活区域和目标区域高度相关。

从图上可以看出特征图只有少量非0值,这些非0值是位置确定的且与目标区域有关。还得到了CNN 特征的语义图,语义图表明,输入的改变,导致目标区域的所选特征图大幅增长。因此,这些特征map获得了目标的可视化描述。这就表明,DNN学到的特征是有位置的且与目标相关的,因此,CNN的特征可用于确定目标位置。

分析2 很多CNN特征是noisy,或者与将目标与背景区分无关

用ImageNet训练的CNN特征能描述大量的目标,但当跟踪时,应当只关注小部分的目标,只需将目标与背景区分即可,这就要求我们选择好的特征。

分析3 不同层编码不同的特征,高层获得目标种类的语义概念,低层编码更多的区分特征来获得内部的种类变化。 

      因为特征图有大量冗余,故采用一种稀疏表示框架来更好的可视化。

Visual Tracking with Fully Convolutional Networks的更多相关文章

  1. 论文笔记之:Visual Tracking with Fully Convolutional Networks

    论文笔记之:Visual Tracking with Fully Convolutional Networks ICCV 2015  CUHK 本文利用 FCN 来做跟踪问题,但开篇就提到并非将其看做 ...

  2. 论文笔记:SiamRPN++: Evolution of Siamese Visual Tracking with Very Deep Networks

    SiamRPN++: Evolution of Siamese Visual Tracking with Very Deep Networks 2019-04-02 12:44:36 Paper:ht ...

  3. 中文版 R-FCN: Object Detection via Region-based Fully Convolutional Networks

    R-FCN: Object Detection via Region-based Fully Convolutional Networks 摘要 我们提出了基于区域的全卷积网络,以实现准确和高效的目标 ...

  4. Fully Convolutional Networks for Semantic Segmentation 译文

    Fully Convolutional Networks for Semantic Segmentation 译文 Abstract   Convolutional networks are powe ...

  5. 论文阅读(Xiang Bai——【CVPR2016】Multi-Oriented Text Detection with Fully Convolutional Networks)

    Xiang Bai--[CVPR2016]Multi-Oriented Text Detection with Fully Convolutional Networks 目录 作者和相关链接 方法概括 ...

  6. 论文学习:Fully Convolutional Networks for Semantic Segmentation

    发表于2015年这篇<Fully Convolutional Networks for Semantic Segmentation>在图像语义分割领域举足轻重. 1 CNN 与 FCN 通 ...

  7. 『计算机视觉』R-FCN:Object Detection via Region-based Fully Convolutional Networks

    一.网络介绍 参考文章:R-FCN详解 论文地址:Object Detection via Region-based Fully Convolutional Networks R-FCN是Faster ...

  8. 【Semantic Segmentation】 Instance-sensitive Fully Convolutional Networks论文解析(转)

    这篇文章比较简单,但还是不想写overview,转自: https://blog.csdn.net/zimenglan_sysu/article/details/52451098 另外,读这篇pape ...

  9. 【Detection】R-FCN: Object Detection via Region-based Fully Convolutional Networks论文分析

    目录 0. Paper link 1. Overview 2. position-sensitive score maps 2.1 Background 2.2 position-sensitive ...

随机推荐

  1. (转)Ubuntu 17.04_64上搭建巡风扫描系统(资产信息漏洞扫描内网神器)

    巡风简介 巡风是一款适用于企业内网的漏洞快速应急.巡航扫描系统,通过搜索功能可清晰的了解内部网络资产分布情况,并且可指定漏洞插件对搜索结果进行快速漏洞检测并输出结果报表.其主体分为两部分:网络资产识别 ...

  2. [CEOI2004]锯木厂选址

    link 试题分析 做这种题就应该去先写个暴力代码 #include<iostream> #include<cstring> #include<cstdio> #i ...

  3. 洛谷P1106 删数问题

    题目描述 键盘输入一个高精度的正整数N,去掉其中任意k个数字后剩下的数字按原左右次序将组成一个新的正整数.编程对给定的N和k,寻找一种方案使得剩下的数字组成的新数最小. 输出应包括所去掉的数字的位置和 ...

  4. java 根据包名、目录名获取所有定义的类

    /** * Scans all classes accessible from the context class loader which belong to the given package a ...

  5. 1.Android JUnit Runner(使用AndroidStudio)

    一.Android JUnit Runner介绍 1.Android JUnit Runner 1)是一个测试运行器,用于运行Junit3和Junit4的Android测试包 2)替换Instrume ...

  6. 「Linux+Django」uwsgi服务启动(start)停止(stop)重新装载(reload)

    转自:http://blog.51cto.com/12482328/2087535?cid=702003 1. 添加uwsgi相关文件 在之前的文章跟讲到过centos中搭建nginx+uwsgi+f ...

  7. NOIP模拟赛8

    今天又爆零啦... T1 题目描述 #define goodcatdog gcd #define important i #define judge  j 神说 每个梦想就是一轮月亮,高高地孤寂地挂在 ...

  8. dp+分类讨论 Gym 101128E

    题目链接:http://codeforces.com/gym/101128 感觉这个人写的不错的(我只看了题目大意):http://blog.csdn.net/v5zsq/article/detail ...

  9. JavaScript:详解 Base64 编码和解码

    Base64是最常用的编码之一,比如开发中用于传递参数.现代浏览器中的<img />标签直接通过Base64字符串来渲染图片以及用于邮件中等等.Base64编码在RFC2045中定义,它被 ...

  10. 《JavaScript 实战》:JavaScript 实现图片切割效果

    很久之前就在一个网站的截取相片的功能中看到这个效果,也叫图片裁剪.图片剪切(设置一下也可以做出放大镜等类似的效果).当时觉得很神奇,碍于水平有限,没做出来.前些日子突然想做一个透镜效果,就突然想到了这 ...