Learning a Deep Compact Image Representation for Visual Tracking

这篇博客对论文进行了部分翻译http://blog.csdn.net/vintage_1/article/details/19546953，不过个人觉得博主有些理解有误。

这篇博客简单分析了代码http://www.cnblogs.com/zeadoit/p/4161427.html

本文的DLT算法在无监督特征的学习，是在线下训练阶段使用SDAE从大量图像数据中学到图像特征，首次运用一层一层的预训练，然后整个SDAE就是fine-tuned.

在线跟踪过程中，一个附加的分类层来对部分训练好的SDAE进行编码。

1.Offline Training with Auxiliary Data

1.1.1 Dataset and Preprocessing

预处理做的不多，包括把32*32的图像转为1024*1的向量，每维的特征值被归一化。

1.1.2 Learning Generic Image Features with a Stacked Denoising Autoencoder

DAE的优化问题可表示为如下形式：

为了更进一步的学习到有意义的特征，对隐藏神经元的激活值施加稀疏性约束：

预训练之后，SDAE可看作一个前馈神经网络。

在第一层使用一个完备的滤波器来学习图像的特征，当新的一层加入时，神经元的个数减半，直到减到256个神经元，作为自编码器的bottleneck。

为了加速第一层的预训练学习局部特征的过程，把32*32的图像分成16*16（除了四个角外，中间还有一个，会与四个角重叠）。然后训练5个DAEs，每个

有512隐含单元。然后将5个DAE组合成一个大的DAE并正常训练。第一层随机选择的滤波器如图所示，可以看出大部分滤波器起的是边缘检测的作用。

1.2 Online Tracking Process

跟踪目标在第一帧里用边框框出来。一个sigmoid分类层添加到离线训练好的SDAE的编码器之后，整体网络如Fig1所示。当一个新的视频帧到来，我们首先撒粒子（一个粒子就是目标可能存在的一块图像，32*32），每个粒子的可信度（即与首帧提取的特征的想似度）通过网络前向传播确定。这种方法在这一步的计算量非常小但准确度很高。如果所有粒子的最大可信度小于预定的阈值，就表示追踪目标的外观发生了巨大改变。为解决这个问题，一旦发生这种情况，这个网络可以再次tune。阈值的设定是一个tradeoff，如果太小，跟踪器不能很好地适应目标的外表变换；如果太大，遮挡物体和背景都有可能被当做跟踪目标，从而造成跟踪从目标漂移。

整个过程仍然是粒子滤波框架，只是将人工特征变成了自动提取特征并通过网络来确定可信度。具体实现还需参考代码。

Learning a Deep Compact Image Representation for Visual Tracking的更多相关文章

论文笔记：Learning regression and verification networks for long-term visual tracking
Learning regression and verification networks for long-term visual tracking 2019-02-18 22:12:25 Pape ...
[CVPR2018] Context-aware Deep Feature Compression for High-speed Visual Tracking
基于内容感知深度特征压缩的高速视觉跟踪论文下载:http://cn.arxiv.org/abs/1803.10537对于视频这种高维度数据,作者训练了多个自编码器AE来进行数据压缩,至于怎么选择具体 ...
Summary on Visual Tracking: Paper List, Benchmarks and Top Groups
Summary on Visual Tracking: Paper List, Benchmarks and Top Groups 2018-07-26 10:32:15 This blog is c ...
论文解读（GRACE）《Deep Graph Contrastive Representation Learning》
Paper Information 论文标题:Deep Graph Contrastive Representation Learning论文作者:Yanqiao Zhu, Yichen Xu, Fe ...
论文阅读之：Deep Meta Learning for Real-Time Visual Tracking based on Target-Specific Feature Space
Deep Meta Learning for Real-Time Visual Tracking based on Target-Specific Feature Space 2018-01-04 ...
论文笔记之：Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning
论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning 2017-06-06 21: ...
论文笔记之：UNSUPERVISED REPRESENTATION LEARNING WITH DEEP CONVOLUTIONAL GENERATIVE ADVERSARIAL NETWORKS
UNSUPERVISED REPRESENTATION LEARNING WITH DEEP CONVOLUTIONAL GENERATIVE ADVERSARIAL NETWORKS ICLR 2 ...
Deep Reinforcement Learning with Iterative Shift for Visual Tracking
Deep Reinforcement Learning with Iterative Shift for Visual Tracking 2019-07-30 14:55:31 Paper: http ...
（转）Understanding, generalisation, and transfer learning in deep neural networks
Understanding, generalisation, and transfer learning in deep neural networks FEBRUARY 27, 2017 Thi ...

随机推荐

《Java程序设计》第8周学习总结 20165218 2017-2018-1
20165218 2017-2018-1 <Java程序设计>第8周学习总结教材学习内容总结第12章 java多线程机制 java中的线程计算机在任何给定时刻只能执行一个线程,多线程 ...
nginx服务器去掉url中的index.php 和配置path_info
隐藏index.php server { listen 80; server_name yourdomain.com; root /home/yourdomain/www/; index index. ...
apue3.e （基于maxos 10.9）
在Google搜到你的问题,我也碰到同样的问题(5分钟前),然后通过其他的搜索结果找到答案,不知道你是否跟我一样,出现以下的错误: ... clang: error: unknown argument ...
Linux之时间相关操作20170607
一.Linux常用时间相关函数 -asctime,ctime,getttimeofday,gmtime,localtime,mktime,settimeofday,time asctime ...
Machine Learning in Action-chapter2-k近邻算法
一.numpy()函数 1.shape[]读取矩阵的长度例: import numpy as np x = np.array([[1,2],[2,3],[3,4]]) print x.shape / ...
UESTC--1727
原题链接:http://acm.uestc.edu.cn/problem.php?pid=1727 分析:用 l[i] 记录第 i 层楼有多少物品需要往上继续搬运,如果某层楼没有物品,但是更上面还有, ...
bzoj1467 Pku3243 clever Y
1467: Pku3243 clever Y Time Limit: 4 Sec Memory Limit: 64 MBSubmit: 313 Solved: 181[Submit][Status ...
laravel5.1 使用中间表的多对多关联
用户表user 标签表tag 中间表user_tag(user_id,tag_id) 在user模型中定义tags关联如下: public function tags() { return $this ...
【题解】彩色树 51nod 1868 虚树树上dp
Prelude 题目在这里:ο(=•ω<=)ρ⌒☆ Solution 蒟蒻__stdcall的第一道虚树题qaq. 首先很容易发现,这个排列是假的. 我们只需要求出每对点之间的颜色数量,然后求个 ...
sql命令创建数据库
mysql create database 指定utf-8编码 CREATE DATABASE IF NOT EXISTS thinkphp DEFAULT CHARSET utf8 COLLATE ...

Learning a Deep Compact Image Representation for Visual Tracking

Learning a Deep Compact Image Representation for Visual Tracking的更多相关文章

随机推荐

热门专题