文章来源:Attentional Action-Driven Deep Network for Visual Object Tracking   博士论文(2017年8月份完稿)

http://s-space.snu.ac.kr/bitstream/10371/136793/1/000000145905.pdf

Chapter 4. Interacted Action-Driven Visual Tracking 

4.1 Overview:

之前作者提出的 Single Agent Reinforcement Learning Tracking Algorithm 存在相似物体遮挡导致失效的问题:

这种情况下,由于只考虑到物体的那一小块区域,由于有相似物体的存在,非常容易导致物体遮挡后,跟着其他物体乱跑的情况:

那么,如何解决这种问题呢?

作者提出了一种新颖的结合多个物体 patch 的方法来解决上述问题,并且结合 多智能体强化学习方法,提出了一种基于智能体之间相互交流的方法:

多智能体之间进行交流本来也是非常热的一个研究问题,本文将其结合到跟踪问题中去,来解决 Context 信息的问题,并且设计出了上述的网络结构,思路是比较直观的。

那么,本文的baseline 方法是:多个 agent 无交流的进行动作的选择的网络:

==================================================================================================================================

==================================================================================================================================

==================================================================================================================================

本文所提出的方法框架为:

该网络主要有三个部分构成:

1. Feature Encoder;

2. Message Encoder;

3. Selector;

==================================================================================================================================

==================================================================================================================================

==================================================================================================================================

接下来,分别进行介绍:

1. feature encoder 没啥好介绍的,就是用 CNN 提取特征;

2. 信息编码网络,就是特征的叠加;

3. Selector:  In order to combine the two primitive actions, the action selector module (Section 4.3.2.2) is proposed.

可以看出,本文引入这个,就是为了将两个网络的输出,进行叠加,融合两个网络的输出。

该选择器,有两维的输出,将两个网络初始的 action 分布,进行加权处理,最终融合为一个网络(多么熟悉的套路)。

可以看出,这个网络的设计,考虑到了 patch块的空间位置信息(Context 信息)。

然后,就是网络的训练,本文采用的是分阶段训练的(虽然可以 end to end 的进行 training),分别对这三个子网络进行训练。

Interacted Action-Driven Visual Tracking Algorithm的更多相关文章

  1. 论文阅读之:Deep Meta Learning for Real-Time Visual Tracking based on Target-Specific Feature Space

    Deep Meta Learning for Real-Time Visual Tracking based on Target-Specific Feature Space  2018-01-04  ...

  2. Correlation Filter in Visual Tracking

    涉及两篇论文:Visual Object Tracking using Adaptive Correlation Filters 和Fast Visual Tracking via Dense Spa ...

  3. 论文笔记之:Learning Multi-Domain Convolutional Neural Networks for Visual Tracking

    Learning Multi-Domain Convolutional Neural Networks for Visual Tracking CVPR 2016 本文提出了一种新的CNN 框架来处理 ...

  4. Particle filter for visual tracking

    Kalman Filter Cons: Kalman filtering is inadequate because it is based on the unimodal Gaussian dist ...

  5. Siam R-CNN: Visual Tracking by Re-Detection

    Siam R-CNN: Visual Tracking by Re-Detection 2019-12-02 22:21:48 Paper:https://128.84.21.199/abs/1911 ...

  6. Deep Reinforcement Learning with Iterative Shift for Visual Tracking

    Deep Reinforcement Learning with Iterative Shift for Visual Tracking 2019-07-30 14:55:31 Paper: http ...

  7. Adaptive Decontamination of the Training Set: A Unified Formulation for Discriminative Visual Tracking

    Martin Danelljan 判决类追踪模型是由训练样本学习得到,但是为了适应目标和背景的变化sample set在每一帧中都会更新. 令(xjk, yjk)表示第k帧k={1,2,...,t}中 ...

  8. (转)CVPR 2016 Visual Tracking Paper Review

    CVPR 2016 Visual Tracking Paper Review  本文摘自:http://blog.csdn.net/ben_ben_niao/article/details/52072 ...

  9. 论文笔记之: Hierarchical Convolutional Features for Visual Tracking

    Hierarchical Convolutional Features for Visual Tracking  ICCV 2015 摘要:跟卢湖川的那个文章一样,本文也是利用深度学习各个 layer ...

随机推荐

  1. synchronize与lock

    1. synchronize的作用 synchronize是java最原始的同步关键字,通过对方法或者代码块进行加锁实现对临界区域的保护.线程每次进去同步方法或者代码块都需要申请锁,如果锁被占用则会等 ...

  2. Vue框架之初识

    介绍 vue.js 是用来构建web应用接口的一个库 技术上,Vue.js 重点集中在MVVM模式的ViewModel层,它连接视图和数据绑定模型通过两种方式.实际的DOM操作和输出格式被抽象的方式到 ...

  3. java学习(1) ----getMethod()和getDeclaredMethod()的区别(转)

    转自: https://blog.csdn.net/qq_36443736/article/details/82890011 getMethod():获取自身能用所有的public公共方法.1.类本身 ...

  4. Markdown编辑器的使用测试

    北京高校(大标题) 北京电子科技学院(小标题) 计算机技术(一级标) 研究生(二级标) 列表(三级标) 姓名 - 扎西 - 卓玛 学号 - 01 - 02 超链接 [QQ邮箱](https://www ...

  5. sql 索引的使用 转载:https://www.cnblogs.com/xiaoyangjia/p/11267191.html#mysql_performance

    B-Tree索引的3个限制: 如果不是按照索引的最左列开始查找,则无法使用索引 不能跳过索引中的列.如果联合索引(a,b,c) ,如果使用条件a和c条件查询,那么只能使用索引的第一列a 如果查询中有某 ...

  6. postgresql学习笔记--基础篇 -psql工具

    --创建用户 CREATE ROLE pguser WITH ENCRYPTED PASSWORD 'pguser'; --创建表空间目录 mkdir -p /database/pg10/pg_tbs ...

  7. 走进 thrift server

    thrift的使用介绍 thriftthrift clientthrift serverthrift 0.7.0  一.About  thrift   二.什么是thrift,怎么工作? 三.Thri ...

  8. LeetCode 282. Expression Add Operators

    原题链接在这里:https://leetcode.com/problems/expression-add-operators/ 题目: Given a string that contains onl ...

  9. 普通页面引入React(使用和不使用JSX)

    1. 不使用JSX 优点: 不用配置有关JSX的编译. 依赖语法: React.createElement(component/type, props, ...chilidren); //第一个参数可 ...

  10. oracle存储过程把查询到的值更新到别的表

    create or replace procedure update_nst_t_Clime2 as cursor c_db is select * from NST_T_FRAME f ,) as ...