【论文阅读】HydraPlus-Net: Attentive Deep Features for Pedestrian Analysis

转载请注明出处：https://www.cnblogs.com/White-xzx/

原文地址：https://arxiv.org/abs/1709.09930

Github: https://github.com/xh-liu/HydraPlus-Net

如有不准确或错误的地方，欢迎交流~

　　HP-Net是一个基于注意力机制（attention-based）的深度神经网络，将多层注意力机制图多向映射到不同的特征层。

【HP-Net Adavantage】

　　（1）模型能够从浅层到语义层捕获注意力；

　　（2）挖掘多尺度的可选注意力特征，充实最终的行人特征表示；

　　（3）提取出细节和局部特征来充实高层全局特征，这些特征在细粒度的行人分析任务中是非常重要的；

　　（4）提出多方向注意机制模块（multi-directional attention，MDA），提取多层（multiple level）特征，包含局部和全局特征，进行多层特征融合，进行细粒度的行人分析；

　　　multi-level：（a）语义层：分辨相似外观行人的局部区域特征，如长短发、长短袖；（b）浅层：捕捉行人的衣服的条纹；

　　 multi-scale：（c）（d）多尺度特征，描述行人特点（c）小尺度特征对应‘打电话’；（d）大尺度全局理解描述‘性别’

【HydraPlus-Net网络结构】

　　（1）Main Net（M-Net）：单纯的CNN结构，论文的实现是基于inception_v2，包含三个inception block，还包含几个低层卷积层

　　（2）Attentive Feature Net（AF-Net）：三个分支，每个分支有三个inception_v2 block和一个MDA

【Attentive Feature Network】

　　AF-Net包含3个MDA增强的网络分支，

　　AF-Net和M-Net共享卷积框架，他们的输出级联后经过全局平均池化和全连接层融合，最终的输出映射到属性logits用于属性识别，或特征向量用于再认证。

　　为inception i模块的输出经过1 1conv、BN、ReLU产生的注意力图，并被相乘到inception k的输出特征图，产生多层多尺度注意力特征，传送到后续的层，MDA模块的最后L个注意力特征级联作为最终特征表示，k∈{1,2,3}

【Attention Mechanism 注意力机制】

　　传统基于注意力的模型，将注意力图返回输入到原相同的模块（右图红线），通过应用注意力图到相邻的模块来扩展此机制；HP-Net应用不同的注意力图到多个模块（下图b），在相同的空间分布下融合多层特征。

【Multi-level Attention Map 多层注意力图】

　　不同模块学习得到注意力图在尺度和细节上差异非常大，如下图(a)，高层通常更粗糙、更聚焦语义区域（特定物体），如，低层捕获局部特征和细节（边缘和纹理），如。因此，使用MDA模块融合不同层注意力特征，可以收集不同层的语义信息，提供更多可选特征表达。

　　上图为每个输入图像提取某level的L = 8 attention channels 的特征图，不同MDA作用下，多级注意力特征的定性演示

　　（a）浅层属性，如上衣类型，需要低层注意力连接，纹理 -> T-Shirt （b）语义或目标级别的属性，如手机，需要高层注意力连接

【Stage-wise Training 分阶段训练】

　　①训练M-Net，提取基本特征；

　　②将M-Net复制三次，得到AF-Net的三个分支，每个MDA模块有三个子分支组成，即临近的三个不同的inception blocks，依次微调每个blocks，即共有9个blocks需要微调；

　　③微调完成后，固定AF-Net和M-Net，训练全局平均池化层（GAP）和全连接层（FC）；

　　④输出层：属性识别使用交叉熵损失函数，行人ReID使用softmax函数。

【实验结果】

【论文阅读】HydraPlus-Net: Attentive Deep Features for Pedestrian Analysis的更多相关文章

论文阅读 | Towards a Robust Deep Neural Network in Text Domain A Survey
摘要这篇文章主要总结文本中的对抗样本,包括器中的攻击方法和防御方法,比较它们的优缺点. 最后给出这个领域的挑战和发展方向. 1 介绍对抗样本有两个核心:一是扰动足够小:二是可以成功欺骗网络. 所有 ...
[论文阅读] ImageNet Classification with Deep Convolutional Neural Networks(传说中的AlexNet)
这篇文章使用的AlexNet网络,在2012年的ImageNet(ILSVRC-2012)竞赛中获得第一名,top-5的测试误差为15.3%,相比于第二名26.2%的误差降低了不少. 本文的创新点: ...
论文解读第三代GCN《 Deep Embedding for CUnsupervisedlustering Analysis》
Paper Information Titlel:<Semi-Supervised Classification with Graph Convolutional Networks>Aut ...
论文解读DEC《Unsupervised Deep Embedding for Clustering Analysis》
Junyuan Xie, Ross B. Girshick, Ali Farhadi2015, ICML1243 Citations, 45 ReferencesCode:DownloadPaper: ...
论文解读GCN 1st《 Deep Embedding for CUnsupervisedlustering Analysis》
论文信息 Tittle:<Spectral Networks and Locally Connected Networks on Graphs> Authors:Joan Bruna.Wo ...
BERT 论文阅读笔记
BERT 论文阅读 BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding 由 @快刀切草莓君 ...
Deep Reinforcement Learning for Dialogue Generation 论文阅读
本文来自李纪为博士的论文 Deep Reinforcement Learning for Dialogue Generation. 1,概述当前在闲聊机器人中的主要技术框架都是seq2seq模型.但 ...
【医学图像】3D Deep Leaky Noisy-or Network 论文阅读（转）
文章来源:https://blog.csdn.net/u013058162/article/details/80470426 3D Deep Leaky Noisy-or Network 论文阅读原 ...
论文阅读：Face Recognition: From Traditional to Deep Learning Methods 《人脸识别综述：从传统方法到深度学习》
论文阅读:Face Recognition: From Traditional to Deep Learning Methods <人脸识别综述:从传统方法到深度学习> 一.引 ...

随机推荐

怎样实现在DBGrid中双击选择整行，并且可以多选？谢谢！！
DBGrid1->Options里有个dgMultiSelect,把它设为true就能多选了先设置DBGrid1->options中dgRowSelect = true, dgMulti ...
MT【81】含参数三次函数因式分解
解答: 评:这题实质上是对关于$x$的三次函数进行了一个因式分解.这种把$a$看成主元的技巧是初中处理高次的因式分解的常用技巧.如果用三次求导去做计算量比较大,要计算极值.
BZOJ 4361 isn | DP 树状数组
链接 BZOJ 4361 题面给出一个长度为n的序列A(A1,A2...AN).如果序列A不是非降的,你必须从中删去一个数, 这一操作,直到A非降为止.求有多少种不同的操作方案,答案模10^9+7. ...
eclipse启动tomcat内存溢出的解决方式
eclipse启动tomcat内存溢出的解决方式 ——IT唐伯虎摘要:eclipse启动tomcat内存溢出的解决方式. 1.打开Run Configurations 2.在VM arguments ...
html5 canvas 奇怪的形状水平渐变（因为大多数的之前的文章把基础都打过了，所以开始写的快了，如果有不明白的，可以回顾下之前的）
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...
html5 canvas路径绘制2
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...
将本地的mongodb迁移到阿里云
首先在阿里云上安装mongodb,可以根据官方教程 https://docs.mongodb.com/manual/tutorial/install-mongodb-on-amazon/ 完成之后启动 ...
centos7.2 安装 composer
安装Composer https://pkg.phpcomposer.com/#how-to-install-composer # 下载composer.phar curl -sS https:// ...
交互题（二分）（D. Game with modulo）
题目链接:http://codeforces.com/contest/1104/problem/D 题目大意:给出一个式子 x%a y%a,会返回结果,如果返回x代表x%a>=y%a.如果返回y ...
oracle 建用户
create user username identified by password; grant dba to username; 注意当对用户赋予resource角色时将同时赋予unlimite ...

【论文阅读】HydraPlus-Net: Attentive Deep Features for Pedestrian Analysis

【论文阅读】HydraPlus-Net: Attentive Deep Features for Pedestrian Analysis的更多相关文章

随机推荐

热门专题