论文笔记 CVPR-2014 DeepReID Deep filter pairing neural network for person re-identification
1. 摘要
第一篇用深度学习做Reid的文章,提出的FPNN采用端到端的训练方式,解决行人再识别的不对齐,光照,姿态等问题。
建立了一个新的带benchmark的数据集CUHK03,表现性能良好。
2.介绍
作者在文章中提到,目前做Reid的大致框架如下
目前的工作主要集中在优化上述框架中的一项或者同时优化几项。
作者在本文的贡献总结:
(1)解决不对齐、光照变换、几何变换、遮挡等问题
(2)使用一些有用的训练技巧;如dropout、数据增强、数据平衡、自助法等,使用端到端的训练
(3)建立发布了一个带benchmark的大规模行人再识别数据集CUHK03,该数据集包含1360个id,13164张图像
3. 模型,方法
模型分为6层,大致框架
(1)Feature extraction
使用卷积核对\((W_k,V_k)\)对输入的图像对进行卷积提取特征,然后最大池化成 $ H_1 $ x $ W_1 $ x \(K_1\)的特征图
\[ f_{ij}^k = \sigma((W_k*I)_{ij}+b_k^I)\]
\[ g_{ij}^k = \sigma((V_k*I)_{ij}+b_k^J)\]
(2)Patch matching
对特征图尽行分条处理,垂直方向分成M条,每条的宽度为\(W_1\),在条内对图像进行匹配,输出为\(K_1MW_1\) x \(W_1\)的块位移矩阵
\[ S_{(i,j) (i',j')}^k = f_{ij}^k g_{i'j'}^k \]
$ S_{(i,j) (i',j')}^k $ 的值越大,响应匹配越好。
(3)Modeling mixture of photometric transforms
maxout-grouping layer 把\(K_1\)通道数分成T组,每组内的最大响应才往下一层传播,输出为\(TMW_1\) x \(W_1\)
(4)Modeling part displacement
这一层卷积池化,输出为\(MW_2\) x \(W_2\) x $K_2 $
(5)Modeling pose and viewpoint transforms
这一层为全连接层
(6)Identity Recognition
这一层为softmax层,使用softmax函数
4. 训练策略
dropout 、data augmentation、data balancing 、bootstrapping
5. 结论
6. 评价
模型性能良好,能够解决一些遮挡、不对齐、光照变化、几何变换、姿态等问题。这是一篇良好的开篇之作,这个提供了一种深度学习解决行人再识别问题的思路。
论文笔记 CVPR-2014 DeepReID Deep filter pairing neural network for person re-identification的更多相关文章
- 论文笔记:(CVPR2019)Relation-Shape Convolutional Neural Network for Point Cloud Analysis
目录 摘要 一.引言 二.相关工作 基于视图和体素的方法 点云上的深度学习 相关性学习 三.形状意识表示学习 3.1关系-形状卷积 建模 经典CNN的局限性 变换:从关系中学习 通道提升映射 3.2性 ...
- 论文笔记之:Hybrid computing using a neural network with dynamic external memory
Hybrid computing using a neural network with dynamic external memory Nature 2016 原文链接:http://www.na ...
- 论文笔记:Person Re-identification with Deep Similarity-Guided Graph Neural Network
Person Re-identification with Deep Similarity-Guided Graph Neural Network 2018-07-27 17:41:45 Paper: ...
- Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.1
3.Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.1 http://blog.csdn.net/sunbow0 ...
- Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.2
3.Spark MLlib Deep Learning Convolution Neural Network(深度学习-卷积神经网络)3.2 http://blog.csdn.net/sunbow0 ...
- Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.3
3.Spark MLlib Deep Learning Convolution Neural Network(深度学习-卷积神经网络)3.3 http://blog.csdn.net/sunbow0 ...
- 论文笔记之:Decoupled Deep Neural Network for Semi-supervised Semantic Segmentation
Decoupled Deep Neural Network for Semi-supervised Semantic Segmentation xx
- 通过Visualizing Representations来理解Deep Learning、Neural network、以及输入样本自身的高维空间结构
catalogue . 引言 . Neural Networks Transform Space - 神经网络内部的空间结构 . Understand the data itself by visua ...
- 论文翻译:2020_WaveCRN: An efficient convolutional recurrent neural network for end-to-end speech enhancement
论文地址:用于端到端语音增强的卷积递归神经网络 论文代码:https://github.com/aleXiehta/WaveCRN 引用格式:Hsieh T A, Wang H M, Lu X, et ...
随机推荐
- linux 上传下载 以及SCP命令
1. scp 用法 scp就是用来在服务器和本地之间传文件的linux命令还有其他的方法,比如装ftp服务器 copy 本地的档案到远程的机器上 scp /Desktop/test.conf 用户名@ ...
- chrome跨域访问
这里设计到跨域访问的问题,如果非要在本地来访问,可以这是chrome的参数. 1.打开chrome快捷方式->属性 2.末尾添加: --args --disable-web-security 3 ...
- javascript之for循环的几种写法
背景 javascript中的for循环选择多种多样,可你知道其中的差别在哪里吗?什么时候又该用哪种循环才是最佳策略?以上这些是本文想讨论的,欢迎交流. 说明 1.20年前的for循环 //20年前的 ...
- HTML学习笔记《一》 ---- HTML基本认识
HTML 基本认识 一.简介 1.HTML是超文本标记语言,标准通用标记语言下的一个应用,解释性语言. 2.“超文本”就是指页面内可以包含图片.链接,甚至音乐.程序等非文字元素. 3.超文本标记语言的 ...
- Laravel 支付宝异步通知 419报错
支付宝在支付是有服务器通知和网页通知,一个在前端展示,一个在后台操作, laravel框架自带csrf_token验证. 所以我们需要把支付的路由跳过验证 可以在中间键的csrf配置中更改
- WDCP上传SSL证书
1.在线申请SSL证书 2.网站管理>SSL证书上传 3.将key文件直接上传,cert文件内容复制到crt文件中,再上传 4.开启https 注意:同一个域名下解析的若干域名,只能走主域名的证 ...
- JQuer.HoverDir的基本使用方法
首先引入JQ和HoverDir库 HTML部分: <ul id="da-thumbs" class="da-thumbs"> <li> ...
- Java 接口和多态
接口 1.1 接口的概述 接口是功能的集合,同样可看做是一种数据类型,是比抽象类更为抽象的”类”. 接口只描述所应该具备的方法,并没有具体实现,具体的实现由接口的实现类(相当于接口的子类)来完成.这样 ...
- 直到黎明 Until Dawn 后感
直到黎明 会免游戏.白金神作.近些年的恐怖电影都有游戏化的趋势,韩国的某岩vlog,美国的真心话大冒险,都把观众作为meta代入游戏,几乎模糊了游戏与游戏的边界,直到黎明这部电影,与当年的暴雨和超凡双 ...
- JavaScript Web 应用最佳实践分析
[编者按]本文作者为 Mathias Schäfer,旨在回顾在客户端大量使用JavaScript 的最佳 Web应用实践.文章系国内 ITOM 管理平台 OneAPM 编译呈现. 对笔者来说,Jav ...