1. 摘要

第一篇用深度学习做Reid的文章,提出的FPNN采用端到端的训练方式,解决行人再识别的不对齐,光照,姿态等问题。
建立了一个新的带benchmark的数据集CUHK03,表现性能良好。

2.介绍

作者在文章中提到,目前做Reid的大致框架如下

目前的工作主要集中在优化上述框架中的一项或者同时优化几项。
作者在本文的贡献总结:
(1)解决不对齐、光照变换、几何变换、遮挡等问题
(2)使用一些有用的训练技巧;如dropout、数据增强、数据平衡、自助法等,使用端到端的训练
(3)建立发布了一个带benchmark的大规模行人再识别数据集CUHK03,该数据集包含1360个id,13164张图像

3. 模型,方法

模型分为6层,大致框架

(1)Feature extraction
使用卷积核对\((W_k,V_k)\)对输入的图像对进行卷积提取特征,然后最大池化成 $ H_1 $ x $ W_1 $ x \(K_1\)的特征图
\[ f_{ij}^k = \sigma((W_k*I)_{ij}+b_k^I)\]
\[ g_{ij}^k = \sigma((V_k*I)_{ij}+b_k^J)\]

(2)Patch matching
对特征图尽行分条处理,垂直方向分成M条,每条的宽度为\(W_1\),在条内对图像进行匹配,输出为\(K_1MW_1\) x \(W_1\)的块位移矩阵
\[ S_{(i,j) (i',j')}^k = f_{ij}^k g_{i'j'}^k \]
$ S_{(i,j) (i',j')}^k $ 的值越大,响应匹配越好。
(3)Modeling mixture of photometric transforms
maxout-grouping layer 把\(K_1\)通道数分成T组,每组内的最大响应才往下一层传播,输出为\(TMW_1\) x \(W_1\)
(4)Modeling part displacement
这一层卷积池化,输出为\(MW_2\) x \(W_2\) x $K_2 $
(5)Modeling pose and viewpoint transforms
这一层为全连接层
(6)Identity Recognition
这一层为softmax层,使用softmax函数

4. 训练策略

dropout 、data augmentation、data balancing 、bootstrapping

5. 结论


6. 评价

模型性能良好,能够解决一些遮挡、不对齐、光照变化、几何变换、姿态等问题。这是一篇良好的开篇之作,这个提供了一种深度学习解决行人再识别问题的思路。

论文笔记 CVPR-2014 DeepReID Deep filter pairing neural network for person re-identification的更多相关文章

  1. 论文笔记:(CVPR2019)Relation-Shape Convolutional Neural Network for Point Cloud Analysis

    目录 摘要 一.引言 二.相关工作 基于视图和体素的方法 点云上的深度学习 相关性学习 三.形状意识表示学习 3.1关系-形状卷积 建模 经典CNN的局限性 变换:从关系中学习 通道提升映射 3.2性 ...

  2. 论文笔记之:Hybrid computing using a neural network with dynamic external memory

    Hybrid computing using a neural network with dynamic external memory Nature  2016 原文链接:http://www.na ...

  3. 论文笔记:Person Re-identification with Deep Similarity-Guided Graph Neural Network

    Person Re-identification with Deep Similarity-Guided Graph Neural Network 2018-07-27 17:41:45 Paper: ...

  4. Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.1

    3.Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.1 http://blog.csdn.net/sunbow0 ...

  5. Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.2

    3.Spark MLlib Deep Learning Convolution Neural Network(深度学习-卷积神经网络)3.2 http://blog.csdn.net/sunbow0 ...

  6. Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.3

    3.Spark MLlib Deep Learning Convolution Neural Network(深度学习-卷积神经网络)3.3 http://blog.csdn.net/sunbow0 ...

  7. 论文笔记之:Decoupled Deep Neural Network for Semi-supervised Semantic Segmentation

    Decoupled Deep Neural Network for Semi-supervised Semantic Segmentation xx

  8. 通过Visualizing Representations来理解Deep Learning、Neural network、以及输入样本自身的高维空间结构

    catalogue . 引言 . Neural Networks Transform Space - 神经网络内部的空间结构 . Understand the data itself by visua ...

  9. 论文翻译:2020_WaveCRN: An efficient convolutional recurrent neural network for end-to-end speech enhancement

    论文地址:用于端到端语音增强的卷积递归神经网络 论文代码:https://github.com/aleXiehta/WaveCRN 引用格式:Hsieh T A, Wang H M, Lu X, et ...

随机推荐

  1. linux 上传下载 以及SCP命令

    1. scp 用法 scp就是用来在服务器和本地之间传文件的linux命令还有其他的方法,比如装ftp服务器 copy 本地的档案到远程的机器上 scp /Desktop/test.conf 用户名@ ...

  2. chrome跨域访问

    这里设计到跨域访问的问题,如果非要在本地来访问,可以这是chrome的参数. 1.打开chrome快捷方式->属性 2.末尾添加: --args --disable-web-security 3 ...

  3. javascript之for循环的几种写法

    背景 javascript中的for循环选择多种多样,可你知道其中的差别在哪里吗?什么时候又该用哪种循环才是最佳策略?以上这些是本文想讨论的,欢迎交流. 说明 1.20年前的for循环 //20年前的 ...

  4. HTML学习笔记《一》 ---- HTML基本认识

    HTML 基本认识 一.简介 1.HTML是超文本标记语言,标准通用标记语言下的一个应用,解释性语言. 2.“超文本”就是指页面内可以包含图片.链接,甚至音乐.程序等非文字元素. 3.超文本标记语言的 ...

  5. Laravel 支付宝异步通知 419报错

    支付宝在支付是有服务器通知和网页通知,一个在前端展示,一个在后台操作, laravel框架自带csrf_token验证. 所以我们需要把支付的路由跳过验证 可以在中间键的csrf配置中更改

  6. WDCP上传SSL证书

    1.在线申请SSL证书 2.网站管理>SSL证书上传 3.将key文件直接上传,cert文件内容复制到crt文件中,再上传 4.开启https 注意:同一个域名下解析的若干域名,只能走主域名的证 ...

  7. JQuer.HoverDir的基本使用方法

    首先引入JQ和HoverDir库 HTML部分: <ul id="da-thumbs" class="da-thumbs"> <li> ...

  8. Java 接口和多态

    接口 1.1 接口的概述 接口是功能的集合,同样可看做是一种数据类型,是比抽象类更为抽象的”类”. 接口只描述所应该具备的方法,并没有具体实现,具体的实现由接口的实现类(相当于接口的子类)来完成.这样 ...

  9. 直到黎明 Until Dawn 后感

    直到黎明 会免游戏.白金神作.近些年的恐怖电影都有游戏化的趋势,韩国的某岩vlog,美国的真心话大冒险,都把观众作为meta代入游戏,几乎模糊了游戏与游戏的边界,直到黎明这部电影,与当年的暴雨和超凡双 ...

  10. JavaScript Web 应用最佳实践分析

    [编者按]本文作者为 Mathias Schäfer,旨在回顾在客户端大量使用JavaScript 的最佳 Web应用实践.文章系国内 ITOM 管理平台 OneAPM 编译呈现. 对笔者来说,Jav ...