http://www.umiacs.umd.edu/~ejaz/

* 也是同时学习feature和metric
* 输入一对图片,输出是否是同一个人
* 包含了一个新的层:
include a layer that computes cross-input neighborhood differences
(capture local relationships between the two input images based on midlevel features from each input image )
* A high-level summary of the outputs of this layer is computed by a layer of patch summary features 
* 在比较大的数据集CUHK03,中等数据集CUHK01取得较好的结果,在无关的大数据集上预训练然后在小数据集上fine-tune后也在小数据集(VIPeR)上有comparable to the state of art的性能

* Person Re-id的定义:the problem of identifying people across images that have been taken using different cameras, or across time using a single camera
* 难点: 由于光照和视角等原因,同一个人变化很大,不同人的样子可能很像
 
* 一般是输入两张图片,计算它们的相似度或者判断他们是同一类或者不是同一类
 
cross-inputneighborhood difference
 f只有中心(x,y)的一个值,5x5的每个元素都是这个值。 g是(x,y)为中心的5x5邻域。
这种操作是非对称的,所以反过来再做一次
如果两个输入是25通道,则结果有50通道。
输入12x37x25-->输出12x37x5x5, 共50通道
这一层之后过一个ReLU

然后过一个patch summary layer, 通过卷积实现
对K',L'也一样,所以结果应该有50个通道的

visualization of features
 
 visualization of weights


给正样本对做data augmentation,但仍然是不平衡的

因此采用hard negative mining
随机采样负样本对,使负样本对是扩充后的正样本对的2倍(1倍会不会更好?)
用这些训练模型,但不是最优的,
用这个模型去分类负样本对,找出网络表现最差的,然后用这些样本 只重训练顶层的fc(实验说明比重训连整个网络要更有效,这也相当于fine-tune)

对于很小的数据集,用大数据集训练的模型(在hard-negative mining之后)初始化,然后fine-tuning,此时learning rate比原来小10倍,0.001

 
这篇文章提出了一个可能的改进方向,对不同的身体部位训练不同的模型, 然后将不同部位的分数组合起来得到最后的决策,这对于实际场景中有严重的occlusion或者对于 图片中的人在一系列时刻做不同动作的(比如某一时刻坐着,另一时刻站着)的情况可能会有帮助。 





                         
 





15 cvpr An Improved Deep Learning Architecture for Person Re-Identification的更多相关文章

  1. (转) Deep learning architecture diagrams

    FastML Machine learning made easy RSS Home Contents Popular Links Backgrounds About Deep learning ar ...

  2. 视觉中的深度学习方法CVPR 2012 Tutorial Deep Learning Methods for Vision

    Deep Learning Methods for Vision CVPR 2012 Tutorial  9:00am-5:30pm, Sunday June 17th, Ballroom D (Fu ...

  3. A Survey of Visual Attention Mechanisms in Deep Learning

    A Survey of Visual Attention Mechanisms in Deep Learning 2019-12-11 15:51:59 Source: Deep Learning o ...

  4. Deep Learning in a Nutshell: History and Training

    Deep Learning in a Nutshell: History and Training This series of blog posts aims to provide an intui ...

  5. 深度学习材料:从感知机到深度网络A Deep Learning Tutorial: From Perceptrons to Deep Networks

    In recent years, there’s been a resurgence in the field of Artificial Intelligence. It’s spread beyo ...

  6. Deep Learning for Chatbots(Introduction)

    聊天机器人又被称为会话系统,已经成为一个热门话题,许多公司都在这上面的投入巨大,包括微软,Facebook,苹果(Siri),Google,微信,Slack.许多创业公司尝试通过多种方式来改变与消费者 ...

  7. 【Deep Learning】genCNN: A Convolutional Architecture for Word Sequence Prediction

    作者:Mingxuan Wang.李航,刘群 单位:华为.中科院 时间:2015 发表于:acl 2015 文章下载:http://pan.baidu.com/s/1bnBBVuJ 主要内容: 用de ...

  8. 【CS-4476-project 6】Deep Learning

    AlexNet / VGG-F network visualized by mNeuron. Project 6: Deep LearningIntroduction to Computer Visi ...

  9. 【深度学习Deep Learning】资料大全

    最近在学深度学习相关的东西,在网上搜集到了一些不错的资料,现在汇总一下: Free Online Books  by Yoshua Bengio, Ian Goodfellow and Aaron C ...

随机推荐

  1. Java集合类学习笔记(Map集合)

    Map用于保存具有映射关系的数据,因此Map集合里保存着两组数据,一组用于保存Map的key,一组用于保存key所对应的value. Map的key不允许重复. HashMap和Hashtable都是 ...

  2. LeetCode 177 Nth-Highest Salary mysql,取第n条数据,limit子句 难度:1

    https://leetcode.com/problems/nth-highest-salary/ ATTENTION:limit 子句只能接受int常量,不能接受运算式 CREATE FUNCTIO ...

  3. keep the bar green to keep the code clean——Junit详解(二)

    测试用例&测试套件 举个栗子: 编写MyStack类模拟栈,并对其进行测试用例编写测试: 编写文件删除方法,并对其删除测试. 不再做演示,戳此获取代码 MyStack类: public cla ...

  4. [SHTSC 2014] 信号增幅仪

    最小覆盖圆算法.看着题解半蒙半抄的搞过去了… 主要参考以下http://blog.csdn.net/acdreamers/article/details/9406735http://blog.csdn ...

  5. Ubuntu的多文件编译以及c语言的数组、函数

    闲言少叙,直接切入主题. 一.Linux下的多文件编译(Ubuntu系统). 对于小程序来说,往往一个.c文件就足够了,里面包含了各种主函数和功能函数,以及函数的声明等等.但是这样的弊端主要有两点,一 ...

  6. DataTable 删除列 调整列顺序 修改列标题名称

    DataTable dt = new DataTable(); //删除列 dt.Columns.Remove("Sex"); dt.Columns.Remove("Ag ...

  7. undefined reference to `Spreadsheet::staticMetaObject'

    <C++ GUI Qt 4 编程>学习 一.遇到的问题 在学完第4章后,Spreasheet程序也已经写好了.在用 FindDialog 搜索时发现没有效果. 二.解决过程 调试跟踪代码, ...

  8. AppCode 2016.2.3 发布,支持 Swift3 的特性

    AppCode 2016.2.3 (build 162.2380.5)发布了,AppCode 是一个全新的 Objective-C.Swift 的集成开发环境,用于帮助开发 Mac.iPhone 和 ...

  9. unity5.0材质添加问题

    将Material拖放到Cube的Inspector视图中 材质添加图片背景,unity自带了很多种材质类型点击Shader下拉按钮可以更换材质类型为Diffuse camera preview: G ...

  10. mstsc连接服务器时如何避免每次在登陆窗口输入密码(rdp passwd decrypted )

    http://blog.chinaunix.net/uid-1835840-id-2831518.html 我们经常需要连接很多服务器,或者服务器的ip经常变动.把连接的密码保存在rdp配置文件里,用 ...