Person Transfer GAN to Bridge Domain Gap for Person Re-identification
注:原创不易,转载请务必注明原作者和出处,感谢支持!
相关背景
行人再识别(Person Re-identification, Person ReID)是指给定一个行人的图片/视频(probe),然后从一个监控网络所拍摄的图片/视频(gallery)库中识别出该行人的这个一个过程。其可以看做是一个基于内容的图像检索(CBIR)的一个子问题。
论文题目:Person Transfer GAN to Bridge Domain Gap for Person Re-identification
来源:CVPR 2018
摘要:Although the performance of person Re-Identification(ReID) has been significantly boosted, many challengins issues in real scenarios have not been fully investigated, e.g., the complex scenes and lighting variations, viewpoint and pose changes, and the large number of identities in a camera network. To facilitate the research towards conquering those issues, this paper contributes a new dataset called MSMT17 with many important features, e.g., 1) the raw videos are taken by an 15-camera network deployed in both indoor and outdoor scenes, 2) the videos cover a long period of time and present complex lighting variations, and 3) it contains currently the largest number of annotated identities, i.e. 4101 identities and 126441 bounding boxes. We also observe that, domain gap commonly exists between datasets, which essentially causes severe performance drop when training and testing on different datasets. This results in that available training data cannot be effectively leveraged for new testing domains. To relieve the expensive costs of annotating new training samples, we propose a Person Transfer Generative Adversarial Network(PTGAN) to bridge the domain gap. Comprehensive experiments show that the domain gap could be substantially narrowed-down by the PTGAN.
主要内容
MSMT17
数据集网址:http://www.pkuvmc.com
针对目前Person ReID数据集存在的缺陷:
- 数据量规模小
- 场景单一
- 数据采集的时间跨度短,光照变化不明显
- 数据标注方式不合理
本文发布了一个新的Person ReID数据集——MSMT17。MSMT17是目前为止数据量规模最大的Person ReID数据集。共有126441个Bounding Boxes,4101个Identities,15个Cameras,涵盖了indoor和outdoor两个场景,Detector用的是更为先进的Faster RCNN。

Person Transfer GAN(PTGAN)
Domain Gap现象
举个例子,比如在CUHK03数据集上训练好的模型放到PRID数据集上测试,结果rank-1的准确率只有2.0%。在不同的Person ReID数据集上进行算法的训练和测试会导致ReID的性能急剧下降。而这种下降是普遍存在的。这意味着基于旧有的训练数据训练到的模型无法直接应用在新的数据集中,如何降低Domain Gap的影响以利用好旧有的标注数据很有研究的必要。为此本文提出了PTGAN模型。
造成Domain Gap现象的原因是复杂的,可能是由于光照、图像分辨率、人种、季节和背景等复杂因素造成的。
比如,我们在数据集B上做Person ReID任务时,为了更好地利用现有数据集A的训练数据,我们可以试着将数据集A中的行人图片迁移到目标数据集B当中。但由于Domain Gap的存在,在迁移时,要求算法能够做到以下两点:
- 被迁移的行人图片应该具有和目标数据集图片相一致的style,这是为了尽可能地降低因为style不一致所导致的Domain Gap所带来的性能下降。
- 具有区分不同行人能力的外观特征(appearance)和身份线索(identity cues)应该在迁移之后保持不变!因为迁移前和迁移后的行人具有相同的label,即他们应该是同一个人。
因为Person Transfer与Unpaired Image-to-Image Translation任务类似,所以本文选择在Unpaired Image-to-Image Translation任务中表现优异的Cycle-GAN模型基础上,提出了Person Transfer GAN模型。PTGAN模型的loss函数\(L_{PTGAN}\)被设计成如下公式:
\[
L_{PTGAN} = L_{Style} + \lambda_1L_{ID}
\]
其中:
\(L_{Style}\):the style loss
\(L_{ID}\):the identity loss
\(\lambda_1\):the parameter for the trade-off between the two losses above
定义下列符号,则\(L_{Style}\)可以表示成:
\(G\):the style mapping function from dataset A to dataset B
\(\overline{G}\):the style mapping function from dataset B to dataset A
\(D_A\):the style discriminator for dataset A
\(D_B\):the style discriminator for dataset B
\[
L_{Style} = L_{GAN}(G, D_B, A, B) + L_{GAN}(\overline{G}, D_A, B, A) + \lambda_2L_{cyc}(G, \overline{G})
\]
其中:
\(L_{GAN}\):the standard adversarial loss
\(L_{cyc}\):the cycle consistency loss
定义下列符号,则\(L_{ID}\)可以表示成:
\(a\)和\(b\):original image from dataset A and B
\(G(a)\)和\(\overline{G}(b)\):transferred image from image a and b
\(M(a)\)和\(M(b)\):forground mask of image a and b
\[
L_{ID} = \mathbb{E}_{a \sim p_{data}(a)}\left[\left\| (G(a) - a) \odot M(a)\right \|_2\right] + \mathbb{E}_{b \sim p_{data}(b)}\left[\left\| (\overline{G}(b) - b) \odot M(b)\right \|_2\right]
\]
迁移效果图

总结
- 本文发布了一个更接近实际应用场景的新数据集MSMT17,因其更接近实际的复杂应用场景,使得MSMT17数据集更具挑战性和研究价值
- 本文提出了一个能够降低Domain Gap影响的PTGAN模型,并通过实验证明其有效性
Person Transfer GAN to Bridge Domain Gap for Person Re-identification的更多相关文章
- Can Microsoft’s exFAT file system bridge the gap between OSes?
转自:http://arstechnica.com/information-technology/2013/06/review-is-microsofts-new-data-sharing-syste ...
- 贫血模型;DTO:数据传输对象(Data Transfer Object);AutoMapper ;Domain Model(领域模型);DDD(领域驱动设计)
====================== 我自己的理解 ========================== 一: DTO 我自己的理解,就是 比如你有一个类,跟数据库的table表结构一模一 ...
- (转)Awsome Domain-Adaptation
Awsome Domain-Adaptation 2018-08-06 19:27:54 This blog is copied from: https://github.com/zhaoxin94/ ...
- CVPR2018资源汇总
CVPR 2018大会将于2018年6月18~22日于美国犹他州的盐湖城(Salt Lake City)举办. CVPR2018论文集下载:http://openaccess.thecvf.com/m ...
- CVPR-2018 那些有趣的新想法
Taylor Guo @ Shanghai - 2018.10.18 缘起 还有什么比顶级会议更适合寻找有趣新想法的地方吗?我们从CVPR 2018 计算机视觉和模式识别的顶级会议中发现了很多有趣的东 ...
- 行人重识别(ReID) ——基于深度学习的行人重识别研究综述
转自:https://zhuanlan.zhihu.com/p/31921944 前言:行人重识别(Person Re-identification)也称行人再识别,本文简称为ReID,是利用计算机视 ...
- AI佳作解读系列(六) - 生成对抗网络(GAN)综述精华
注:本文来自机器之心的PaperWeekly系列:万字综述之生成对抗网络(GAN),如有侵权,请联系删除,谢谢! 前阵子学习 GAN 的过程发现现在的 GAN 综述文章大都是 2016 年 Ian G ...
- A Gentle Introduction to Transfer Learning for Deep Learning | 迁移学习
by Jason Brownlee on December 20, 2017 in Better Deep Learning Transfer learning is a machine learni ...
- PatentTips - Cross-domain data transfer using deferred page remapping
BACKGROUND OF THE INVENTION The present invention relates to data transfer across domains, and more ...
随机推荐
- 阿里云服务器部署Java Web项目全过程
最近需要将一个Java Web项目部署到服务器上,方便多人共享访问.这也是我第一次接触服务器之类的东西,也花了一点时间,最终总算部署成功,写下一篇文章记录以便日后回顾. 购买服务器 第一步当然是需要购 ...
- C#零基础入门-2-Visual Studio (VS)程序初始化及各组成部分
X:\Program Files (x86)\Microsoft Visual Studio 14.0\Common7\IDE\devenv.exe 可以使用桌面快捷方式启动,也可以从开始菜单启动,还 ...
- Node.js在指定的图片模板上生成二维码图片并附带底部文字说明
在Node.js中,我们可以通过qr-image包直接在后台生成二维码图片,使用方法很简单: var qr = require('qr-image'); exports.createQRImage = ...
- Java基础系列--07_String、StringBuffer和StringBuilder
String类 (1)字符串:字符串是常量:它们的值在创建之后不能更改,存储在堆中. 如果字符串多次赋值,其实是每次重新赋值的时候程序都先在内存中寻找已开辟的空间是否存在该值;如果 ...
- LVM 磁盘分区扩容
前提:将磁盘中未分区磁盘进行分区操作 https://www.cnblogs.com/guoxiangyue/p/10033367.html 然后进行vg扩容 pvcreate /dev/sdc lv ...
- 逆向-攻防世界-logmein
iDA载入程序,shift+F12查看关键字符串,找到双击来到所在地址,进入函数 然后进入主函数, 经过分析,可以得出:输入的字符要等于 经过处理的v7和v8的异或.v8很明显,但是v7是怎么回事呢 ...
- 01-Django介绍和安装
01-Django介绍和安装 1.Django介绍 1.1介绍 Django是一个开放源代码的Web应用框架,由Python写成.采用了MVC的框架模式,即模型M(Model),视图V(View)和控 ...
- 最新:百度春节抢百万游戏--汤圆向前冲--辅助工具v1.0.0.2
https://www.cnblogs.com/Charltsing/p/ADBJumpTY.html 联系QQ:564955427 本程序为Windows版,不要在手机里面打开. 汤圆向前冲辅助工具 ...
- Excel阅读模式/聚光灯开发技术序列作品之三 高级自定义任务窗格开发原理简述—— 隐鹤
Excel阅读模式/聚光灯开发技术序列作品之三 高级自定义任务窗格开发原理简述—— 隐鹤 1. 引言 Excel任务窗格是一个可以用来存放各种常用命令的侧边窗口(准确的说是一个可以停靠在类名为x ...
- JS 获取某个容器控件中id包含制定字符串的控件id列表
//获取某容器控件中id包含某字符串的控件id列表 //参数:容器控件.要查找的控件的id关键字 function GetIdListBySubKey(container,subIdKey) { va ...