Introduction

文章主要提出了 Dynamic Graph Matching(DGM)方法,以非监督的方式对多个相机的行人视频中识别出正确匹配、错误匹配的结果。本文主要思想如下图:

具体而言:方法采用迭代的方式,每次迭代生成一个二部图(bipartite),估计标签并学习区分矩阵。通过不断迭代,标签准确率提高,矩阵区分度更显著。方法加入了重新加权策略(re-weighting),提供软标签而不是硬标签,来降低标签的误差。

Graph Matching for Video Re-ID

(1)挖掘标签信息:

假设相机A拍摄的未标签图 GA 包含 m 个行人,表示为 [A] = {xai | i = 1, 2, ..., m};

相机B拍摄的图 GB 包含 n 个行人,表示为 [B]0 = {xbj | j = 0, 1, 2, ..., n},[B]0 指除了 n 个元素外包含0元素(为什么加上0元素?)。

目标函数:

其中 y = {yij} 表示 i 和 j 是否表示同一个行人,C = {C(i, j)} 为损失矩阵,其每个元素表示 i 到 j 的距离,计算为:(个人觉得这只是粗略提一下,具体损失函数在下面细说)

(2)惩罚函数:

总体惩罚函数:

Sequence Cost (CS) 惩罚匹配视频序列之间的差距:

Neighborhood Cost(CN)惩罚匹配视频邻居之间的差距:

其中和 表示相机A的第 i 个邻居行人和相机B的第 j 个邻居行人(即同一个人),k 为邻居参数,在本实验中 k 设置为5.

存在约束条件:

其中 分别是的邻居;

由于不等式的右侧三项均是很小的正项,因此也是个很小的正项,即:

Dynamic Graph Matching

(1)标签重新加权:

① positive re-weighting:

对于 y = 1 的项,设置软标签,可以过滤一些误报,然后分配不同的正样本对不同的权重:

② negative re-weighting:

对于 y = 0 的项,设置硬标签,过滤比较明显的负样本对:

其中设置 ,Cm 为 C 的均值,可参照下图进行理解:

总结:

(2)采用重新加权标签进行矩阵学习:

矩阵学习损失函数:

其中 c0 位一个正数,定义为两个相机的平均距离,马氏距离函数为:

矩阵学习目标函数:

其中 wij 为平衡正负样本对的平衡因子,如果为正样本对,,如果是负样本对,

(3)算法描述:

Experiment

(1)实验设置:

① 数据集:PRID-2011、iLIDS-VID、MARS;

② 特征提取:提取帧特征 LOMO,所有图片帧正规化为 128*64,采用PCA方法将特征维度压缩至600维;

③ 参数设置:迭代次数10次,λ = 0.5;

④ 实验环境:PC with i7-4790K @4.0 GHz CPU and 16GB RAM

(2)自我评估:

① 迭代效果:

② 重新加权效果:

③ 标签评估效果:

(3)对比监督学习:

(4)其他方法对比实验:

论文阅读笔记(十七)【ICCV2017】:Dynamic Label Graph Matching for Unsupervised Video Re-Identification的更多相关文章

  1. 论文阅读笔记十七:RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation(CVPR2017)

    论文源址:https://arxiv.org/abs/1611.06612 tensorflow代码:https://github.com/eragonruan/refinenet-image-seg ...

  2. 论文阅读笔记(十九)【ITIP2017】:Super-Resolution Person Re-Identification With Semi-Coupled Low-Rank Discriminant Dictionary Learning

    Introduction (1)问题描述: super resolution(SP)问题:Gallery是 high resolution(HR),Probe是 low resolution(LR). ...

  3. 论文阅读笔记(十八)【ITIP2019】:Dynamic Graph Co-Matching for Unsupervised Video-Based Person Re-Identification

    论文阅读笔记(十七)ICCV2017的扩刊(会议论文[传送门]) 改进部分: (1)惩罚函数:原本由两部分组成的惩罚函数,改为只包含 Sequence Cost 函数: (2)对重新权重改进: ① P ...

  4. [论文阅读笔记] GEMSEC,Graph Embedding with Self Clustering

    [论文阅读笔记] GEMSEC: Graph Embedding with Self Clustering 本文结构 解决问题 主要贡献 算法原理 参考文献 (1) 解决问题 已经有一些工作在使用学习 ...

  5. [论文阅读笔记] Are Meta-Paths Necessary, Revisiting Heterogeneous Graph Embeddings

    [论文阅读笔记] Are Meta-Paths Necessary? Revisiting Heterogeneous Graph Embeddings 本文结构 解决问题 主要贡献 算法原理 参考文 ...

  6. 论文阅读笔记(二十一)【CVPR2017】:Deep Spatial-Temporal Fusion Network for Video-Based Person Re-Identification

    Introduction (1)Motivation: 当前CNN无法提取图像序列的关系特征:RNN较为忽视视频序列前期的帧信息,也缺乏对于步态等具体信息的提取:Siamese损失和Triplet损失 ...

  7. [论文阅读笔记] Fast Network Embedding Enhancement via High Order Proximity Approximati

    [论文阅读笔记] Fast Network Embedding Enhancement via High Order Proximity Approximation 本文结构 解决问题 主要贡献 主要 ...

  8. 论文阅读笔记 - YARN : Architecture of Next Generation Apache Hadoop MapReduceFramework

    作者:刘旭晖 Raymond 转载请注明出处 Email:colorant at 163.com BLOG:http://blog.csdn.net/colorant/ 更多论文阅读笔记 http:/ ...

  9. 论文阅读笔记 - Mesos: A Platform for Fine-Grained ResourceSharing in the Data Center

    作者:刘旭晖 Raymond 转载请注明出处 Email:colorant at 163.com BLOG:http://blog.csdn.net/colorant/ 更多论文阅读笔记 http:/ ...

随机推荐

  1. qt5实现简单布局

    layout.h #ifndef LAYOUT_H #define LAYOUT_H #include <QtWidgets/QDialog> #include <QLabel> ...

  2. linux入门系列9--用户管理及文件权限控制

    ​ 前面文章分享了Linux下常用命令以及Shell编程相关知识,本节继续学习Linux用户管理及文件权限控制. ​ Linux是多用户多任务操作系统,具有很好的稳定性和安全性.既然是多用户,那就意味 ...

  3. 每日一练_PAT_B1001

    鲁宾逊先生有一只宠物猴,名叫多多.这天,他们两个正沿着乡间小路散步,突然发现路边的告示牌上贴着一张小小的纸条:“欢迎免费品尝我种的花生!——熊字”.鲁宾逊先生和多多都很开心,因为花生正是他们的最爱.在 ...

  4. 【Java并发工具类】Semaphore

    前言 1965年,荷兰计算机科学家Dijkstra提出的信号量机制成为一种高效的进程同步机制.这之后的15年,信号量一直都是并发编程领域的终结者.1980年,管程被提出,成为继信号量之后的在并发编程领 ...

  5. 《C# 爬虫 破境之道》:第二境 爬虫应用 — 第五节:小总结带来的优化与重构

    在上一节中,我们完成了一个简单的采集示例.本节呢,我们先来小结一下,这个示例可能存在的问题: 没有做异常处理 没有做反爬应对策略 没有做重试机制 没有做并发限制 …… 呃,看似平静的表面下还是隐藏着不 ...

  6. [Effective Java 读书笔记] 第三章类和接口 第十八--十九条

    十八条 接口优于抽象类 接口的特点: 1.一个类可以实现多个接口,不能继承多个类(抽象类) 2.接口不能有具体的方法实现,只定义标准类型 骨架类: 即实现一个abstract类来实现接口,提供给其他类 ...

  7. 【WPF学习】第四十七章 WriteableBitmap类

    WPF允许使用Image元素显示位图.然而,按这种方法显示图片的方法完全是单向的.应用程序使用现成的位图,读取问题,并在窗口中显示位图.就其本身而言,Image元素没有提供创建和编辑位图信息的方法. ...

  8. objectarx 多段线自交检查

    只支持直线段的多段线检查,因为主要用了初中的知识,一元一次方程求交点,详细的说就是,把多段线上相邻的两个点构成一条直线段,然后每条直线段与剩余的直线段求交点,一条直线段就代表一个一元一次方程,知道两点 ...

  9. 中文维基百科分类提取(jwpl)--构建知识图谱数据获取

    首先感谢 : 1.https://blog.csdn.net/qq_39023569/article/details/88556301 2.https://www.cnblogs.com/Cheris ...

  10. mysql 查询指定数据库所有表, 指定表所有列, 指定列所有表 所有外键及索引, 以及索引的创建和删除

    查询指定 数据库 中所有 表 (指定数据库的,所有表) // 可以把 TABLE_NAME 换成 * 号, 查看更丰富的信息 SELECT TABLE_NAME FROM information_sc ...