论文笔记：Auto-ReID: Searching for a Part-aware ConvNet for Person Re-Identification

Auto-ReID: Searching for a Part-aware ConvNet for Person Re-Identification

2019-03-26 15:27:10

Paper：https://arxiv.org/pdf/1903.09776.pdf

1. Background and Motivation：

本文将 NAS 的技术用到了 person re-ID 上，但是并非简单的用 NAS 技术来搜索一种 ConvNet，本文考虑到 re-ID 的特色，将其结合到 NAS 中。当然之所以这么做，是因为作者认为专门为 classification 任务所设计的 CNN backbones，并不是完美的适合 re-ID 的任务，因为其网络模型可能含有 noisy, redundancy and missing components。作者认为 NAS 的方法用到 re-ID 的任务上，有如下三个挑战：

1). the body structure information 在 re-ID 中扮演着重要的作用，但是，现有的 NAS 方法却无法建模；

2). re-ID 算法通常在 CNN backbone 的 tail 部分来编码结构化信息，但是，大部分这些方法都是依赖于 backbone 的。当采用不同 backbone 的时候，需要充分的手工调整超参数。

3). re-ID 本质上算是一种 retrieval task，但是大部分的 NAS 方法缺只是被设计用于 classification。由于 retrieval 和 classification 有不同的目标，现有的 NAS 算法无法直接用于 re-ID 的问题。

基于上述观察和分析，作者设计了一种新的 Auto-reID 算法来解决上述三个问题。而这种方法的关键在于：design a new re-ID search space，这种搜索空间可以将身体结构化的信息作为可操作的 CNN 成分。另外，作者也将 retrieval loss 结合到搜索机制中，使得搜索的结果更加适合 re-ID 任务。那么，本文所提出的 re-ID search space 和 re-ID search algorithm 可以确保找到一个 efficient 和 effective 的网络结构，如图 1 所示：

2. Methodology：

2.1 Preliminaries:

许多 NAS 的方法都是许多 neural cell 的堆叠，而一个 cell 包含多个 layers，将之前 cells 的输出作为输入，然后产生新的输出 tensor。作者也服从这种套路，来搜索适合的 re-ID 网络结构。

具体来说，一个 neural cell 可以看做是一个 directed acyclic graph （DAG），假设有 B 个 blocks。每一个 block 有如下三个步骤：

1). 将 2 tensors 作为输入；

2). 在输入 tensors 上分别采用 two operations；

3). 将这两个 tensors 进行 sum。

而所选择的操作，就是从一个候选操作集合 O 上选择。本文中，采用如下的 operations：

(1) 3×3 max pooling,

(2) 3×3 average pooling,

(3) 3×3 depth-wise separable convolution,

(4) 3×3 dilated convolution,

(5) zero operation (none),

(6) identity mapping.

第 c 个 cell 的第 i 个 block 可以表达为如下的四元组：另外，第 c 个 cell 的第 i 个 block 的输出是：

其中，I are selected from the candidate input tensors, which consists of output tensors from the last two neural cells and output tensors from the previous block in the current cell. 为了搜索公式 1 中的操作符 O 以及 I，我们将操作符选择的问题进行松弛，用 softmax 来对每一个 operation 进行打分：

其中，$\alpha$ 代表对于一个 neural cell 的拓扑结构，称为：architecture parameters。我们将所有 O 中的参数记为 w，称为 operation parameters，一个典型的可微分的 NAS 算法，联合的在 training set 上进行 w 的训练，在 validation set 上进行 $\alpha$ 的训练。在训练之后，H 和 I 之间的强度（strength）定义为：

其中，带有最大强度的 H 被选择作为 I，做大权重的操作符，被选为 $O_{i1}^c$。上述常规的 NAS 搜索方法 DARTS 是被设计用于 classification task，所以作者考虑将该机制结合到 re-ID 任务中。

2.2 Re-ID Search Algorithm：

作者尝试将 the re-ID specific knowledge 结合到搜索算法中。从网络结构的角度来说，作者利用 ResNet 的 macro structure 作为 re-ID 的backbone，每一个 residual layer 被 neural cell 所替换。而这种 neural cell 的结构，就是搜索出来的。

上述过程，简述了特征变换的过程。另外一个重要的问题是损失函数的定义，在 classification task 中 cross-entropy loss function 当然是首选，那么问题是 re-ID task 并非简单的分类问题。所以，作者在这里做了些许的改变，引入了 triplet loss 来进一步改善网络的训练过程。联合的损失函数表示如下：

其中，交叉熵损失函数和三元组损失函数的定义分别如下所示：

上述就是损失函数的定义。算法流程如下所示：

2.3. ReID Search Space with Part-aware Module：

该小节主要是介绍作者设计的 part-aware module 来改善搜索空间的问题。作者也给出了一个 pipeline，来说明该过程：

具体的操作其实就是对 feature map 进行 part 的划分，然后计算其 self-attention，进行 attend。然后将 attend 之后的 local feature，分别与原始的 input feature 进行组合，然后用 1*1 的卷积操作进行降维处理，得到 output tensor。这么做的优势是什么呢？作者提到本文所设计的 part-aware module 可以捕获有用的 body part cue，并将这种结构化信息融合到 input feature 中。本文所提出的 part-aware module 的参数大小和数量和 3*3 的depth-wise separable convlution 是相当的。所以，并不会显著的影响 NAS 的效率。

3. Experimental Results：

4. Future Works:

在未来工作中，作者提到本文是首次进行 re-ID 网络结构的设计，仅考虑到了一种可能的特定模块。更多的关于 re-ID 的特定领域知识，都可以考虑进来。以得到更好的 re-ID 的性能。

论文笔记：Auto-ReID: Searching for a Part-aware ConvNet for Person Re-Identification的更多相关文章

Person Re-identification 系列论文笔记（一）：Scalable Person Re-identification: A Benchmark
打算整理一个关于Person Re-identification的系列论文笔记,主要记录近年CNN快速发展中的部分有亮点和借鉴意义的论文. 论文笔记流程采用contributions->algo ...
Deep Learning论文笔记之（四）CNN卷积神经网络推导和实现（转）
Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文, ...
论文笔记之：Visual Tracking with Fully Convolutional Networks
论文笔记之:Visual Tracking with Fully Convolutional Networks ICCV 2015 CUHK 本文利用 FCN 来做跟踪问题,但开篇就提到并非将其看做 ...
Deep Learning论文笔记之（八）Deep Learning最新综述
Deep Learning论文笔记之(八)Deep Learning最新综述 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感觉看完 ...
Twitter 新一代流处理利器——Heron 论文笔记之Heron架构
Twitter 新一代流处理利器--Heron 论文笔记之Heron架构标签(空格分隔): Streaming-process realtime-process Heron Architecture ...
Deep Learning论文笔记之（六）Multi-Stage多级架构分析
Deep Learning论文笔记之(六)Multi-Stage多级架构分析 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些 ...
Multimodal —— 看图说话（Image Caption）任务的论文笔记（一）评价指标和NIC模型
看图说话(Image Caption)任务是结合CV和NLP两个领域的一种比较综合的任务,Image Caption模型的输入是一幅图像,输出是对该幅图像进行描述的一段文字.这项任务要求模型可以识别图 ...
论文笔记(1)：Deep Learning.
论文笔记1:Deep Learning 2015年,深度学习三位大牛(Yann LeCun,Yoshua Bengio & Geoffrey Hinton),合作在Nature ...
论文笔记(2)：A fast learning algorithm for deep belief nets.
论文笔记(2):A fast learning algorithm for deep belief nets. 这几天继续学习一篇论文,Hinton的A Fast Learning Algorithm ...

随机推荐

lnmp 切换PHP版本，并且安装swoole
lnmp 切换php版本进入 lnmp 安装的目录,进入install.sh 的目录执行: sudo ./install.sh mphp 备注: find / -name install.sh 备注 ...
3.3.1 MyBatis框架介绍
MyBatis框架介绍 1. 什么是框架 (1) 框架是偷懒的程序员将代码进行封装, 之后进行重复使用的过程. (2) 框架其实是一个半成品, 以连接数据库为例, 连接数据库使用的驱动, url, 用 ...
B. Lynyrd Skynyrd
传送门: 题意:给出 n,m,q 然后给出模板串,从1-n数字只出现一次,然后给出长度为m的要询问的串. q组询问:每组询问输出 ‘1’或者‘0’ 每组询问一对x,y 问在x到y中有没有模板串 ...
MFC Dialog使用
1. OnInitDialog 对话框初始化函数在MFC主对话框OnInitDialog()中弹出对话框 BOOL CXXXDlg::OnInitDialog() { CDialogEx::OnIn ...
django--orm对象关系映射之常用的增删改查
1.查询表里所有数据 book=models.Book.objects.all() 2.条件查询 book = models.Book.objects.filter(id=1).first() # 查 ...
设置VS2017背景图片
设置方法很简单:安装扩展ClaudiaIDE 1.在这里下载扩展,https://visualstudiogallery.msdn.microsoft.com/9ba50f8d-f30c-4e33-a ...
读C#图解教程的笔记
第一章记录: 格式化字符串 Console.WriteLine("{0:D}", 123456789);//表示十进制字符串 Console.WriteLine("{0: ...
SpringBoot缓存之redis--最简单的使用方式
第一步:配置redis 这里使用的是yml类型的配置文件 mybatis: mapper-locations: classpath:mapping/*.xml spring: datasource: ...
JD-GUI反编译出现ERROR
反编译Jar包一般使用JD-GUI工具,很方便.但有时会出现异常,如下: 此时,可以辅助使用另一个工具来反编译代码:Luyten(https://github.com/deathmarine/Luyt ...
Visual Studio 项目依赖
在解决方案上点击右键,选择项目依赖项选择需要发布的所有依赖项目主要是为了解决插件项目DLL无法生成的问题

论文笔记：Auto-ReID: Searching for a Part-aware ConvNet for Person Re-Identification

论文笔记：Auto-ReID: Searching for a Part-aware ConvNet for Person Re-Identification的更多相关文章

随机推荐

热门专题