论文从理论的角度出发，对目标检测的域自适应问题进行了深入的研究，基于H-divergence的对抗训练提出了DA Faster R-CNN，从图片级和实例级两种角度进行域对齐，并且加入一致性正则化来学习域不变的RPN。从实验来看，论文的方法十分有效，这是一个很符合实际需求的研究，能解决现实中场景多样，训练数据标注有限的情况。

来源：晓飞的算法工程笔记公众号

论文: Domain Adaptive Faster R-CNN for Object Detection in the Wild

论文地址：https://arxiv.org/pdf/1803.03243.pdf
论文代码：https://github.com/yuhuayc/da-faster-rcnn

Introduction

目前，目标检测算法在公开数据上有很好的表现，但在现实世界环境中通常会有许多特殊的挑战，比如视角、物体外观、背景、光照以及图片质量的不同，使得测试数据和训练数据存在较大的跨偏移问题。

以自动驾驶为例，不同的公开数据集里的图片存在较大的差异，域偏移问题会导致明显的检测器性能下降。尽管收集更多的训练图片能解决域偏移的影响，但显然这不是最好的方案。

为了解决上面的问题，论文提出Domain Adaptive Faster R-CNN，最小化图片级别域偏移(图片尺寸、图片风格、光照等)以及实例级域偏移(目标外表、目标尺寸等)，每个模块学习一个域分类器并且通过对抗训练学习域不变的特征，并且加入分类器的一致性正则化来保证RPN学习到域不变的proposal。

论文的主要贡献如下：

从概率角度对跨域目标检测中的域偏移问题进行理论分析。
设计了两个域自适应模块来消除图片级别和实例级别的域差异。
提出一致性正则化来学习域不变RPN。
将提出的模块集成到Faster R-CNN中，进行端到端的训练。

Distribution Alignment with H-divergence

论文设计了H-divergence度量两个不同分布的样本集，定义$x$为特征向量，$x_{\mathcal{S}}$为源域样本$x_{\mathcal{T}}$为目标域样本，$h:x\to {0,1}$为域分类器，预测源域样本$x_{\mathcal{S}}$为0，预测目标域样本$x_{\mathcal{T}}$为1。假设$\mathcal{H}$为一组域分类器，则H-divergence的定义为：

$err_{\mathcal{S}}$和$err_{\mathcal{T}}$为$h(x)$在源域和目标域样本的预测误差，上述的公式意味着域距离$d_{\mathcal{H}}(\mathcal{S},\mathcal{T})$与域分类器的错误率成反比，若最好的域分类器的错误率越高，则源域和目标域的距离越近。

在神经网络中，定义网络$f$产生特征向量$x$，为了进行域对齐，需要网络$f$产生能够减小域距离$d_{\mathcal{H}}(\mathcal{S},\mathcal{T})$的特征向量，即最小化公式：

上述的公式可以通过对抗训练进行优化，论文采用gradient reverse

layer(GRL)进行实现，训练主干特征最大化域分类误差并且训练域分类器最小域分类误差进行对抗训练，最终得出鲁棒的特征。

Domain Adaptation for Object Detection

A Probabilistic Perspective

目标检测问题可表示为后验概率$P(C, B|I)$，$I$为图片，$B$为目标的bbox，$C\in {1,\cdots,K}$为目标类别。定义目标检测的样本的联合分布为$P(C,B,I)$，其中源域和目标域的分布是不一样的$P_{\mathcal{S}}(C,B,I) \neq P_{\mathcal{T}}(C,B,I)$

Image-Level Adaptation

根据贝叶斯公式，目标检测的联合分布可定义为

定义目标检测为covariate shift假设，设定域间的条件概率$P(C, B|I)$是一样的，域分布偏移主要来自于$P(I)$分布的不同。在Faster R-CNN中，$P(I)$即从图片提取的特征，所以要解决域偏移问题，就要控制$P_{\mathcal{S}}(I)=P_{\mathcal{T}}(I)$，保证不同域的图片提取的特征一致。

Instance-Level Adaptation

另一方面，目标检测的联合分布也可以定义为

基于covariate shift假设，设定域间的条件概率$P(C|B,I)$是一样的，域分布偏移主要来自于$P(B,I)$分布的不同，而$P(B,I)$即图像中bbox区域特征，所以为了解决域偏移问题，需要控制$P_{\mathcal{S}}(B,I)=P_{\mathcal{T}}(B,I)$，保证不同域的图片提取的相同目标的bbox特征不变。

需要注意的是，目标域是没有标注信息的，只能通过$P(B,I)=P(B|I)P(I)$获取，$P(B|I)$为bbox预测器，这样就需要RPN具备域不变性，为此，论文再添加了Joint Adaptation。

Joint Adaptation

考虑到$P(B,I)=P(B|I)P(I)$，而分布$P(B|I)$是域不变且非零的，因此有

Domain Adaptation Components

DA Faster R-CNN的架构如图2所示，包含两个域自适应模块以及一致性正则化模块，自适应模块加入GRL(gradient reverse layer)进行对抗训练，每个模块包含一个域分类器，最终的损失函数为

Image-Level Adaptation

为了消除图片级域分布不匹配，使用patch-based域分类器对特征图的每个特征点进行分类，每个特征点实际对应原图的一片区域$I_i$，这样特征点域分类器就等同于预测了每个图像中每个patch的域标签，这样的好处在于：

图片级表达的对齐通常能有助于消除整图带来的偏移。
由于目标检测算法的batch size通常很小，path-based能够提高域分类器的训练样本数。

定义$D_i$为第$i$个训练图片的域标签，$\phi_{u,v}(I_i)$为特征图上的一个激活值，$p^{(u,v)}_i$为域分类器的一个输出，则图片级自适应损失为

为了对齐域分布，需要同时优化域分类器最小化域分类损失以及优化主干网络的参数最大化域分类损失进行对抗训练，论文采用GRL进行实现，使用梯度下降来训练域分类器，回传梯度给主干时将梯度置为反符号。

Instance-Level Adaptation

实例级特征对齐有助于减少实例的局部差异，比如外表，大小，视角等。跟图片级特征对齐类似，定义$p_{i,j}$为第$i$个图片的第$j$个proposal，实例级的自适应损失为

同样的，在域分类器前添加GRL模块进行对抗训练。

Consistency Regularization

如前面的分析，强制域分类器的一致性有助于学习鲁棒的跨域bbox预测器，加入一致性正则化。由于图片级域分类器是对特征值进行分类的，取平均输出作为图片级概率，一致性正则化为

其中$|I|$为特征图的点数，$||\cdot||$为$\mathcal{l}_2$距离。

Experiments

Learning from Synthetic Data

SIM 10k是从GTAV中截取画面进行标注的数据集，Cityscapes为真实图片，这里对比从生成图片到真实图片的域转移。

Driving in Adverse Weather

Foggy Cityscapes通过生成雾来模拟真实场景，这里对比天气带来的域转移。

Cross Camera Adaptation

这里对比两个不同的训练数据集的域对齐。

Error Analysis on Top Ranked Detections

每个模块都能提升一定的准确率，而图片级对齐的背景错误率较高，这可能由于图片级对齐对RPN的提升更直接。

Image-level v.s. Instance-level Alignment

Consistency Regularization

CONCLUSION

论文从理论的角度出发，对目标检测的域自适应问题进行了深入的研究，基于H-divergence的对抗训练提出了DA Faster R-CNN，从图片级和实例级两种角度进行域对齐，并且加入一致性正则化来学习域不变的RPN。从实验来看，论文的方法十分有效，这是一个很符合实际需求的研究，能解决现实中场景多样，训练数据标注有限的情况。

如果本文对你有帮助，麻烦点个赞或在看呗～

更多内容请关注微信公众号【晓飞的算法工程笔记】

Domain Adaptive Faster R-CNN：经典域自适应目标检测算法，解决现实中痛点，代码开源 | CVPR2018的更多相关文章

旷世提出类别正则化的域自适应目标检测模型，缓解场景多样的痛点 | CVPR 2020
论文基于DA Faster R-CNN系列提出类别正则化框架,充分利用多标签分类的弱定位能力以及图片级预测和实例级预测的类一致性,从实验结果来看,类该方法能够很好地提升DA Faster R-CNN系 ...
深度学习笔记之目标检测算法系列（包括RCNN、Fast RCNN、Faster RCNN和SSD）
不多说,直接上干货! 本文一系列目标检测算法:RCNN, Fast RCNN, Faster RCNN代表当下目标检测的前沿水平,在github都给出了基于Caffe的源码. • RCNN RCN ...
目标检测算法的总结（R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD、FNP、ALEXnet、RetianNet、VGG Net-16）
目标检测解决的是计算机视觉任务的基本问题:即What objects are where?图像中有什么目标,在哪里?这意味着,我们不仅要用算法判断图片中是不是要检测的目标, 还要在图片中标记出它的位置 ...
基于候选区域的深度学习目标检测算法R-CNN，Fast R-CNN，Faster R-CNN
参考文献 [1]Rich feature hierarchies for accurate object detection and semantic segmentation [2]Fast R-C ...
经典论文系列 | 目标检测--CornerNet & 又名 anchor boxes的缺陷
前言: 目标检测的预测框经过了滑动窗口.selective search.RPN.anchor based等一系列生成方法的发展,到18年开始,开始流行anchor free系列,CornerNe ...
（五）目标检测算法之Faster R-CNN
系列博客链接: (一)目标检测概述 https://www.cnblogs.com/kongweisi/p/10894415.html (二)目标检测算法之R-CNN https://www.cnbl ...
论文笔记：目标检测算法（R-CNN，Fast R-CNN，Faster R-CNN，FPN，YOLOv1-v3）
R-CNN(Region-based CNN) motivation:之前的视觉任务大多数考虑使用SIFT和HOG特征,而近年来CNN和ImageNet的出现使得图像分类问题取得重大突破,那么这方面的 ...
【深度学习】目标检测算法总结（R-CNN、Fast R-CNN、Faster R-CNN、FPN、YOLO、SSD、RetinaNet）
目标检测是很多计算机视觉任务的基础,不论我们需要实现图像与文字的交互还是需要识别精细类别,它都提供了可靠的信息.本文对目标检测进行了整体回顾,第一部分从RCNN开始介绍基于候选区域的目标检测器,包括F ...
第三十一节，目标检测算法之 Faster R-CNN算法详解
Ren, Shaoqing, et al. “Faster R-CNN: Towards real-time object detection with region proposal network ...

随机推荐

Spring_Bean的配置方式
1.通过工厂方法配置bean beans-factory.xml <?xml version="1.0" encoding="UTF-8"?> &l ...
关于ueditor编译器
取消自动保存提示.edui-editor-messageholder.edui-default{ visibility:hidden;} Qiyuwen 1033935470@qq.com
Java实现蓝桥杯算法训练天数计算
试题算法训练天数计算问题描述编写函数求某年某月某日(**** ** **)是这一年的第几天 .提示:要考虑闰年,闰年的2月是29天(闰年的条件:是4的倍数但不是100的倍数,或者是400的倍数 ...
Java实现 LeetCode 646 最长数对链（暴力）
646. 最长数对链给出 n 个数对. 在每一个数对中,第一个数字总是比第二个数字小. 现在,我们定义一种跟随关系,当且仅当 b < c 时,数对(c, d) 才可以跟在 (a, b) 后面. ...
Java实现 LeetCode 599 两个列表的最小索引总和（使用hash提高效率）
599. 两个列表的最小索引总和假设Andy和Doris想在晚餐时选择一家餐厅,并且他们都有一个表示最喜爱餐厅的列表,每个餐厅的名字用字符串表示. 你需要帮助他们用最少的索引和找出他们共同喜爱的餐厅 ...
Java实现第八届蓝桥杯图形排版
标题:图形排版小明需要在一篇文档中加入 N 张图片,其中第 i 张图片的宽度是 Wi,高度是 Hi. 假设纸张的宽度是 M,小明使用的文档编辑工具会用以下方式对图片进行自动排版: 1. 该工具会按照 ...
容器技术之Docker私有镜像仓库docker-distribution
在前边的博客中我们说到docker的架构由docker客户端.服务端以及仓库组成:docker仓库就是用来存放镜像的地方:其实docker registry我们理解为存放docker镜像仓库的仓库比较 ...
JSP基础知识点（转传智）
一.JSP概述 1.JSP:Java Server Pages(运行在服务器端的页面).就是Servlet. 学习JSP学好的关键:时刻联想到Servlet即可. 2.JSP的原理 ...
本地配置gitee
一下载工具 Git-2.62.0-64-bit.exe 以上工具版本号不需要一样,安装完前两个后重新启动系统,再安装第3个. 二码云网站注册 https://gitee.com/ 使用邮箱注册注 ...
树莓派配置文档config.txt说明
原文连接:http://elinux.org/RPi_config.txt 由于树莓派并没有传统意义上的BIOS, 所以现在各种系统配置参数通常被存在"config.txt"这个文 ...

Domain Adaptive Faster R-CNN：经典域自适应目标检测算法，解决现实中痛点，代码开源 | CVPR2018

Introduction

Distribution Alignment with H-divergence

Domain Adaptation for Object Detection

A Probabilistic Perspective

Image-Level Adaptation

Instance-Level Adaptation

Joint Adaptation

Domain Adaptation Components

Image-Level Adaptation

Instance-Level Adaptation

Consistency Regularization

Experiments

Learning from Synthetic Data

Driving in Adverse Weather

Cross Camera Adaptation

Error Analysis on Top Ranked Detections

Image-level v.s. Instance-level Alignment

Consistency Regularization

CONCLUSION

Domain Adaptive Faster R-CNN：经典域自适应目标检测算法，解决现实中痛点，代码开源 | CVPR2018的更多相关文章

随机推荐

热门专题