论文笔记之：Learning Cross-Modal Deep Representations for Robust Pedestrian Detection

Learning Cross-Modal Deep Representations for Robust Pedestrian Detection

2017-04-11 19:40:22

Motivation：

　　本文主要是考虑了在光照极端恶劣的情况下，如何充分的利用 thermal data 进行协助学习提升可见光图像的特征表达能力，而借鉴了 ICCV 2015 年的一个文章，称为：监督迁移的方法，以一种模态的特征为 label，以监督学习的方式实现无监督学习。说到这里可能比较让人糊涂，什么叫：以监督学习的方式实现无监督学习？说道监督学习，因为这里 training RGB modal 是以监督学习的方式进行训练的，因为标签是以 thermal 提取出来的特征为调整的目标（称为 target label）。说到无监督学习，其实这里没有用到人工标注的数据，只是用到了网络提取出来的 thermal feature, 而这就是比较好的地方了。这也是那个 Supervised Transfer 文章的主要卖点，而这里作者将其应用到 multi-modal 的情况下。

　　所以，很自然的就可以知道网络的大致设计：

　　1. 首先要有特征的跨模态迁移，算是第一阶段：

　　那么，可以看到上图就是刚刚讲的监督学习的方式进行特征迁移的过程。

　　2. 有了这个增强的特征，我们就可以利用这个进行黑暗环境下的行人检测了：

　　看到这个网络的设计，主要是原始特征和后续增强特征的组合了，然后进行最终的 bounding box regression 以及 softmax 分类。

　　从而完成整个行人检测算法。效果之所以有提升，主要在于第二个网络提供了更好的黑暗环境下从 thermal data 那里学习到的 feature。

　　这就是文章的主题思想了。。。。

　　作者在两个数据集上做了相关的实验。。。具体结果见原文了。

　　Reference:

　　1. Learning Cross-Modal Deep Representations for Robust Pedestrian Detection.　In CVPR, 2017.

　　2. S. Gupta, J. Hoffman, and J. Malik. Cross modal distillation for supervision transfer. In CVPR, 2016.

　　3. J. Hoffman, S. Gupta, and T. Darrell. Learning with side information through modality hallucination. In CVPR, 2016

论文笔记之：Learning Cross-Modal Deep Representations for Robust Pedestrian Detection的更多相关文章

Deep Learning论文笔记之（八）Deep Learning最新综述
Deep Learning论文笔记之(八)Deep Learning最新综述 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感觉看完 ...
Deep Learning 17：DBN的学习_读论文“A fast learning algorithm for deep belief nets”的总结
1.论文“A fast learning algorithm for deep belief nets”的“explaining away”现象的解释: 见:Explaining Away的简单理解 ...
【论文笔记】Learning Fashion Compatibility with Bidirectional LSTMs
论文:<Learning Fashion Compatibility with Bidirectional LSTMs> 论文地址:https://arxiv.org/abs/1707.0 ...
论文笔记：Learning Attribute-Specific Representations for Visual Tracking
Learning Attribute-Specific Representations for Visual Tracking AAAI-2019 Paper:http://faculty.ucmer ...
论文笔记：Learning how to Active Learn: A Deep Reinforcement Learning Approach
Learning how to Active Learn: A Deep Reinforcement Learning Approach 2018-03-11 12:56:04 1. Introduc ...
论文笔记：A Review on Deep Learning Techniques Applied to Semantic Segmentation
A Review on Deep Learning Techniques Applied to Semantic Segmentation 2018-02-22 10:38:12 1. Intr ...
论文笔记: Mutual Learning to Adapt for Joint Human Parsing and Pose Estimation
Mutual Learning to Adapt for Joint Human Parsing and Pose Estimation 2018-11-03 09:58:58 Paper: http ...
论文笔记：Learning wrapped guidance for blind face restoration
这篇论文主要是讲人脸修复的,所谓人脸修复,其实就是将低清的,或者经过压缩等操作的人脸图像进行高清复原.这可以近似为针对人脸的图像修复工作.在图像修复中,我们都会假设退化的图像是高清图像经过某种函数映射 ...
论文笔记：Person Re-identification with Deep Similarity-Guided Graph Neural Network
Person Re-identification with Deep Similarity-Guided Graph Neural Network 2018-07-27 17:41:45 Paper: ...

随机推荐

Sitecore CMS中如何命名项目名称
如何在Sitecore CMS中命名项目,以及配置命名限制,“显示名称”是什么以及如何使用它. 任何其他名称的项目当创建Sitecore的项目,内容编辑器要求制作者为新建项目提供名称.输入的名称将其 ...
Vim 文本编辑器的基本使用
Vim文本编辑器是Linux/Unix系统下最常用的工具之一,通过该工具可以很方便的建立.修改.编辑文档或者程序文件,其作用类似与windows系统下的记事本或者notepad++,因此熟练掌握该工具 ...
关于Vue中的 render: h => h(App) 具体是什么含义？
render: h => h(App) 是下面内容的缩写: render: function (createElement) { return createElement(App); } 进一步 ...
51nod 1057 N的阶乘 (大数运算)
输入N求N的阶乘的准确值. Input 输入N(1 <= N <= 10000) Output 输出N的阶乘 Input示例 5 Output示例 120 压位: 每个数组元素存多位数 ...
[转载]时间显示插件 flipclock.js
<html> <head> <link rel="stylesheet" href="/assets/css/flipclock.css&q ...
Python+OpenCV图像处理（一）——读取显示一张图片
先在此处先声明,后面学习python+opencv图像处理时均参考这位博主的博文https://blog.csdn.net/u011321546/article/category/7495016/2? ...
java类中使用quartz，设置自动任务Demo
package com.tech.jin.jobScheduler; import java.text.ParseException; import java.util.ArrayList; impo ...
centos系统swap设置查看swap分区的方法
交换分区swap,意思是“交换”.“实物交易”,它的功能就是在内存不够的情况下,操作系统先把内存中暂时不用的数据,存到硬盘的交换空间,腾出内存来让别的程序运行,和Windows的虚拟内存(pagefi ...
Docker学习笔记之常用的 Docker Compose 配置项
0x00 概述与 Dockerfile 一样,编写 Docker Compose 的配置文件是掌握和使用好 Docker Compose 的前提.编写 Docker Compose 配置文件,其本质 ...
通过RMAN 识别失败数据库损坏的对象
背景业务起不来,读取数据库时报坏块,无法读取数据数据库版本:11.2.0.3 数据库无备份,无归档 1. 识别坏块执行以下命令后,rman 会把坏块信息统计到 v$database_block_ ...

论文笔记之：Learning Cross-Modal Deep Representations for Robust Pedestrian Detection

论文笔记之：Learning Cross-Modal Deep Representations for Robust Pedestrian Detection的更多相关文章

随机推荐

热门专题