ICCV2013、CVPR2013、ECCV2013目标检测相关论文
CVPapers 网址: http://www.cvpapers.com/
ICCV2013 Papers about Object Detection:
1. Regionlets for Generic Object Detection. Xiaoyu Wang, Ming Yang, Shenghuo Zhu, Yuanqing Lin .(暂无源码提供)
Website: http://www.xiaoyumu.com/project/detection
这篇文章提出了一种新的特征描述子——Regionlet描述子。该特征能很好的、灵活的描述目标,包括发生形变的目标。Regionlet特征描述子是由带检测窗口中的若干子区域的特征组合成一个一维向量来表示,这样做很好的刻画了目标的空间结构关系。Regionlet的选择也不是随便选取的,它是通过boosting算法在特征池中选取。下图显示了这篇文章的整体算法思路:(这篇文章的算法框架有点类似于Viola-Jones提出的人脸检测算法,只是提取的特征不同)
2. Efficient pedestrian detection by directly optimizing the partial area under the ROC curve. Sakrapee Paisitkriangkrai, Chunhua Shen, Anton Van den Hengel.(级联分类器的训练)
该文提出了一种新的策略——pAUC(the partial area under the ROC curve). 由于高效级联的分类器依赖于训练若干节点分类器,使得其在适当的误检率的情况下达到最大的检测率。因此,文章描述了一种新的集成学习方法,通过使用结构学习(Structured Learning)直接优化pAUC,使得其能在用户定义的误检率范围内达到最大的检测率。
3. Contextual Hypergraph Modeling for Salient Object Detection. Xi Li*, Yao Li, Chunhua Shen, Anthony Dick, Anton Van den Hengel.(关于显著目标检测的文章,显著目标检测是指在图像中将引起人注意的目标定位出来。)
Website : http://cs.adelaide.edu.au/~yaoli/?page_id=149
4. Discriminatively Trained Templates for 3D Object Detection: A Real Time Scalable Approach. Reyes Rios-Cabrera, Tinne Tuytelaars.
该文在Hinterstoisser等人提出的基于模板的LINE2D/LINEMOD描述子的基础上做了2处改进:1)提出以区分式的形式来学习模板(将离线学习和在线学习结合起来);2)提出了一种基于级联式的快速检测。
5. Joint Deep Learning for Pedestrian Detection. Wanli Ouyang*, Xiaogang Wang.
Website: 1)http://www.ee.cuhk.edu.hk/~wlouyang/projects/ouyangWiccv13Joint/index.html
2) http://www.ee.cuhk.edu.hk/~wlouyang/ (主页)
(有代码,Matlab)
特征提取、形变处理、遮挡处理、分类,它们是行人检测的四个重要组成部分。现存的方法都是分别的学习和设计这些部分,这些组成部分之间的交互还没有被探索。这篇文章通过深度学习联合这些组成部分,最大化了它们的优势。通过深度学习框架,建立自动的、组成部分之间多交互的模型,使得其相较于当前最好的行人检测算法,精度提高了9%。下面是其原理图。
6. Learning Near-Optimal Cost-Sensitive Decision Policy for Object Detection. Tianfu Wu*, Song Chun Zhu .(目的是解决大量扫描窗口的检测耗时)
Website: http://www.stat.ucla.edu/~tfwu/project/DecisionPolicy_2013.htm
很多常用的检测器,如:AdaBoost,SVM,DPM等等,在大量的扫描窗口中需要计算Score functions,这需要大量的计算,因此在实际的应用中,除了检测精度外,我们还要考虑实时性。这篇文章描述了一个框架:学习一个接近最优且代码敏感的决策策略(即一个双边阈值)来执行早期的判断(拒绝or接受)。实验表明,在不影响检测准确度的情况下,该方法大大的提高了检测的速度。
7. An Human Co-detection and Labeling Framework. Jianping Shi* (CUHK), Renjie Liao (CUHK), Jiaya Jia (Chinese University of Hong Kong)(本监督训练——检测+标记)
Website: http://shijianping.me/codel/index.html
这篇文章提出了一个联合人体检测和标记(贴标签)的框架。首先,利用基于变形部件模型的人体检测器来检测可能的人体目标;然后利用匹配分类器得到可信度较高的人体目标。这样,检测器和匹配分类器在一起就构成了一个半监督联合训练的框架。流程图如下:
8. Coherent Object Detection with 3D Geometric Context from a Single Image. Jiyan Pan* , Takeo Kanade (利用3D上下文信息辅助目标检测)
9. Random Forests of Local Experts for Pedestrian Detection. Javier Marin* , David Vazquez , Jaume Amores, Antonio Lopez, Bastian Leibe
这篇文章提出了利用随机森林组合多个Local Experts来进行行人检测,提出的方法利用基于块的描述(如:HOG、LBP)。并提出了如何利用该方法生成一个级联的分类器以保证准
确率不降低的情况下,提高检测速度。(该方法有点类似于组合Part-Based检测器的方法)
10. From Subcategories to Visual Composites: A Multi-Level Framework for Object Detection. Tian Lan* (Simon Fraser University), Leonid Sigal, Michalis Raptis (Disney Research Pittsburgh), Greg Mori (Simon Fraser University )
11. Alternating Regression Forests for Object Detection and Pose Estimation .
Website :http://lrs.icg.tugraz.at/pubs/schulter_iccv_13.pdf
提出了一种新的回归算法(Alternating Regression Forests, ARFs),通过优化一个全局的损失函数来学习一个随机森林。将这种方法应用与目标检测和姿态估计。
CVPR2013 Papers about Object Detection:
12. Robust Multi-Resolution Pedestrian Detection in Traffic Scenes. Junjie Yan, Xucong Zhang, Zhen Lei, Dong Yi, Shengcai Liao, Stan Li
Website :
13. Detection Evolution with Multi-Order Contextual Co-occurrence. Chen Guang, Yuanyuan Ding, Jing Xiao, Tony Han
提出了一种结合多级上下文描述与Deformable part models相结合的方法。
14. Fast, Accurate Detection of 100,000 Object Classes on a Single Machine. Thomas Dean, Jay Yagnik, Mark Ruzon, Mark Segal, Jonathon` Shlens, Sudheendra Vijayanarasimhan.
(Best CVPR2013 Paper)
Website:
http://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/40814.pdf
这篇文章利用Locality-sensitive hashing(LSH)来替代点乘核操作,能够高效的采样过滤器的响应。为了显示该技术的高效性,他们将其应用到100,000个deformable-part model的估计中,耗时低于20s。
15. Learning Structured Hough Voting for Joint Object Detection and Occlusion Reasoning. Tao Wang, Xuming He, Nick Barnes
Website : http://www.cvwang.com/projects/cvpr13
这篇文章提出了一种结构霍夫投票的方法用于室内遮挡环境下的目标检测。首先,它扩展霍夫假设空间到目标位置和它的可视化模型,并设计一种新的得分函数来积累投票用于目标检测和遮挡预测。另外,这篇文章还探索了目标和它周围环境之间的联系,构建了一个基于RGB-D数据集的深度编码的目标上下文模型。它设计了一种层次上下文描述,并允许目标和背景中的图像块对目标假设进行投票。
ECCV2012 Papers about Object Detection:
16. Object Co-detection. Yinzge Bao (U of Michigan at Ann Arbor), Yu Xiang (University of Michigan), Silvio Savarese (The University of Michigan - Ann Arbor)
Website :
1) http://sitemaker.umich.edu/bao/home
2) http://cvgl.stanford.edu/projects/codetection/index.htm
这篇文章引入了一个新的问题:联合目标检测(object co-detection)。
总结 :从上面这些文章可以看出,目前目标检测的研究方向是:1)新的特征描述子的挖掘;2)一个好的级联分类器的训练;3)在大量滑动窗口下的检测算法改进;4)基于Part-Model(或结构信息)的目标检测应用;5)深度学习应用到目标检测中;6)充分利用上下文信息;7)深度信息(RGBD)辅助检测;8)多种策略的组合(如:joint deep learning for pedestrian detection)。
ICCV2013、CVPR2013、ECCV2013目标检测相关论文的更多相关文章
- 目标检测入门论文YOLOV1精读以及pytorch源码复现(yolov1)
结果展示 其中绿线是我绘制的图像划分网格. 这里的loss是我训练的 0.77 ,由于损失函数是我自己写的,所以可能跟大家的不太一样,这个不重要,重要的是学习思路. 重点提示 yolov1是一个目标检 ...
- Windows下用cpu模式跑通目标检测py-faster-rcnn 的demo.py
关键字:Windows.cpu模式.Python.faster-rcnn.demo.py 声明:原文发表在博客园,未经允许不得转载!!!本篇blog过程已经多名读者实践验证,有人反馈报错TypeErr ...
- AI佳作解读系列(五) - 目标检测二十年技术综述
计算机视觉中的目标检测,因其在真实世界的大量应用需求,比如自动驾驶.视频监控.机器人视觉等,而被研究学者广泛关注. 上周四,arXiv新出一篇目标检测文献<Object Detection ...
- paddlepaddle目标检测之水果检测(yolov3_mobilenet_v1)
一.创建项目 (1)进入到https://aistudio.baidu.com/aistudio/projectoverview/public (2)创建项目 点击添加数据集:找到这两个 然后创建即可 ...
- [炼丹术]基于SwinTransformer的目标检测训练模型学习总结
基于SwinTransformer的目标检测训练模型学习总结 一.简要介绍 Swin Transformer是2021年提出的,是一种基于Transformer的一种深度学习网络结构,在目标检测.实例 ...
- ILSVRC2016目标检测任务回顾——视频目标检测(VID)
转自知乎<深度学习大讲堂> 雷锋网(公众号:雷锋网)按:本文作者王斌,中科院计算所前瞻研究实验室跨媒体计算组博士生,导师张勇东研究员.2016年在唐胜副研究员的带领下,作为计算所MCG-I ...
- 论文笔记:目标检测算法(R-CNN,Fast R-CNN,Faster R-CNN,FPN,YOLOv1-v3)
R-CNN(Region-based CNN) motivation:之前的视觉任务大多数考虑使用SIFT和HOG特征,而近年来CNN和ImageNet的出现使得图像分类问题取得重大突破,那么这方面的 ...
- 论文翻译——R-CNN(目标检测开山之作)
R-CNN论文翻译 <Rich feature hierarchies for accurate object detection and semantic segmentation> 用 ...
- CVPR2019:无人驾驶3D目标检测论文点评
CVPR2019:无人驾驶3D目标检测论文点评 重读CVPR2019的文章,现在对以下文章进行点评. Stereo R-CNN based 3D Object Detection for Autono ...
随机推荐
- SQL 创建联合主键Table
CREATE TABLE [User_Instance]( [IntanceID] [int] NOT NULL, ) NOT NULL ) ON [PRIMARY] GO SET ANSI_PADD ...
- DOM-DOMTree-查找
1. 什么是DOM: Document Object Model 专门操作网页内容的API js=ES+DOM+BOM DOM是由W3C指定的API标准 为什么: 为了统一各个浏览器操作网页内容的AP ...
- libmysqlclient version
You probably know that the version number of the libmysqlclient.so library has changed from .16 to . ...
- python学习 day11 (3月16日)----(生成器内置函数)
1生成器 1生成器的本质 一定是迭代器(反之不一定(用send(生成器特有方法)验证))2生成器是可以让程序员自己定义的一个迭代器3生成器的好处,节省内存空间4生成器的特性,一次性的,惰性机制,从上往 ...
- ubuntu禁用n卡驱动(进系统卡死)
显卡驱动 该发行版依旧内置了Nouveau 开源驱动,这是导致频繁死机的直接原因.接下来要做的三件事情是: 禁用Nouveau 内核模块 安装Intel HD 530 驱动(二选一) 安装NVIDIA ...
- Maven手动将jar包放入本地仓库
mvn install:install-file -Dfile=jar包的位置 -DgroupId=上面的groupId -DartifactId=上面的artifactId -Dversion=上面 ...
- oracle undo表空间
查询undo表空间状态 "Bytes(M)" FROM dba_undo_extents GROUP BY tablespace_name, status; Undo表空间的状态( ...
- Codeforces 1086 简要题解
文章目录 A题 B题 C题 D题 E题 传送门 这场比赛原地爆炸了啊!!! 只做了两道. A题 传送门 手贱没关freopenfreopenfreopen于是wawawa了一次,死活调不出错. 题意: ...
- Codeforces Round #541 (Div. 2) D 并查集 + 拓扑排序
https://codeforces.com/contest/1131/problem/D 题意 给你一个n*m二维偏序表,代表x[i]和y[j]的大小关系,根据表构造大小分别为n,m的x[],y[] ...
- ssh scp 加端口
scp -P one-infrastructure-api.tar.gz console@172.31.16.2:/root/ ssh -p console@172.31.16.2