小刘的深度学习---Faster RCNN

前言：

对于目标检测Faster RCNN有着广泛的应用，其性能更是远超传统的方法。

正文：

R-CNN（第一个成功在目标检测上应用的深度学习的算法）

从名字上可以看出R-CNN是 Faster RCNN 的基础。正是通过不断的改进才有了后面的Fast RCNN 和 Faster RCNN。

R-CNN的流程可以分为4个步骤：用SS（Sekective Search）找候选区域 >>> CNN提取特征 >>> 用提取的特征训练SVM中做物体识别 >>> 用提取的特征训练回归器提议区域

Sekective Search（选择性搜索）是一种基于区域的目标检测方法。先将图像划分成很多尺寸不同的区域（满足目标多尺寸要求），再将这些区域的层次聚类。其中的相似度计算包含4个方面：颜色，纹理，尺寸和空间交叠

颜色相似度是转HSV，每个通道以bins=25计算直方图，再除以区域尺寸做归一化

纹理相似度采用方差为1的高斯分布在8个方向上做梯度统计，以bins=10计算直方图

尺寸相似度

空间交叠相似度

最终的相似度

点击查看 CNN 部分

点击查看 SVM部分

以上是R-CNN的基本流程，但是由于一张图可能会生成大约2千个候选区域，导致它运行的非常的慢。

Fast R-CNN（R-CNN的续作）

考虑到R-CNN中候选区域会有许多重叠部分，这里会先抽取特征再用SS选区域。并且会用softmax代替SVM。

其中的Rol Pooling 类似于Max Pooling ,它是将一个区域划分为几个小区域后再进行Max Pooling

但由于其本身还是沿用的SS，通常速度还是很慢。

Faster R-CNN

通过用区域提议网络来提速。这里不再直接寻找目标在哪里，而是将问题分为锚点是否包含目标和如何将锚框更好的拟合目标。

以每个像素点为中心生成几种固定尺寸的锚框

具体来说，先做3x3的卷积得到一个与公共尺寸相同的特征图（256x(HxW），再通过1x1的卷积得到2个输出，分别用于BBox 和用于区分前景与背景的softmax 。

往后的步骤与Fast RCNN相同。

放一张效果图

具体代码可以去GitHub上查看。

续:

因为最近在追妹纸，关于代码详解可能要等些时日了。just do it♥

小刘的深度学习---Faster RCNN的更多相关文章

小刘的深度学习---CNN
前言: 前段时间我在树莓派上通过KNN,SVM等机器学习的算法实现了门派识别的项目,所用到的数据集是经典的MNIST.可能是因为手写数字与印刷体存在一些区别,识别率并是很不高.基于这样的情况,我打算在 ...
[计算机视觉][神经网络与深度学习]Faster R-CNN配置及其训练教程2
faster-rcnn分为matlab版本和python版本,首先记录弄python版本的环境搭建过程.matlab版本见另一篇:faster-rcnn(testing): ubuntu14.04+c ...
从编程实现角度学习Faster R-CNN（附极简实现）
https://www.jianshu.com/p/9da1f0756813 从编程实现角度学习Faster R-CNN(附极简实现) GoDeep 关注 2018.03.11 15:51* 字数 5 ...
【小刘的linux学习笔记】——01认识操作系统
1.操作系统的地位计算机系统由硬件和软件两部分组成.通常把未配置软件的计算机称为裸机.直接使用裸机不仅不方便,而且将严重降低工作效率和机器的利用率. 操作系统(OS,Operation System ...
faster rcnn 源码学习-------数据读入及RoIDataLayer相关模块解读
参考博客:::https://www.cnblogs.com/Dzhen/p/6845852.html 非常全面的解读参考:::https://blog.csdn.net/DaVinciL/artic ...
新人如何运行Faster RCNN的tensorflow代码
0.目的刚刚学习faster rcnn目标检测算法,在尝试跑通github上面Xinlei Chen的tensorflow版本的faster rcnn代码时候遇到很多问题(我真是太菜),代码地址如下 ...
Faster R-CNN代码例子
主要参考文章:1,从编程实现角度学习Faster R-CNN(附极简实现) 经常是做到一半发现收敛情况不理想,然后又回去看看这篇文章的细节. 另外两篇: 2,Faster R-CNN学习总结 ...
【深度学习】目标检测算法总结（R-CNN、Fast R-CNN、Faster R-CNN、FPN、YOLO、SSD、RetinaNet）
目标检测是很多计算机视觉任务的基础,不论我们需要实现图像与文字的交互还是需要识别精细类别,它都提供了可靠的信息.本文对目标检测进行了整体回顾,第一部分从RCNN开始介绍基于候选区域的目标检测器,包括F ...
深度学习论文翻译解析（四）：Faster R-CNN: Down the rabbit hole of modern object detection
论文标题:Faster R-CNN: Down the rabbit hole of modern object detection 论文作者:Zhi Tian , Weilin Huang, Ton ...

随机推荐

记一次ajax交互问题
问题描述:仍然在表单中,像往常一样,异步获取表单内所有输入框的信息,点击提交,确实也走了后台,但是结果却走了ajax的error.这一点使我当时非常疑惑,为什么会走error呢? 一般走error的原 ...
Python自动化之django model验证（很弱，感觉应用场景不多）
django model的数据验证使用full_clean进行验证 obj = models.UserInfo(name="alex",email="tiantian& ...
关于VS2010 C#使用DirectX的问题[英]
转载的,就不翻译了…微软把精力放到xna去了.所以推荐大家用XNA,如果非要用托管的DirectX也可以,只不过版本一直是2006年的了. 具体方法: 安装SDK之后他默认的位置在C:\WINDOW ...
highcharts柱状图实现legend和数据列一一对应效果
var cate = ['Green', 'Pink']; Highcharts.chart('container', { chart: { type: 'column' }, legend: { e ...
[NOIp2009] $Hankson$の趣味题
$23333$这是最近第二份在时间上吊打$yjk$的代码--啊哈哈哈哈哈哈哈嗯,其实遇到这种单纯的$gcd \ \ or \ \ lcm$的题,我们都可以用一种比较简单的方法分析:唯一分 ...
RabbitMQ如何保证发送端消息的可靠投递
消息发布者向RabbitMQ进行消息投递时默认情况下是不返回发布者该条消息在broker中的状态的,也就是说发布者不知道这条消息是否真的抵达RabbitMQ的broker之上,也因此会发生消息丢失的情 ...
PHP中const,static,public,private,protected的区别
原文地址:http://small.aiweimeng.top/index.php/archives/54.html const: 定义常量,一般定义后不可改变static: 静态,类名可以访问pub ...
CentOS7 安装.netcore 2 部署应用出现An assembly specified in the application dependencies manifest (xxx.deps.json)
# dotnet xxx.dll Error: An assembly specified in the application dependencies manifest (xxx.deps.jso ...
2017-2018-1 20155220 《信息安全系统设计基础》课下实践——实现mypwd
学习pwd命令输入pwd命令于是man 1 pwd查看pwd详细然后查看pwd实现需要的系统调用man -k; grep 在这发现了一个功能相同的内核函数getcwd 到这步就很简单了,先查看这 ...
仙人掌&圆方树
仙人掌&圆方树 Tags:图论 [x] [luogu4320]道路相遇 https://www.luogu.org/problemnew/show/P4320 [ ] [SDOI2018]战略 ...

小刘的深度学习---Faster RCNN

小刘的深度学习---Faster RCNN的更多相关文章

随机推荐

热门专题