anchor_target_layer中的bounding regression

在anchor_target层，这两行是计算bounding regression代码：

bbox_targets = np.zeros((len(inds_inside), 4), dtype=np.float32)

bbox_targets = _compute_targets(anchors, gt_boxes[argmax_overlaps, :])

def _compute_targets(ex_rois, gt_rois):

    """Compute bounding-box regression targets for an image."""

    assert ex_rois.shape[0] == gt_rois.shape[0]

    assert ex_rois.shape[1] == 4

    assert gt_rois.shape[1] == 5

    return bbox_transform(ex_rois, gt_rois[:, :4]).astype(np.float32, copy=False)

以下是bounding regression的计算公式：

def bbox_transform(ex_rois, gt_rois):

    ex_widths = ex_rois[:, 2] - ex_rois[:, 0] + 1.0

    ex_heights = ex_rois[:, 3] - ex_rois[:, 1] + 1.0

    ex_ctr_x = ex_rois[:, 0] + 0.5 * ex_widths

    ex_ctr_y = ex_rois[:, 1] + 0.5 * ex_heights

    gt_widths = gt_rois[:, 2] - gt_rois[:, 0] + 1.0

    gt_heights = gt_rois[:, 3] - gt_rois[:, 1] + 1.0

    gt_ctr_x = gt_rois[:, 0] + 0.5 * gt_widths

    gt_ctr_y = gt_rois[:, 1] + 0.5 * gt_heights

    targets_dx = (gt_ctr_x - ex_ctr_x) / ex_widths

    targets_dy = (gt_ctr_y - ex_ctr_y) / ex_heights

    targets_dw = np.log(gt_widths / ex_widths)

    targets_dh = np.log(gt_heights / ex_heights)

    targets = np.vstack(

        (targets_dx, targets_dy, targets_dw, targets_dh)).transpose()

    return targets

argmax_overlaps是每个anchor对应最大overlap的gt_boxes的下标，所以bbox_targets存储的是anchor和最大overlap的gt之间的bouding regression。

因为all_anchors裁减掉了2/3左右，仅仅保留在图像内的anchor。利用_unmap函数复原作为这一层的一个输出，并reshape成相应的格式，输出到rpn_loss_bbox。

rpn_loss_bbox的另一个输入是由特征提取出的4个坐标变换。

实际上，

rpn_loss_bbox就是rpn损失函数的第二部分，也就是计算框损失的部分。论文中的两个输入是ti和ti*，我本以为ti和ti*是两个框的4个坐标（即左上右下）。但实际看代码发现，ti是

rpn_bbox_pred，

是一个feature map（即特征向量）。ti*是anchor和gt bounding box regression的结果（即△x，△y，△w，△h）。这样也可以看出rpn_bbox_pred不是直接生成的roi坐标，而是feature map。

anchor_target_layer中的bounding regression的更多相关文章

目标检测中的bounding box regression
目标检测中的bounding box regression 理解:与传统算法的最大不同就是并不是去滑窗检测,而是生成了一些候选区域与GT做回归.
解读SSD中的Default box（Prior Box）
1:SSD更具体的框架如下: 2: Prior Box 缩进在SSD中引入了Prior Box,实际上与anchor非常类似,就是一些目标的预选框,后续通过softmax分类+bounding box ...
Object-Detection中常用的概念解析
常用的Region Proposal Selective Search Edge Boxes Softmax-loss softmax-loss层和softmax层计算大致是相同的,softmax是一 ...
SparkMLlib之 logistic regression源码分析
最近在研究机器学习,使用的工具是spark,本文是针对spar最新的源码Spark1.6.0的MLlib中的logistic regression, linear regression进行源码分析,其 ...
在matlab中实现线性回归和logistic回归
本文主要讲解在matlab中实现Linear Regression和Logistic Regression的代码,并不涉及公式推导.具体的计算公式和推导,相关的机器学习文章和视频一大堆,推荐看Andr ...
Linear Regression总结
转自:http://blog.csdn.net/dongtingzhizi/article/details/16884215 Linear Regression总结作者:洞庭之子微博:洞庭之子-B ...
Logistic Regression总结
转自:http://blog.csdn.net/dongtingzhizi/article/details/15962797 Logistic回归总结作者:洞庭之子微博:洞庭之子-Bing (20 ...
Android中蓝牙的基本使用----BluetoothAdapter类简介
天气逐渐热了,自己也越来越懒了,虽然看着了很多东西,解决了很多问题,有些收获却不想写着.主要有一下两方面原因: 第一.以前写的一些关于Android知识的Blog,都是在学习过程中发现网络上没有相关知 ...
rcnn ->fast rcnn->faster rcnn物体检测论文
faster rcnn中的rpn网络: 特征可以看做一个尺度51*39的256通道图像,对于该图像的每一个位置,考虑9个可能的候选窗口:三种面积{1282,2562,5122}×三种比例{1:1,1: ...

随机推荐

BZOJ_3476_[Usaco2014 Mar]The Lazy Cow_扫描线+切比雪夫距离
BZOJ_3476_[Usaco2014 Mar]The Lazy Cow_扫描线+切比雪夫距离 Description It's a hot summer day, and Bessie the c ...
《JAVA与模式》之解释器模式
解释器模式是类的行为模式.给定一个语言之后,解释器模式可以定义出其文法的一种表示,并同时提供一个解释器.客户端可以使用这个解释器来解释这个语言中的句子. 解释器模式的结构下面就以一个示意性的系统为例 ...
机器学习经典算法笔记-Support Vector Machine SVM
可供使用现成工具:Matlab SVM工具箱.LibSVM.SciKit Learn based on python 一问题原型解决模式识别领域中的数据分类问题,属于有监督学习算法的一种. 如图所 ...
UI：sqlite数据库
使用sqllite的时候一些笔记数据库(管理类),在工程 general 导入动态链接库 libsqllite3.0.dylib 在.h文件里引入导入 sqllite3.h 头文件在.h里面声 ...
字节流与字符流简单操作（OutputStream、InputStream、Writer、Reader）
操作流程使用File类打开一个文件通过字节流或者字符流的子类.指定输出的位置. 进行读/写操作关闭输入/出字节流与字符流在java.io包中操作文件内容主要有两大类:字节流字符流.两大类分为 ...
linux中的C里面使用pthread_mutex_t锁（转载）
转自:http://blog.csdn.net/w397090770/article/details/7264315 linux下为了多线程同步,通常用到锁的概念. posix下抽象了一个锁类型的结构 ...
Swift4 协议
创建: 2018/02/27 完成: 2018/02/28 更新: 2018/03/07 增加类采用协议时的注意补充只有类, 结构体, 枚举型可以采用协议增加为类定义准备的协议( protocol ...
你想要的sublime、webstorm、vi/vim不得不用的快捷键【简报】【实用】
你想要的sublime.webstorm.vi/vim不得不用的快捷键[简报][实用] 话不多说,马上走起: Sublime Text: ctrl+d alt+f3全选 ctrl+shift+’ ...
mybatis 批量insert,update报错 The error occurred while setting parameters
数据脚本执行正常,但是报错,搜索关键信息 The error occurred while setting parameters ,发现了解决帖子: http://blog.csdn.net/jing ...
ROS学习笔记六：xxx.launch文件详解
每当我们需要运行一个ROS节点或工具时,都需要打开一个新的终端运行一个命令.当系统中的节点数量不断增加时,每个节点一个终端的模式会变得非常麻烦.那么有没有一种方式可以一次性启动所有节点呢?答案当然是肯 ...

anchor_target_layer中的bounding regression

anchor_target_layer中的bounding regression的更多相关文章

随机推荐

热门专题