fast rcnn

统一了sppnet和rcnn,将原来rcnn分stage的训练合为一个整体的stage,一次完成cls, regression的训练。引入两个loss函数,一个是用来进行cls的,一个是进行regression的,这个思路其实是和google的multibox类似的,但是不同的是regression是对bbox的,而bbox怎么引入到cnn中,同时还可以进行训练呢,这就是sppnet的思路了。fast rcnn在训练cnn时,就是借鉴了spp,通过引入roipooling layer,将用selective search得到的2K的regions通过roipooling layer映射到具体的patch上,类似于sppnet,然后每个patch分别进行分类和regression,这样就一次性完成了所有regions的分类和定位。fastrcnn既利用了sppnet在前面几层统一用conv和pooling对整图进行计算的计算资源节约的特征,又通过引入roipooling 层,将sppnet无法完成的整体cnn的ft完成了,同时引入了l1 norm对regression进行调整,做到了end-to-end.流程框架如下图,图里我少了一条线,roi的label应该是cls的loss的输入之一。

这篇文章看似内容没那么多,但是很重要,而且其实在细节的很多地方都值得借鉴,代码写的也是相当完美。

Multi-Objective Convolutional Learning for Face Labeling,其实是引入了单个pixel的loss,以及pixel之间的邻域loss,即引入了crf的两个energy,通过引入这两个loss完成对cnn的训练,但是在进行test时,并不用crf,使用graphcut完成分割。我个人觉得有点类似于fcn,但是fcn是单纯对pixel的分类,而本文通过引入crf,利用了pixel之间的关系,根据作者所说,这么做提高了不少。

Object detection via a multi-region & semantic segmentation-aware CNN model

本文我读了一下,有点类似于是sppnet,但是不同的是在生成特征时,把一个regions,通过不同方向的裁剪,得到很多个regions,而后这些regions分别得到特征,然后把这些特征通过spp统一到一个尺度,最后展开作为一个大特征,完成检测。而在分割时,直接用bbox作为正样本,而不需要那么严格的pixel级别的正样本,cnn能够对bbox带来的噪声具有鲁棒性。具体需要细看。

multibox,google的工作,整图作为输入,得到的是confidence和可能存在object的bbox位置,fastrcnn其实借鉴了这个思路。但是感觉google的工作很庞大,不知道能不能调试下来。

fcn,通过cnn,完成分割,这个工作的出现,引入了很多后续工作。

cnn-crf(deeplab),是cnn和crf分stage训练的,但是和别的思路不一样的地方是,crf在分割时起到作用了,而cnn的训练又没有用到crf。

最近就在不停的读文章和比较其中的差别了,其中可以分为两个路子,fastrcnn, multibox; fcn cnn-crf。

最近的阅读list的更多相关文章

  1. 【原】FMDB源码阅读(三)

    [原]FMDB源码阅读(三) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言 FMDB比较优秀的地方就在于对多线程的处理.所以这一篇主要是研究FMDB的多线程处理的实现.而 ...

  2. 【原】FMDB源码阅读(二)

    [原]FMDB源码阅读(二) 本文转载请注明出处 -- polobymulberry-博客园 1. 前言 上一篇只是简单地过了一下FMDB一个简单例子的基本流程,并没有涉及到FMDB的所有方方面面,比 ...

  3. 【原】FMDB源码阅读(一)

    [原]FMDB源码阅读(一) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言 说实话,之前的SDWebImage和AFNetworking这两个组件我还是使用过的,但是对于 ...

  4. 【原】AFNetworking源码阅读(六)

    [原]AFNetworking源码阅读(六) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言 这一篇的想讲的,一个就是分析一下AFSecurityPolicy文件,看看AF ...

  5. 【原】AFNetworking源码阅读(五)

    [原]AFNetworking源码阅读(五) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言 上一篇中提及到了Multipart Request的构建方法- [AFHTTP ...

  6. 【原】AFNetworking源码阅读(四)

    [原]AFNetworking源码阅读(四) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言 上一篇还遗留了很多问题,包括AFURLSessionManagerTaskDe ...

  7. 【原】AFNetworking源码阅读(三)

    [原]AFNetworking源码阅读(三) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言 上一篇的话,主要是讲了如何通过构建一个request来生成一个data tas ...

  8. 【原】AFNetworking源码阅读(二)

    [原]AFNetworking源码阅读(二) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言 上一篇中我们在iOS Example代码中提到了AFHTTPSessionMa ...

  9. 【原】AFNetworking源码阅读(一)

    [原]AFNetworking源码阅读(一) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言 AFNetworking版本:3.0.4 由于我平常并没有经常使用AFNetw ...

  10. [PHP源码阅读]count函数

    在PHP编程中,在遍历数组的时候经常需要先计算数组的长度作为循环结束的判断条件,而在PHP里面对数组的操作是很频繁的,因此count也算是一个常用函数,下面研究一下count函数的具体实现. 我在gi ...

随机推荐

  1. keil版本控制

    keil5.15才有对git svn的支持,之前的有其它的svcs;   http://www.keil.com/appnotes/files/apnt_279.pdf http://stdbit.c ...

  2. C# List(T).Reverse 方法 顺序反转

    using System; using System.Collections.Generic; public class Example { public static void Main() { L ...

  3. LeetCode 887.鸡蛋掉落(C++)

    每个蛋的功能都是一样的,如果一个蛋碎了,你就不能再把它掉下去. 你知道存在楼层 F ,满足 0 <= F <= N 任何从高于 F 的楼层落下的鸡蛋都会碎,从 F 楼层或比它低的楼层落下的 ...

  4. 在rails 中使用mysql 出现Mysql::Error: Incorrect string value: 的问题

    这是因为你在做数据库的操作中有非英文的问题,之后gem mysql2 处理中文必须要数据库也指定是utf-8 才比较好处理 解决的方法很简单,将数据库每张表都转化成utf-8即可,如果数据库没有什么重 ...

  5. C语言实现通用链表初步(一)

    注意:本文讨论的是无头单向非循环链表. 假设不采用Linux内核链表的思路,怎样用C语言实现通用链表呢? 一种常用的做法是: typedef int element_t; struct node_in ...

  6. linux下追查线上问题常用命令

    (1)查占用cpu最多的进程方法一:核心指令:ps实际命令:ps H -eo pid,pcpu | sort -nk2 | tail执行效果如下:[work@test01 ~]$ ps H -eo p ...

  7. 云计算&大数据相关知识

    1.极客学院云计算&大数据总链接:http://wiki.jikexueyuan.com/list/cloud/ 一.NSQ相关参考资料: 1.极客学院NSQ指南:http://wiki.ji ...

  8. 显卡(GPU)的基础知识

    显卡的性能指标有: 流处理器(SP)数量 核心频率 流处理器的架构 显存容量 显存频率 显存带宽 1. 流处理器的数量 把一个GPU当成是一个画画的工厂,其中流处理器的数量就是画师的数量,其数量自然是 ...

  9. mybatis VS hibernate

    转自:http://blog.csdn.net/firejuly/article/details/81902 第一章     Hibernate与MyBatis Hibernate 是当前最流行的O/ ...

  10. (生产)create-keyframe-animation -动画实现

    参考:https://github.com/HenrikJoreteg/create-keyframe-animation 实例 var animations = require('create-ke ...