cs231n spring 2017 lecture11 Detection and Segmentation

1. Semantic Segmentation

　　把每个像素分类到某个语义。

　　为了减少运算量，会先降采样再升采样。降采样一般用池化层，升采样有各种“Unpooling”、“Transpose Convolution”（文献中也叫“Upconvolution”之类的其他名字）。

　　这个问题的训练数据的获得非常昂贵，因为需要一个像素一个像素的贴标签。

2. Classification + Localizatoin

　　一般用同一个网络，一方面得出分类，一方面得出Bounding box的位置和大小。

3. Object Detection

　　预先设定好要找哪些objects，一旦图片里发现，就框出来。Classification + Localizatoin一般是针对单个物体，而这里是针对多个物体。

　　Sliding window：计算量太大，舍弃。

　　Region Proposals：先找可能有物体的图片区域，然后一个个处理，在CPU上大概几秒的时间。这种方法在深度学习之前就出来了。

　　R-CNN：先找出region proposal，然后把region proposal调整成神经网络需要的大小，然后给神经网络计算，最后通过SVM分类。

　　　　　　训练很慢（84h），也非常耗内存。预测也很慢（47秒 VGG16）

　　Fast R-CNN：相比R-CNN快很多，训练（8.75h），预测（计算region proposal花2秒，神经网络预测花0.32秒）。

　　　　　　　　训练的时候把下图中的Linear + softmax和Linear加起来得到multi-task loss。

　　Faster R-CNN：用卷积层去预测region proposal。比Fast R-CNN更快，预测耗时0.2秒。

　　YOLO（Redmon et al., CVPR 2016）/SSD（Liu et al, "Single-Shot MultiBox Detecotr", ECCV 2016）：这两种方法没有用region proposal，更快，但是相对不那么准。Faster R-CNN更慢，但是更准。

　　Object Detection + Captioning （DenseCap， CVPR 2016）

4. Instance Segmentation

　　Semantic Segmentation和Object Detection的结合，找出多个物体，并且判断每个像素属于哪个分类。

　　Mask R-CNN （He et al., 2017），网络有两个分支，第一个执行Object Detection，第二个执行Semantic Segmentation。这个网络把之前的都融合起来，是集大成者，表现非常非常好。在Object Detection分支加入对人体关节的识别，还能识别人的pose。基于Faster R-CNN，接近real-time。

cs231n spring 2017 lecture11 Detection and Segmentation的更多相关文章

cs231n spring 2017 lecture11 Detection and Segmentation 听课笔记
1. Semantic Segmentation 把每个像素分类到某个语义. 为了减少运算量,会先降采样再升采样.降采样一般用池化层,升采样有各种"Unpooling"." ...
cs231n spring 2017 lecture13 Generative Models 听课笔记
1. 非监督学习监督学习有数据有标签,目的是学习数据和标签之间的映射关系.而无监督学习只有数据,没有标签,目的是学习数据额隐藏结构. 2. 生成模型(Generative Models) 已知训练数 ...
cs231n spring 2017 lecture9 CNN Architectures 听课笔记
参考<deeplearning.ai 卷积神经网络 Week 2 听课笔记>. 1. AlexNet(Krizhevsky et al. 2012),8层网络. 学会计算每一层的输出的sh ...
cs231n spring 2017 lecture7 Training Neural Networks II 听课笔记
1. 优化: 1.1 随机梯度下降法(Stochasitc Gradient Decent, SGD)的问题: 1)对于condition number(Hessian矩阵最大和最小的奇异值的比值)很 ...
cs231n spring 2017 Python/Numpy基础 (1)
本文使根据CS231n的讲义整理而成(http://cs231n.github.io/python-numpy-tutorial/),以下内容基于Python3. 1. 基本数据类型:可以用 prin ...
cs231n spring 2017 lecture13 Generative Models
1. 非监督学习监督学习有数据有标签,目的是学习数据和标签之间的映射关系.而无监督学习只有数据,没有标签,目的是学习数据额隐藏结构. 2. 生成模型(Generative Models) 已知训练数 ...
cs231n spring 2017 lecture9 CNN Architectures
参考<deeplearning.ai 卷积神经网络 Week 2 听课笔记>. 1. AlexNet(Krizhevsky et al. 2012),8层网络. 学会计算每一层的输出的sh ...
cs231n spring 2017 lecture7 Training Neural Networks II
1. 优化: 1.1 随机梯度下降法(Stochasitc Gradient Decent, SGD)的问题: 1)对于condition number(Hessian矩阵最大和最小的奇异值的比值)很 ...
cs231n spring 2017 Python/Numpy基础
本文使根据CS231n的讲义整理而成(http://cs231n.github.io/python-numpy-tutorial/),以下内容基于Python3. 1. 基本数据类型:可以用 prin ...

随机推荐

Django1.11基础视图
Django视图路由命名与reverse反解析在项目urls中的include函数,使用namespace参数定义路由命名空间 url(r'^',incude('book.urls',namesp ...
nginx 负载策略
1.轮询(weight=1) 默认选项,当weight不指定时,各服务器weight相同,每个请求按时间顺序逐一分配到不同的后端服务器,如果后端服务器down掉,能自动剔除. upstream bak ...
00java语法基础和课后实践
一:运行代码,并分析结果代码1: package reserve; public class Main { public static void main(String[] args) { Size ...
图论中最优树问题的LINGO求解
树:连通且不含圈的无向图称为树.常用T表示.树中的边称为树枝,树中度为1的顶点称为树叶. 生成树:若T是包含图G的全部顶点的子图,它又是树,则称T是G的生成树. 最小生成树:设T=(V,E1)是赋权图 ...
Java 14 有哪些新特性？
记录为 Java 提供了一种正确实现数据类的能力,不再需要为实现数据类而编写冗长的代码.下面就来看看 Java 14 中的记录有哪些新特性. 作者 | Nathan Esquenazi 译者 | 弯月 ...
Python—使用列表构造栈数据结构
class Stack(object): """ 使用列表实现栈 """ def __init__(self): self.stack = ...
POJ 1845 Sumdiv [素数分解快速幂取模二分求和等比数列]
传送门:http://poj.org/problem?id=1845 大致题意: 求A^B的所有约数(即因子)之和,并对其取模 9901再输出. 解题基础: 1) 整数的唯一分解定理: 任意正整数都有 ...
php获取客户IP
获取客户真实IP,保存到数据库建议转整 function getIp(){ $ip = ''; if(!empty($_SERVER['HTTP_CLIENT_IP'])){ $ip = $_SERV ...
yuyuecms 1.2文件删除漏洞
www.yuyue-cms.com yuyuecms版本1.2 管理员/索引控制器删除方法中的漏洞请参阅catfishcmsCatfish isPost静态方法如果调用后验证静态方法如果为tru ...
python与mysql部分函数和控制流语法对比
条件语句 python语法 a=int(input("输入一个数[0,100]成绩:")) if 100>=a>=90: print("优") el ...

cs231n spring 2017 lecture11 Detection and Segmentation

cs231n spring 2017 lecture11 Detection and Segmentation的更多相关文章

随机推荐

热门专题