dense prediction问题

dense prediction

理解：标注出图像中每个像素点的对象类别，要求不但给出具体目标的位置，还要描绘物体的边界，如图像分割、语义分割、边缘检测等等。

基于深度学习主要的做法有两种：

基于图像分块：利用像素、超像素块周围小邻域进行独立的分类。（在分类网络中使用全连接层，固定图像块尺寸）
基于全卷积网络：对图像进行pixel-to-pixel 的预测，可以得到任意大小的图像分割结果，而且不需要对每个图像块进行分类，速度快。重要的两点：卷积层上采样、skip connection结构

由于全卷积网络的各种优点，之后各种改进模型被提出来：

u-net（用作医学图像分割）对图像进行编码之后解码，在编码时同样是卷积+下采样的结构，为了恢复图像的细节空间信息，在编码与解码过程中加入shortcut connection结构。
segNet结构：也是一种编码解码结构，无shortcut connection结构，（将最大池化索引maxpooling indices 转移到解码器）解码时，不像FCN中进行upsampling 的反卷积，而是复制了最大池化索引，使得segNet 比FCN节省内存。（但是准确率不高）
dialated convolutions 结构:此结构不需要池化层，使用空洞卷积使得感受野指数增长，但空间维度不下降。3*3的卷积核对应5*5的视觉野。但是空洞卷积的缺点是：得到的都是高分辨率的特征图，计算量较大。

tips：尽管这些操作补充了细节信息，但是还是丢失部分信息，因此为了优化结果常常使用fully connected CRF 进行优化，CRF是基于图像的颜色信息对图像进行平滑分割的算法，改善分割结果。将灰度相近的像素标注为同一类，（相似的基于图的图像分割算法，在显著性检测基于流行排序算法的显著性目标分割，也是同样的思想，要尽量保持原始的label，又要使颜色相似的像素点归为一类）在DeepLab 论文中使用空洞卷积和CRF：

近来各种改进的模型：

refineNet:用于边缘检测，编码解码的改进以及残差连接设计，编码器是resNet101结构。解码是多层连接。
PSPNet
large kernel matters

参考： https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw%3D%3D&idx=4&mid=2650728920&sn=3c51fa0a95742d37222c3e16b77267ca

dense prediction问题的更多相关文章

dense prediction
Dense prediction fully convolutional network for sementic segmentation 先用feature extractor 提特征,然后再使 ...
Anchor-free目标检测综述 -- Dense Prediction篇
早期目标检测研究以anchor-based为主,设定初始anchor,预测anchor的修正值,分为two-stage目标检测与one-stage目标检测,分别以Faster R-CNN和SSD作 ...
论文阅读（Xiang Bai——【arXiv2016】Scene Text Detection via Holistic, Multi-Channel Prediction）
Xiang Bai--[arXiv2016]Scene Text Detection via Holistic, Multi-Channel Prediction 目录作者和相关链接方法概括创新 ...
Fully Convolutional Networks for semantic Segmentation（深度学习经典论文翻译）
摘要卷积网络在特征分层领域是非常强大的视觉模型.我们证明了经过端到端.像素到像素训练的卷积网络超过语义分割中最先进的技术.我们的核心观点是建立"全卷积"网络,输入任意尺寸,经过有 ...
大规模视觉识别挑战赛ILSVRC2015各团队结果和方法 Large Scale Visual Recognition Challenge 2015
Large Scale Visual Recognition Challenge 2015 (ILSVRC2015) Legend: Yellow background = winner in thi ...
论文笔记：Fast Neural Architecture Search of Compact Semantic Segmentation Models via Auxiliary Cells
Fast Neural Architecture Search of Compact Semantic Segmentation Models via Auxiliary Cells 2019-04- ...
OSVOS 半监督视频分割入门论文（中文翻译）
摘要: 本文解决了半监督视频目标分割的问题.给定第一帧的mask,将目标从视频背景中分离出来.本文提出OSVOS,基于FCN框架的,可以连续依次地将在IMAGENET上学到的信息转移到通用语义信息,实 ...
论文阅读笔记六：FCN：Fully Convolutional Networks for Semantic Segmentation(CVPR2015)
今天来看一看一个比较经典的语义分割网络,那就是FCN,全称如题,原英文论文网址:https://people.eecs.berkeley.edu/~jonlong/long_shelhamer_fcn ...
人工智能必须要知道的语义分割模型：DeepLabv3+
图像分割是计算机视觉中除了分类和检测外的另一项基本任务,它意味着要将图片根据内容分割成不同的块.相比图像分类和检测,分割是一项更精细的工作,因为需要对每个像素点分类,如下图的街景分割,由于对每个像素点 ...

随机推荐

不安分的 Go 语言开始入侵 Web 前端领域了！（ WebAssembly ）
参考:https://blog.csdn.net/csdnnews/article/details/84038848 从 Go 语言诞生以来,它就开始不断侵蚀 Java .C.C++ 语言的领地.今年 ...
Google Chrome等浏览器不允许关闭点击跟踪？？
hrome.Safari.Opera 和 Microsoft Edge 的新版本将不再允许用户关闭“链接审计( hyperlink auditing)”的功能.链接审计是一项 HTML 标准,被用于跟 ...
spring中基于注解使用AOP
本文内容:spring中如何使用注解实现面向切面编程,以及如何使用自定义注解. 一个场景比如用户登录,每个请求发起之前都会判断用户是否登录,如果每个请求都去判断一次,那就重复地做了很多事情,只要是有 ...
[properJavaRDP]在网页中实现远程连接
内容摘要: 利用开源软件properJavaRDP实现远程桌面连接如何让Applet嵌入到网页中正常运行如何处理连接win7时的异常:Wrong modulus size! Expected 64 ...
Linux下安装 Python3
前言 Linux下大部分系统默认自带python2.x的版本,最常见的是python2.6或python2.7版本,默认的python被系统很多程序所依赖,比如centos下的yum就是python2 ...
软工+C(6): 最近发展区／脚手架
// 上一篇:工具和结构化 // 下一篇:野生程序员教育心理学里面有提到"最近发展区"这个概念,这个概念是前苏联发展心理学家维果茨基(Vygotsky)提出的,英文名词是Zone ...
spring boot 操作MySQL pom添加的配置
1 在项目中的pom.xml配置文件添加依赖  <dependency> <groupId>mysql</groupId> ...
Pyspark 使用 Spark Udf 的一些经验
起初开始写一些 udf 的时候感觉有一些奇怪,在 spark 的计算中,一般通过转换(Transformation) 在不触发计算(Action) 的情况下就行一些预处理.udf 就是这样一个好用的东 ...
转 - Linux安装python3.6
https://www.cnblogs.com/kimyeee/p/7250560.html
Python——Flask框架——电子邮件
一.框架(Flask-Mail) 安装 : pip install flask-mail 二.SMTP服务器的配置配置默认值说明 MAIL_SERVER locallhost 电子邮件服务器的主 ...

dense prediction问题

dense prediction问题的更多相关文章

随机推荐

热门专题