1、基本信息

题目:使用马尔科夫场实现基于超像素的RGB-D图像分割;

作者所属:Ferdowsi University of Mashhad(Iron)

发表:2015 International Symposium on Artificial Intelligence and Signal Processing (AISP)

关键词:微软Kinect传感器;RGB-D图像分割;MRF;法向量

2、摘要

针对问题:能量最小化;

使用场景:室内场景标签问题(分割、分类等);

主要数据:微软Kinect获得的带有距离信息的图像数据;

主要方法:基于色彩和距离变化对原图进行超像素预处理,使用图像模型处理超像素块,并用MRF推断得到最后的标签结果;

主要结果:NYU的数据,效果更好;

可取与差异:图像模型如何套用在预处理结果的,以及MRF的带入?SAR图像可以得到距离信息,但是否有必要?效率和质量上有没有可取之处?

3、Introduction

--distance,距离因素相比其他rgb等信息,收到的干扰要小/少一点;同样也是因为运用了距离信息进行了超像素预处理(当然也用了色彩的信息),比其他效果要好;

--本文把分割问题看作是一个随机优化问题(另一种常见的看法是该问题是一个确定的优化问题);

--随机优化又有两种模型:图像模型和其他非图像的模型(用参数或非参的方法得到后延概率);本文使用著名的后验概率图像模型——MRF——来最小化势能量函数,以得到每个超像素的全局的最优标签;

4、Related works

略。(与自己研究相关的少,主要是3D图像的处理问题,针对性太强,适用面窄,又需要再看吧)

5、MRF

--labeling问题:最大化后验概率p(L|f),在f特征下的L的最大化——》利用贝叶斯公式,得到=p(f|L)*P(L)/P(f),P(f)是个常数,分析中可以忽略掉;P(f|L)等于是似然函数,P(L)用gibbs分布等于到u能量函数,再变为势函数——》所以,标签问题由求标签的最大后验概率,变为求最小势能函数之和(或最小能量函数,这就是个名字)——》若后验概率假设是高斯分布的,得到式子后,v变为potts模型(似乎是本文采用的模型)

--这里,最后的势函数是所谓的order2势函数,反应了图中相邻标签的关系;之前的势函数反应的是单一像素/超像素在图中的关系。(?)

6、三边的深度去噪(?)

提出了一种针对性的去噪方法,但没怎么看懂——不过自己的研究中,因为针对的是高分辨率的图像,且强调速度的实现,这里跳过。

7、Proposed Method

7.1 超像素提取方法

--是很重要的一步,影响最终结果很多(同);

--针对labcie彩色空间的canny边缘检测方法和针对深度(距离)信息的相邻像素法向量的cos夹角方法;

--也就是说,文中是用这两种边缘检测方法得到边缘,然后将得到的分割后的块作为下一步处理的超像素(也就是说,大小形状不定);(这里倒是提供了一种超像素的思路,由边缘检测等其他方法得到,自己定义超像素亦可,只要服务于我!!)

7.2 能量函数(?)

--这里没有太懂:order3势函数也有了,表示两个相邻像素的order2势函数的集合(?);

7.3 最小化(势函数)方法

--已经有很多(成熟的)方法:ICM,Graph Cut,梯度下降,a-expansion, a-beta-swap and message passing based method;

--本文采用的是一种MRF方法,具体是把原始问题分解为sub(亚)问题——变成主从系列的问题,仆一个一个解决,让主不断更新到最后的结果;起了个算法名字:快速原始对偶算法(Fast Primal Dual Algorithm);

8、实验结果

--具体的就不多说了,毕竟不是很一样,谈谈可取之处;

--数量:30个场景/图片;

--评判方法:与the Hoover method对比(公认的一些方法),以及其他成熟方法;三个指标(correct detection,noise instances,missed instances)作图展示!

9、Conclusion

--利用几何信息(这里特指深度/距离信息)增强分割结果;

--具体实现的方法是利用MRF原理,把信息“加载”到能量函数中去;

--在预处理阶段(得到超像素),利用了彩色边缘和几何(深度)边缘来做检测的;

--适用于high level图像处理问题,以及机器人导航问题(用kniect);

10、Future works

--更好的分割结果;

--现有或前次分割结果的利用;每次迭代后标签的反馈信息;

11、参考文献

[9] Radhakrishna Achanta, Appu Shaji, Kevin Smith, Aurélien Lucchi,Pascal Fua, Sabine Süsstrunk: S L IC Superpixels Compared to Stateof-the-Art Superpixel Methods. IEEE Trans. Pattern Anal. Mach.Intell. 34(11): 2274-2282 (2012).

[31] Komodakis, N., Paragios, N., Tziritas, G., "MRF Energy Minimization and Beyond via Dual Decomposition," Pattern Analysis and Machine Intelligence, IEEE Transactions on , vol.33, no.3,pp.531,552, March 2011.

[32] Chaohui Wang, Nikos Komodakis, Nikos Paragios, "Markov Random Field modeling, inference & learning in computer vision ; image understanding", A survey, Computer Vision and Image Understanding, Volume 117, Issue 11, Pages 1610-1627, ISSN 1077-3142, 2013.94

12、个人总结

--获得超像素的方法,不死板,对超像素定义的理解更深入;

--运用MRF的能量函数的变化,来实现所谓的“基于”;

--没有讲具体怎么实现的问题由大化小的,对超像素块的操纵还是不灵光...

Superpixel Based RGB-D Image Segmentation Using Markov Random Field——阅读笔记的更多相关文章

  1. 马尔科夫随机场(Markov Random Field)

    马尔可夫随机场(Markov Random Field),它包含两层意思:一是什么是马尔可夫,二是什么是随机场. 马尔可夫过程可以理解为其当前的状态只与上一刻有关而与以前的是没有关系的.X(t+1)= ...

  2. Dostoevsky: Better Space-Time Trade-Offs for LSM-Tree Based Key-Value Stores via Adaptive Removal of Superfluous Merging 阅读笔记

    Introduction 主流的基于LSM树的KV存储都在两方面进行权衡,一方面是写入更新的开销,另一方面是查询和存储空间的开销.但它们都不是最优的,问题在于这些存储系统在LSM树的每一个level上 ...

  3. Markov Random Fields

    We have seen that directed graphical models specify a factorization of the joint distribution over a ...

  4. 个性探测综述阅读笔记——Recent trends in deep learning based personality detection

    目录 abstract 1. introduction 1.1 个性衡量方法 1.2 应用前景 1.3 伦理道德 2. Related works 3. Baseline methods 3.1 文本 ...

  5. 马尔可夫随机场(Markov random fields) 概率无向图模型 马尔科夫网(Markov network)

    上面两篇博客,解释了概率有向图(贝叶斯网),和用其解释条件独立.本篇将研究马尔可夫随机场(Markov random fields),也叫无向图模型,或称为马尔科夫网(Markov network) ...

  6. Adversarial Examples for Semantic Segmentation and Object Detection 阅读笔记

    Adversarial Examples for Semantic Segmentation and Object Detection (语义分割和目标检测中的对抗样本) 作者:Cihang Xie, ...

  7. 论文阅读笔记二十四:Rich feature hierarchies for accurate object detection and semantic segmentation Tech report(R-CNN CVPR2014)

    论文源址:http://www.cs.berkeley.edu/~rbg/#girshick2014rcnn 摘要 在PASCAL VOC数据集上,最好的方法的思路是将低级信息与较高层次的上下文信息进 ...

  8. 论文阅读笔记二十二:End-to-End Instance Segmentation with Recurrent Attention(CVPR2017)

    论文源址:https://arxiv.org/abs/1605.09410 tensorflow 代码:https://github.com/renmengye/rec-attend-public 摘 ...

  9. 论文阅读笔记十七:RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation(CVPR2017)

    论文源址:https://arxiv.org/abs/1611.06612 tensorflow代码:https://github.com/eragonruan/refinenet-image-seg ...

随机推荐

  1. WPF的ComboBox 数据模板自定义

    WPF的ComboBox 有些时候不能满足用户需求,需要对数据内容和样式进行自定义,下面就简要介绍一下用数据模板(DataTemplate)的方式对ComboBox 内容进行定制: 原型设计如下: 步 ...

  2. windows 安装 go语言

    下载地址:http://www.cnblogs.com/osfipin/p/4856839.html. 官方教程说明: Windows 对于Windows用户,Go项目提供两种安装选项(从源码安装除外 ...

  3. [deviceone开发]-仿微信应用(一):框架搭建

    一.简介 这个示例是一步一步跟我学DeviceOne开发 - 仿微信应用系列文档对应的文档.详细介绍了ListView,IndexListView,add方法等常用功能,推荐初学者学习. 二.效果图 ...

  4. [原][CSS3]会动的盒子机器人

    [PC与移动端皆可]会动的盒子机器人 浏览器必须可以解析perspective属性. 在线:http://wangxinsheng.herokuapp.com/boxMan 代码: <!DOCT ...

  5. java连接hbase报错

    报错信息如下: The node /hbase is not in ZooKeeper. It should have been written by the master. Check the va ...

  6. 虚拟机克隆以后出现“需要整合虚拟机磁盘”的解决方法

    问题描述 在虚拟机克隆完毕以后,原始虚拟机提示"需要整合虚拟机磁盘" 在"任务与事件"栏中看到以下信息 解决方法 从上面可以看到是因为整合失败导致的,那么我们只 ...

  7. 利用Dreamweaver配置PHP服务器的站点

    配置的步骤: 1.打开Dreamweaver的站点------->新建站点-------->点击保存 2.点击服务器------>保存 3.配置完成之后就可以看到在Dreamweav ...

  8. EditText显示明文与密码

    布局 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android=& ...

  9. js获取url

    location.href 返回完整的url location.origin  返回带协议的主机域名  如http://www.test.com location.pathname  返回url中路径 ...

  10. symfony2 安装并创建第一个页面

    1.安装和配置 参考 http://symfony.cn/docs/book/installation.html 使用安装工具: windows系统 Open your command console ...