Efficient Graph-Based Image Segmentation

转：http://blog.csdn.net/asongoficeandfire/article/details/8434799

Efficient Graph-Based Image Segmentation 是2004年由Felzenszwalb发表在IJCV上的一篇文章。主要介绍了基于图表示的图像分割。并且提出了一种基于贪心选择的图像分割方法，此方法能够考虑到全局特征。根据距离度量方式的不同，此算法有两种具体的实现形式。结果表明算法的运行时间接近于线性（相对于图中边的个数来说）。此算法的更重要的特性在于，在特征变化较小的情况下，对细节的重视性大于特征变化较大时的情况。

论文开头提到了一个分割算法要想达到广泛应用（broad utility），应该具备的两个性质：

1.应该能提取在感知上重要的区域（perceptually important regions）

2.高效的，即最好能以线性于图像像素数的时间运行

就像Urquhart 1982 所用的方法类似，文章的算法基于用图表示图像：图像中的每个像素表示图上的一个节点，每一条连接节点的无向边都具有一个权重（weights），以衡量其连接的两个节点之间的不相似度（dissimilarity）。与传统方法不同的是，本文会根据相邻区域在特征值上变化速度的大小动态调整分割阈值（adaptively adjusts the segmentation criterion based on the degree of variability in neighboring regions of the image）。

上图这个例子说明，图像分割算法既不能单一的使用像素强度值的变化作为分割依据，也不能使用单一的分割阈值来决定分割与否。所以文章中提到的算法基于两个特征来判断两个区域是否应该合并：区域间间距和区域内间距。如果两个区域的区域间间距明显大于其中任意一个区域的区域内间距，那么就认为这两个区域之间存在明显的界限（即不可以merge两个区域）。

区域对比较断言（pairwise region comparison predicate）

定义区域内间距如下：即区域对应MST（minimum spanning treee最小生成树）中权重最大的边的权重值。

定义区域间间距如下：即在所有分别属于两个区域且有边连接的点对中，寻找权重最小的那对（若两个区域内的点没有边相连，则定义间距为正无穷大）。

（在此提到如果利用最大和最小这两个极端的度量方式，可能对有些结果造成误差，为了更好的鲁棒性，建议选择使用quantile点的方式。但实际实验中，使用最值方式效果相当好（works quite well），而且复杂度明显要比使用qualtile点方式小很多（Appendix中有关于quantile点方式复杂度的证明））。

有了区域内间距和区域间间距的定义之后，通过比较两者之间的关系，就可以得出断言函数的形式：，其中，。注意，此处的τ是一个阈值函数，用来控制两个区域的区域间间距要在多大程度上大于他们的区域内间距才能被认定为两个区域间有明显的分割界限。举个例子来说，当其中一个区域很小时，Int（C)并不能很好的反应其区域内间距（极端的情况是当C只含一个节点时，Int（C）=0）。本文在此处对τ的定义为|C|的负相关函数：，其中k是一个常数。k要根据实验的具体情况来确定其值，但当k越大时，我们界定的可以区分两个区域的界限就越明显。

更重要的是，只要不与实验目的相悖，任何非负函数都可以用来表示τ。比如：如果我们需要将图像分割成为特定形状的区域，则可以将τ定义为与复合这个特定形状正相关的函数。而且τ对特定形状的倾向性可强可弱。这确保了开头提到的第一条性质的实现。

分割算法

输入是一个有n个节点和m条边的图G，输出是一系列区域。步骤如下：

0.将边按照权重值以非递减方式排序

1.最初的分割记为S（0），即每一个节点属于一个区域

2.按照以下的方式由S(q-1)构造S(q)：记第q条边连接的两个节点为vi和vj，如果在S(q-1)中vi和vj是分别属于两个区域并且第q条边的权重小于两个区域的区域内间距，则合并两个区域。否则令S(q) = S(q-1)。

3.从q=1到q=m，重复步骤2

4.返回S(m)即为所求分割区域集合

算法过程保证了开头提到的第二条性质。

接下来论文具体实现了两种算法：基于Grid Graphs的和基于Nearest Neighber Graphs的方法。

两者的区别在于graph中节点和边的选取方式的不同：GG方法将图像中的每个元素视为一个节点，只要两个像素相邻，则认为其对应的节点之间有边连接（一般来说，每个节点有8条边）。边的权重值为对应两个节点的像素值差值的绝对值。（细节方面，1预处理过程使用σ=0.8的高斯函数来对图像进行平滑以减少噪声。2当图像为三通道图像时，将算法应用于全部三个通道，只有当三个通道全部给出合并区域的建议时才合并区域。3文章中使用的k值，当图片是128*128时k=150，当图片是320*240时k=300，即k值大概与图片尺寸成正比）。NNG方法先将图像的每个像素映射到特征空间形成图的节点，然后利用特征空间中的距离选取与其距离最近的点作为他们的邻居（有多种方法来选择邻居节点，即可以选择与其最近的k个邻居点，也可以选择与其距离不超过d的所有点作为邻居点），连接邻居点的边权重为两个对应节点在特征空间内的距离。

结果说明，NNG算法比GG算法在保证算法第一条性质的效果上要更好一些。

论文中还有涉及到related works和一些定理的证明，以及results部分，在此暂不做讨论。

Efficient Graph-Based Image Segmentation的更多相关文章

VIPS: a VIsion based Page Segmentation Algorithm
VIPS: a VIsion based Page Segmentation Algorithm VIPS: a VIsion based Page Segmentation Algorithm In ...
Graph Based SLAM 基本原理
作者 | Alex 01 引言 SLAM 基本框架大致分为两大类:基于概率的方法如 EKF, UKF, particle filters 和基于图的方法 .基于图的方法本质上是种优化方法,一个以最小化 ...
论文解读（GCC）《Efficient Graph Convolution for Joint Node RepresentationLearning and Clustering》
论文信息论文标题:Efficient Graph Convolution for Joint Node RepresentationLearning and Clustering论文作者:Chaki ...
论文阅读笔记五十二：CornerNet-Lite: Efficient Keypoint Based Object Detection（CVPR2019）
论文原址:https://arxiv.org/pdf/1904.08900.pdf github:https://github.com/princeton-vl/CornerNet-Lite 摘要基 ...
论文阅读-Temporal Phenotyping from Longitudinal Electronic Health Records: A Graph Based Framework
Awesome Deep Vision
Awesome Deep Vision A curated list of deep learning resources for computer vision, inspired by awes ...
Computer Vision Tutorials from Conferences (3) -- CVPR
CVPR 2013 (http://www.pamitc.org/cvpr13/tutorials.php) Foundations of Spatial SpectroscopyJames Cogg ...
PP: Extracting statisticla graph features for accurate and efficient time series classification
Problem: TSC, time series classification; Traditional TSC: find global similarities or local pattern ...
Survey of single-target visual tracking methods based on online learning 翻译
基于在线学习的单目标跟踪算法调研摘要视觉跟踪在计算机视觉和机器人学领域是一个流行和有挑战的话题.由于多种场景下出现的目标外貌和复杂环境变量的改变,先进的跟踪框架就有必要采用在线学习的原理.本论文简 ...
Visualizing MNIST with t-SNE, MDS, Sammon’s Mapping and Nearest neighbor graph
MNIST 可视化 Visualizing MNIST: An Exploration of Dimensionality Reduction At some fundamental level, n ...

随机推荐

redux样板代码简化写法
直接使用redux,要写很多样板代码,大量的actiontype,actionCreator.一个异步的方法要写三个actiontype,三个actionCreator,十分繁琐.下面是本人使用的一种 ...
【题解】互不侵犯 SCOI 2005 BZOJ 1087 插头dp
以前没学插头dp的时候觉得这题贼难,根本不会做,学了才发现原来是一裸题. 用二进制表示以前的格子的状态,0表示没放国王,1表示放了国王. 假设当前位置为(x,y),需要记录的是(x-1,y-1)至(x ...
C# 生成订单号的几种方式
public class RandomNumber { public static object _lock = new object(); ; public string GetRandom1() ...
Difference between Netbios and Host name
Hostnames or NetBIOS names were used to provide a friendlier means of identifying servers or worksta ...
Spring filter和拦截器(Interceptor)的区别和执行顺序
转载自:http://listenup.iteye.com/blog/1559553 1.Filter过滤器只过滤jsp文件不过滤action请求解决方案解决办法:在web.xml中将filter的 ...
js的数据类型--数字
近期做一些项目的时候发现,自己的js基础还是不够扎实,再看一遍犀牛书,加深自己的理解和印象.所以从这篇文章开始,后面都是关于原生js的一些内容. 这篇文章,我们具体介绍一下js的数据类型其中一种. j ...
LightOJ 1023 Discovering Permutations 水题
http://www.lightoj.com/volume_showproblem.php?problem=1023 题意:26字母全排列思路:用next_permutation或者思维想一下都可以 ...
[cerc2012][Gym100624C]20181013
题意:用元素符号表示字符串题解:签到题简单dp 难点在于把元素符号都改成小写qaq #include<cstdio> #include<cstdlib> #include& ...
JQGrid 导出Excel 获取筛选条件
需求描述:页面加载后,进行相关数据搜索,要求点击导出按钮后下载Excel文件. 思路:希望在点击[导出Excel]按钮时,获取到表格搜索时的filters内容. 在百度.api.jqgrid.js ...
js基础知识点收集
js基础知识点收集 js常用基本类型 function show(x) { console.log(typeof(x)); // undefined console.log(typeof(10)); ...

Efficient Graph-Based Image Segmentation

Efficient Graph-Based Image Segmentation的更多相关文章

随机推荐

热门专题