(1)线段检测应用背景

(2)线段检测原理简介

(3)线段检测实例 a line segment detector

(4)hough 变换和 lsd 的区别

---------------------author:pkf

------------------------------time:2015-1-26

-----------------------------------------qq:1327706646

(1)线段检测应用背景

  线段检测在高铁电机机车顶部图像检测系统中有很大应用,像受电弓检测程序之类的,很有必要,最近也是客户有这个需求,做lsd移植发现的。

http://wenku.baidu.com/link?url=Tsm6xLIA1Dx2VQECCpY8xpMRWm0bcnJ0Ivn_dk4Nb5DcEwPVqOE9pn55sBpHvt8aKqe7s6XLMcyHNLMkJbAn-iqO9uPbVbrkApmGSVqOLf3 机车顶部图像检测系统方案!

http://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=受电弓检测程序&rsv_pq=b0f1b87b000047b9&rsv_t=17eaouGpLbNXKYoRVknb%2B3%2BRaEZADB3lfcGpq7nR%2FQCM9hZcVI2x7vj%2FgaE&rsv_enter=1&inputT=1014&rsv_sug3=4&rsv_n=2&rsv_sug2=0&rsv_sug4=1872

(2)线段检测简介

  为提高数字图像中的直线的检测速度,从时频域变换和空间域变换两个角度出发,提出了一种改进型数字图像中直线快速检测方法。首先,采用小波提升提取图像中的低频轮廓信息,抑制高频噪声。然后,对像素降低后的图像进行二值化处理;基于"两点确定一条直线"以及Hough变换过程中"图像空间中一条直线上的多个点对应参数空间中一个点"的原理,按照从局部到整体的检测顺序,将二值化后图像空间中的非零点映射到参数空间中具有较大存在概率的累加单元,而不是所有可能的累加单元。最后,对累加单元进行统计,以确定图像中直线的参数。利用该方法对一幅像素为128×128的数字图像进行直线检测,耗时为213 ms。

首先,我们需要回顾一下,为什么需要检测图像中的直线段?直线段作为图像中边缘的一种,又有什么特殊之处呢?在Marr关于视觉的计算理论中提到,视觉是一种处理过程,经过这个过程我们能从图像中发现外部世界中有什么东西和它们在什么地方。同时,我们还知道,信息处理具有三个层次:(1)第一个层次是信息处理的计算理论(theory),也就是研究是对什么信息进行计算和为什么要进行这些计算;(2)第二个层次是算法(algorithm),也就是如何进行所需要的计算,或者说是设计算法;(3)第三个层次是实现算法的机制,也就是研究某一算法的特定构成。对于视觉系统,观看图像的过程,也可以看做是信息处理的过程。从图像推理得到物体的形状信息的过程也可以对应为三个阶段:(1)初始简图(primal sketch),这个初始简图可以是轮廓图像,也可以是一堆具有特定意义的特征点构成的掩码,或者是像素的光强等信息;(2)2.5维简图(2.5 dimensional sketch),2.5维简图是对初始简图进行一系列的处理和运算,推导出的一个能反映某些几何特征的表象,它和初始简图都是以观察者为核心;(3)三维模型(3D model)。

那么哪些信息可以用来构造图像的初始简图呢?一个形象的例子是画画。画家速写时,用很少的边,点,线等符号,就可以勾勒出大致的景物。当然,这样的景物与实际景物在人体视网膜上产生的以像素为单位的亮度矩阵式不一样的,但是人们也可以轻松的识别出他们。这说明视觉对图形所做的第一个运算就是把他们转换成一些原始符号构成的描述,这些描述所反映的不止是亮度的绝对值的大小,还有图像中的亮度变化和局部的几何特征。

初始简图是一种基元。它可以由若干边缘段(edge segments),线(line segment),斑点(blob)和端点(terminations)构成,这些杂乱的基元构成的初始简图又被称作未处理的初始简图,当这些基元通过各种方式进行聚合、概括和抽象以形成更大、更加抽象的标记(tokens)时,这样的初始简图又被称为完全的初始简图。

这也就是边缘检测之所以称为图像处理和机器视觉的基本问题的原因。边缘检测的直接目的是寻找未处理的初始简图。它通常寻找图像中亮度变化明显的点,当这些点位置相邻且方向相近时,则构成了边缘中的特殊边缘-直线段。目前流行的直线检测算法主要是霍夫变换,它的优势是不受图像旋转的影响,易于进行几何图像的快速变换。基于霍夫变换的改进方法也很多,其中一个重要的方法是广义霍夫变换,可以用来检测任意形状的曲线。

最简单的霍夫变换是在图像中识别直线。在平面直角坐标系(x-y)中,一条直线可以用方程

表示。对于直线上一个确定的点(,),有

这表示参数平面(k-b)中的一条直线。因此,图像中的一个点对应参数平面中的一条正弦曲线,图像中的一条直线对应参数平面中的一个点。对图像上所有的点作霍夫变换,最终所要检测的直线对应的一定是参数平面中直线相交最多的那个点。这样就在图像中检测出了直线。在实际应用中,直线通常采用参数方程

.

类似的还有检测线段、圆、圆弧、椭圆、矩形等的霍夫变换。

废话了这么多,终于开始回顾LSD了,使用LSD主要是在遥感图像中几何形状明显的目标进行检测时用到。利用LSD,可以快速的检测图像中的直线段,然后根据目标的几何特征设计快速算法,以快速确定疑似目标区域。

LSD的核心是像素合并于误差控制。利用合并像素来检测直线段并不是什么新鲜的方法,但是合并像素的方法通常运算量较大。LSD号称是能在线性时间(linear-time)内得到亚像素级准确度的直线段检测算法。LSD虽然号称不需人工设置任何参数,但是实际使用时,可以设置采样率和判断俩像素是否合并的方向差。我们知道,检测图像中的直线其实就是寻找图像中梯度变化较大的像素。因此,梯度和图像的level-line是LSD提及的两个基本概念。LSD首先计算每一个像素与level-line的夹角以构成一个level-line场。然后,合并这个场里方向近似相同的像素,这样可以得到一系列regions,这些 regions被称为 line support regions。如下图所示。

每一个line support region其实就是一组像素,它也是直线段(line segment)的候选。同时,对于这个line support region,我们可以观察它的最小外接矩形。直观上来讲,当一组像素构成的区域,特别细长时,那么这组像素更加可能是直线段。基于此,作者还统计了line support region的最小外接矩形的主方向。line support region中的一个像素的level-line 角度与最小外接矩形的主方向的角度差在容忍度(tolerance)2τ内的话,那么这个点被称作"aligned point"。作者统计最小外接矩形内的所有像素数和其内的alinedg points数,用来判定这个line support region是否是一个直线段。判定的准则使用的是“a contrario approach”和“Helmholtz principle”方法。在这里,aligned  points的数量是我们感兴趣的信息。因此作者考虑如下假设:aligned points越多,那么region越可能是直线段。对于一副图像i和一个矩形r,记k(i,r)为aligned points的数量,n(r)为矩形r内的总像素数。那么,我们希望能够看到:

其中,Ntest是所有要考虑的矩形的数量。PH0是针对 contrario model H0的一个概率。I是在H0模型下的随机图像。在这篇文章中,作者用H0的模型,主要有以下两个属性:

(1){LLA(j)},其中j是像素,是一由一组随机变量组成;(2)LLA(j)在[0,2π]上均匀分布。

因此,判断一个像素是不是aligned point可以记作概率:

p = τ/π

这样,再通过误差控制,最终的直线段检测算法如下:

在上述算法中,还有两个要点我们没有解释。一是line support region具体是怎么得到了,二是怎样进行误差控制的。

前面我们说过,line support region是通过合并方向近似相同的像素得到。其实在这里,这个合并的过程更多的是依赖于区域生长算法。对于一个level-line 场LLA,种子像素P,和容忍度 τ。我们 可以通过简单的区域生长算法来得到line support region,具体的算法过程参考论文里给出的步骤吧。

至于NFA(the number of false alarms)计算,作者使用如下公式计算:

其中,N和M是采样过后图像的列和行,B(n,k,p)是一个二项分布。n依旧是矩形内所有像素数,k是矩形内的所有p-aligned point数。此处的p-aligned point是指和矩形的主方向在容忍度pπ下方向相同的像素。如果,那么可以认为结果有效。

在实际使用作者的源码时,可以调整lsd函数中的scale来调整图像采样率。此外,合并角度代码里默认是22.5度。图像越小,角度越小,得到的结果越少。不过当图像采样不同时,在同一位置可能得到差异特别大的直线段,这个暂时不知道是什么造成的。

一个比较迷人的结果:

http://blog.csdn.net/polly_yang/article/details/10085401

http://blog.csdn.net/carson2005/article/details/9326847

http://coursegraph.com/category/math

http://blog.csdn.net/polly_yang/article/category/1243538 pgm 公开课

(3)线段检测实例 a line segment detector

有带缩放的高斯下采样,也有1.0的不缩放的检测

http://www.ipol.im/pub/art/2012/gjmr-lsd/?utm_source=doi v1.6

http://blog.csdn.net/tianwaifeimao/article/details/17678669

(4)hough 变换和 lsd 的区别

http://blog.csdn.net/tianwaifeimao/article/details/17678669 各自优缺点

目标检测之线段检测---lsd line segment detector的更多相关文章

  1. 目标检测之单步检测(Single Shot detectors)

    目标检测之单步检测(Single Shot detectors) 前言 像RCNN,fast RCNN,faster RCNN,这类检测方法都需要先通过一些方法得到候选区域,然后对这些候选区使用高质量 ...

  2. 带你读AI论文丨用于目标检测的高斯检测框与ProbIoU

    摘要:本文解读了<Gaussian Bounding Boxes and Probabilistic Intersection-over-Union for Object Detection&g ...

  3. OPENCV图像特征点检测与FAST检测算法

    前面描述角点检测的时候说到,角点其实也是一种图像特征点,对于一张图像来说,特征点分为三种形式包括边缘,焦点和斑点,在OPENCV中,加上角点检测,总共提供了以下的图像特征点检测方法 FAST SURF ...

  4. kaggle信用卡欺诈看异常检测算法——无监督的方法包括: 基于统计的技术,如BACON *离群检测 多变量异常值检测 基于聚类的技术;监督方法: 神经网络 SVM 逻辑回归

    使用google翻译自:https://software.seek.intel.com/dealing-with-outliers 数据分析中的一项具有挑战性但非常重要的任务是处理异常值.我们通常将异 ...

  5. JavaScript浏览器检测之客户端检测

    客户端检测一共分为三种,分别为:能力检测.怪癖检测和用户代理检测,通过这三种检测方案,我们可以充分的了解当前浏览器所处系统.所支持的语法.所具有的特殊性能. 一.能力检测: 能力检测又称作为特性检测, ...

  6. Opencv+Yolov3算法实现社交距离安全检测讲解和实战(Social Distance Detector)

    在我们进行交流谈话时,人与人之间总要保持一定的距离,尤其是在疫情的情况下,人与人之间更要保持一定的安全距离,今天给大家来介绍一个检测社交距离的项目,实现社交距离检测器. 社交距离(Social Dis ...

  7. HowTo Perform the spatial selection 'Share a line segment with' using ArcObjects

    HowTo  Perform the spatial selection 'Share a line segment with' using ArcObjects Article ID: 26528 ...

  8. unity3d 赛车游戏——复位点检测优化、反向检测、圈数检测、赛道长度计算

    接着上一篇文章说 因为代码简短且思路简单 所以我就把这几个功能汇总为一篇文章 因为我之前就是做游戏外挂的 经过验证核实,**飞车的复位点检测.圈数检测就是以下的方法实现的 至于反向检测和赛道长度计算, ...

  9. 离群点检测与序列数据异常检测以及异常检测大杀器-iForest

    1. 异常检测简介 异常检测,它的任务是发现与大部分其他对象不同的对象,我们称为异常对象.异常检测算法已经广泛应用于电信.互联网和信用卡的诈骗检测.贷款审批.电子商务.网络入侵和天气预报等领域.这些异 ...

随机推荐

  1. 推荐10个免费的HTML编辑器

    如果你想开发一个网站,你肯定想要一个很棒的HTML编辑器,一个好的编辑器可以让代码更加整齐格式化,前端显示也会更好,从而提升你的工作效率.下面就为开发者推荐10个免费的HTML编辑器,你可以尝试使用. ...

  2. Linux C 面试题总结

    1.进程和线程的区别,及优劣性比较 进程和线程的主要差别在于它们是不同的操作系统资源管理方式.进程有独立的地址空间,一个进程崩溃后,在保护模式下不会对其它进程产生影响,而线程只是一个进程中的不同执行路 ...

  3. Python 操作mongodb 简单实例

    1.建立数据库用户 要读写 mongo数据库,默认没有用户名和密码也可以对数据库进行读写操作,但是从安全的角度,最好给要操作的数据库建立用户名和密码. 打开mongo数据库服务,打开mongo.exe ...

  4. Key-Value Observing (键值监測)

    Key-Value Observing (键值监測) 简单介绍 KVO是一套当目标对象的属性值改变时观察者对象能够接受到通知的机制.必须先理解KVC才干更好的理解KVO,前者是后者的实现基础. 这种通 ...

  5. Laravel 5系列教程二:路由,视图,控制器工作流程

    免费视频教程地址https://laravist.com/series/laravel-5-basic 上一篇教程我们走了那么长的路,终于把Laravel安装好了,这一篇教程我们就要进入Laravel ...

  6. Java源码阅读LinkedHashMap

    1类签名与注释 public class LinkedHashMap<K,V> extends HashMap<K,V> implements Map<K,V> 哈 ...

  7. Scala快学笔记(一)

    一,基本概念: 1,Scala是一种基于JVM的面向对象和函数式编程语言 2,基本类型:数值类型 ->:Byte,Short,Int,Long,Float,Double和布尔类型:Boolean ...

  8. web应用程序指识别中的指纹收集

    web应用程序指纹识别是入侵前的关键步骤,假设通过指纹识别能确定web应用程序的名称及版本号.下一步就可以在网上搜索已公开的漏洞.或网上搜到其源码然后进行白盒的漏洞挖掘. 指纹识别的核心原理是通过正則 ...

  9. Linux启动U盘制作

    Linux目前最好的u盘启动工具之一,下面介绍它的用法,首先下载Linux live OK了,一步一步跟我步骤走! 启动时,选择需要用的U盘 步骤二,就选择安装源即可(一般为ISO文件) 最后进行步骤 ...

  10. Django——基于类的视图源码分析 二

    源码分析 抽象类和常用视图(base.py) 这个文件包含视图的顶级抽象类(View),基于模板的工具类(TemplateResponseMixin),模板视图(TemplateView)和重定向视图 ...