颜色和边缘的方向性描述符(Color and Edge Directivity Descriptor,CEDD)

本文节选自论文《Android手机上图像分类技术的研究》。

CEDD具有抽取特征速度较快,特征描述符占用空间较小的优势。下面就对CEDD原理进行详细的阐述和分析。

1.颜色信息

CEDD特征结合了颜色和纹理两方面信息,本小结将给出颜色信息提取的过程,重点分析RGB-HSV模型转换、10-bins模糊过滤器和24-bins模糊过滤器的原理。

1.1.RGB模型转换为HSV模型

RGB模型可以说是我们最熟悉、使用也最多的颜色模型,它们分别代表组成一个颜色的三个分量,(0,0,0)代表黑色,(255,255,255)
代表白色,(255,0,0)代表红色,(0,255,0)代表绿色,(0,0,255)代表蓝色,其它颜色也可通过调整这三个分量表示出来。RGB颜色
模型的设计是根据色彩发光原理而来的,且与硬件相关,一般情况下,计算机都会釆用这种空间模型在屏幕上显示某种颜色的定义,即人们所熟悉的三色组合。所
以,当从一幅图像中提取像素点时首先提取的一般也是像素点的RGB信息。

HSV模型中,H (Hue)代表色调,指通过物体传播或从物体射出的颜色,一般在使用中是由颜色名称来标识的。S
(Saturation)代表饱和度,表示色调中灰色成分的比例,指颜色的纯度或强度。V
(Value)代表亮度,指颜色相对的明暗程度。HSV模型能够较好地反应人对颜色的感知和鉴别能力,所以非常适合于比较基于颜色的图像相似性,在图像分
类中也得到了广泛应用。

综合上述两点,在提取颜色信息前就需要对图像像素进行RGB-HSV的模型转换。在此特征提取算法中RGB-HSV转换的方式稍有不同,且最后得出的S、V取值范围也有差别,都是(0,255),但基本原理不变,这是为了方便于后面在模糊过滤器中的运算,转换公式如下:

这里所有的HSV值最后都取整数。

通过上面的计算,便可以得出像素点的HSV值,下面将用HSV值进行模糊过滤,得出颜色信息的直方图。

1.2. 10-bins模糊过滤器

10-bins模糊过滤器的工作过程是通过三个通道输入HSV信息,然后输出10个模糊的直方图信息值。10个直方图信息值的含义如下:(0)黒色
(Black),(1)灰色(Gray),(2)白色(White),(3)红色(Red),
(4)橙色(Orange),(5)黄色(Yellow),(6)绿色(Green),(7)青色(Cyan),(8)蓝色(Blue),(9)品红色
(Magenta)。其原理如图所示。

10-bins模糊过滤器是基于模糊理论的,我们先来分析一下模糊理论中颜色径向边缘的生成。由于H代表的是色调,从它的计算方法可以看出H的取值
范围为0-360,则当一张图片上出现由一种颜色向另一种颜色过渡时,H值的变化就会较快,这时就会出现所谓的颜色径向边缘。根据模糊理论可以找出这些径
向边缘的位置。如图所示,图(a)为提取出的H通道值的图像,图(b)是将图(a)通过CLF过滤器模糊处理后得出的。CLF的英文全称为
Coordinatelogic
filters,它的方法就是将图像上每个3*3方块的九个像素点的二进制值进行逻辑“与”运算,这样,在H通道的颜色边缘处就会出现较小的H值,也就是
我们看到的图
(b)的效果。再将原H值图像与过滤后的H图像进行差运算即可得如图(c)所示的较明显的颜色径向边缘。图 (d)为H通道理论上的径向边缘位置。

通过上述原理反复实验可以得到H径向边缘的范围,如图所示,将H通道的值分为八个模糊区域,每一区域依次命名为:(0)红色-橙色(Redto
Orange),(1)橙色(Orange),(2)黄色(Yellow),(3)绿色(Green),(4)青色(Cyan),(5)蓝色
(Blue),(6)品红色(Magenta),(7)蓝色-红色(Blueto Red)。每两个相邻区域都有交叉的部分。

3.1.3.24-bins模糊过滤器

24-bins模糊过滤器就是将10-bins模糊过滤器输出的每种色区再分为3个H值区域,输入一个10维向量和S、V通道值,输出的是一个24
维向量,其系统模型如图3-7所示。它输出的每一维所代表的信息分别是:(0)黑色(Black),(1)灰色(Grey),(2)白色(White),
(3)暗红色(Dark Red),(4)红色(Red),(5)浅红(Light
Red),(6)暗橙色(DarkOrange),(7)橙色(Orange),(8)浅橙色(Light Orange),(9)暗黄色(Dark
Yellow),(10)黄色(Yellow),
(11)浅黄色(LightYellow),(12)深绿色(Dark Green),(13)绿色(Green),(14)浅绿色(Light
Green),(15)暗青色(Dark Cyan),(16)青色(Cyan),(17)浅青色(Light Cyan),(18)深蓝色(Dark
Blue),(19)蓝色(Blue),(20)淡蓝色(LightBlue),(21)暗品红色(DarkMagenta),(22)品红色
(Magenta),(23)浅品红色(Light Magenta)。

3.2.纹理信息

本小结将介绍CEDD特征中纹理信息的提取过程,通过YIQ模型计算出像素灰度值,再提取图像的边缘方向直方图纹理信息。

3.2.1.YIQ彩色空间

YIQ色彩空间属于NTSC (国际电视标准委员会)系统。Y(Luminace)代表了颜色的明视度,直观点说就是图像的灰度值。I和Q
(Chrominace)代表了色调信息,它们分别描述图像色彩以及饱和度的属性。在YIQ色彩空间模型中,Y分量表示图像的亮度信息,I和Q分量表示颜
色信息,I分量是指从橙色到青色,Q分量则是指从紫色到黄绿色[24]。

通过对彩色图像从RGB到YIQ空间的转换,可以分开彩色图像中的亮度信息与色度信息,并对其各自进行独立处理。RGB转换到YIQ空间模型的对应关系如下面方程所示:

提取纹理特征时,最常用的就是图像的灰度值,这里引出YIQ空间也只为求出Y值,以便后面进行纹理信息的提取。

3.2.2.边缘方向直方图

在这里将提出一种计算速度较快捷的纹理信息提取方法,EHD( Edge Histogram Descriptor),即边缘直方图描述符,将会用到5个数字滤波器,如图3-9所示。

这五个数字滤波器是用来提取纹理边缘信息的,它们能够将其所作用的区域分为垂直方向、水平方向、45度方向、135度方向和无方向五个类别。在对图
像进行纹理信息提取时会将图像分为若干小区。然后每个小区再分为如图3-9的四个大小相等的子小区。然后每个小区再分为如图3-9的四个大小相等的子小
区。用g0 (i,j),g1(i,j),g2(i,j),g3(i,j)分别表示在第(i,j)个小区内四个子小区的平均灰度值。av
(k),ah (k),ad-45 (k),ad-135 (k)和and (k)分别代表四个子小区平均灰度值经过过滤器时的参数,图中每个子小区中的数值便是滤波器的参数,其中k的取值范围是0到3整数,表示小区内的四个子小区。nv (i, j),nh (i,j),nd-45(i,j),nd-135(i,j)和nnd(i,j)为第(i,j)个小区内所判定各方向的取值。计算方法如下:

找出最大值,

再对所有n值规范化,

通过上面的计算公式,可以得出每个小区内图像边缘的信息。CEDD中纹理信息提取的是一个6维直方图,直方图中各维信息的含义分别是:(0)无边缘
信息,(1)无方向的边缘信息,(2)水平方向的边缘信息,(3)垂直方向的边缘信息,(4) 45度方向的边缘信息,(5)
135度方向的边缘信息。判断每个小区纹理信息所属的直方图区域的方法如图3-10所示:

首先设定4个阈值:T0=14,检验该小区是否含有边缘信息;T1=0.68,判断该小区是否含有无方向信息;T2=T3=0.98,用来判断该小区是否含有其它四个方向的信息。如果mmax大于T0,则该小区含有纹理信息,如果不大于则是非含有纹理信息的小区,那么6维直方图第一维的值会加1。如果该区域是有边缘信息的,即mmax大于等于T0,便可以计算其它各方向信息的值,如图3-10所示。此原理图是一个发散的五边形,每个顶点代表一个边缘方向类别,每个小区内计算出的nnd、nh、nv、nd-45、nd-135值便分别落在五个点与中心原点的连线上。中心点的值为1,五边形边界线上的值为0。如果n值大于它相应边缘方向类别上的阈值,则可判定该小区属于这个边缘方向类别,可想而知,一个小区可以同时属于几个类别。由此,便有如下划分方法:若nnd大于T1,则直方图中含有无方向信息的区域值加1;若nh大于T2,则直方图中含有水平方向边缘信息的区域值加1;若nv大于T2,则直方图中含有垂直方向边缘信息的区域值加1;若nd-45大于T3,则直方图中含有45度方向边缘信息的区域值加1;若nd-135大于T3,则直方图中含有135度方向边缘信息的区域值加1。

3.3. CEDD 特征

CEDD的英文全称是Color and Edge Directivity
Descriptor,即颜色和边缘方向特征描述符。它结合了图像的颜色和纹理信息,生成一个144位的直方图。这个特征提取方法可以分为两个子模块系
统,提取颜色信息的是颜色模块,提取纹理信息的是纹理模块,这两个单元的具体算法已经在3.1小节和3.2小节进行了详细讲述。CEDD直方图信息由六个
区域组成,也就是3.2中讲到的纹理模块,六个区域就是提取出的6维向量直方图,然后在这些纹理信息的每一维中再加入颜色模块提取出的24维颜色信息,这
样就可以将颜色和纹理有效结合起来,最终得出6*24=144维的直方图信息。其原理如图3-11所示。

在实现过程中先将图片分成若干小区,小区的数量是根据图像具体情况和计算机能力综合决定的,每一个图像小区都会经过纹理模块和颜色模块的处理。

小区在纹理模块特征提取过程中会先分为4个子小区。根据YIQ计算公式得出每个像素的灰度值,求出每个子小区的平均灰度值。再经过5个数字滤波器过滤后,根据图3-10的原理判断该子小区属于哪些纹理信息类别。

在颜色模块中,每个图像小区都会转换为HSV色彩空间,系统会将小区内HSV各通道的平均值通过10-bins模糊过滤器输出的10维向量再通过
24-bins模糊过滤器中。通过10-bins模糊过滤器后根据H值得出了
10个色彩类别,当通过24-bins模糊过滤器时会根据S和V的区域判定对H进行再分类输出24维的直方图。

图像的每一个小区都会经过颜色模块的处理,处理后将24个数据分别加入到该小区所属的各纹理类别中,最后对直方图进行归一化处理。

如果只进行到归一化这一步并不能体现出CEDD的优越性,因为这里面的值含有小数部分,要占用大量的存储空间。如果对其进行量化,则量化后的整数值
既方便存储,又可以让人们直观的读取特征值。表3-1是CEDD特征提取后的量化表,量化范围是0-7的整数。可以看出它并不是一个均匀量化,向量中每一
纹理区域的量化范围都是不同的,而且区域内的量化级也不是等比递增,有关它的原理可以参考文献。

图像检索:CEDD(Color and Edge Directivity Descriptor)算法 颜色和边缘的方向性描述符的更多相关文章

  1. 图像检索:CEDD(Color and Edge Directivity Descriptor)算法

    颜色和边缘的方向性描述符(Color and Edge Directivity Descriptor,CEDD) 本文节选自论文<Android手机上图像分类技术的研究>. CEDD具有抽 ...

  2. python描述符 descriptor

    descriptor 在python中,如果一个新式类定义了__get__, __set__, __delete__方法中的一个或者多个,那么称之为descriptor.descriptor通常用来改 ...

  3. Descriptor - Python 描述符协议

    描述符(descriptor) descriptor 是一个实现了 __get__. __set__ 和 __delete__ 特殊方法中的一个或多个的. 与 descriptor 有关的几个名词解释 ...

  4. 文件描述符(File Descriptor)简介

    本文转载自文件描述符(File Descriptor)简介 导语 维基百科:文件描述符在形式上是一个非负整数.实际上,它是一个索引值,指向内核为每一个进程所维护的该进程打开文件的记录表.当程序打开一个 ...

  5. 【python】描述符descriptor

    开始看官方文档,各种看不懂,只看到一句Properties, bound and unbound methods, static methods, and class methods are all ...

  6. Python描述符(descriptor)解密(转)

    原文:http://www.geekfan.net/7862/ Python中包含了许多内建的语言特性,它们使得代码简洁且易于理解.这些特性包括列表/集合/字典推导式,属性(property).以及装 ...

  7. Python 描述符(descriptor) 杂记

    转自:https://blog.tonyseek.com/post/notes-about-python-descriptor/ Python 引入的“描述符”(descriptor)语法特性真的很黄 ...

  8. python描述符descriptor(一)

    Python 描述符是一种创建托管属性的方法.每当一个属性被查询时,一个动作就会发生.这个动作默认是get,set或者delete.不过,有时候某个应用可能会有 更多的需求,需要你设计一些更复杂的动作 ...

  9. USB HID Report Descriptor 报告描述符详解

    Report descriptors are composed of pieces of information. Each piece of information is called an Ite ...

随机推荐

  1. 「JSOI2011」分特产

    「JSOI2011」分特产 传送门 计数题. 考虑容斥掉每人至少一个的限制. 就直接枚举至少有多少人没有分到特产,然后剩下的随便分. \[Ans = \sum_{i = 0}^n (-1)^i {n ...

  2. jsp格式化日期

    1.先引入JSTL库 <%@ taglib uri="http://java.sun.com/jsp/jstl/fmt" prefix="fmt"%> ...

  3. Vue学习笔记:计算属性

    使用函数的缺点 如果我们想要将数据经过转化后再显示,或者多个数据结合起来进行显示,一般可以直接在数据渲染或者数据绑定的时候书写表达式 如果表达式过于复杂,或者逻辑太多的时候,我们可以将其封装在函数里, ...

  4. gcd && exgcd算法

    目录 欧几里德算法与扩展欧几里德算法 1.欧几里德算法 2.扩展欧几里德算法 欧几里德算法与扩展欧几里德算法 1.欧几里德算法 #include<bits/stdc++.h> using ...

  5. WebVR大潮来袭时,前端开发能做些什么

    WebVR大潮来袭时,前端开发能做些什么?     WebVR即web + VR的体验方式,我们可以戴着头显享受沉浸式的网页,新的API标准让我们可以使用js语言来开发.本文将介绍如何快速开发一个We ...

  6. [zlib] CMake + VS2015 下编译zlib,及使用小例

    下载与解压 可以到zlib官网 http://zlib.net/ 下载,这个没有被墙的,如果下载,试一下换个网络再访问.因为我在公司的网络是访问不了的. 我当前使用的是 zlib1.2.11版本. 下 ...

  7. 「POJ3613」Cow Relays

    「POJ3613」Cow Relays 传送门 就一个思想:\(N\) 遍 \(\text{Floyd}\) 求出经过 \(N\) 个点的最短路 看一眼数据范围,想到离散化+矩阵快速幂 代码: #in ...

  8. eclipse中使用maven创建项目JDK版本默认是1.5

    1. 修改maven的settings.xml文件. 添加以下行,jdk版本改为自己需要的版本: <profile> <id>jdk-1.7</id> <ac ...

  9. eclispe+maven+ssm+sql_server/mysql配置

    链接: https://pan.baidu.com/s/1_BFI8XfS8l89-3-1IjlVZg 密码: x9in

  10. Python字符乱码

    content = b'{"log_id": 5507183146687669657, "words_result_num": 2, "words_r ...