《principal component analysis based cataract grading and classification》学习笔记
Abstract
A cataract is lens opacification caused by protein denaturation which leads to a decrease in vision and even results in complete blindness at later stages. The concept of a classification system of automatic cataract detecting based on retinal fundus images has been proposed in previous research work which consists of fundus image preprocessing, feature extraction and the building of classifier .This paper proposes to make use of the method of PCA (principal component analysis) to reduce the dimensionality of two sets of features extracted from fundus images which are wavelet features and sketch features, respectively. We find the classification accuracy rate based on new features after PCA transformation is nearly the same with the original ones, but the computation cost can really be decreased a lot. Experiment results provide a bright foresight in later practical application of classification system of automatic cataract detecting.
白内障是蛋白质变性导致晶状体混浊,它的基本特征就是视力下降,甚至在最后阶段完全失明。白内障的视网膜眼底图像自动检测分类系统的概念已经在以前的研究工作提出,它主要包括眼底图像预处理,特征提取和分类器的构建。本文提出了利用PCA方法(主成分分析)降维从眼底图像分别提取两个特征集,这两个特征是小波特征和轮辐特征。我们发现分类的准确率在基于PCA的新的特征后,其结果与之前的方法准确率相似,但计算效率却有很大的提高。实验结果为白内障自动检测分类系统的实际应用提供了实际应用参考。
I. Introduction
- 首先介绍成因,并且白内障被认为是最普遍的致盲疾病。传统的诊断就是有经验的眼科医生凭借肉眼,通过查看眼底图像来判断患病程度,但是效率很低,所以自动化的分类系统就被提出了。
- 在之前的步骤中加入了降维这一步骤,同时介绍了各个流程的具体实现方法:第一步是图像预处理,主要使用了改进的高低帽变换,三边滤波。第二步是特征提取,这一步至关重要,提取了两个特征集,分别是小波特征和轮辐特征。第三步PCA降维处理。第四步就是分类,主要使用了SVMs(support vector machines),Bagging(套袋,投票法), Random forests(随机森林),Gradient Boosting Decision Tree(迭代的决策树算法)。最后说明虽然准确率稍微有所下降,但是效率有极大的提高,所以是非常有意义的。
II. Related Work
介绍了视网膜相关研究的研究进展。
III. Implementation
A.特征提取
1.哈尔小波变换
小波变换的基本思想是用一组小波函数或者基函数表示一个函数或者信号,例如图像信号。为了理解什么是小波变换,下面用一个具体的例子来说明小波变换的过程。 . 求有限信号的均值和差值 [例8. ] 假设有一幅分辨率只有4个像素 的一维图像,对应的像素值或者叫做图像位置的系数分别为:
[ ]
计算它的哈尔小波变换系数。 计算步骤如下:
步骤1:求均值(averaging)。计算相邻像素对的平均值,得到一幅分辨率比较低的新图像,它的像素数目变成了2个,即新的图像的分辨率是原来的1/,相应的像素值为: [ ] 步骤2:求差值(differencing)。很明显,用2个像素表示这幅图像时,图像的信息已经部分丢失。为了能够从由2个像素组成的图像重构出由4个像素组成的原始图像,就需要存储一些图像的细节系数(detail coefficient),以便在重构时找回丢失的信息。方法是把像素对的第一个像素值减去这个像素对的平均值,或者使用这个像素对的差值除以2。在这个例子中,第一个细节系数是(-)=,因为计算得到的平均值是8,它比9小1而比7大1,存储这个细节系数就可以恢复原始图像的前两个像素值。使用同样的方法,第二个细节系数是(-)=-,存储这个细节系数就可以恢复后2个像素值。因此,原始图像就可以用下面的两个平均值和两个细节系数表示, [ -] 步骤3:重复第1,2步,把由第一步分解得到的图像进一步分解成分辨率更低的图像和细节系数。在这个例子中,分解到最后,就用一个像素的平均值6和三个细节系数2,1和-1表示整幅图像。 [ -] 这个分解过程如表8-1所示。 表8- 哈尔变换过程 分辨率 平均值 细节系数 [ ] [ ] [ -] [] [] 由此可见,通过上述分解就把由4像素组成的一幅图像用一个平均像素值和三个细节系数表示,这个过程就叫做哈尔小波变换(Haar wavelet transform),也称哈尔小波分解(Haar wavelet decomposition)。这个概念可以推广到使用其他小波基的变换。
从这个例子中我们可以看到:
① 变换过程中没有丢失信息,因为能够从所记录的数据中重构出原始图像。
② 对这个给定的变换,我们可以从所记录的数据中重构出各种分辨率的图像。例如,在分辨率为1的图像基础上重构出分辨率为2的图像,在分辨率为2的图像基础上重构出分辨率为4的图像。
③ 通过变换之后产生的细节系数的幅度值比较小,这就为图像压缩提供了一种途径,例如去掉一些微不足道的细节系数并不影响对重构图像的理解。
哈尔小波变换
2.轮辐方法配合离散余弦变换
B.四个流行的算法
1.SVMs是一种有监督学习模型,它被广泛应用在机器学习的分类和线性回归分析中。
2.Bagging的核心就是使多个弱分类器结合称强分类器。
3.Random forests是针对分类,回归和其它任务的集成方法。随机森林能有效防止过拟合。
4.GBDT,短梯度升压决策树。
C.实验结果
D.实验结果分析
PCA最好
IV. Conclusion
本研究增加了PCA这一个步骤,虽然精确度有所下降,但是计算速度有很大提升,这是很有意义的,所以有很大的发展前景。
问题
1 轮辐特征是什么?
2 交叉验证是什么?
《principal component analysis based cataract grading and classification》学习笔记的更多相关文章
- js学习笔记:webpack基础入门(一)
之前听说过webpack,今天想正式的接触一下,先跟着webpack的官方用户指南走: 在这里有: 如何安装webpack 如何使用webpack 如何使用loader 如何使用webpack的开发者 ...
- PHP-自定义模板-学习笔记
1. 开始 这几天,看了李炎恢老师的<PHP第二季度视频>中的“章节7:创建TPL自定义模板”,做一个学习笔记,通过绘制架构图.UML类图和思维导图,来对加深理解. 2. 整体架构图 ...
- PHP-会员登录与注册例子解析-学习笔记
1.开始 最近开始学习李炎恢老师的<PHP第二季度视频>中的“章节5:使用OOP注册会员”,做一个学习笔记,通过绘制基本页面流程和UML类图,来对加深理解. 2.基本页面流程 3.通过UM ...
- 2014年暑假c#学习笔记目录
2014年暑假c#学习笔记 一.C#编程基础 1. c#编程基础之枚举 2. c#编程基础之函数可变参数 3. c#编程基础之字符串基础 4. c#编程基础之字符串函数 5.c#编程基础之ref.ou ...
- JAVA GUI编程学习笔记目录
2014年暑假JAVA GUI编程学习笔记目录 1.JAVA之GUI编程概述 2.JAVA之GUI编程布局 3.JAVA之GUI编程Frame窗口 4.JAVA之GUI编程事件监听机制 5.JAVA之 ...
- seaJs学习笔记2 – seaJs组建库的使用
原文地址:seaJs学习笔记2 – seaJs组建库的使用 我觉得学习新东西并不是会使用它就够了的,会使用仅仅代表你看懂了,理解了,二不代表你深入了,彻悟了它的精髓. 所以不断的学习将是源源不断. 最 ...
- CSS学习笔记
CSS学习笔记 2016年12月15日整理 CSS基础 Chapter1 在console输入escape("宋体") ENTER 就会出现unicode编码 显示"%u ...
- HTML学习笔记
HTML学习笔记 2016年12月15日整理 Chapter1 URL(scheme://host.domain:port/path/filename) scheme: 定义因特网服务的类型,常见的为 ...
- DirectX Graphics Infrastructure(DXGI):最佳范例 学习笔记
今天要学习的这篇文章写的算是比较早的了,大概在DX11时代就写好了,当时龙书11版看得很潦草,并没有注意这篇文章,现在看12,觉得是跳不过去的一篇文章,地址如下: https://msdn.micro ...
- ucos实时操作系统学习笔记——任务间通信(消息)
ucos另一种任务间通信的机制是消息(mbox),个人感觉是它是queue中只有一个信息的特殊情况,从代码中可以很清楚的看到,因为之前有关于queue的学习笔记,所以一并讲一下mbox.为什么有了qu ...
随机推荐
- javascript 高级程序设计 九
JS 面向对象的程序设计思想(1)深入理解JS对象 1.js的中没有OO语言中的'类'的概念.ECMAjs中把对象定义为:‘无序属性的集合,其属性可以包含基本值,对象或函数’. 2.ECMAScrip ...
- 添加exe为windows service服务
[方法一] 一.介绍 srvany.exe是Microsoft Windows Resource Kits工具集的一个实用小工具,用于将EXE程序作为Windows服务运行.srvany是其注册程序的 ...
- HISAT,sTRINGTIE,ballgown三款RNA-seq信息分析软件
HISAT,sTRINGTIE,ballgown三款RNA-seq信息分析软件 2015年04月02日 11:35:47 夜丘 阅读数:8940 标签: 生物 更多 个人分类: 论文笔记 Bowt ...
- Codeforces 782C. Andryusha and Colored Balloons 搜索
C. Andryusha and Colored Balloons time limit per test:2 seconds memory limit per test:256 megabytes ...
- ark是什么
https://github.com/QuadHex/ARK/releases 0.8.0版本网络使用evpp 调用 https://www.jianshu.com/p/9f09928829ba
- [AI]神经网络章1 神经网络基本工作原理
神经元细胞的数学计算模型 神经网络由基本的神经元组成,下图就是一个神经元的数学/计算模型,便于我们用程序来实现. 输入 (x1,x2,x3) 是外界输入信号,一般是一个训练数据样本的多个属性,比如,我 ...
- eclipse项目两个红点
Description Resource Path Location Type Unbound classpath container: 'JRE Sy 选中项目右键build path 选择libr ...
- js 文件下载 进度条
js: /** * 下载文件 - 带进度监控 * @param url: 文件请求路径 * @param params: 请求参数 * @param name: 保存的文件名 * @param pro ...
- nginx自旋锁
#include <stdio.h> #include <stdint.h> #include <unistd.h> /* typedef unsigned lon ...
- Windows 8.1 新控件和功能:
http://msdn.microsoft.com/zh-cn/library/windows/apps/bg182878.aspx#five 将 XAML 树呈现为位图: 适用于 Windows 8 ...