[OpenCV] Image Processing - Image Elementary Knowledge
"没有坚实的理论基础,实践只会浅尝于表面。"


这是两本打基础的书,没系统学过的话,怎么好意思说自己会CV。
该领域,兴军亮 这个名字屡次出现,看来是计算机视觉领域国内的年轻才俊,向他学习!


2.1.1 几何基元
2D 点:
- 齐次坐标 (8,4,2)、(4,2,1)表示的都是二维点(4,2)。
- [X Y H]→
= [x y 1], 这个过程称为归一化处理。在几何意义上,相当于把发生在三维空间的变换限制在H=1的平面内。 - n+1维的齐次坐标中如果h=0,实际上就表示了n维空间的一个无穷远点。

仿射变换:

2D 直线:
多一维的意义其中之一便是:

转化为了极坐标的形式,一种数学技巧而已。

向量积算法:

3D 平面:

3D 直线:
直线上两点的线性组合:

/* 其他transform详见2.1 */
/* 2.2光度测定学的图像形成,不是人看的 */
/* 2.3类似,偏物理硬件原理,都是非必备知识 */
色度图
CIE 1931色度图是用标称值表示的CIE色度图,x表示红色分量,y表示绿色分量。E点代表白光,它的坐标为(0.33,0.33);

环绕在颜色空间边沿的颜色是光谱色,边界代表光谱色的最大饱和度,边界上的数字表示光谱色的波长,其轮廓包含所有的感知色调。所有单色光都位于舌形曲线上,这条曲线就是单色轨迹,曲线旁标注的数字是单色(或称光谱色)光的波长值;自然界中各种实际颜色都位于这条闭合曲线内;RGB系统中选用的物理三基色在色度图的舌形曲线上。
但是,人类视觉系统对色彩的频率响应不如对亮度变化的相应。
YCbCr : Y'为颜色的亮度(luma)成分、而CB和CR则为蓝色和红色的浓度偏移量成份。
图像模式
1、位图模式
位图模式是1位深度的图像。它只是黑和白两种颜色。它可以由扫描或置入黑色的矢量线条图像生成,也能由灰度模式或双色调模式转换而成。其他图像模式不能直接转换为位图模式。
2、灰度模式
灰度模式是8位深度的图像模式。也就是2^8,2^8=256,在全黑和全白之间插有254个灰度等级的颜色来描绘灰度模式的图像。
所有模式的图像都能换成灰度模式,甚至位图也可转换为灰度模式。Photoshop几乎所有的功能都支持灰度模式。
3、双色调模式
双色调模式不是单个的图像模式,而是一个分类。它仅仅是单色调、双色调、三色调和四色调的一个统称。双色调模式只有一个通道。双色调模式和位图模式一样,也只有灰度模式才能转换。
4、RGB模式
RGB模式是数码图像中最重要的一个模式,Photoshop的全部功能都支持它,因为Photoshop就是以它为基础来开发的。显示屏上显示的颜色是RGB模式,电视屏幕也是RGB模式,所不同的它不是用数码而是用电平来描述的。扫描仪和数码相机都是捕捉RGB图像信息的。
RGB模式是相加的模式,当R、G、B的值都达到最大值时,三色合成便成白色。
RGB模式是24位颜色深度。它共有三个通道,每个通道都有8位深度。三个通道合成一起可生成1677万种颜色,我们也称之谓“真彩色”。
5、CMYK模式
CMYK模式是用来打印或印刷的模式,它是相减的模式,当C、M、Y三值达到最大值时,在理论上应为黑色,但实际上因颜料的关系,呈显的不是黑色,而是深褐色。为弥补这个问题,所以加进了黑色K。
由于加了黑色,CMYK共有四个通道,正因为如此,对于同一个图像文件来说,CMYK模式比RGB模式的信息量要大四分之一。
但RGB模式的色域范围比CMYK模式大。因为印刷颜料在印刷过程中不能重现RGB色彩。
CMY 和 RGB 为互补色。
C-青色:由G-绿色和B-蓝色合成,其中没有R-红色成份;
M-洋红:由R-红色和B-蓝色合成,其中没有G-绿色成份;
Y-黄色:由R-绿色和G-红色合成,其中没有B-蓝色成份;
CMYK模式不能转换为索引模式。
Photoshop的大部分功能不支持CMYK模式
6、Lab模式
Lab模式是24位颜色深度的图像模式,有三个通道。L通道是亮度通道(Lightness),a和b两个为色彩通道。它的特点在于:
(1)他的色域范围最广,它和RGB与CMYK模式的关系如下:
就色域范围而言 Lab > RGB > CMYK
(2)此模式下的图像是独立于设备外的,它的颜色不会因不同的印刷设备,显示器和操作平台而改变。由于它有以上的有点,当Photoshop把RGB模式和CMYK模式互相转换时,它成为中间模式,颜色信息就不会因以上两模式的色域范围不同而丢失。
a分量是由绿色向红色过度。
b分量是由蓝色向黄色过渡。
Lab模式不能转换为索引模式。
Photoshop的大部分功能不支持Lab模式。
7、索引颜色模式
索引颜色模式是8位颜色深度模式,它最多只能拥有256种颜色。
(1)每一副图像都各自拥有一张颜色表,而随图像不同,颜色表也不同。这一点是至关重要的。
(2)它的信息量小,又可制动画,所以它的图像和动画被广泛地用于网页制作上。
(3)它可制成透明图像,在网页使用。
在转换时,只有灰度和RGB两种模式,不能转换成索引颜色模式。
转换时只有两个选择是实用的:
(随样性 )当图像颜色数大于256时,使用该选项,Photoshop会定做颜色表。实际当图像颜色小于256时,使用该选项,就用实际的颜色制作颜色表。
Photoshop完全不支持索引颜色模式。
8、多通道模式
多通道模式是把含有通道的图像分割成单个的通道。
CMYK模式转为多通道模式时,生成的通道为青色、洋红、黄色和黑色四个通道。
Lab模式转为多通道模式时,生成三个Alpha通道。
9、8位/通道和16位/通道
在灰度、RGB和CMYK模式下可以用每个通道16位深度来取代8位深度。那么,每个通道的颜色数从256色剧增到65536色,可生成更好的颜色细节。
目前,由于设备的不支持,16位/通道的图像不能被打印或印刷。


你是不是发现,右边动来动去的大黑点,在经过某个区域时消失了(大概在二十度左右,亲测)。
这是因为我们人眼的视觉有盲区。
总之,人眼感知与实际光照因为杆状体(暗环境感知)和椎状体(亮环境感知)的主导性不同而有一定的差异。
各种频率的光传播速度都一样,即光速。
但在介质中,不同频率的光线传播速度不同:
频率越高或波长越短的光线具有更高的能量,其受到介质电介性阻碍的影响更大,所以速度越慢。

扩展:关于伽马射线的原子核仨射线

首先我们看到图中的三条射线,下面我们进行初步认识
- α射线是氦原子核,简称氦核流,它的速度可以达到光速的1/10,电离能力最强,穿透能力最差,在空气中只能前进几厘米,一张纸就可以挡住。
- β射线是高速粒子流,速度很大,达光速的99%,穿透能力较强,很容易穿透黑纸,也能穿透几毫米厚的铝板,但是电离能力较弱。
- γ射线呈电中性,电离作用小,但穿透能力非常强。可以穿透几十厘米厚的混凝土
感知光强度 (灰度级):
入射分量 乘以 反射分量
离散灰度级数范围:[ Lmin, Lmax ] 之间的区域,统一化为[0, L-1]。
上限取决于饱和度,下限取决于噪声。上下限之差为对比度,即动态范围较大。
以下为图像矩阵。

图像缩放的内插算法
双线性内插

双三次内插 (商业标准内插方法)

相邻像素


数字图像处理中有4邻接、8邻接和m邻接三种关系。


在这个图中
8邻域中的中间的那个1可以有两条路到达右上角的那个1,这就是所说的二义性
这个情况在边缘检测里面是很不希望的。
而改成m邻域以后,中间的1像素和右上角的像素是8连通的却不是m连通的,这可以从m连通的定义得到。
因此,如果用M连通从中间的1到右上角的1就只有一条路。
/* 2.5.2 关于边界的问题,在此标记下 */
/* 2.5.3 距离度量可见KNN */
线性算子

图像相加
处理噪声图像,叠加后认为噪声相互抵消。
图像相减
增强图像之间的差。
图像相乘(相除)
阴影矫正。
线性变换域 (难点,傅立叶变换时重点研究)

[OpenCV] Image Processing - Image Elementary Knowledge的更多相关文章
- 使用OpenMP加快OpenCV图像处理性能 | speed up opencv image processing with openmp
本文首发于个人博客https://kezunlin.me/post/7a6ba82e/,欢迎阅读! speed up opencv image processing with openmp Serie ...
- 使用OpenCL提升OpenCV图像处理性能 | speed up opencv image processing with OpenCL
本文首发于个人博客https://kezunlin.me/post/59afd8b3/,欢迎阅读最新内容! speed up opencv image processing with OpenCL G ...
- [OpenCV] Image Processing - Grayscale Transform
"每个像素的输出值只取决于其输入值" 重难点:Histogram equalization 参考:笑得很甜 http://blog.csdn.net/xiaowei_cqu/art ...
- [OpenCV] Image Processing - Grayscale Transform & Histogram
颜色直方图 首先,先介绍一些Hist的基本使用. Ref:[OpenCV]数字图像灰度直方图 官方文档:https://docs.opencv.org/trunk/d8/dbc/tutorial_hi ...
- [OpenCV] Image Processing - Fuzzy Set
使用模糊技术进行 (灰度变换Grayscale Transform) 和 (空间滤波Spatial Filtering) 模糊集合为处理不严密信息提供了一种形式. 首先,需要将输入量折算为隶属度,这个 ...
- [OpenCV] Image Processing - Spatial Filtering
"利用给定像素周围的像素的值决定此像素的最终的输出值“ 教学效果: 策略: 1. 拉普拉斯,突出小细节: . 梯度,突出边缘: . 平滑过的梯度图像用于掩蔽: . 灰度变换,增加灰度动态范围 ...
- [Python] python vs cplusplus
一些学习过程中的总结的两种语言的小对比,帮助理解OO programming. Continue... 字典 序列 --> 字典 Python: def get_counts(sequence) ...
- 本人AI知识体系导航 - AI menu
Relevant Readable Links Name Interesting topic Comment Edwin Chen 非参贝叶斯 徐亦达老板 Dirichlet Process 学习 ...
- Computer Vision: OpenCV, Feature Tracking, and Beyond--From <<Make Things See>> by Greg
In the 1960s, the legendary Stanford artificial intelligence pioneer, John McCarthy, famously gave a ...
随机推荐
- Windows下如何枚举所有进程
要编写一个类似于 Windows 任务管理器的软件,首先遇到的问题是如何实现枚举所有进程.暂且不考虑进入核心态去查隐藏进程一类的,下面提供几种方法.请注意每种方法的使用局限,比如使用这些 API 所需 ...
- Android之把手机的3g流量共享出来让其他人连接这个wifi
转自:http://blog.csdn.net/luoboo525/article/details/7883998 亲测可用 用过快牙的朋友应该知道它们在两天设备之间传输文件的时候使用的是wifi ...
- 为PHP函数执行设置超时
如何防止一个函数执行时间过长呢?在PHP里可以用pcntl时钟信号+异常来实现. 代码如下: declare(ticks = 1); function a(){ sleep(10); echo &qu ...
- 从Windows XP系统迁移到Windows 7,Windows 8开始
Microsoft在2014年4月8日结束了Windows XP的支持.您的公司准备好了吗?如果您还没有迁移到Windows 7或8,那就要抓紧时间了.从现在起将不再向XP系统提供安全修补程序,而仍然 ...
- GTD中回顾闭环
一: 回顾的作用 :让事情告一段落 A: 回顾已经完成---->找到成就感 B: 安排未完成----->做到心中有数 2: 让心情告一段落 当事情一天的事情告一段落的时候,内心就会彻底放下 ...
- 解密程序代写,订制服务qq:928900200
CS461 MP 1: Due Wednesday 09/17 by 11:59 pm Fall 2014\Anyone, from the most clueless amateur to the ...
- VC++ 学习笔记(一):如何开始
毫无疑问,学习C++是一件痛苦的事情. 我大概十年前接触C++.那是在学校里,准备考研究生,某学校要求考C++.我就开始一点一点学习,学习的过程还是比较舒服的.不得不说,就古典C++的理论,钱老讲的还 ...
- server 2012 IIS 启用.NET 4.5
server2012 自带.NET 4.5 不过IIS服务器只有2.0 和 4.0 所以我们需要手动配置 1.服务器-添加角色和功能 2.依次下一步,选择到服务器角色 -点开web服务器(IIS)-应 ...
- pentaho saiku 安装全过程
公司希望也开发一套多维分析系统,以解决运营/产品无休止的需求和技术人力不足的矛盾! 一.开发选型: 一.BIRT:易用性差,所以没再使用 二.JasperReport+ireport:文档收费,不支持 ...
- HTML单选按钮样式更换
<!DOCTYPE html > <html lang="en"> <head> <meta http-equiv="Conte ...