令人迷惑的Gamma
概述
首先我想说,接触到Gamma的概念也很长时间了,一直没有认真的去学习它。知其然而不知其所以然。最近恰巧学到了这一部分,就想彻底地搞懂它。
CRT
说起Gamma,肯定离不开CRT(阴极射线管)。
CRT(阴极射线管)是大多数计算机显示器、视频监视器、电视接收器和示波器中使用的显示设备,由德国科学家 Karl Ferdinand Braun于1897年发明。它的特点是荧光屏被加热的阴极发射的电子束照射时发出可见光。电子被集中在一束光中,这束光在磁场的作用下发生偏转,扫描被磷光材料覆盖的观察端(阳极)。当电子撞击这种材料时,就会发出光来。
在电视阴极射线管(CRT)中,整个显像管区域以一种固定的模式被扫描,这种模式被称为光栅。通过视频信号调节电子束的强度,就可以产生一幅图像。在现代的电视机中,电子束是通过一个磁轭(一组由电子电路驱动的线圈)作用在电子管颈上的磁场来扫描的。彩色阴极射线管使用三种不同的材料,分别发出绿色、蓝色和红色的光,紧密地排列在条状(在孔径格栅设计中)或簇状(在荫罩阴极射线管中)。有三支电子枪,每种颜色一支,每支电子枪只能打到一种颜色的点。
在电视的早期,人们发现阴极射线管不会产生与输入电压成比例的光强。视频信号与阴极射线管产生的光(传递函数)之间的关系是非线性的,通常用幂定律来描述:
\]
Gamma(γ)的值为2.8 (PAL和SECAM制式)或2.2 (NTSC)。传递函数通常被称为曲线。它是由电子枪内部的静电效应引起的。这种关系的图形,如下所示:
按照这种关系,最后屏幕上显示的亮度会比预期中的更暗。
比如如果是线性关系的话,50%亮度的入射光应该输出50%的亮度;但是按照这个指数关系,\(50 \%^{2.2} = 21.8 \%\),实际上在CRT显示器上只会输出21.8%的亮度,还不到预期亮度的一半!
Gamma编码
人们发现了CRT的问题,必然要想办法解决。
可以想到的一种解决方法是,改变CRT显示器,使其可以线性输出。但当时已经存在很多的CRT显示器,重新改造的话,不是很现实。考虑到当时的情况,图像采集设备,例如相机,并不是很多,能不能对其进行改良,来解决CRT的Gamma问题呢?答案是肯定的。
图形采集设备,采集到的现实中的亮度,是线性的。在需要将采集到的数据存储之前,可以进行Gamma编码,它也符合幂定律:
\]
用图像表示这种关系的话,如下:
问题来了,这样为什么可以解决CRT的Gamma问题呢?
从数学上来看,存储图像时,要进行的操作是:
\]
将图像显示到屏幕上,要进行的操作是:
\]
所以,最后屏幕上输出的,是线性的。这个过程如下图所示:
这样,就可以解决CRT的Gamma问题了。
许多文章提到Gamma编码与人类视觉对亮度的非线性响应有关。这是不准确的。
这种混淆很可能源于Gamma编码(大约\(x^{0.45}\))和人类视觉(大约\(x^{0.42}\))之间非常相似的指数关系——但这只是巧合。
话虽如此,这种类似的关系确实有一个显著的好处。由于Gamma编码重新分配的色调水平更接近我们的眼睛如何感知它们,我们对暗部的表达更精细,而对亮部的表达会比较简单。
这是因为人类的视觉对暗部的变化比亮部的变化更敏感。通过以与我们的视觉系统相匹配的方式对数据进行编码,色调值可以更有效地分布。换句话说,在亮部,我们很难看到细微的差别;然而,在暗部,我们却能探测到同样的绝对变化。因此,即使在更高的亮度级别上有更少的色调,我们也不会感知到任何差异。
所以,同等带宽/存储空间的前提下,尽量存储更多的暗部的信息可以给人带来更多的信息量。
Gamma编码的图形表示如下。可以看到,在输入x比较低的时候,y有更大的增长性;而在x比较大的时候,y的增长性就比较平缓了。所以我们可以使用更多的空间来处理暗部的信息。
重要的是要记住,这不是我们Gamma编码图像的原因,只是一个有趣的副作用。
sRGB (standard Red Green Blue)
sRGB是一个彩色空间,是当今消费电子设备,事实上的标准,包括显示器、数码相机、扫描仪、打印机和手持设备。它也是互联网上图像的标准颜色空间。
sRGB规范定义了使用什么Gamma来对sRGB图像进行编码和解码。sRGB的Gamma非常接近标准Gamma2.2。
因为显示器总是在sRGB空间中显示应用了Gamma的颜色,无论什么时候当你在计算机上绘制、编辑或者画出一个图片的时候,你所选的颜色都是根据你在显示器上看到的那种。这实际意味着所有你创建或编辑的图片并不是在线性空间,而是在sRGB空间中,假如在你的屏幕上对红色翻一倍,就是根据你所感知到的亮度进行的,并不等于将红色元素加倍。
这里考虑两种情况,一种情况是,图像是图像采集设备(如相机)产生的;另一种情况是,图像是美术工作者在计算机上画出来的。
对于前者,设备采集到图像后,会对线性的图像进行Gamma编码,即应用\(V_{encode} = V_{linear}^{\gamma}\)的幂函数关系映射。这里,\(\gamma\)约等于0.45(\(1/2.2\))。此时,图像就存储在sRGB空间中。
对于后者,当美术工作者在计算机上作图时,并不是在线性空间中,而是在sRGB空间中。
Gamma工作流
尽管有这些好处,Gamma编码还是在记录和显示图像的过程中,增加了一层复杂性。一个Gamma编码的图像在屏幕上显示时,必须有Gamma解码,它被视为有效的转换为原始场景的效果。换句话说,Gamma编码的目的是记录图像,而不是显示图像。幸运的是,这第二步(“Gamma解码”)是由显示器和视频卡自动执行。下图说明了所有这些是如何组合在一起的:
- 图像\(\gamma\):当捕获的图像转换为标准的JPEG或TIFF文件时,相机或原始开发软件都会应用这种方法。它将相机的固有色调重新分配为更一致的色调,从而最有效地利用给定的位深度。
- 显示\(\gamma\):这指的是你的显卡和显示设备的净影响,所以它实际上可能是由几个Gamma组成的。显示\(\gamma\)的主要目的是补偿文件的Gamma,从而确保图像在屏幕上显示时不会不真实地变亮。较高的显示\(\gamma\)导致更黑暗的图像与更大的对比度。
- 系统\(\gamma\):这表示应用于图像的所有Gamma值的净效果,也称为“查看Gamma”。为了忠实地再现场景,这应该接近于一条直线(Gamma = 1.0)。一条直线确保输入(原始场景)与输出(屏幕或打印中显示的灯光)相同。然而,为了提高对比度,系统Gamma有时设置略大于1.0。这有助于弥补由于显示设备的动态范围,或由于非理想的观看条件和图像耀斑所造成的限制。
参考
- [1] Gamma Correction
- [2] Understanding Gamma in Photography
- [3] What every coder should know about gamma
- [4] UNDERSTANDING GAMMA CORRECTION
- [5] Cathode-ray tube
令人迷惑的Gamma的更多相关文章
- 基础概念——令人迷惑的EOF
EOF概念常常使人迷惑. 首先我们要理解并没有像EOF字符这样的东西. 进一步讲EOF是由内核检测到的一种条件. 应用程序在它接收到由read函数返回的零返回码时,它就会发现EOF条件. 对于磁盘文件 ...
- 那些令人迷惑的名词:切图/H5/XML/REST
长时间以来对一些名词感到很困惑,不明白其具体指什么,在此记录一下. 一.切图 1.1 原先理解 从字面意思理解,切图是指将一张大的图切割成很多张小的图片.最早(视频教程网或者我要自学网)看到的视频也是 ...
- C#令人迷惑的DateTime:世界标准时间还是本地时间?
先来看一段代码: 复制内容到剪贴板程序代码 DateTime time = DateTime.Parse("2013-07-05 00:00:00");Console.WriteL ...
- Python中令人迷惑的4个引用
第一个:执行时机的差异 1. array = [1, 8, 15] g = (x for x in array if array.count(x) > 0) array = [2, 8, 22] ...
- C#重构之道
定义 重构的定义:在不改变软件可观察行为的前提下,改善其内部结构. 其中,不改变软件行为,是重构最基本的要求.要想真正发挥威力,就必须做到“不需了解软件行为”. 如果一段代码能让你容易了解其行为,说明 ...
- C Primer Plus(第五版)12
第 12 章 存储类, 链接和内存管理 在本章中你将学习下列内容 . 关键字: auto, extern, static, register, const, volatile, restricted. ...
- PHPUnit 手册
PHPUnit 手册 Sebastian Bergmann 版权 © 2005, 2006, 2007, 2008, 2009, 2010, 2011, 2012, 2013, 2014, 2015 ...
- PHPUnit 手册(转)
PHPUnit 手册 PHPUnit 手册 Sebastian Bergmann 版权 © 2005, 2006, 2007, 2008, 2009, 2010, 2011, 2012, 2013, ...
- 重构 改善既有代码的设计 (Martin Fowler 著)
第1章 重构, 第一个案例 1.1 起点 1.2 重构的第一步 1.3 分解并重组 statement() 1.4 运用多态取代与价格相关的条件逻辑 1.5 结语 第2章 重构原则 2.1 何谓重构 ...
随机推荐
- (数据科学学习手札80)用Python编写小工具下载OSM路网数据
本文对应脚本已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 我们平时在数据可视化或空间数据分析的过程中经常会 ...
- hdu1532 用BFS求拓扑排序
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1285 题目给出一些点对之间的先后顺序,要求给出一个字典序最小的拓扑排列.对于拓扑排序的问题,我们有DF ...
- 用c写的简单的日历(学习模块划分)
简单日历 主要目的是学习函数模块划分,成品大概是这样,加了一些花里胡哨的东西(/▽\) 分三个模块,主函数.c 显示.c 计算.c 与.h 文件 有两种实现方式,区别在于是否以数组在模块之间传 ...
- 图-连通分量-DFS-并查集-695. 岛屿的最大面积
2020-03-15 16:41:45 问题描述: 给定一个包含了一些 0 和 1的非空二维数组 grid , 一个 岛屿 是由四个方向 (水平或垂直) 的 1 (代表土地) 构成的组合.你可以假设二 ...
- Python第五章-内置数据结构03-元组
Python 内置的数据结构 三.元组(tuple) python 作为一个发展中的语言,也提供了其他的一些数据类型. tuple也是 python 中一个标准的序列类型. 他的一些操作和str和li ...
- effective-java学习笔记---使用标记接口定义类型40
标记接口(marker interface),不包含方法声明,只是指定(或“标记”)一个类实现了具有某些属性的接口. 例如,考虑 Serializable 接口.通过实现这个接口,一个类表明它的实例可 ...
- React入门(2)
承接上次学习的react,今天继续学习react 划重点!!! 今天学习的全是react的核心概念:①props②ref③state 一.核心概念---props 作用:主要用来实现父子组件通信 1. ...
- k8s可视化工具kubernetes-dashboard部署——小白教程
参考资料: kubernetes官方文档 官方GitHub 创建访问用户 解决chrome无法访问dashboard 官方部署方法如下: kubectl apply -f https://raw.gi ...
- Oracle 11g中创建实例
1.打开“所有程序” -> “Oracle -OraDb11g_home1” -> “配置移植工具” -> “Database Configuration Assistant”. ...
- Ribbon负载均衡实现
1,在之前的博文中,我通过eureka,consul,zookeeper 实现了注册中心,在实现的服务发现过程中,都是通过RstTemplate 来实现RPC 远程调用 RestTemplate 封装 ...