[OpenCV] Image Processing - Image Elementary Knowledge
"没有坚实的理论基础,实践只会浅尝于表面。"
这是两本打基础的书,没系统学过的话,怎么好意思说自己会CV。
该领域,兴军亮 这个名字屡次出现,看来是计算机视觉领域国内的年轻才俊,向他学习!
2.1.1 几何基元
2D 点:
- 齐次坐标 (8,4,2)、(4,2,1)表示的都是二维点(4,2)。
- [X Y H]→ = [x y 1], 这个过程称为归一化处理。在几何意义上,相当于把发生在三维空间的变换限制在H=1的平面内。
- n+1维的齐次坐标中如果h=0,实际上就表示了n维空间的一个无穷远点。
仿射变换:
2D 直线:
多一维的意义其中之一便是:
转化为了极坐标的形式,一种数学技巧而已。
向量积算法:
3D 平面:
3D 直线:
直线上两点的线性组合:
/* 其他transform详见2.1 */
/* 2.2光度测定学的图像形成,不是人看的 */
/* 2.3类似,偏物理硬件原理,都是非必备知识 */
色度图
CIE 1931色度图是用标称值表示的CIE色度图,x表示红色分量,y表示绿色分量。E点代表白光,它的坐标为(0.33,0.33);
环绕在颜色空间边沿的颜色是光谱色,边界代表光谱色的最大饱和度,边界上的数字表示光谱色的波长,其轮廓包含所有的感知色调。所有单色光都位于舌形曲线上,这条曲线就是单色轨迹,曲线旁标注的数字是单色(或称光谱色)光的波长值;自然界中各种实际颜色都位于这条闭合曲线内;RGB系统中选用的物理三基色在色度图的舌形曲线上。
但是,人类视觉系统对色彩的频率响应不如对亮度变化的相应。
YCbCr : Y'为颜色的亮度(luma)成分、而CB和CR则为蓝色和红色的浓度偏移量成份。
图像模式
1、位图模式
位图模式是1位深度的图像。它只是黑和白两种颜色。它可以由扫描或置入黑色的矢量线条图像生成,也能由灰度模式或双色调模式转换而成。其他图像模式不能直接转换为位图模式。
2、灰度模式
灰度模式是8位深度的图像模式。也就是2^8,2^8=256,在全黑和全白之间插有254个灰度等级的颜色来描绘灰度模式的图像。
所有模式的图像都能换成灰度模式,甚至位图也可转换为灰度模式。Photoshop几乎所有的功能都支持灰度模式。
3、双色调模式
双色调模式不是单个的图像模式,而是一个分类。它仅仅是单色调、双色调、三色调和四色调的一个统称。双色调模式只有一个通道。双色调模式和位图模式一样,也只有灰度模式才能转换。
4、RGB模式
RGB模式是数码图像中最重要的一个模式,Photoshop的全部功能都支持它,因为Photoshop就是以它为基础来开发的。显示屏上显示的颜色是RGB模式,电视屏幕也是RGB模式,所不同的它不是用数码而是用电平来描述的。扫描仪和数码相机都是捕捉RGB图像信息的。
RGB模式是相加的模式,当R、G、B的值都达到最大值时,三色合成便成白色。
RGB模式是24位颜色深度。它共有三个通道,每个通道都有8位深度。三个通道合成一起可生成1677万种颜色,我们也称之谓“真彩色”。
5、CMYK模式
CMYK模式是用来打印或印刷的模式,它是相减的模式,当C、M、Y三值达到最大值时,在理论上应为黑色,但实际上因颜料的关系,呈显的不是黑色,而是深褐色。为弥补这个问题,所以加进了黑色K。
由于加了黑色,CMYK共有四个通道,正因为如此,对于同一个图像文件来说,CMYK模式比RGB模式的信息量要大四分之一。
但RGB模式的色域范围比CMYK模式大。因为印刷颜料在印刷过程中不能重现RGB色彩。
CMY 和 RGB 为互补色。
C-青色:由G-绿色和B-蓝色合成,其中没有R-红色成份;
M-洋红:由R-红色和B-蓝色合成,其中没有G-绿色成份;
Y-黄色:由R-绿色和G-红色合成,其中没有B-蓝色成份;
CMYK模式不能转换为索引模式。
Photoshop的大部分功能不支持CMYK模式
6、Lab模式
Lab模式是24位颜色深度的图像模式,有三个通道。L通道是亮度通道(Lightness),a和b两个为色彩通道。它的特点在于:
(1)他的色域范围最广,它和RGB与CMYK模式的关系如下:
就色域范围而言 Lab > RGB > CMYK
(2)此模式下的图像是独立于设备外的,它的颜色不会因不同的印刷设备,显示器和操作平台而改变。由于它有以上的有点,当Photoshop把RGB模式和CMYK模式互相转换时,它成为中间模式,颜色信息就不会因以上两模式的色域范围不同而丢失。
a分量是由绿色向红色过度。
b分量是由蓝色向黄色过渡。
Lab模式不能转换为索引模式。
Photoshop的大部分功能不支持Lab模式。
7、索引颜色模式
索引颜色模式是8位颜色深度模式,它最多只能拥有256种颜色。
(1)每一副图像都各自拥有一张颜色表,而随图像不同,颜色表也不同。这一点是至关重要的。
(2)它的信息量小,又可制动画,所以它的图像和动画被广泛地用于网页制作上。
(3)它可制成透明图像,在网页使用。
在转换时,只有灰度和RGB两种模式,不能转换成索引颜色模式。
转换时只有两个选择是实用的:
(随样性 )当图像颜色数大于256时,使用该选项,Photoshop会定做颜色表。实际当图像颜色小于256时,使用该选项,就用实际的颜色制作颜色表。
Photoshop完全不支持索引颜色模式。
8、多通道模式
多通道模式是把含有通道的图像分割成单个的通道。
CMYK模式转为多通道模式时,生成的通道为青色、洋红、黄色和黑色四个通道。
Lab模式转为多通道模式时,生成三个Alpha通道。
9、8位/通道和16位/通道
在灰度、RGB和CMYK模式下可以用每个通道16位深度来取代8位深度。那么,每个通道的颜色数从256色剧增到65536色,可生成更好的颜色细节。
目前,由于设备的不支持,16位/通道的图像不能被打印或印刷。
你是不是发现,右边动来动去的大黑点,在经过某个区域时消失了(大概在二十度左右,亲测)。
这是因为我们人眼的视觉有盲区。
总之,人眼感知与实际光照因为杆状体(暗环境感知)和椎状体(亮环境感知)的主导性不同而有一定的差异。
各种频率的光传播速度都一样,即光速。
但在介质中,不同频率的光线传播速度不同:
频率越高或波长越短的光线具有更高的能量,其受到介质电介性阻碍的影响更大,所以速度越慢。
扩展:关于伽马射线的原子核仨射线
首先我们看到图中的三条射线,下面我们进行初步认识
- α射线是氦原子核,简称氦核流,它的速度可以达到光速的1/10,电离能力最强,穿透能力最差,在空气中只能前进几厘米,一张纸就可以挡住。
- β射线是高速粒子流,速度很大,达光速的99%,穿透能力较强,很容易穿透黑纸,也能穿透几毫米厚的铝板,但是电离能力较弱。
- γ射线呈电中性,电离作用小,但穿透能力非常强。可以穿透几十厘米厚的混凝土
感知光强度 (灰度级):
入射分量 乘以 反射分量
离散灰度级数范围:[ Lmin, Lmax ] 之间的区域,统一化为[0, L-1]。
上限取决于饱和度,下限取决于噪声。上下限之差为对比度,即动态范围较大。
以下为图像矩阵。
图像缩放的内插算法
双线性内插
双三次内插 (商业标准内插方法)
相邻像素
数字图像处理中有4邻接、8邻接和m邻接三种关系。
在这个图中
8邻域中的中间的那个1可以有两条路到达右上角的那个1,这就是所说的二义性
这个情况在边缘检测里面是很不希望的。
而改成m邻域以后,中间的1像素和右上角的像素是8连通的却不是m连通的,这可以从m连通的定义得到。
因此,如果用M连通从中间的1到右上角的1就只有一条路。
/* 2.5.2 关于边界的问题,在此标记下 */
/* 2.5.3 距离度量可见KNN */
线性算子
图像相加
处理噪声图像,叠加后认为噪声相互抵消。
图像相减
增强图像之间的差。
图像相乘(相除)
阴影矫正。
线性变换域 (难点,傅立叶变换时重点研究)