数字图像、灰度直方图、色彩空间
pixel:picture element 二维图像
voxel:volume element 三维图像
像素点描述:(x,y) 图像在计算机描述里是从左上角到右下角,因此将数学中的坐标系的y轴翻转下来,x轴不变。
像素之间的关系:
灰阶:gray level 为何一般是0-255共256阶,因为计算机一般用一个字节表示一个像素,而一个字节通常是8位,2^8 = 256
灰度图: 0黑——1 白
彩图的灰度图: 每一个通道是一个电磁波波段,一个通道是一个灰度图
- R通道 0黑——255最红
- G通道 0黑——255最绿
- B通道 0黑——255最蓝
图像灰度直方图:histogram
灰度级(像素的最小划分范围)为横坐标,纵坐标为灰度级像素出现的频率,因此灰度直方图上纵坐标之和为1。
- 双峰性:一个峰代表背景,一个峰代表前景。两个峰之间的分界点可以作为二值化的阈值,很好的分开前景和背景。这个分界点实际也不是精确的前景背景分界,因为实际上这个平滑的谷底是由于前景这个高斯曲线和背景的高斯曲线重合得来的。如何寻找最低点,有些图片是没有双峰性的。
- 两个经典方法:日本的OTSU算法,寻找两类的相关性。另一个算法:熵算法。前景熵+背景熵 对其最优化 得到最优二值化灰度值。
图像处理的不同层次:
- low level: 图像滤波 ( 增强,平滑,插值), 图片→图片
- intermediate level: 图像分割 ( 图片→符号级), 得到的是物体的轮廓等,轮廓实际是一圈像素点
- high level : 图像识别 (符号级→功能级), 高级语义
图像数学形态学的应用:图像增强,图像分割,图像修复,边缘检测,纹理texture分析,图像压缩等。 形态学中结构化要素 (SE)的概念,相当于卷积的kernel。
图像二值化是一个很好用的增强的过程。
二值化膨胀:binary dilation。直观上讲,比如一个三角形用一个小正方形(SE)做二值化膨胀,结果是这个三角形的周边扩张了相当于小正方形(SE)半径的一圈。 SE是一个全都是1的核,用这个核的中心去重叠图像上每一个为1的像素点,重叠后将SE周边为1的像素点对原图像重叠像素点做一个并集,也都变成1,类似数学中的加法运算。
受限膨胀:我们对图像进行去噪后,常常是我们想要的区域也遭到了一定的破坏,如何恢复呢?受限膨胀,给一个阈值。
彩色图像——色彩空间:
- RGB表示(直角坐标系)
- HIS(极坐标系),也叫HLS——lightness
- LAB空间