数字图像处理及应用(期末复习整理)
一、图像及其类型
图像(image)的定义是:在一般意义下,一幅图像是一个物体或对象(object)的另一种表示。亦即图像是其所表示物体或对象信息的一个直接描述和浓缩表示。简而言之,即图像是物体在平面坐标上的直观再现。一幅图像包含了所表示物体的描述信息和特征信息,或者说图像是与之对应的物体或抽象的一个真实表示,这个表示可以通过某些技术手段实现。
数字图像处理(digital image processing):又称为计算机图像处理,它是通过计算机对图像进行去除噪声、增强、变换、复原、分割、特征提取、识别等运算与处理。
图像的分类:
- 可见图像(visible image):是指视觉系统可以直接看见的图像,这也是大多数人在日常生活中所见到的和所理解的图像,这一类图像一般通过照像、手工绘制等传统方法获得,通常计算机不能直接处理,但是经过数字化处理后可变为数字图像。
- 物理图像(physical image):所反映的是物体的电磁波辐射能,包括可见光和不可见光图像。
- 数字图像(maths image):指由连续函数或离散函数生成的抽象图像,其中离散函数所生成的图像就是计算机可以处理的数字图像。
其他相关概念:
计算机图形学(computer graphic):是指利用计算机技术将概念或数学描述所表示的物体(非实物)图像进行处理和显示的过程。
计算机视觉(computer vision):是指利用计算机、传感器及相关设备模拟生物的视觉功能,主要目的是通过对传感器采集到的图像或视频信息进行处理,理解自然场景的二维或三维信息。
噪声(noise):一般是指加性的或乘性的非图像本源信息,即图像的污染信息。
像素(pixel):是指在由一个数字序列表示的图像中的一个最小单位,称为像素。
对比度(contrast):是指一幅图像中灰度反差的大小。
采样密度(sampling density):是指在图像上单位长度所包含的采样点数。
放大率(magnification):是指图像中物体与其所对应的实际景物中物体的大小的比例关系。
数字化(digitizing):是将一副图像从其原来的形式转换为数字形式的处理过程。
扫描(scanning):是按照一定的先后顺序对一幅图像进行遍历的过程。
采样(sampling):是指遍历过程中,在图像的每个像素位置上测量其灰度值,即亮度值。
量化(quantization):是指将采样得到的灰度值通过模/数转换等期间转换为离散的整数值。
三、数字图像获取方法
- 图像传感器:其作用是将真实场景的空间信息转换为图像信号,以数据文件的形式保存在存储介质上,并传输至计算机,它是图像处理不可或缺的通用设备。
- 数字化扫描仪:其作用是将传统的可见光图像进过数字化处理转换为数字图像。
- 应用各种光电转换设备直接得到数字图像。
- 合成图像:直接由二维离散数学函数生成数字图像。
四、数据图像矩阵表示
数字图像在计算机中通常采用二维矩阵表示和存储,原始图像在水平方向和垂直方向被等间隔地分割成大小相同的小方格(grid),其中的每一个小方格称为像素点,简称为像素或像元(pixel)。像素是构成图像的最小基本单元,图像的每一像素都具有独立的属性,其中最基本的属性包括像元位置和灰度值两个属性。位置由像素所在的行和列的坐标值决定,通常以像素的位置坐标(x,y)表示,像素的灰度值即该像素对应的光学亮度值。
数字图像的类型:
- 二值图像:其灰度值只有0/1,其中灰度值0代表黑色,1代表白色。因此,二值图像所对应的的二维矩阵元素也只由0、1构成。
- 灰度图像:一般指具有256级灰度值的数字图像,灰度图像只有灰度值二没有彩色。因此,每个像素都是介于黑色和白色之间的256中灰度中的一种。256级灰度值图像的数据类型为8位无符号整数,灰度值0代表纯黑色,255表示纯白色,0-255之间的数字由小到大表示从纯黑到纯白之间的过渡色。
- 索引图像:它的文件结构与灰度图像和RGB图像文件不同,它既包括存放图像数据的二维矩阵,还包括一个颜色索引矩阵(称为MAP),因此称为索引图像,又称为映射图像。
- RGB彩色图像:又称为真彩色图像,RGB彩色图像与索引图像都是计算机可以处理的彩色图像。RGB彩色图像也同样是以R、G、B三原色的叠加来表示每个像素的颜色。与索引图像不同的是,RGB彩色图像每一个像素的颜色值(由RGB三原色表示)直接存放在图像矩阵中,不需要进行索引。
五、图像的采样和量化
图像的采样:图像在二维空间上的离散化成为采样,具体地说,就是以空间上部分点的灰度值代表一幅图像,而这些点称为采样点。因为图像是一种二维分布的信息,因此,为了对它进行采样操作,需在垂直方向和水平方向分别进行采样。具体做法是:先沿垂直方向按一定间隔从上到下顺序地沿水平方向直线扫描,取出各水平线上灰度值的一维扫描信息。而后再对一维扫描信号按一定间隔采样得到离散信号,即先沿垂直方向采样,再沿水平方向采样,这样就完成了二维图形的数字化采样操作。对于运动图像,即时间域也是连续的图像,则虚线在时间轴上采样,再沿垂直方向采样,最后沿水平方向采样。
图像的量化:模拟图像经过采样以后,在时间和空间上被离散化为像素,但采样所得到的像素值依然是连续量。量化的过程就是以离散的灰度值信息代替连续的模拟量灰度信息的过程,该过程是一对多的映射过程。量化可以分为线性量化和非线性量化两种方式。
- 线性量化:模拟图像的亮度值f是连续变化的数值,若f(x,y)的亮度值L的范围为[Lmin,Lmax],则称区间[Lmin,Lmax]为灰度级范围(或色度范围)。若将灰度值区间[Lmin,Lmax]分成K个等间距的子区间,则称为线性量化或等间隔量化。量化过程中每个子区间对应一个亮度值qi,这样在灰度值范围[Lmin,Lmax]内就有K个亮度值对应,称为灰度级K。为方便计算机处理,灰度级K一般以2的整数次幂表示,一般取K=256,表示共有256个灰度级,此时位深度为8,一副128*128的彩色图像此时需要128*128*8*3位表示,即每一个像素实际上需要用24位表示。
- 非线性量化:与线性量化的等间隔划分灰度区间相反,若将表示数字图像的灰度级范围分为不等间隔的子区间,则称为非线性量化或非均匀量化。
采样和量化的参数选择:并不是一味地提高采样点数和灰度级数量就可以获得高清晰度且高质量的数字图像,在确定采样和量化参数时,还应根据原始图像的性质与质量进行科学、合理的选择。
六、灰度直方图
灰度直方图:是基于图像灰度值和像素统计分布的形象表示,它概括地表示了一副图像的灰度级信息。
灰度直方图的定义:在数字图像处理中灰度直方图是灰度级的函数,它描述了图像中具有该灰度级的像素的个数,其横坐标是灰度级,纵坐标是该灰度出现的频率(像素的个数)。
直方图的性质:
- 其是一幅图像中各像素灰度值出现次数或频数的统计结果,它只反映该图像中不同灰度值出现的频率,而不能反映某一灰度值像素所在的位置信息。
- 任一幅图像,都能唯一的确定一个与之对应的直方图,但不同的图像,可能有相同的直方图。也就是说,图像与直方图之间是一种多对一的映射关系。
- 由于直方图是对具有相同灰度值的像素统计计数得到的,若一幅图像由若干个子图像区域构成,那么个子区域直方图之和就等于原图像的直方图。
直方图的作用:
- 数字化参数
- 选择边界阈值
- 计算机综合光密度
七、傅里叶变换(不是很懂)
傅里叶变换是线性统计分析的有力工具,在数字图像处理与分析中,图像增强、图像恢复、图像编码与压缩、图像分析与描述等每一种处理手段和方法都可以应用图像变换方法。
八、离散余弦变换(不是很懂)
DCT变换的全称是离散余弦变换,主要用于将数据或图像的压缩,能够将空域的信号转换到频域上,具有良好的去相关性的性能。
九、图像噪声
对于数字图像处理而言,噪声是指图像中的非本源信息。图像中各种妨碍人们对其信息接受的因素即可称为图像噪声。
噪声的产生:图像数字化设备、电气系统和外界影响将使得图像噪声的产生不可避免。
图像噪声的分类:内部噪声、外部噪声;平稳噪声、非平稳噪声;加性噪声、乘性噪声;白噪声、1/f噪声、三角噪声等。
外部噪声:是指系统外部干扰以电磁波或经电源串进系统内部而引起的噪声,如电气设备、天体放电现象等引起的噪声。
内部噪声:是指成像系统本身原因引起的噪声。
图像噪声的特点:
- 随机性:即噪声在图像中是随机出现的。
- 叠加性:噪声包括加性噪声、乘性噪声。生活中绝大多数的是加性噪声,在图像的串联传输系统中,各串联部件引起的噪声一般具有叠加效应,导致信噪比下降。
- 噪声与图像之间具有相关性:通常情况下,摄像机的信号和噪声相关,明亮部分噪声小,黑暗部分噪声大。数字图像处理技术中存在的量化噪声与图像相位相关。
十、图像增强处理
图像增强处理分类:
十一、直方图的图像增强
直方图均衡化:其做的处理是以累积分布函数为基础的直方图修改法。直方图均衡化的目的是将原始图像的直方图变为均衡分布的形式,将一非均匀灰度概率密度分布图像,通过寻求某周灰度变换,变成一副具有均匀概率分布的目的图像。
直方图均衡化实现可以参考之前的(直方图均衡化部分):https://www.cnblogs.com/shixinzei/p/10902520.html
十二、空域滤波增强
图像的空间纹理信息可以反映图像中物体的位置、形状、大小等特征。
图像的空间纹理信息增强则可以通过空域滤波和频域滤波方法实现。
数字图像处理根据需要可以分别采用不同方法对图像的高频和低频特征信息进行增强。例如,公安系统在进行人像的比对查询时,就需要突出高频信息增强五官轮廓特征信息,这样不仅可以提高比对速度,还可以提升比对的准确率。
高频滤波:增强图像的高频信息称为高频滤波它可以突出物体的边缘轮廓,从而起到锐化图像的作用,因此又称为锐化滤波器。根据频域分析理论,高频滤波能起到减弱或消除图像的低频分量、保留高频分量的作用。
低频滤波:相应地,低通滤波则是指对图像的低频信息进行增强,又称为平滑滤波器。它可以实现图像的平滑处理,一般用于图像的噪声消除。平滑滤波可以减弱甚至消除图像的高频分量、保留低频分量。
空域滤波模板:
数字图像空域滤波的实现是应用模板卷积方法对每一像素点的领域进行处理完成的,它可分为线性和非线性两类空域滤波方法。
模板(template)运算方法是数字图像处理中常用的一种运算方式,图像的平滑、锐化、细化和边缘检测等都运用到模板操作。
模板操作实现了一种领域运算,即某个像素点的结果不仅和本像素灰度值有关,而且和其领域点的值有关。模板运算的数学含义是卷积(或互相关)运算。
卷积是一种用途很广的算法,可用卷积来完成各种处理变换。
以3*3领域f和3*3模板(又称为卷积核)卷积运算的处理过程为例,领域中的每一个像素点f1,f2,f3,...f9分别于模板中的每一个元素h1,h2,h3,...h9相乘,乘积求和所得的结果即为中心像素点的灰度值。
模板或卷积的加权运算中,以下问题需要引起注意:
- 图像边界问题。即在图像上移动模板至图像的边界时,在原图像中找不到与卷积核中的加权系数相对应的9个像素。一般的解决方法是:一种方法是忽略图像边界数据,即不处理图像的边缘像素;另一种方法是在图像四周复制原图像边界像素的值(或其他方法),从而达到平滑边界像素点的目的。实际应用中,多采用第一种方法。
- 卷积求和计算出来的像素值的动态范围问题,对此可以简单地将其值置为0或255,即小于零的置为0,大于255的置为255。
- 模板的大小与平滑效果直接相关,模板越大,平滑的效果越明显,但模板太大会造成图像的边缘信息的损失,模板的大小要在保证消除噪声的前提下尽可能保持图像的边缘信息。模板大小一般为技术,且不超过11*11。
线性平滑滤波:
各种线性平滑滤波方法一般都基于模板卷积进行运算,平滑滤波一般用于消除图像中的随机噪声,起到图像平滑的作用。线性平滑滤波的作用是对图像的高频分量进行削弱或消除,增强图像的低频分量。平滑滤波器的设计比较简单,若模板各系数取不同的值,就可以得到不同的平滑滤波器。
常用的平滑滤波方法是领域均值滤波法和中值滤波法,其中领域平均法是线性运算,而中值滤波法是非线性运算。
领域平均法:领域平均滤波法是将一个像素点及其领域中的所有像素点的平均值赋给输出图像中相应的像素点,从而达到平滑的目的,又称为均值滤波法。最简单的领域平均法是所有模板系数都去相同的值,例如,取模板系数为1,常用的模板为3*3和5*5的两种模板类型,如下图所示():
3*3模板如下:
5*5模板如下:
领域平均法实例:
领域平均法实现代码(matlab)如下:
1 %Mean(Averaging) Filter 2 clear;clc; 3 i=imread('1.png'); 4 i=im2double(i); 5 g=rgb2gray(i); 6 g = imnoise(g,'salt & pepper',0.08); 7 b=g; 8 s=size(g); 9 for x=2:s(1)-1 10 for y=2:s(2)-1 11 b(x,y)=(g(x+1,y)+g(x-1,y)+g(x+1,y+1)+g(x,y+1)+g(x,y-1)+g(x+1,y-1)+g(x-1,y-1)+g(x,y)+g(x-1,y+1))/9; 12 end 13 end 14 subplot(1,3,1); imshow(i); 15 subplot(1,3,2); imshow(g); 16 subplot(1,3,3); imshow(b);
测试结果如下:(最左边的图像是原图像,中间的图像是加了噪声后的图像,最右边是用领域平均法处理后的图像)
加权平均法:领域平均法认为被处理像素与领域内其他像素点的作用相等,因此,模板的系数完全相等。加权均值滤波法认为,对于被处理的像素点,其领域内像素的贡献是不一样的,离被处理像素距离近者,其贡献大,因此,其模板的系数大小不完全相等。以3*3模板为例,常用的加权平均模板矩阵为:
高斯滤波:实质上是根据高斯函数计算出来的一种滤波模板,其用途为对图像信号进行平滑消噪处理。图像处理的后期应用,其噪声是一个很重要的问题,因为误差会累积传递,高斯平滑滤波器对于抑制服从正态分布的噪声非常有效,用于得到信噪比SNR较高的图像(反映真实信号)。图像处理中,高斯滤波主要可以用两种方法实现。一种方法是:离散化窗口滑窗卷积,另一种方法是通过傅里叶变换。一般采用第一种离散化窗口卷积形式实现,5*5的高斯模板为:
非线性平滑滤波:
虽然基于模板的线性滤波方法简便易行,但对于既需要消除噪声又要保持好的图像细节时,其效果并不理想,二非线性滤波在这方面具有一定的优势。
非线性滤波最经典使用的方法是基于模板的统计排序滤波,主要包括中值滤波、最大值滤波和最小值滤波三种方法,该滤波方法基于滤波器所在图像区域中像素的排序,由排序结果决定的值代替中心像素的值。
中值滤波:
尽管领域平均滤波法可以起到平滑图像的作用,但在消除噪声的同时,会使图像中的一些细节变得模糊。中值滤波法在消除噪声的同时还能保持图像中的细节部分,防止图像边缘部分模糊。与领域平均法不同,中值滤波是一种非线性滤波,它将领域内所有像素点值从小到大排序,取中间值作为中心像素点的输出值。采用中值滤波,在一定的条件下,可以克服数字图像细节模糊的问题。中值滤波的原理是利用一个奇数点的移动窗口(3*3或5*5窗口),将窗口中心点的值用窗口各点的中间值代替。计算公式为:gij=Med{xij}
中值滤波实现代码(matlab)如下:
1 %Median filtering 2 clear;clc; 3 I=imread('1.png'); 4 I=rgb2gray(I); 5 [r c]=size(I); 6 I = imnoise(I,'salt & pepper',0.02);%加入噪声 7 for x=2: r-1 8 for y=2: c-1 9 w=I(x-1:x+1,y-1:y+1); 10 g=sort(w);%3*3窗口内元素排序 11 f(x,y)=median(median(g));%取中值 12 end 13 end 14 imshow(I,[]); 15 figure;imshow(f,[]);
测试结果如下:(Figure1为加了噪声的图像,Figure2为进行中值滤波处理后的图像,效果还是比较明显)
最大值滤波:
最大值滤波法的实现过程与中值滤波类似,不同之处是用像素领域内的最大值代替被处理像素的灰度值实现滤波。其主要用途是寻找最亮点。
计算公式为:gij=Max{xij}
最小值滤波:
最小值滤波法的实现是用像素领域内的最小值代替被处理像素的灰度值实现滤波。其主要用途是寻找最暗点。
计算公式为:gij=Min{xij}
锐化滤波器
- 梯度法
- 拉普拉斯算子
- 定向滤波
梯度法测试代码(matlab):
1 %Gradient Operators 2 clear;clc; 3 I=imread('1.png'); 4 I=rgb2gray(I); 5 I=imresize(I,[256 256]); 6 [r c]=size(I); 7 LP=[-1 -2 -1; 8 0 0 0; 9 -1 -2 -1]; % Gradient with repect to Horizontal 10 LN=[-1 0 1; 11 -2 0 2; 12 -1 0 1]; % Gradient with repect to Vertical 13 for x=2: r-1 14 for y=2: c-1 15 w=I(x-1:x+1,y-1:y+1); 16 gi=double(w)+double(LP); 17 gp(x,y)=gi(2,2); %Gradient with repect to Horizontal 18 g=imsubtract(double(w),double(LN)); 19 gn(x,y)=g(2,2); % Gradient with repect to Vertical 20 21 end 22 end 23 figure;imshow(I,[]);title('orignal image'); 24 figure;imshow(gp,[]);title('horiz grad Image'); 25 figure;imshow(gn,[]);title('ver grad Image');
拉普拉斯算子测试代码(matlab):
1 % Laplacian program with respect to +ve and -ve 2 clear;clc; 3 I=imread('1.png'); 4 I=rgb2gray(I); 5 I=imresize(I,[256 256]); 6 %PSF=fspecial('gaussian',5,3); 7 %I=imfilter(I,PSF); 8 [r c]=size(I); 9 LP=[-1 -1 -1; 10 -1 4 -1; 11 -1 -1 -1]; % Laplacian with repect to +ve window 12 LN=[1 1 1; 13 1 -4 1; 14 1 1 1]; % Laplacian with repect to -ve window 15 for x=2: r-1 16 for y=2: c-1 17 w=I(x-1:x+1,y-1:y+1); 18 gi=double(w)+double(LP); 19 gp(x,y)=gi(2,2); % Laplacian with repect to +ve 20 g=imsubtract(double(w),double(LN)); 21 gn(x,y)=g(2,2); % Laplacian with repect to +ve 22 23 end 24 end 25 figure;imshow(I,[]);title('orignal image'); 26 figure;imshow(gp,[]);title('+ve Laplacian Image'); 27 figure;imshow(gn,[]);title('-ve Laplacian Image');
定向滤波测试代码(matlab):
先空着。。。
十三、低通滤波
图像从空间域变换到频率域后,其低频分量对应图像中的灰度值变化比较缓慢的区域,而高频分量则表示图像中物体得边缘和随机噪声信息。低通滤波功能是通过低通滤波器函数H减弱或抑制高频分量,保留低频分量。因此,低通滤波与空域中的平滑滤波器在功能上是一样的,可以消除图像中的随机噪声、削弱边缘效应,起到平滑图像的作用。
低通滤波器的类型:
- 理想低通滤波器
- 巴特沃斯低通滤波器
- 指数低通滤波器
- 梯形低通滤波器
十四、高通滤波
图像中物体的边缘及其他灰度变化较快的区域与图像的高频信息有关,因此可以利用高通滤波器可以对图像的边缘信息进行增强,起到锐化图像的作用。
高通滤波器的类型:
- 理想高通滤波器
- 巴特沃斯高通滤波器
- 指数高通滤波器
- 梯形高通滤波器
十五、全彩色图像处理
自然界的颜色是多种多样的、丰富多彩的,能真实反映自然物体真实色彩的图像叫真彩色图像或全彩色图像,若彩色图像的单通道位深度为8位,则真彩色图像是指24位RGB图像。
处理方法分两类:
- 合成处理法:即将RGB图像分解为R、G、B三个波段的图像分量,分别对R分量、G分量、B分量的图像进行处理,处理之后合成处理后的彩色图像。
- 直接处理法:指直接处理每一个彩色像素,即每一个像素是三个三维分量,令c表示RGB图像任意像素的向量,则有c=[CR,CG,CB]'=[R,G,B]';
彩色图像直方图增强
彩色图像直方图均衡化的作用是扩展输入图像各分量灰度值的动态范围,提高图像的对比度和亮度。
彩色图像去噪
彩色图像去噪基础理论和灰度图像去噪方法类似,不同之处是需按R、G、B三分量分别进行滤波消噪,在彩色图像消噪中,空域滤波和频域滤波方法都可以根据情况选择采用。
彩色频域处理
彩色图像频域滤波的基本原理是:先将RGB彩色图像的R、G、B三个分量分别进行傅里叶变换,并根据各分量的特点和图像处理的目的,对各分量分别选择低通、高通、带通、或带阻滤波,以及对各分量信息进行其他处理。
以上的实际操作代码可以参考之前的图像处理实现部分:https://www.cnblogs.com/shixinzei/p/10902520.html
十六、无约束复原技术(不是很懂)
无约束复原法就是在已经给定退化图像g(x,y)的条件下,图像复原完全取决于对退化系统h(x,y)及噪声n(x,y)的了解,从而估计出原始图像f(x,y)。
十七、逆滤波器(不是很懂)
逆滤波复原法是无约束复原法的一种,又称为反向滤波复原法或去模糊。逆滤波是通过变换到频率进行滤波的,属于频域图像复原法。逆滤波复原法的基本原理是根据图像退化原因进行反向滤波。
十八、几何畸变校正
数字图像在获取过程中常常由于成像系统的几何非线性误差,导致图像产生几何失真。例如,成像图与原景物图像相比可能出现了比例失调,甚至扭曲现象,这类图退化现象一般称为图像的几何畸变。几何畸变校正的目的是需对失真的图像进行精确的几何校正,通常是先确定一幅图像为基准,然后去校正另一幅图像的几何形状。
几何畸变校正一般分两步进行:第一步是图像空间坐标的变换;第二步是重新确定在校正空间各像素点的取值。
- 空间几何坐标变换
- 三角形线性法
- 灰度值的确定
十九、盲目图像复原
盲目图像复原法是指在没有图像退化先验知识、对退化系统了解不足的条件下,通过观察退化图像的多个图像并以某种特殊方式抽出退化信息,进行图像复原的方法。
在这种条件下,具有加噪声的模糊图像复原方法一般有:
- 直接测量法
- 简介估计法
二十、图像编码的基本原理
编码是信息科学的经典研究课题,应用计算机进行图像处理必须首先进行图像数字化,而图像数字化的关键是编码。50年来,图像编码技术得到了快速的发展,已经有多种成熟的编码方法得到了广泛应用,特别是所谓的第一代编码更是如此。 而且,随着多媒体技术的发展,已有若干编码标准由ITU-T制定出来,如JPEG、H.261、H. 263、MPEG-1、MPEG-2、MPEG-4、MPEG 7、JBIG等。数据压缩编码方法经过几十年的发展,针对不同的原始数据的特点如文本、声音、图像、视频、动画已研究出了不同的编码方法。
图像编码也称图像压缩:是指在保证一定质量(信噪比或主观评价)的条件下,按照一定的规则、以较少比特数表示源图像的一种方法。
图像中的信息冗余:
- 视觉冗余
- 空间冗余
- 时间冗余
- 信息熵冗余
- 结构冗余
- 知识冗余
图像编码方法分类:
熵编码:
- 霍夫曼编码
- 算术编码
- RLE编码
预测编码:
- DPCM编码
- 运动补偿法
变换编码:
- DCT变换编码
- DFT变换编码
- 小波变换编码
混合编码:
- JPEG编码
- MPEG编码
二十一、图像统计编码
统计编码又称为熵编码,它是建立在图像统计特征基础之上的数据压缩方法,根据香农的观点,信息冗余来自信源数据本身的相关性和信源内事件的概率分布不均匀性,只要找到去除相关性和改变概率分布不均匀的方法,也就找到了信源数据的统计编码方法。
变长最佳编码原理:在变长编码中,对出现概率大的符号编以短码字,对出现概率小的符号编以长码字。
霍夫曼编码:有时又称为最佳编码,完全依据信源字符出现的概率来构造其码字,对出现概率大的字符使用较短的码字,而对出现概率低的字符使用较长的码字,从而达到压缩数据的目的,最初主要用于文本文件压缩。
简单的霍夫曼树算法参考链接:https://www.cnblogs.com/shixinzei/p/10683774.html
还有其他的编码(不在赘述):
- 香农-范诺编码
- 行程长度编码
- 算术编码
- 位平面编码
- 灰度码分解
二十二、预测编码
预测编码是指依据某一模型,根据以往的样本值对于新样本进行预测,然后将样本的实际值与预测值相减得到一个误差值,对这一误差值进行编码。如果模型足够好且样本序列在时间和空间上存在较强的相关性,那么误差信号的幅度将远远小于信源原始信号,从而可以用较少的电平量对其差值量化得到较大的数据压缩结果。
预测编码的类型:
- 线性预测
- 非线性预测
二十三、图像分割的基本概念
图像分割的目的是将图像划分为若干具有一定意义的或一定目的的子区域。可以逐个像素点为基础研究图像分割,也可以利用在规定邻域中的某些图像信息进行分割。分割的依据一般建立在相似性和非连续性两个基本概念的基础上。
图像分割的基本原理:
图像分割是根据图像的组成结构和应用需求将图像划分成若干个互不相交的子区域的过程,这些子区域是某种意义下具有共同属性的像素的连通集合。
图像分割的方法:
- 基于阈值的分割方法
- 基于区域的分割方法
- 基于边缘的分割方法
二十四、阈值分割法
阈值分割是一种常用的、传统的图像分割方法,实现简单、计算量小、性能比较稳定,目前在图像分割中早已成为一种基本方法,得到广泛应用。
常用的图像分割方法:是把图像灰度分为不同的等级,然后用设置灰度门限值(阈值)的方法确定有意义的区域或分割物体的边界。常用的阈值化处理就是图像的二值化处理,即选择一阈值,将图像转换为黑白二值图像,用于图像分割及边缘提取等处理之中。
图像阈值化处理的变换函数形式为:
显然,图像阈值化处理是一种阶梯函数,属于图像灰度级的非线性运算。它的功能是由用户指定一个阈值,如果图像中某个像素的灰度值大于该阈值,则将该像素的灰度值置为255,否则将其灰度值置为0.
阈值分割的优点:计算简单、运算效率高、速度快。
阈值分割法代码实现(matlab)如下:
1 clear;clc; 2 r=imread('2.png'); 3 r=rgb2gray(r); 4 t=130; 5 [m n]=size(r); 6 for i=1:m 7 for j=1:n 8 if r(i,j)<=t 9 s(i,j)=0; 10 else 11 s(i,j)=255; 12 end 13 end 14 end 15 hold on 16 subplot(1,2,1);imshow(s); 17 subplot(1,2,2);imshow(r);
测试结果如下(右图为原图像的灰度图,左图为阈值T为130阈值分割处理后的图像):
二十五、区域分割
基于区域的图像分割方法主要包括区域生长和区域分裂与合并两种典型的方法。
- 区域生长法是从单个像素出发,逐渐合并周围像素,最后形成所需要的分割结果。
- 分裂与合并法是从整幅图像出发,逐渐分裂或合并,会后形成所需要的分割结果。
二十六、边缘检测的基本原理
图像分割的另一种重要途径就是通过边缘检测,即检测灰度级或者一幅图像中结构具有突变的地方,表明一个区域的终结,也是另一个区域的开始。这种不连续性称为边缘。图像内不同物体灰度不同,一般有明显边缘,利用此特征可以分割图像。
图像内边缘处像素的灰度值不连续,这种不连续性可通过求导数检测。对于阶跃类型的边缘,其位置对应一阶导数的极值点,对应二阶导数的过零点。因此常用微分算子进行边缘检测。常用的一阶微分算子有Robert算子和Sobel算子,二阶微分算子有Laplace算子和Kirsh算子等。实际应用时各种微分算子通常用模板来实现,即微分运算是利用模板和图像卷积实现的。这些算子对噪声敏感,只适合于噪声较小不太复杂的图像。
具体实现以及测试可以参考之前的博文(边缘检测部分): https://www.cnblogs.com/shixinzei/p/10899102.html
二十七、几何特征
图像的几何特征是指图像中物体的位置、方向、周长和面积等方面的特征。提取图像几何特征之前,一般要对图像进行分割和二值化处理。二值图像只有0和1两个灰度级,便于获取、分析和处理,虽然二值图像只能给出物体的轮廓信息,但在图像分析和计算机视觉中,二值图像及其几何特征特别具有价值,可用来完成分类、检验、定位、轨迹跟踪等任务。
二十八、颜色特征
颜色特征是图像检索、图像识别与分类中应用广泛的重要视觉特征,主要原因在于颜色往往和图像中所包含的物体或场景相关。与其他视觉特征相比,颜色特征对图像自身的某些几何形状特性,如尺寸、方向、视角的依赖性较小,从而具有较高的鲁棒性。颜色特征是一种全局特征,描述了图像或图像内区域所对应的景物的表面性质。
颜色直方图是最常用的表达颜色特征的方法,其优点是不受图像旋转和平移变化的影响,基于归一化的直方图还可不受图像尺寸变化的影响,其缺点是没有表达出颜色空间分布的信息。颜色特征常用的特征提取与匹配方法主要包括颜色直方图、颜色集、颜色炬、颜色聚合向量和颜色相关图。
特别提一下,基于HSV空间的颜色直方图也常常被采用,它的三个分量分别代表色彩(hue)、饱和度(saturation)和值(value)。
二十九、纹理特征
纹理图像在局部区域内可能呈现不规则性,但整体上则表现出一定的规律性,其灰度分布往往表现出某种周期性。纹理图像所表现出的这种特有的性质称为纹理。纹理最初是指纤维物外观,纹理图像在很大范围内没有重大细节变化,在这些区域内图像往往显示出重复性结构。有时,物体纹理上与周围背景和其他物体有区别,这是,图像分割应以纹理为基础。
一般来说,纹理是由许多相互接近的、互相交织的元素构成,它们具有周期性。纹理在一定程度上反映了一个区域中像素灰度级的空间分布的属性。
纹理分析常用的方法有:
- 统计法
- 自相关函数法
- 傅里叶频谱法
- 联合概率矩阵法
- 句法结构法
三十、骨架的概念
图像骨架提取是指提取目标在图像中的中心像素轮廓,即以物体的对称中心为目标,对目标进行细化,细化后的目标通常为单层像素宽度。
图像细化和骨架提取的目的都是为了减小像素的连通区,一般情况下这些运算都是不可逆的。
通俗的说,骨架化运算是指将目标区域变为条形骨架的算法。骨架或细化的概念主要是针对二值图而言。从某种意义上,所谓骨架,可以理解为图像的中轴。
骨架获取的方法:
- 烈火燃烧
- 基于最大圆盘