图像识别的一个核心问题是图像的特征提取,简单描述即为用一组简单的数据(图像描述量)来描述整个图像,这组数据越简单越有代表性越好。良好的特征不受光线、噪点、几何形变的干扰。图像识别发展几十年,不断有新的特征提出,而图像不变矩就是其中一个。

1、HU距

 图像的hu矩是一种具有平移、旋转和尺度不变性的图像特征

普通矩的计算:
f(x,y)的p+q阶原点矩可以表示为

 

 

 而数字图像是一个二维的离散信号,对上述公式进行离散化之后:

 

其中C与R分别表示图像的列与行。

各阶矩的物理意义:
0阶矩(m00):其中零阶矩与物体的质量有关(目标质量)
1阶矩(m01,m10):与形状有关,(零阶矩与一阶矩可以求出重心)
2阶矩(m02,m11,m20):二阶矩显示曲线围绕直线平均值的扩展程度
3阶矩(m03,m12,m21,m30):三阶矩则是关于平均值的对称性的测量。

但是目标区域往往伴随着空间变换(平移,尺度,旋转),所以需要在普通矩的基础上构造出具备不变性的矩组—hu矩。

由零阶矩和一阶矩计算质心

 

 由二阶距计算图像方向

 

 

 

 利用二阶和三阶规格中心矩可以导出下面7个不变矩组,它们在图像平移、旋转和比例变化时保持不变。

这7个不变矩构成一组特征量,实际上,在对图片中物体的识别过程中,只有M1和M2不变性保持的比较好,其他的几个不变矩带来的误差比较大,有学者认为只有基于二阶矩的不变矩对二维物体的描述才是真正的具有旋转、缩放和平移不变性(M1和M2刚好都是由二阶矩组成的)。
由Hu矩组成的特征量对图片进行识别,优点就是速度很快,缺点是识别率比较低。Hu不变矩一般用来识别图像中大的物体,对于物体的形状描述得比较好,图像的纹理特征不能太复杂,像识别水果的形状,或者对于车牌中的简单字符的识别效果会相对好一些。

补充:不变矩的物理含义
如果把图像看成是一块质量密度不均匀的薄板,其图像的灰度分布函数f(x,y)就是薄板的密度分布函数,则其各阶矩有着不同的含义,如零阶矩表示它的总质量;一阶矩表示它的质心;二阶矩又叫惯性矩,表示图像的大小和方向。事实上,如果仅考虑阶次为2的矩集,则原始图像等同于一个具有确定的大小、方向和离心率,以图像质心为中心且具有恒定辐射率的椭圆。当密度分布函数发生改变时,图像的实质没有改变,仍然可以看做一个薄板,只是密度分布有所改变。虽然此时各阶矩的值可能发生变化,但由各阶矩计算出的不变矩仍具有平移、旋转和尺度不变性。通过这个思想,可对图像进行简化处理,保留最能反映目标特性的信息,再用简化后的图像计算不变矩特征,可减少计算量。