图像的矩特征

1. 矩的概念

图像识别的一个核心问题是图像的特征提取，简单描述即为用一组简单的数据（图像描述量）来描述整个图像，这组数据越简单越有代表性越好。良好的特征不受光线、噪点、几何形变的干扰。图像识别发展几十年，不断有新的特征提出，而图像不变矩就是其中一个。

矩是概率与统计中的一个概念，是随机变量的一种数字特征。设

比较重要的有两种情况：

一阶原点矩就是期望。一阶中心矩

针对于一幅图像，我们把像素的坐标看成是一个二维随机变量

不变矩(Invariant Moments)是一处高度浓缩的图像特征，具有平移、灰度、尺度、旋转不变性。M.K.Hu在1961年首先提出了不变矩的概念。1979年M.R.Teague根据正交多项式理论提出了Zernike矩。下面主要介绍这两种矩特征的算法原理与实现。

2. Hu矩

一幅

m p q = \sum i = 1 M \sum j = 1 N i p j q f (i, j)

μ p q = \sum i = 1 M \sum j = 1 N (i - i ¯) p (j - j ¯) q f (

其中

若将

为了消除图像比例变化带来的影响，定义规格化中心矩如下：

η p q = μ p a μ γ 00 , ( γ = p + q 2 , p + q = 2 , 3 , \dots )

利用二阶和三阶规格中心矩可以导出下面7个不变矩组

3. 利用OpenCV计算Hu矩

opencv里对Hu矩的计算有直接的API，它分为了两个函数：moments()函数用于计算中心矩，HuMoments函数用于由中心矩计算Hu矩。

Moments moments(InputArray array, bool binaryImage=false )

参数说明

输入参数：array是一幅单通道，8-bits的图像，或一个二维浮点数组(Point of Point2f)。binaryImage用来指示输出图像是否为一幅二值图像，如果是二值图像，则图像中所有非0像素看作为1进行计算。
输出参数：moments是一个类：

class Moments
{
public:
    Moments();
    Moments(double m00, double m10, double m01, double m20, double m11,
            double m02, double m30, double m21, double m12, double m03 );
    Moments( const CvMoments& moments );
    operator CvMoments() const;
}

里面保存了图像的2阶与3阶中心矩的值。

void HuMoments(const Moments& moments, double* hu)

参数说明：

输入参数：moments即为上面一个函数计算得到的moments类型。

输出参数：hu是一个含有7个数的数组。

int main(int argc, char** argv) 
{ 
    Mat image = imread(argv[1]);  
    cvtColor(image, image, CV_BGR2GRAY); 
    Moments mts = moments(image); 
    double hu[7]; 
    HuMoments(mts, hu); 
    for (int i=0; i<7; i++) 
    { 
        cout << log(abs(hu[i])) <<endl; 
    } 
   return 0; 
}

4. Zernike矩

Hu矩在图像描述上有广泛的应用，但是其低阶几何矩与图像整体特征有关，不包含太多的图像细节信息，而高阶几何矩易受噪声影响，因此很难利用几何矩恢复图像。

Zernike矩能够很容易地构造图像的任意高阶矩，并能够使用较少的矩来重建图像。Zernike矩是基于Zernike多项式的正交化函数，虽然其计算比较复杂，但是Zernide矩在图像旋转和低噪声敏感度方面具有较大的优越性。由于Zernike矩具有图像旋转不变性，而且可以构造任意高阶矩，所以被广泛应用对目标进行识别中。

4.1 Zernike矩多项式

首先要弄清楚什么是正交多项式。若函数

对于一个多项式的序列

若

那么正交多项式有什么作用呢？答案是：逼近！正交多项式相当于基，任何一个n维多项式函数

Zernike在1934年提出了在单位圆上定义的一组正交多项式，即Zernike正交多项式，其定义形式为：

其中

Zernike多项式

R n m (ρ) = [ ( K 2 2 ρ 2 + K 3 ) R ( n - 2 ) m ( ρ ) + K 4 R

R m m (ρ) = ρ m

式中：

4.2 Zernike矩的定义

由于Zernike多项式的正交完备性，所以在单位圆内的任何图像

f (x, y) = \sum n = 0 \infty \sum m = 0 \infty Z n m V n, m (ρ, θ)

上式中的

对二维函数

Z n m = n + 1 π \int 1 0 \int 2 π 0 [ V n m ( ρ , θ ) ] f ( ρ

= n + 1 π \iint R n m ( ρ ) e j m θ f ( ρ , θ ) d ρ d θ

式中

4.3 Zernike矩的计算

从Zernike矩的计算公式上来看，对于二维图像，其Zernike矩

C n m = 2 n + 2 π \int 1 0 \int 2 π 0 [ R n m ( ρ ) c o s ( m

C n m = 2 n + 2 π \int 1 0 \int 2 π 0 [ R n m ( ρ ) s i n ( m

因为数字图像是离散形式的点，所以需要将上式离散化，把积分号换为求和号，但是需要作一些坐标变换。

对于

如果

σ = 2 ( r - x ) y | y | + x y r

如果

σ = 2 y - x y r

我们容易计算出，

ρ = 2 r / N, θ = π σ (4 r)

所以，最终我们得到离散化的Zernike矩的计算公式：

C n m = 2 n + 2 N 2 \sum r = 1 N / 2 R n m ( 2 r / N ) \sum

S n m = 2 n + 2 N 2 \sum r = 1 N / 2 R n m ( 2 r / N ) \sum

5. 总结

不变矩的应用过程一般包括：

选择合适的不变矩类型；
选择分类器（如神经网络、最短距离等）；
如果是神经网络分类器，则需要计算学习样例的不变矩去训练神经网络；
计算待识别对象的不变矩，输入神经网络就可得到待识别对象的类型，或者计算待识别对象不变矩与类别对象不变矩之间的距离，选择最短距离的类别作为待识别对象的类别。

可以看出，不变矩作用主要目的是描述事物（图像）的特征。人眼识别图像的特征往往又表现为“求和”的形式，因此不变矩是对图像元素进行了积分操作。

不变矩能够描述图像整体特征就是因为它具有平移不变形、比例不变性和旋转不变性等性质。

然而，另一方面图像的各阶不变矩究竟代表的什么特征很难进行直观的物理解释。

posted @ 2022-06-10 16:11 葵葵的执着阅读(111) 评论(0) 编辑收藏举报

刷新页面返回顶部

葵葵的执着