[Bayes] *Bayesian Classifier for Face Recognition
Bayesian在识别领域的贡献,着实吸引人
阅读笔记
Gabor特征
(简介,另单独详述)
通过上面的分析,我们知道了,一个Gabor核能获取到图像某个频率邻域的响应情况,这个响应结果可以看做是图像的一个特征。
那么,我们如果用多个不同频率的Gabor核去获取图像在不同频率邻域的响应情况,最后就能形成图像在各个频率段的特征,这个特征就可以描述图像的频率信息了。
上图展示了一系列具有不同频率的 Gabor 核,用这些核与图像卷积,我们就能得到图像上每个点和其附近区域的频率分布情况。
由于纹理特征通常和频率相关,因此Gabor核经常用来作为纹理特征。
又因为字符识别问题通常都是识别纹理的过程,所以Gabor核在光学字符识别(OCR)系统中也有广泛应用。
Ref: http://blog.csdn.net/xidianzhimeng/article/details/19493019
Gabor小波与人类视觉系统中简单细胞的视觉刺激响应非常相似。它在提取目标的局部空间和频率域信息方面具有良好的特性。
虽然Gabor小波本身并不能构成正交基,但在特定参数下可构成紧框架。
Gabor小波对于图像的边缘敏感,能够提供良好的方向选择和尺度选择特性,而且对于光照变化不敏感,能够提供对光照变化良好的适应性。上述特点使Gabor小波被广泛应用于视觉信息理解。
二维Gabor小波变换是在时频域进行信号分析处理的重要工具,其变换系数有着良好的视觉特性和生物学背景,因此被广泛应用于图像处理、模式识别等领域。
与传统的傅立叶变换相比,Gabor小波变换具有良好的时频局部化特性。即非常容易地调整Gabor滤波器的方向、基频带宽及中心频率从而能够最好的兼顾信号在时空域和频域中的分辨能力;
Gabor小波变换具有多分辨率特性即变焦能力。即采用多通道滤波技术,将一组具有不同时频域特性的Gabor小波应用于图像变换,每个通道都能够得到输入图像的某种局部特性,这样可以根据需要在不同粗细粒度上分析图像。
此外,在特征提取方面,Gabor小波变换与其它方法相比:
-
- 一方面其处理的数据量较少,能满足系统的实时性要求;
- 另一方面,小波变换对光照变化不敏感,且能容忍一定程度的图像旋转和变形,当采用基于欧氏距离进行识别时,特征模式与待测特征不需要严格的对应,故能提高系统的鲁棒性。
无论从生物学的角度还是技术的角度,Gabor特征都有很大的优越性。
研究表明,在基本视觉皮层里的简单细胞的感受野局限在很小的空域范围内,并且高度结构化。
-
- Gabor变换所采用的核(Kernels)与哺乳动物视觉皮层简单细胞2D感受野剖面(Profile)非常相似,具有优良的空间局部性和方向选择性,能够抓住图像局部区域内多个方向的空间频率(尺度)和局部性结构特征。这样,Gabor分解可以看作一个对方向和尺度敏感的有方向性的显微镜。
- 同时,二维Gabor函数也类似于增强边缘以及峰、谷、脊轮廓等底层图像特征,这相当于增强了被认为是面部关键部件的眼睛、鼻子、嘴巴等信息,同时也增强了诸于黑痣、酒窝、伤疤等局部特征,从而使得在保留总体人脸信息的同时增强局部特性成为可能.
它的小波特性说明了Gabor滤波结果是描述图像局部灰度分布的有力工具,因此,可以使用Gabor滤波来抽取图像的纹理信息. 由于Gabor特征具有良好的空间局部性和方向选择性,而且对光照、姿态具有一定的鲁棒性,因此在人脸识别中获得了成功的应用。
然而,大部分基于Gabor特征的人脸识别算法中,只应用了Gabor幅值信息,而没有应用相位信息,主要原因是Gabor相位信息随着空间位置呈周期性变化,而幅值的变化相对平滑而稳定,幅值反映了图像的能量谱,Gabor幅值特征通常称为Gabor 能量特征(Gabor Energy Features. Gabor小波可像放大镜一样放大灰度的变化,人脸的一些关键功能区域(眼睛、鼻子、嘴、眉毛等)的局部特征被强化,从而有利于区分不同的人脸图像。Gabor小波核函数具有与哺育动物大脑皮层简单细胞的二维反射区相同的特性,即具有较强的空间位置和方向选择性,并且能够捕捉对应于空间和频率的局部结构信息;
Gabor滤波器对于图像的亮度和对比度变化以及人脸姿态变化具有较强的健壮性,并且它表达的是对人脸识别最为有用的局部特征。
Gabor 小波是对高级脊椎动物视觉皮层中的神经元的良好逼近,是时域和频域精确度的一种折中。
Ref: http://blog.chinaunix.net/uid-14281799-id-2239597.html
一般情况下图像的边沿含有图像的主要信息,利用图像边沿含有的信息可以做图像识别。用一组加强了方向性的 gabor 核和图像做卷积可以提取出图像的边沿信息。
首先把一般的 gabor 核改一下加强方向性,改过的核在这个程序里叫 zegabor。用一组不同方向的 zegabor 核和图像作卷积,
在卷积结果图中,图像的边缘部分的坐标点上的不同方向结果中会有某一个或几个比平均值大很多,取这样的点做特征点,这些方向做特征值。
例如玩具猫,右图上的
-
- 红点 是取得的特征点,
- 黄线段 是特征点上图像局部边沿的方向,就是此点上卷积结果模值最大的 zegabor 核的方向。
gabor 特征是有方向的,这次的实验主要就是在图像中特征点比较密集方向变化较多的区域中把临近的特征点编成一小组,用其中一个特征值较大的点上的特征的方向做小组主方向,然后临近的几个小组编成一大组,记录大组中各小组的相对位置,做图像匹配时就在图像中寻找相似的特征组。
有了图,就比较直观。
(另起一篇详述原理:属于小波,小波这个东西,是需要仔细看一看di.)
非参数技术
其实就是:
所有的算子都是artifical,但没有人类,模型本来就是客观存在的。那么,
我们不设计模型,我们通过大数据找模型!
而且不是单纯的给个参数的分布,参数的分布也是训练出来的,尽可能地,彻彻地地的 无(人工)参!
什么Sift,什么Gabor统统不要不要的啦!
让我们通过数据训练来给出客观的模型!比如接下来的 GaussianFace.
"高斯脸"涉及到的技术要点
1. Introduction
涉及到的如下概念搞明白。
其中的大量数据训练过程中如何优化的问题,貌似是很值钱的东西。
概念:
主成分分析 与 隐变量模型(Principal Component Analysis,PCA & Latent Variable Model)
kernel Fisher discriminant analysis (KFDA), also known as generalized discriminant analysis and kernel discriminant analysis, is a kernelized version of linear discriminant analysis (LDA).
共轭梯度法(Scaled Conjugate Gradient): 优化方法。
高斯过程近似(GP approximations):优化方法。
Anchor Graphs:W. Liu, J. He, and S.-F. Chang. Large graph construction for scalable semi-supervised learning. In ICML, pages 679–686, 2010.
(另各自详述)
2. Related Work
Continue...