人脸检測中几种框框大小的选择~
人脸检測应用极为广泛,内部细节也偏多,尤其是涉及到几种类型的框,这几种框的大小之前有着千丝万缕的联系,对检測性能的好坏影响程度大小不一。本篇文章基于自己在人脸检測方面的经验,说说对这些框之间关系的一些理解。
如今大部分人脸检測效果都已adaboost+LBP(各种改进)的方式实现,adaboost由N个强分类器组成,每一个强分类器由M个弱分类器组成,而每一个弱分类器事实上就是一个特征。
本文以LBP特征为例,人脸检測共涉及到例如以下几类框:
1. LBP特征矩形框大小(极为重要)
2. 检測框大小(重要)
3. 检測目标大小(次要)
4. 原始训练样本大小(重要)
5. 图像大小(不重要)
当中,LBP特征矩形框大小一般由四个量组成,它们是:矩形框相对于模板的位置(x, y)。矩形框的大小(w, h)。这四个变量均能够自由改变,仅仅是有一个约束。那就是原始训练样本的大小(这也是我说的联系1)。
联系1:如果原始训练样本大小为28*28。那么LBP特征矩形框四个变量的取值均在[0-28]之内。
这点是由于,LBP特征都是在训练阶段确定下来的,位置和大小均是相对于原始训练样本而定。自然要在此范围之内。
进一步,由于測试阶段,LBP特征的计算过程是在检測框中进行,于是能够引出第二个联系(联系2)
联系2:检測框大小和原始训练样本大小之间一定具有明白的比例关系,且原始训练样本长宽比例最好为1:1。
说白了,检測框是正方形的,它在图像中一步一步(step)的遍历。对每一个检測框内的图像都要进行adaboost检測(想想看,算法时间还是比較恐怖的)。
进一步,检測目标大小一般由人为设定,比方我看到一个视频,我认为里面的人脸可能是80*80。那么我就设定检測目标大小为80*80,这个设置的影响就是,限制了检測框的大小,也就是联系3。
联系3:检測目标大小由用户设置,其大小约束了检測框大小。假设检測框大小小于检測目标大小,则该检測框无用。
连锁反应,大家能够依据以上几种联系自己想想检測目标大小对特征矩形框的影响。
以下举个样例。用于说明人脸检測中特征矩形框的变化策略。
如果原始训练样本大小为28*28,此时检測框大小为56*56,即为前者的两倍。对于这样的情况,理论上,应该是将整幅图像下採样2倍,检測框的位置和长宽也就随之缩小两倍,LBP特征矩形框大小和位置保持不变。可是。在实际应用中。对整幅图像下採样时间较多。更加经济实惠的策略是保持检測框位置和大小不变。更改LBP特征矩形框位置和大小,比如,都扩大两倍。这两种方式显然存在差别,可是效果不会有太大的差距。所以常常被採用。
联系4:图像大小随意,对其余大小没有不论什么约束。
之前做这方面的研究,一点一直没理解,就是为什么训练的时候把目标图像裁剪为指定大小(比方说28*28),可是在測试过程中,却对不论什么大小的图像都能够。
如今想想看,自己当时挺傻的,训练阶段採用的图像,都是仅仅包括目标的,然后再规格化为28*28,在測试阶段,实际上也是这样。仅仅只是这个时候。针对的是检測框,而不是整幅图像了,adaboost是在检測框中的图像进行,和图像真心没啥关系,自然就不要求图像为指定大小(联系4)。
我弄了两幅图,左面是训练样本。右边是測试图像。大家看看吧,别和我一样犯傻。
其中,右图其中的绿色框就是检測框,不同大小的绿框代表着检測框的大小变化。
总结起来一句话,原始训练样本大小约束LBP特征矩形框大小,检測框大小必须为原始训练样本大小的倍数。检測目标大小约束了检測框大小。图像大小对其余大小没有不论什么约束。
(转载请注明:http://blog.csdn.net/wsj998689aa/article/details/41243117)