随笔 - 997 文章 - 5 评论 - 181 阅读 - 300万

人脸检测---特征的提取

　　什么是特征？想一想我们是如何分辨物体的？更具体一点，你是如何辨别一张图片里面的人脸是一个人脸的？其实很简单，你会去找是不是有眼睛、嘴巴等面部器官。

当然这些器官的位置基本是固定的。是否有眼睛，眼睛之间的距离，眼睛跟鼻子的位置关系等等这些都叫特征。选择使用特征的一个重要的原因：基于特征的系统的运行

速度要远比基于像素的快。

　　说到特征，不得不提在识别领域中应用非常广泛的哈尔特征。

历史上，直接使用图像的强度(就是图像每一个像素点的RGB值)使得特征的计算强度很大。帕帕乔治奥等人提出可以使用基于哈尔小波的特征而不是图像强度^[1] 。维奥拉

和琼斯^[2]进而提出了哈尔特征。哈尔特征使用检测窗口中指定位置的相邻矩形，计算每一个矩形的像素和并取其差值。然后用这些差值来对图像的子区域进行分类。

例如，当前有一个人脸图像集合。通过观察可以发现，眼睛的颜色要比两颊的深。因此，用于人脸检测的哈尔特征是分别放置在眼睛和脸颊的两个相邻矩形。这些矩形的

位置则通过类似于人脸图像的外接矩形的检测窗口进行定义。

　　　　图一

在维奥拉-琼斯目标检测框架的检测阶段，一个与目标物体同样尺寸的检测窗口将在输入图像上滑动，在图像的每一个子区域都计算一个哈尔特征。然后这个差值会与一个预

先计算好的阈值进行比较，将目标和非目标区分开来。因为这样的一个哈尔特征是一个弱分类器(它的检测正确率仅仅比随机猜测强一点点)，为了达到一个可信的判断，就

需要一大群这样的特征。在维奥拉-琼斯目标检测框架中，就会将这些哈尔特征组合成一个级联分类器，最终形成一个强分类群。

　　哈尔特征最主要的优势是它的计算非常快速。使用一个称为积分图的结构，任意尺寸的哈尔特征可以在常数时间内进行计算。

一个矩形哈尔特征可以定义为矩形中几个区域的像素和的差值，可以具有任意的位置和尺寸。这种特质也被称为2矩形特征（2-rectangle feature）。维奥拉和琼斯也定义了

3矩形特征和4矩形特征。这个值表明了图像的特定区域的某些特性。每一个特征可以描述图像上特定特性的存在或不存在，比如边缘或者纹理的变化。例如，一个2-矩形特征

可以表明一个边界位于一个亮区域和一个暗区域之间。

　　维奥拉和琼斯的一个重要贡献是使用积分图^[3] 。积分图是一个二维矩形的查找表，与原始图像具有一样的尺寸。积分图的每一个元素是原始图像在对应位置左上角所有像素的和。

这就使得在任意位置计算任意尺寸的矩形的像素和时，只需要进行四次查表：

{\text{sum}}=I(C)+I(A)-I(B)-I(D).\,

其中点 $A,B,C,D$ 每个哈尔特征的查找次数取决于它的定义。维奥拉和琼斯的2矩形特征需要六次查询，3矩形需要八次，而4矩形則需要九次。

参考文档：

1 https://zh.wikipedia.org/wiki/%E5%93%88%E5%B0%94%E7%89%B9%E5%BE%81

posted on 2018-05-04 13:32 虚生阅读(5946) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 微软正式发布.NET 10 Preview 1：开启下一代开发框架新篇章
· 没有源码，如何修改代码逻辑？
· PowerShell开发游戏 · 打蜜蜂
· 在鹅厂做java开发是什么体验
· WPF到Web的无缝过渡：英雄联盟客户端的OpenSilver迁移实战

公告