人脸检测的基本原理

资源描述

《人脸检测的基本原理》由会员分享，可在线阅读，更多相关《人脸检测的基本原理（12页珍藏版）》请在金锄头文库上搜索。

1、人脸检测的基本原理1 引言2 人脸检测的基本知识2.1 人脸特征2.2 预处理技术3 图像处理的基本运算方法3.1 数字图像的表示3.2 区域分割与合并的原理3.3 膨胀与腐蚀1 引言人脸检测是指给定静止图像或视频序列，不管图像中人脸的位置、大小、方向、姿势、光照等如何变化，找到并定位所有人脸确切位置的技术。有很多与人脸相关的研究领域与人脸检测技术紧密相关，比如人脸定位（Face Localization），经过简化的、仅针对包含单个人脸图像的检测技术；人脸跟踪（Face Tracking），在连续的视频序列中实时定位并跟踪人脸的位置；面部特征检测（Facial Feature Detec

2、tion），准确定位人脸区域内的眼睛、眉毛、鼻子、嘴、嘴唇、耳朵等面部器官的位置；人脸识别（Face Recognition），比较输入图像与已经建好的人脸数据库内各图像间的差异，找到差异最小的作为识别结果输出；面部表情识别（Facial Expression Recognition），识别人脸面部的感情状态，比如高兴、沮丧、悲伤等等。上述这些人脸处理技术的第一步都是要求准确定位好图像中的人脸，因此一个鲁棒、高效的人脸检测算法对这些技术的发展起着关键的作用。2 人脸检测的基本知识人脸检测从本质上讲是目标检测的一种，也就是将目标（人脸，Target）与干扰（背景，Clutter）区分开来的

3、过程。2.1 人脸特征人脸图像中包含的特征非常丰富。人脸检测利用的是人脸的共性特征，大致分为基本特征、肤色特征、变换域特征、统计特征等。基本特征1）灰度特征人脸区域内具有明显的灰度分布特征。眉、眼和嘴等区域的灰度值较低，前额、脸颊、鼻梁和下颌等区域的灰度值较高。利用这些信息，可以建立简单的人脸模板，用于粗检。例如，多个人脸图像的平均就是一个简单的人脸模板，类似的眼模板和嘴模板也常常使用。人脸具有明显的灰度梯度分布特征。在人脸区域进行水平和垂直方向的灰度投影，根据极小点的位置可以得到眉、眼、鼻和嘴等器官所处的大致区域。光照不均对灰度特征有很大的影响。但在偏光的情况下，眼和嘴、鼻和嘴、鼻和脸颊等区

4、域灰度的比值会保持一定的比率。根据这个特点，可采用线性光照拟合和直方图均衡的方法来补偿光照的影响。Log、Exp 和 LogAbout 等一些非线性变换也可用于光照补偿。2）边缘和形状特征人脸及人脸器官具有典型的边缘和形状特征，如人脸轮廓、眼睑轮廓、虹膜轮廓、眉毛边缘、鼻侧线和嘴唇轮廓等均可近似视为椭圆、圆、弧线或线段等简单的几何单元。可采用 Sobel、Laplacian 和 Canny 等算子或小波变换提取这些边缘特征。噪声的存在会导致边缘的不连续，常采用边缘跟踪器把属于同一轮廓的各段边缘连接起来，并通过约束搜索范围防止边缘跟踪失败。数学形态学的腐蚀与膨胀运算与 Hough 变换也常用于提

5、取人脸轮廓特征，并对噪声有较好的适应性。应用 Snakes 模型或主动形状模型（ASM，Active Shape Model）能够较好地抽取人脸的边缘特征，但这些模型需要一个较好的初始化位置。尽管在强光照变化下也会产生一些伪边缘，但相对于灰度特征，边缘特征对光照变化具有一定的鲁棒性。3）结构特征结构特征主要表现在人脸的对称性和各个器官的空间位置分布。人脸在结构上的对称性是十分有用的特征。正面人脸左右对称，对应位置上的边缘和灰度特征基本一致；同时，各个器官也具有自身的对称性，比如双眼、鼻子、耳朵等。面部器官如眉毛、眼睛、鼻子、嘴等，是按一定位置关系组织在一起的。各器官按照从上而下的顺序排列，相

6、对位置保持不变。各器官间还存在着一些几何关系，比如两眼和嘴中心构成一个三角形、鼻子的中心大致位于这个三角形的中心等。根据这些结构特征，配合前面介绍的灰度特征和边缘、形状特征，可以建立基本的规则，区分人脸区域与背景。4）纹理特征人脸具有特定的纹理分布特征，基于灰度共生（SGLD，Space Grey Level Dependency）矩阵建立人脸纹理特征模型，得到表征人脸的一系列纹理特征。肤色特征肤色特征按类别划分应属于人脸基本特征，但其在彩色图像人脸检测中所起到的作用非常重要。肤色是脸部区别于其他区域的重要特征，不依赖于面部细节特征，不受旋转、姿势、表情等变化的影响，具有相对稳定性并和大多数背

7、景物体颜色相区别，已成为彩色图像人脸检测中的一个非常重要的特征。尽管不同种族、不同年龄、不同光照条件下，肤色区域呈现不同的颜色，但相关研究证明，不同类的肤色点间的差别更多的在于颜色中的亮度分量，而色度分量在各肤色点间变化不大。由此，可以在特定的色彩空间中建立肤色模型，描述人脸肤色的特征，有效去除图像中复杂背景的干扰、减小待搜索范围。常用的色彩空间有 RGB、归一化 RGB、HSV、YCbCr、YIQ、YES、CIE XYZ、CIE LUV、CIE Lab、CIE DSH、TSL 等，常用的肤色模型有直方图模型、高斯模型、混合高斯模型等。变换域特征基于 FFT、DCT、小波、K-L 等变换，根据

8、能量规则选择一系列系数作为表征人脸图像的特征。人脸识别中广泛使用的本征脸（Eigen Face）以及最近流行的类 Haar 特征（Haar-like feature）均属于变换域特征。目前图像大多以压缩的格式存在，各个图像压缩标准广泛地应用了 DCT 和小波变换，因此，研究如何有效地提取这些变换域下的人脸特征，具有很强的实际意义，已成为目前一个很受重视的研究方向。统计特征由于人脸图像模式的复杂性，能够用来描述人脸共性特点的显式特征是有限的，而由此建立起的人脸规则的有效性也有很大的局限性。解决这个问题的办法就是更多地使用人脸图像的统计特征，也可称为隐式特征。统计特征是指通过统计的方法，从单个图像

9、数据或大量图像数据中获得的特征，如自相关、高阶矩、不变矩、在子空间的投影、空间距离、隶属度、概率分布、熵、互信息，以及神经网络的抽象特征等。统计特征不如基本特征直观，但描述的往往都是人脸与非人脸的本质区别，在一个更高的层次上描述人脸特征。在大量统计特征基础上构建起来的基于统计学习的人脸检测算法，具有良好的适应性和鲁棒性，得到了广大研究人员的普遍重视，已成为目前研究的主流。运动特征对于视频序列，相邻帧间的运动信息是一个重要的特征。计算相邻帧图像的差分即可得到运动区域。为了提高算法对噪声的鲁棒性，可采用空间连通区域、多帧差分、差分图像光滑滤波、时空三维张量等方法。运动特征也常用于人脸跟踪的研究中，

10、基本方法就是跟踪整个人脸或基于特征器官（如眼、嘴）的跟踪。2.2 预处理技术为了提高检测算法的效率，需对输入图像进行一些预处理。通用的预处理手段主要包括：1)边缘提取，去除图像中低频的背景区域；2)直方图均衡，使图像中象素值分布均衡化；3)光照补偿，克服亮度不均对结果的干扰；4)肤色分割，将肤色区域与背景分离。背景去除人脸区域内灰度变化较大，在图像中属于高频信息，通过提取边缘、去除边缘很弱的图像区域，可以去除变化平坦的背景区域。除了这种简单的方法外，Shaick 等提出了一种新的针对灰度图像的预处理方法，算法的框图如图 1 所示。图 1 Shai ck 算法框图首先对输入图像进行直方图均衡，

11、然后利用 2D-FFT 将其变换到频域。在频域利用最佳自适应相关器（Optimal Adaptive Correlator, OAC）将输入图像与“平均脸”模板求相关，滤波器输出如式（1）（1）),(/),(),( 2*yxyxyx fVfUfH其中 U、V 分别为“平均脸”模板和输入图像的傅立叶变换， “*”代表二维复共轭，、分别是二维频域内的索引，为 55 大小的矩形窗口，代xfy 表卷积算子。将滤波器的输出按照实验得到的阈值分为人脸区域、可能的人脸区域和背景区域三部分。实际使用中，首先通过训练的方法得到“平均脸”模板，然后在 79 的窗口内对待测图像进行局部灰度均衡（Local

12、Homogenization），最后使用 OAC 滤波器排除背景区域。经过这样的处理，在 MIT Set B 测试集中可以排除图像中 99%的待检测区域，而仅仅产生了 1.3%（2/153）的漏检，同时其计算复杂度也相对较小，可以在不对算法精度产生太大影响的条件下提高算法的速度。肤色模型肤色是彩色图像中人脸部区别与其他区域的一个非常重要的特征。利用肤色分割算法不但可以减小待搜索图像的大小，而且还可以有效的控制误检。因此肤色模型在人脸检测的研究中一直受到很大的重视。1）彩色空间各种标准的彩色空间均可用于构建肤色模型，比如 YCbCr、HSV、归一化rgb 等。Hsu 等考察了肤色点与背景点在各

13、彩色空间中的实际分布情况，具体的统计结果如图 2 所示。图 2 不同颜色空间内肤色点的分布(a)YCbCr 空间，(b)肤色点在 CbCr 平面内的投影，(c)rgb 空间(d)HSV 空间（红点表示肤色点，蓝点表示背景点）由图 2 中可以明显看出，与其它空间相比，YCbCr 空间中的肤色点具有更加集中的分布，最为适合肤色分割。因此目前很多研究工作都是基于 YCbCr 彩色空间进行的。在 YCbCr 彩色空间的基础上，进行更深一步的考虑。YCbCr 三分量与视频中使用的 YUV 三分量具有相似的思路，即将原来的 RGB 三个色度分量通过一个线性变换，转化为一个亮度和两个色度分量，其中 Y 为亮

14、度分量，CbCr 分别为蓝色（Blue）和红色（Red）的色度分量。通过分析 RGB 三个分量在肤色区域的分布，Dios 等提出与 YCbCr 空间类似的一个新的颜色空间YCgCr，使用 Cg（代表绿色 Green）分量来代替 Cb 分量。依据 ITU Rec.BT.601规定的标准，Cg 分量可以由式（2）所示的变换公式得到：（2）BGRCrgY 214.876.9312950085. .468如图 3 所示，在 YCgCr 空间内，肤色点的分布更加集中，更加有利于排除那些近似肤色点的区域。相关的实验也证明了其可以获得更好的结果。图 3 两个颜色空间肤色分布比较进一步思考产生这个现象的原因。

15、人脸的肤色区域接近于黄色，而黄色是由红色和绿色混合而成，因此在肤色区域内，红、绿分量的值更大且基本相同（有很大的相关性），而蓝色分量则明显偏小且与其它两个颜色的分布无关。这一点可以由图 3 明显看出，图 3（a）的分布没有任何规律，而图 3（b）则呈现线性分布。因此，YCgCr 彩色空间可以更加有效地描述肤色点的分布情况。2)肤色分布的描述常用的肤色分布描述方法有阈值法、高斯法、混合高斯法、直方图法等。阈值法最为简单，根据训练样本中各肤色点的色度分量出现的范围，确定一个阈值范围，如Cr1,Cr2及Cb1,Cb2。若待测图像中某个象素点的色度分量(Cr,Cb)，满足 Cr1CrCr2 并且 C

16、b1CbCb2，则该点就被认为是肤色点保留；否则认为该点是背景点去除。直方图法是比阈值法更为准确的一种模型描述方法，通过统计训练图像中各肤色点出现的概率，得到一个关于 CrCb 分量的二维统计直方图。直方图中，z 方向的分量即表示该点（Cr,Cb）为肤色点概率的大小。通过一个合适的阈值，确定哪些区域的颜色点是肤色点，哪些不是。高斯以及混合高斯法均是用概率模型来描述各肤色点的分布。高斯法的思想是假设大量肤色点在彩色空间中的分布符合一个二维高斯分布，将肤色点的分布用一个高斯模型来表示，均值（也就是肤色点分布的中心）和协方差矩阵由统计的方法获得。通过这个高斯模型可以得到待测图像中各点属于肤色的概率，利用一个阈值作为判决条件，将概率大于这个阈值的点判断为肤色点，而小于这个阈值的点判为背景点。在实际应用中，人们发现肤色点在彩色空间的真实分布大多具有多峰的性质，单一的高斯模型不能充分地描述。因此，Yang 等提出了使用高斯混合模型的方法来描述肤色点的分布，具体定义如下：

展开阅读全文