论文题目高性能旋转不变多视角人脸检测

资源描述

《论文题目高性能旋转不变多视角人脸检测》由会员分享，可在线阅读，更多相关《论文题目高性能旋转不变多视角人脸检测（5页珍藏版）》请在金锄头文库上搜索。

1、论文题目：高性能旋转不变多视角人脸检测作者简介：黄畅，男， 1981年1月出生，2003年9月师从于清华大学艾海舟教授，于2007年7月获博士学位。中文摘要人脸检测是一项在图像中自动搜索并定位其中所有人脸出现位置及其大小和姿态的技术。作为所有物体检测问题中极具代表性的一个特例，人脸检测在学术界和工业界内始终是一个备受关注的计算机视觉问题。一方面，许多用于人脸检测问题的方法具有较好的一般性和推广性，能够有效地促进其他物体检测技术乃至相关模式识别、机器学习方法的发展；另一方面，作为人脸视觉信息自动化处理过程中必不可少的初始步骤，人脸检测技术的应用遍及视频监控、安全验证、智能化人机交互等众多新

2、兴领域。因此，人脸检测问题具有很高的理论研究价值和广阔的市场应用前景。本文系统地分析了整个人脸检测算法的核心单元人脸检测器，自上而下将其划分成为三个功能相对独立的层次：检测器结构、强分类器和弱分类器。本文进一步在各个功能层次上提出了一系列行之有效的新方法，包括：（1）基于矢量树模型的检测器结构。不同于以往常用于正面人脸检测问题的瀑布型结构，本文采用矢量树模型作为检测器的基本结构，用于处理人脸姿态变化范围更大的多视角人脸检测问题。这一树状模型由若干多类节点、分支节点和单类节点共同组成，采用从粗到细的视角划分策略，将原本困难的多视角人脸检测问题逐步分解成为更易于解决的单视角人脸检测问题。由于不同视

3、角的人脸模式之间同时存在着相似性和差异性这一对内在的矛盾，矢量树模型在关键的多类节点和分支节点中采用了灵活的矢量化的分支预测结果，既可以将输入模式作为非人脸模式抛弃，也可以将其作为某些视角下的人脸模式送至对应的一个或多个子节点做进一步的处理。事实上，矢量树模型在保留不同视角人脸模式之间固有差异性的基础上，有效地利用了人脸模式之间内在的相似性将其同非人脸模式区分开来。这一做法既不同于决策树模型在分支节点处只考虑区分不同视角的人脸模式而无视非人脸模式，也不像金字塔模型和标量树模型那样过分关注于区分人脸模式和非人脸模式而忽略了不同视角人脸模式之间的差异性，而是适当地兼顾了相似性和差异性这对矛盾的两个

4、方面。（2）Vector Boosting算法，用于训练矢量树模型中至关重要的多类节点和分支节点。这一算法将弱分类器和强分类器的输出从标量空间扩展到了矢量空间，通过引入本质投影向量和目标域这两个新概念，将复杂的多类别分类问题置于同一框架下同步解决，而无需采用传统的分而治之策略。同其他常用的多分类Boosting 算法相比，Vector Boosting 算法具有更强的灵活性和可变性：通过为不同的模式类别定义相互交叠的目标域，Vector Boosting算法能够很好地兼顾它们之间的相似性和差异性，从而在矢量树模型的学习过程中得到更有效率的分支节点和多类节点。本文还证明，通过设置不同的本质投影向

5、量，Vector Boosting算法实际上能够替代许多已有的用于解决多分类、不对称分类和回归问题的Boosting算法。因而它可以被认为是基于指数损失函数的Boosting 类算法的一般框架。（3）采用稀疏粒度特征和分段线性函数、基于启发式搜索策略的弱分类器学习算法。本文通过对图像粒度空间内的若干粒子进行灵活的简单线性组合，得到了一个数量极其庞大、表达能力十分丰富的稀疏粒度特征集合。同之前广泛用于人脸检测问题的Haar 型矩形特征相比，稀疏粒度特征具有更高的计算效率、更强的区分能力和更好的适应性，尤其在多视角人脸检测问题中表现得更加明显。然而这种新的特征设计方式同时也不可避免地增大了特征选择

6、问题的难度：之前常用于人脸检测问题的穷举法根本无法胜任在这样一个庞大的特征集合中进行特征搜索的艰巨任务，而稀疏粒度特征自身的不连续性又使得各种基于导数分析的梯度下降法也无法适用。为此，本文提出了一种启发式搜索策略：根据稀疏粒度特征的区分能力和复杂程度定义了它们的适应值，并以此作为优化的目标，采用三种不同的特征扩展手段，在有限的时间和空间范围内，高效地搜索这一庞大的稀疏粒度特征集合以便为弱分类器的学习挑选合适的特征。本文还提出在弱分类器中采用分段线性函数对特征空间进行细致的划分，使之能够更好地刻画人脸模式和非人脸模式的分布差异，从而令弱分类器达到更好的区分效果。灵活的特征组织模式、细致的分类函数

7、预测、以及高效的特征搜索方法，这三部分共同构成了本文所提出的弱分类器学习算法。除此之外，本文还提出了嵌入式弱分类器方法，用以更加紧密地联结矢量树模型中的父节点和子节点。嵌入式弱分类器以父节点中强分类器的预测置信度作为特征，采用某种函数形式（如本文中所采用的二次函数）对其进行适当的变换后，加入到子节点的分类预测结果之中。这种特殊的弱分类器设计方法不仅让子节点能够充分地利用父节点预测结果中保留的区分性信息，还有助于克服在子节点中因截断和重采样所导致的训练样本噪音化问题。由于嵌入式弱分类器与普通的弱分类器相比具有更高的分类精度，所以在训练子节点强分类器的过程中，采用嵌入式弱分类器能够显著地加快Boo

8、sting算法的迭代收敛速度，降低各个子节点强分类器中所包含的弱分类器个数，最终可以达到提高检测器整体运行效率的目的。（4）一种用于检测器的增量学习算法，作为对离线训练过程的有益补充。这种方法可以根据非常少量的在线训练样本（通常由检测器的用户手工收集得到），对已有的人脸检测器进行快速而有效的调整，使之适应各种不同的特殊应用环境（如极端的光照条件或是遮挡情况），同时依然能够保持该检测器原有的处理一般环境中人脸检测问题的能力。这种增量学习算法将Boosting算法的损失函数划分为在线和离线两个部分，根据其各自的特点采用不同的方式进行计算。其中，在线部分的计算延续了传统的基于样本采样的方式，而离线部

9、分的计算则采用了一种类似于简单贝叶斯的近似方法。具体来说，受限于终端用户所能提供的计算资源，增量学习过程不可能像离线训练那样保存所有的离线训练样本。因此本文提出，在计算损失函数离线部分的过程中，采用简单的加权边缘密度函数的乘积来近似复杂的加权联合密度函数，从而极大地降低了增量学习算法的存储开销；同时得益于Boosting算法中损失函数的指数形式，我们可以对近似后的损失函数离线部分进行因式分解。最终，这种近似计算方法将增量学习算法的复杂度在计算时间和存储空间两方面都从原来不可行的指数规模降低到了可行的线性规模。本文还通过理论推导和具体实验进一步证明，在不对原有检测器做过大调整的前提下，这一损失函

10、数离线部分的近似算法具有比较理想的精度，其学习结果完全可以满足终端用户对于特殊环境下人脸检测的需求。以上这些居于不同层次上的新方法有机地结合在一起，组成了一套功能完整的高性能人脸检测算法，涵盖了检测器的离线学习、在线检测和增量学习这三个方面。在若干标准测试图片集合上的评测结果表明，与已经公开发表过的相关工作相比，本文所提出的这一人脸检测算法在可检测人脸视角覆盖范围、检测精度、检测速度等方面均具有比较明显的优势；而在实际应用条件下，这一算法能够在十分复杂的场景环境中可靠地检测各种视角的人脸模式，同时在普通的PC机上便能以接近实时的速度处理QVGA（320240）大小的视频序列，达到了基本的工业应

11、用水平。关键词：人脸检测；旋转不变多视角；矢量树型检测器结构；Vector Boosting 算法；稀疏粒度特征High Performance Rotation Invariant Multiview Face Detection Huang Chang ABSTRACTFace detection is the task of automatically searching faces in images, reporting their positions, sizes and poses. As a representative case of generic object dete

12、ction problems, face detection has long been attracting a wide spread of attentions from both academia and industry. On one side, the research on face detection can shed light on the approach to other generic object detection problems, and further can help to improve many fundamental algorithms in t

13、he field of pattern recognition and machine learning; on the other side, as the initial stage of automatic face vision processing systems, face detection has broad applications in many related areas, such as visual surveillance, security authentication, and smart human-computer interaction, etc. The

14、refore, face detection has both important theoretical research merits and apparent practical value in applications.In this thesis through systematic analysis of the key unit of the face detection algorithm, the face detector is divided into three functional levels from top to down: the detector stru

15、cture level, the strong classifier level, and the weak classifier level. A series of innovative methods are proposed in this thesis for the learning of a face detector in different levels, including:(1) A vector-tree based detector structure. In this thesis, to handle the multi-view face detection p

16、roblem, the face detector is organized as a vector-tree instead of the cascade used widely in frontal face detection. The vector tree is composed of multi-class nodes, branching nodes, and single-class nodes, which partitions the entire face space into finer and finer subspaces so as to reduce a complicated multi-view face detection problem to a set of easier single-view face detection problems. Due to the inherent similarities and diversities betwee

展开阅读全文

论文题目高性能旋转不变多视角人脸检测

最新文档