关于人脸识别研究及在通信行业的应用前景分析

资源描述

《关于人脸识别研究及在通信行业的应用前景分析》由会员分享，可在线阅读，更多相关《关于人脸识别研究及在通信行业的应用前景分析（6页珍藏版）》请在金锄头文库上搜索。

1、关于人脸识别研究及在通信行业的应用前景分析吴云云黄金金上海师范大学国家计算机网络应急技术处理协调中心江西分中心摘要：在未来的人机交互中, 服务机器人对人类的情感理解将是决定家庭服务机器人能否进入千家万户的关键, 现在随着计算机硬件的发展和科学研究者的努力, 对情感计算的研究已经起步并取得一定的成绩。本文分析了人脸识别的发展状况, 并对表情库的建立进行说明, 方便通信行业的分类选择, 再此基础上对表情识别流程进行说明, 最后提出了人脸识别在通信行业的几个应用前景。关键词：人脸识别; 表情库; 表情识别流程; 0 引言随着科技的发展以及人们生活质量的提高, 为人类服务并代替人类劳动

2、的服务机器人逐渐走进大众家庭的生活中, 同时也对服务机器人的要求越来越高, 需求量越来越大。以服务机器人为代表的个人机器人将成为继个人电脑之后的下一个热门领域。目前的计算机主要是通过 GUI (Graphical User Interface, GUI) 采集人类的命令从而去被动的执行, 人机交互的下一个进步方向就是计算机提前判断我们人类的想法, 以一种更方便、高效的方式与人交互。人机交互的研究目的是提供给使用者更加高效、简单、安全的方式与计算机进行交流。由于人作为服务机器人的工作对象或合作对象, 从而要求服务机器人能够在一定程度上理解人的行为, 具有与人和环境进行信息交换和知识融合的能力。这

3、也就是人机交互发展的下一阶段多媒体、多通道的可感知人机交互界面 (Perceptual User Interface, PUI) , 利用人的多种感觉通道和动作通道 (如语音、手写、姿势、视线、表情等输入) , 以并行、非精确的方式与计算机进行交互, 可以提高人机交互的自然性和高效性1。多模态 PUI 由于以下两个关键特征已经成为下一代交互的潜在候选者。首先, PUI 是高度互动的。第二, 它们是多模态的, 利用从计算机到用户和从用户到计算机两个方向上的多个感知模态 (例如视觉, 听觉, 触觉等) 来感知理解人类的想法。1997 年, MIT 实验室 Picard 教授出版一本专著“Affec

4、tive Computing”, 定义了情感计算2。如古语“Necessity is the mother of invention”所表述的, 任何研究的驱动力都是它的潜在应用或其解决问题的能力。这项研究的积极性由于其在人机交互 (Human-Computer Interaction, HCI) 中的应用得到提高, 在人机交互中, 人的语音、视觉外观、视觉和触觉的感觉也被同时得到应用。因此, 在 HCI 中的所有交互方式中, 面部表情是最重要的。除此之外, 机器人视觉, 虚拟现实和面部动画需要面部表情分析。日本软银公司开发的机器人 Pepper 是世界上最像人的机器人之一, 它是世界上第一款

5、可以读取人类感情的机器人, 可综合考虑周围环境, 并积极主动地做出反应。Empathy Bot 是一个可以读取人类情感的机器人的套件, 他可以侦测幸福、悲伤、生气、惊讶的情感, 然后针对不同的表情做出不同的表情。国内的研究始于 20 世纪 90 年代末, 例如哈尔滨工业大学、中国科学院、清华大学、浙江大学、南京理工大学、南昌大学等。并取得了不少的成绩, 例如我国中科院合肥物质科学研究院先进制造技术研究所研制的首台老年人服务机器人“慧慧”, 该机器人用于老人的监护, 此外, “慧慧”还可以照顾小孩。中科大机器人“佳佳”的出现吸引了无数的目光, 其不但拥有逼真细腻以及东方女人美丽的外表, 更能对目

6、标用户进行实时跟踪, 进一步提高回答的表现力。这种技术创新有效地改善了人机交互的效果, 加强了人机交互的针对性、生动性和亲切感。移动服务机器人有别于传统的工业机器人, 要使移动服务机器人更智能、人性化、稳定地在人类生活中发挥作用, 依然需要大量的研究。1 情感类别以及表情数据库20 世纪 90 年代, 对人脸表情识别的研究变得非常活跃。国外研究机构有麻省理工学院、加利福尼亚大学、代尔夫特理工大学等都对表情识别进行了研究。下图显示了广泛使用的 JAFFE (Japanese Female Facial Expression, JAFFE) 表情数据库中一个普通日本女性中性的面孔和其他六个基本的面

7、部表情3。如下图 1 所示。图 1 不同的面部表情下载原图近年来, 不同的学者根据自己的研究对表情种类进行了划分, 使得学者在研究表情识别的时候可以选择预定义的表情库, 测试自己表情识别方法的性能。JAFFE 数据库中包含了 213 幅日本女性的表情图像。表情库中共有 10 个人, 每个人有 7 种表情。2000 年, 作者 Kanade T, Cohn, J F 设计的 Cohn-Kanada Database 表情库4。具体明细如下表:表 1 Cohn-Kanada Facial Expression Database 下载原表 2010 年, 根据研究需要以及 CK 的相关缺点, 作者

8、 Lucey P, Cohn J.F, Kanade T, Saragih J 提出 CK+表情数据库5。该表情库的每种表情都是由中性表情逐渐变化到该表情的极值, 表情的变化过程中肌肉变化清晰可见。北京航空航天大学 2005 年制作的 BHU 人脸表情数据库6包括 21-25 岁的面部表情, 相比较于其他的数据库, 增加了诸如惊讶-喜悦、惊讶-悲伤、惊讶-生气3 种混合面部表情以及手遮挡脸时微笑、手遮挡脸时生气、谈话时微笑和谈话时生气等四种复杂面部表情。该表情库采集的图像并不是脸部, 而是整个上半身, 背景环境比较复杂。2 面部表情识别的流程目前的面部表情识别主要是运用机器学习、模式识别的方法

9、对提取的表情特征进行分类。一般的方法主要包括下面三个步骤。在第一阶段, 识别采集输入图像的面部区域, 提取出面部感兴趣的区域, 并选择采用图像缩放、归一化、平滑、滤波等算法降低噪声。第二阶段, 面部特征提取主要是提取、表示面部表情变化引起的面部变化, 尽可能提取出最有区分性的表情特征。第三阶段, 提取的面部表情特征向量输入到分类器。2.1 特征提取基于外貌的特征提取方法通过提取人脸图像像素之间的梯度、相关性、纹理等信息进行表情识别。在表情识别中, 常用的外貌特征提取方法包括 KPCA (Kernel Principal Component Analysis) , Gabor 小波, PCA (

10、Principal Component Analysis) , ICA (Independent Component Analysis) , LFA (Local Feature Analysis) 、FLD (Fishers Linear Discriminant) , Harr特征、基于不变矩的方法、高阶局部自相关、局部二元模式等。面部表情是非语言交流的重要方式, 被观察者的情绪状态通过面部表情传给观察者。因此可以在脸部选取关键点将位置信息表示为几何特征作为识别面部表情的判断人的情绪。FACS7正是根据这样的理念设计出来的, FACS 系统对不同表情时, 各个面部肌肉块的运动进行了定义。到

11、目前为止, 该系统仍然是行为科学中测量面部表情的主要方法8。几何特征能够较为简洁地表示出人脸特征的形变, 外貌特征能够反映脸部肌肉的细微变化。不同特征提取方法各有优势, 一些研究者将它们融合起来组成融合特征。融合方式包括整体特征与局部特征的融合、几何特征与外貌特征的融合等。Chang 等29将脸部分为左眼、右眼、鼻根、鼻子、左脸颊、右脸颊和嘴巴 7 个部分, 并加上上半脸和全脸, 从这 9 个部分提取特征, 通过局部特征与整体特征的融合实现表情识别。Zhan 等9将 Gabor 小波和 AAM 结合起来实现表情特征的提取。Wimmer 等10提出一种基于模型的特征提取方法, 该方法同时提取了脸

12、部变化的结构信息和时间信息实现表情识别。2.2 特征选择特征选择主要任务就是从众多的特征中寻找最有代表性、利于分类器正确分类的特征, 其结果往往是原来特征集的子集或者映射变换, 同时也实现了特征的降维, 这也是模式识别的三大核心问题11之一。2.3 分类器在最后阶段, 提取的面部表情特征向量被输入到预先定义的分类器中, 对分类器进行训练以及识别, 测试提取的特征或者分类器的性能。典型的分类器有如下几种。KNN 分类是最简单和基本的分类方法之一, 通过计算样本间的相似性, 根据样本之间相似性对样本的属性进行划分。相似性的度量方法通常是计算样本之间的距离。在距离空间中, 如果一个样本最近邻的 k

13、个邻居大多数都属于某一个类, 那么判定该样本也属于该类。主要的距离度量方法有欧氏距离、L1 范数、L2 范数、马氏距离等。人工神经网络 (Artificial Neural Network) 灵感来自于生物的神经网络。人工神经网络通过训练样本自动调整参数, 降低实际输出和期望目标之间的差值。神经网络的结构由许多简单的、相互连接的神经元组成, 每个神经元对上一层的输入进行加权求和, 如果加权和大于阈值, 则产生输出, 否则抑制, 和生物神经网信号的传输类似。3 人脸识别在通信行业的应用前景随着计算机、光学成像等相关技术的高速发展, 人脸识别技术得到越来越多的应用, 市场规模持续提升。据统计数据显

14、示, 仅在中国地区未来三年内就有望形成年销售额过百亿元, 并在未来十年内有望形成年销售额过千亿元的市场规模。目前在国内, 人脸识别技术应用非常广泛, 政府部门和金融行业是人脸识别市场的主要客户。同时, 在通信行业领域人脸识别技术也逐步得以应用。3.1 人脸识别技术助手机实现实名制广东移动响应国家电话号码实名登记的要求, 在原有业务办理流程中, 引入了人脸识别技术, 应用在实名登记业务办理流程, 规避了各种主客观因素带来的风险, 为实名登记业务的推进提供了新的方法思路。分享通信推出人脸识别技术用以辅助手机实名制登记。该人脸识别技术通过人工智能技术识别用户身份证信息, 可以判断用户上传头像或实际活

15、动中的人脸信息与用户证件照片是否为同一人。业内人士表示, 目前人脸识别技术尚属较新技术, 基础电信运营商也在探索将该技术用于手机实名制认证系统。人脸识别技术的日趋成熟, 将有力推动手机实名制落实。3.2 人脸识别通过硬件配套加速落地通信领域在 6 月苹果在 WWDC 大会上公布了 i OS 11 的 VRKit 工具, 引起很多业内人士对AR 以及人脸识别技术的支持。据悉, 苹果 i Phone8 上将会内置 3D 传感器组件, 用来进行用户的面部识别和虹膜识别功能。据媒体报道, 苹果正在测试革新版安全系统, 可让用户通过面部识别, 登入、验证支付、以及启动安全应用软件, 可透过脸部辨识, 在

16、短短数毫秒内解锁启动 i Phone。此外有传闻称, i Phone8 的另一竞争对手华为 Mate10, 也将搭载 3D 感应系统, 具备 3D 感测、人脸识别技术与虹膜辨识等功能。通信行业终端巨头通过硬件配套的使用加速了人脸识别在通信领域的应用。4 结语人脸识别技术是目前被广泛研究的热门课题。人脸识别技术就是利用计算机分析人脸图像, 通过检测对比人脸数据库中的所有已知原型人脸图像来达到辨认身份的目的。随着科学技术的发展及各种技术手段的综合应用, 云计算、云储存的发展为通讯行业中的人脸数据提供技术支撑, 客户对人脸识别需求也日趋成熟和明确, 人脸识别将在智慧城市、公安、交通、金融、电信等方面应用更加广泛, 带来通讯发展新时代。参考文献1董士海.人机交互的进展及面临的挑战J.计算机辅助设计与图形学学报, 2004, 16 (1) :2. 2Semiconductors, P.The I2C-BUS Specification Version 2.1J, 20

展开阅读全文

关于人脸识别研究及在通信行业的应用前景分析

最新文档