基于Android的视觉手势识别

资源描述

《基于Android的视觉手势识别》由会员分享，可在线阅读，更多相关《基于Android的视觉手势识别（28页珍藏版）》请在金锄头文库上搜索。

1、-基于Android系统的视觉手势识别基于Android的视觉手势识别-相册管理实现中文摘要手势识别是计算机视觉领域和数值图像处理领域一个迅速开展的重要方向。手势主要分为静态手势和动态手势两种，动态手势可以看作是连续的静态手势序列。动态手势具有丰富和直观的表达能力，与静态手势结合在一起，能创造出更丰富的语义。利用动态手势识别构建新型的交互界面，是新一代的人机交互界面对输入方式自然性的要求，可以弥补传统交互方式的缺乏。手势识别技术在过去几年得到了很好的开展，但移动设备中的手势识别技术仍然面临一些重要的难题，例如移动设备常常处于各种不同的环境中，其环境背景可能会有差异，而且处于变化状态中，则在这一

2、情况下能够实现较高准确度的手势识别就能使得这一技术得到很好的用户体验。本研究从实际出发，开发出一款不必接触屏幕即可控制手机的技术，并以相册的管理作为演示案例。关键字： Android，手势识别，相册管理英文摘要Gesture recognition is an important direction of the field of puter vision and numerical image processing a rapid development. The gesture is divided into two kinds of static gestures and dynamic

3、 gestures, dynamic gesture can be seen as a continuous sequence of static gestures. The dynamic gesture has a rich and intuitive skills, and with static gestures bine to create a richer semantics. Dynamic gesture recognition to build a new interface, a new generation of human-puter interaction inter

4、face naturally the input requirements, can make up for the deficiencies of the traditional interactive mode.Gesture recognition technology in the past few years has been well developed, but the gesture recognition technology still faces some important challenges in the mobile device, such as mobile

5、devices are often in a variety of different environments, the environmental background may vary, butin a state of change, in this case can achieve higher accuracy of the gesture recognition will be able to make this technology a good user e*perience.The actual, developed a do not have to touch the s

6、creen to control the mobile phone technology, and the management of the album as a demonstration case.Key Words: Android,Gesture recognition,Album management1 绪论11手势识别研究的意义在人机交互的开展过程中先后出现了基于文本方式的键盘、基于图形方式的鼠标等交互接，然而从*种程度上说，这些机械设备在人机交互方面是不方便和不和谐的。它把机器作为人机交互的中心，在人机交互时人需要去适应机器的输入输出设备，对机器没有主动控制的能力。随着计算机科

7、学的快速开展，研究符合人类交流习惯的人机交互技术成为国内外关注的热点，这些研究包括人脸识别、面部表情识别、头部运动跟踪、眼睛识别、手势识别以及人体姿势识别等。总体来说，人机交互的研究已经从以计算机为中心转移到以人为中心，大大提高了人机交互的效率。手势作为人类最自然的表达方式之一，在日常生活中得到了广泛的应用。手势生动、形象、直观，而且蕴涵着丰富的信息，是人与人沟通的重要媒介。目前基于手势的交互已经成为人机交互的重要内容。手势识别的应用前景十分广阔：(1)对于聋哑人而言，特别是文化程度比较低的聋哑人，使用手语和正常人交流更加方便和高效。手语是用手势表示意思的语言，对不熟悉手语的普通人来说，理解手

8、语是非常困难的。如果有一套可以翻译手语的系统，则将大大方便聋哑人与正常人之间的交流；(2)利用手势对虚拟现实中的智能设备进展控制。比方在虚拟场景内利用手势实现虚拟钢琴的演奏，又如用机器人的虚拟手抓取物体等；(3)研究人类对于视觉语言的理解规律，提高计算机对人类语言的理解能力；(4)手势交互是虚拟现实中多通道接口的重要组成局部之一。12手势识别国内外研究现状根据外围设备采集手势图像方式的不同可以把手势识别分为两种：基于数据手套的手势识别和基于视觉的手势识别。基于数据手套的手势识别是通过数据手套和位置跟踪来测量手势运动的轨迹和时序信息，其优点是系统的识别率高，缺点是输入设备昂贵，并且要求打手势的人

9、穿戴复杂的数据手套，给人带来很多不便，因此这种方式不能成为未来开展的趋势。基于视觉的手势识别是计算机通过对摄像头拍摄的手势图像进展分析和处理提取出手的位置及形状。这种方法在实现时无需购置昂贵的设备，仅需要廉价的摄像头和低端处理能力的PC机即可。并且在操作时更加自然、方便，符合以人为本和自由性的要求，是手势识别未来开展的趋势。但是这种方法的识别效率比基于数据手套的手势识别低，而且能够识别的手势种类受到很大的限制，是目前亟待解决的问题。1.3基于视觉的手势跟踪与识别流程图本课题的主要内容是研究基于计算机视觉的手势跟踪与识别。首先对手势跟踪与识别各个阶段的算法进展了分析，提出基于Hu矩特征和一对多径

10、向基核函数支持向量机相结合的手势识别算法，并在Microsoft Visual C+60开发环境下，借助OpenCV开源库，实现了对从摄像头输入的10个常用手势的识别，以验证提出算法的可行性，并以此为根底建立了一个简单的手势交互系统。基于视觉的手势跟踪与识别流程图见图1-1。图1-1 基于视觉的手势跟踪与识别流程图2 基于计算机视觉的手势识别根底理论在人与人的交际过程中，经常会用到手势，手势的语义强大并且直观，可以很好地表达思想，与自然语言形成互补。所以近些年来，手势识别的研究得到了很大的关注和开展。本章主要介绍基于视觉的手势识别的一些根底理论。21模式识别概述通常，我们把通过对具体的个别事物

11、进展观测所得到的具有时间和空间分布的信息称为模式，把各模式所属的类别称为模式类。模式识别是对表征事物或者现象的各种形式的信息进展分析和处理，来实现对事物或现象进展描述、识别、分类和解释，是信息科学和人工智能的重要组成局部。人们为了掌握客观事物，就将事物按照相似度组成类别。模式识别的作用和目的就在于面对*一具体事物时将其J下确的归入*一类别。有两种根本的模式识别方法，即统计模式识别方法和构造模式识别方法。与此相应的模式识别系统都由两个过程组成，即设计与实现。设计是指用一定数量的样本(叫做训练集或学习集)进展分类器的设计。实现是指用所设计的分类器对待识别的样本进展分类决策。基于统计方法的模式识别主

12、要由4个局部组成：数据获取、预处理、特征提取和选择、分类决策，如图2-1所示。图2-1 模式识别系统的根本构成1数据获取为了使计算机能够对各种现象进展分类识别，要用计算机可以运算的符号来表示所研究的对象。通常输入对象的信息有一维波形、物理参量和逻辑值、二维图像3种类型，通过测量、采样和量化，可以用矩阵或向量表示二维图像或一维波形。这就是数据获取的过程。2预处理预处理的目的是去除噪声，加强有用的信息，并对输入测量仪器或其他因素所造成的退化现象进展复原。3特征提取由图像或波形所获得的数据量是相当大的。例如，一个文字图像可以有几千个数据，一个心电图波形也可能有几千个数据。为了有效地实现分类识别，就要

13、对原始数据进展变换，得到最能反映分类本质的特征。这就是特征提取和选择的过程。一般我们把原始数据组成的空间叫测量空间，把分类识别赖以进展的空间叫做特征空间，通过变换，可把在维数较高的测量空间中表示的模式变为在维数较低的特征空间中表示的模式。4分类决策分类决策就是在特征空间中用统计方法把被识别对象归为*一类别。根本做法是在样本训练集根底上确定*个判决规则，使按这种判决规则对被识别对象进展分类所造成的错误识别率最小或引起的损失最小。22基于计算机视觉的手势跟踪理论手势分割与跟踪是手势识别的根底，其好坏将影响识别率的大小。手势分割的方法大体分为三种：基于运动信息的、基于运动模板的和基于颜色信息的。基于

14、运动信息的手势分割是通过对前后两帧图像做差分运算来检测手势的，当手势运动时则图像发生变化。运动估计的依据是图像强度发生变化，用图像序列中相邻图像的差来表示强度的变化。图像差运算非常简单，这是由于在图像差运算中仅仅涉及到了像素强度的相减。在实际的手势识别系统中，摄像机的位置是固定的，对手势序列中相邻两帧图像做差分运算便能有效地保存运动的局部(即手势)，滤除图像中保持不变的背景区域。基于运动模板的手势分割是用模板匹配方法寻找运动的手势，一般把二维可变形模板作为插值节点去近似物体轮廓。模板由平均点集合、点可变性参数和外部变形构成，平均点集合描述的是*一组形状的平均形状，点可变性参数描述的是可变形模板

15、的全局运动。通常用基于可变形模板的人手模型来跟踪人手。二维模板实现简单，但对手的姿念有一定限制。三维模板则不受手的姿态的限制，但其参数过多使得实现困难。基于颜色信息的分割在图像分割中占有重要地位。颜色分割与其他两种方法相比，具有高效性和鲁棒性等特点，得到了广泛的应用。但是在复杂背景的情况下或者光照变化快时，基于颜色的分割效果不好，为了解决这个问题，目前众多研究者尝试利用融合多种信息的技术进展手势分割。国内外对手势跟踪的研究很多，例如利用粒子滤波(Particle Filter)对手势跟踪获得了较好的效果。Camshift巧J(ContinuouslyAdaptive Mean Shift)是一

16、种基于颜色概率模型的跟踪算法，它是Mean Shift算法的改进与扩展，可以处理动态变化的分布。当视频序列一帧一帧变化时，Camshift能够自动调节搜索窗的大小和位置，定位被跟踪目标的中心和大小，并且用当前帧定位的结果来预测下一帧图像中目标的中心和大小，每帧图像都这样处理，就形成了连续的跟踪。23基于计算机视觉的手势识别理论基于视觉的手势识别可以分为基于单目视觉的手势识别和基于多目视觉的手势识别。基于单目视觉的手势识别就是通过单个摄像机来采集手势图像，从而建立平面手势模型。这种方法处理的数据量较小，识别速度快，但是对于用户手势的输入限制较大。基于多目视觉的手势识别是通过两个或两个以上的摄像机来采集图像，建立的是立体模型。这种方法对于用户手势的输入限制较小，可以实现更加自然的人机交互，但由于立体模型的复杂性，需要处理大量的数据，识别时间长，无法实现实时的识别。基于视觉

展开阅读全文