拟人机器人听觉跟踪系统的研究

资源描述

《拟人机器人听觉跟踪系统的研究》由会员分享，可在线阅读，更多相关《拟人机器人听觉跟踪系统的研究（62页珍藏版）》请在金锄头文库上搜索。

1、河北工业大学硕士学位论文拟人机器人听觉跟踪系统的研究姓名：于振江申请学位级别：硕士专业：机械制造及其自动化指导教师：孙立新 20061101 河北工业大学硕士学位论文 i 拟人机器人听觉跟踪系统的研究拟人机器人听觉跟踪系统的研究摘摘要要在机器人人听觉系统中，对多目标人类语音声源的方向定位，是语音信号的增强，多声音目标的分离和识别基础，为多感官拟人机器人头部的人机交互方面的发展提供了有力的支持。对声目标的定位和跟踪，广泛应用于军事目标探测，会议录音等领域。本文仿人耳的部分生理特性，建立了声音传播和采集的模型，介绍了主要的定位方法。本文通过对成型波定位方法进行研究，

2、提出了一种改进的成型波定位方法。这种方法通过预先测量无信号时的噪音水平，来抑制某些被噪音干扰较严重的频带；我们分析了回响干扰的特性，利用它的脉冲性和指数衰减性，提出了去除回音干扰的有效方法；另外，我们通过对汉语语音的发音规则进行研究，总结其频率特性，对成型波的定位方法进一步做频域加权，达到了良好的定位效果。我们对多目标的声源定位系统进行了研究。提出了在成型波定位方法基础上的声源分离方法。首先，通过成型波方法搜索空间声波能量，计算得到几个可能目标的方位和数量。然后，通过卡尔曼滤波器，预测目标的运动轨迹，把预报的轨迹与实际计算得到的轨迹相比较，确定目标的同一性。最后，当多个

3、目标在同一个位置重合，其他方法失效时，我们通过对前一时刻声音特征的提取，将处于同一方位的多个声音目标分离提取出，保证对他们的跟踪。综合开发速度成本和功能效用的因素，系统使用三只麦克风布置在机器人头部；在以声音背景为普通办公室环境的实验条件下，可准确跟踪两米以内用较高声量说话的多个移动声音目标。关键词：关键词：声音定位，成型波，目标分离，卡尔曼滤波仿人机器人头部视觉及嗅觉系统的研究 ii THE RESEARCH FOR HUMANOID ROBOT ACOUSTIC TRACKING SYSTEM ABSTRACT The audition means much for robot

4、 to get information from environment and control its behavior. The localization and tracking of object are widely used in the fields of military, meet record, and so on. Mobile robot can be steered to the target by following the Sound source direction; humanoid robots audition is an important way to

5、 intercommunicate between robot and human. Sound source localization and tracking often greatly supports to demonstrate the functions above, such as the fusion of multi-sensor, recognition of speech, etc. The main difficulty of sound source localization based on robot lies in the elimination of nois

6、e, especially the noise submitted by itself, such as by the operation of electromotor, the friction of joint and the vibration of weakly-rigid structure; and for multi-target tracking system, the difficulty is to conform the identity of the same target, especially when several sound object are in th

7、e same area. Hence, this paper presents the sharp beamforming arithmetic which is based on the classical beamforming method and contains new way to get sharper cross-relation and beamforming peak. In addition, the system applies Unscented Kalman Filter to forecast the contrail of tracked objects, wh

8、ich helps to realize the conformation of the targets identity. According to speed of development and function, the system use three microphone on the robot head;The experiment shows that after brief prepare when there is no target of sound, the audition system behaves robustly and precisely in low s

9、ignal-to-noise condition and reacts more intelligently to multi-target. KEY WORDS : sound source tracking, beamforming, Kalman filter 原创性声明原创性声明本人郑重声明：所呈交的学位论文，是本人在导师指导下，进行研究工作所取得的成果。除文中已经注明引用的内容外，本学位论文的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集体，均已在文中以明确方式标明。本学位论文原创性声明的法律责任由本人承担

10、。学位论文作者签名：日期：关于学位论文版权使用授权的说明关于学位论文版权使用授权的说明本人完全了解河北工业大学关于收集、保存、使用学位论文的规定。同意如下各项内容：按照学校要求提交学位论文的印刷本和电子版本；学校有权保存学位论文的印刷本和电子版，并采用影印、缩印、扫描、数字化或其它手段保存论文；学校有权提供目录检索以及提供本学位论文全文或者部分的阅览服务；学校有权按有关规定向国家有关部门或者机构送交论文的复印件和电子版；在不以赢利为目的的前提下，学校可以适当复制论文的部分或全部内容用于学术活动。（保密的学位论文在解密后适用本授权说明）学位论文作者签名：日期：导师签名：

11、日期：河北工业大学硕士学位论文 1 第一章第一章绪论绪论 1-1 研究背景 1-1 研究背景随着数字信号处理技术和声电技术的不断发展和完善，以及仿人机器人人工智能水平的进步，听觉系统，作为人类感官的重要组成部分，已经成为机器人研究领域的重要研究对象。声探测是一种采用声学原理、利用电子装置处理获取的声波信息,以实现对目标的识别和定位的技术,在军事上和民用上都有十分广阔的应用前景，如智能雷弹系统对目标的定位与跟踪就是由被动声探测系统完成的。此外，声探测技术还广泛应用于声控装置、辅助听力系统、语言识别系统、雷达、被动声纳以及视频会议系统等；对于机器人来说， “耳朵”将会是一种

12、重要的感知设备。机器人听觉系统是智能机器人的重要标志之一，是实现人机交互、机器人与环境交互的重要手段。而且由于声音具有可以绕过障碍物的性质，听觉可以在机器人多信息采集系统中，与机器人视觉、嗅觉等感官相配合，弥补其他传感传感器视场有限且不能穿过非透光障碍物的局限。同时，对人类听觉系统的模拟和研究，也从一方面表明了人类对自身听觉生理能力的探知程度，是人类对自身的求索和发展。由于其广阔的应用范围及其深远的发展前途，各发达国家都在声信号处理领域投入巨大的科技力量。而我国则相对起步比较晚，而且多停留在理论研究的层面。 1-2 国内外发展状况 1-2 国内外发展状况 2003 年，台湾 Chi

13、ao Tung 大学的机电工程学院制作的以听觉为移动引导的小型机器人，该机器人以单片机为控制核心，无须有线连接其他控制部分，其声源定向误差在 5 度以内 1。 Jean-Marc Valin 用由八只麦克风组成的阵列系统为机器人 Pioneer2 进行声源定位，具有比较好的鲁棒性。但是，这个系统使用的运算规则非常复杂，同时处理八只麦克风采集的信号量也非常巨大，使系统的反应时间超过了 200 毫秒。而且，由于八路信号带来的过约束条件，使得求解困难。另外，麦克风阵列所占的空间很大，不适合与机器人头部相配合 2。东京大学 2001 年研制了具有听觉定位系统的仿人形机器人的简介。该系统的软件

14、功能做得比较强大，能同时发现和区分在同一个房间里的两个声源，并分别对其进行定位。此模型采用了一种比较特殊的去除噪音的方法，即设立专门采集噪音的麦克风，将采集到的噪音同信号中的噪音成分进行比较，从而抑制响应的噪音成分。SIG2 听觉系统，在定位原理上与上面类似。但是，它的机器人骨架被蒙皮包裹，因此，由于机器人身体的遮蔽效应，这个系统对高频声音的定位精度是很有限的。还有，它仅用谐波原理来确定目标特征，在实际应用时，遇到两个基音相近的目标时，则对目标的同一性的识别能力就很有限了 3。意大利的的里雅斯特大学和帕多瓦大学于 2004 年联合研制的视声融合系统，其声音系统可用于对脚步声之类

15、的声源进行轨迹跟踪。其使用用途可作为博物馆等公共场所的人流记录系统，或监测某作品前，人们停留的时间长短。在其整体系统中，还设置了机动机器人，可以进一步跟踪目标，如在仓库中对未知人物的监视控制 4。声音目标的定位方法有很多，总体上可以分为四类：一是建立各个声源在不同位置(方向)的模板数据库，在应用的时候听觉系统将采集到的声音信号与数据库里的资料进行匹配，即视教的方式。其中 HRTF 算法是模拟人类的心理学感官的定位方法 5,其定义为耳道中信号与特定方向上自由声场信号的傅立叶变换之比。研究表明，对于人和绝大多数哺乳动物仿人机器人头部视觉及嗅觉系统的研究 2 的听觉来说，由于

16、外耳（包括头和肩膀）的作用，声信号在抵达耳膜前已经发生了变化，这变化是声源的方位的函数。外耳这种依赖于入射声方向的传递函数在听觉心理学称为头部相关联的传递函数 HRTF （Head-Related Transfer Function），即为耳道中声音信号与自由声场信号的傅立叶变换之比，他含有声源方位的全部信息。通常，HRTF 是通过测量得到，将测量所得到的数据提前存入库中，当进行定位时，将采集的信号与库中数据相匹配，即得到了声源的方位信息 6。 HRTF 方法有以下缺点：由于库中的数据需要通过直接测量获得，这种测量工作比较烦琐费时； HRTF 计算所得到的数据是离散的；环境改变时，旧的环境数据失效，要重新进行校验；计算量大。二是根据声传感器的阵列空间方位和时间延迟估计来实现的。时延估计的准确性直接关系到对目标定位和跟踪的

展开阅读全文