异常声音检测识别研究背景意义及现状

资源描述

《异常声音检测识别研究背景意义及现状》由会员分享，可在线阅读，更多相关《异常声音检测识别研究背景意义及现状（4页珍藏版）》请在金锄头文库上搜索。

1、异常声音检测识别研究背景意义及现状1研究背景12声音的检测识别的发展和现状12.1声音识别技术的发展12.2国外研究现状22.3国内现状综述33研究异常声音识别的意义41研究背景随着人类社会的进步，人们的生活水平有了较大的改善；然而复杂的社会负面因素，酝酿了许多不安全因素并导致了犯罪率的上升。随着城市化进程的加速，不安全因素对国家和人民生命财产安全的威胁日益加重。安全问题已经成为社会关注的焦点。随着信息化和网络化技术的发展，安全监控在国防和社会安全中所起的作用越来越突出。声音信号在日常生活中分布非常广泛，包含信息量大，也是人类交流的基本方式。声音传播媒介多种多样分布非常广泛，同时声音信号的获取

2、也较为方便。公共场所的异常声音能够有效的揭示和表征异常状况以及突发事故，受到人们越来越多的关注。2声音的检测识别的发展和现状声音是由物体的振动产生的，并通过传播媒介传播开来。声音检测技术识别可以分为两个主要的方面：一个是语音信号检测识别技术(主要指语音识别技术)；另一个是非语音声音信号的检测识别技术。2.1声音识别技术的发展语音识别的研究工作大约开始于五十年代，当时AT&T Bell实验室实现了第一个可识别十个英文数字的语音识别系统Audry系统。六十年代，计算机的应用推动了语音识别的发展。这时期的重要成果是提出了动态规划(DP)和线性预测分析技术(LP)，而后者较好地解决了语音信号模型的问题

3、，对语音识别的发展产生了深远影响。七十年代，语音识别领域取得了突破。在理论上，LP技术得到进一步发展，动态时间规整技术(DTW)基本成熟，特别是提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。在实践上，实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别系统。八十年代语音识别研究的重点是连续语音识别，各种连续语音的识别算法被开发，如NEC提出的二层动态规划算法:Bell实验室的Myers、Rabiner和Lee等人提出的分层构造算法，以及帧同步分层构造算法等。同时，研究方向从基于模板匹配技术转向基于统计模型技术，不再追求刻意细化语音特征，而是从整体平均(统计)的角度来建立最佳的语音识别

4、系统。同时，HMM方法逐步成为主流的语音识别技术。对它的研究使大词汇量连续语音识别的开发成为可能。1988年，美国CMU大学用VQ/HMM方法实现了997词的非特定人连续语音识别系统SPHINX，这是世界上第一个高性能的非特定人、大词汇量、连续语音识别系统，开创了语音识别的新纪元。进入九十年代，语音识别步入了高速发展时期，语音识别在某些领域已经走向成熟，同时随着多媒体时代的来临迫切要求语音识别系统从实验室走向实用。90年代语音技术的另一个主要趋势是语音识别在日趋完善的同时开始与其他领域的技术相结合。90年代初期人们开始进一步研究语音识别与自然语言处理的结合，产生了基于口音识别和理解的人机对话系

5、统。90年代中期语音识别与机器翻译技术相结合，发展面向不同语种人类之间交流的直接语音翻译技术，这些技术在有些领域内(如火车、飞机订票等)开始走向实用化。目前，IBM，Dragon，Philips等公司都己经能够提供相应的产品。AT&T应用语音识别技术研制出了智慧卡，已应用于自动提款机。美国主要电信运营商Sprint的PCS部门以卓越、创新的客户服务著称。自2000年以来为客户开通了语音驱动系统，提供客户服务、语音拨号、查号和更改地址等业务。2001年9月它开通的可以自然方式对话的咨询系统，更实现了以自然、开放的询问方式实时获得所需信息的功能。欧洲电信联盟在电信与金融结合领域应用语音识别技术，于

6、1998年完成了CAVE(Caller Verification in Banking and Telecomm-unication)计划，并于同年又启动了PICASSO(Pioneering Call Authentication for Secure Service Operation)计划，在电信网上完成了说话人识别。2.2国外研究现状针对声音信号的研究可以分为语音信号的研究和非语音信号的研究。20世纪50年代AT&T贝尔实验室的Audry系统以来，语音信号的研究（主要指语音识别）目前已经得到了很大的发展。语音信号线性预测系数（LPC）技术，Mel频率倒谱系数(Mel-Frequency

7、 Cepstrum Coefficient，MFCC)和感知线性预测系数(Perceptual Linear Predictive，PLP)和动态时间规整（DTW）技术的提出，有效的检测了语音信号的特征提取和不等长匹配问题。这些都使得语音信号的研究达到了前所未有的高度。异常声音中的枪声、爆炸声属于非语言信号。对非语音信号的研究相比语音信号的研究相对缓慢。国外主要将声音信号的检测技术用于健康状况的检测中。Wavelet Packet Based Respir.Atory Sound Classification（基于小波包的呼吸声音分类）先将获取到的呼吸声音信号在时间域进行定长的分割，划分为多个

8、段；再用小波包分解分析各个声音段的特性；寻找出最佳基；利用最佳基构造特征向量。特征向量的分类是采用知识向量量子化的方法。该方法的研究对象是人呼吸的声音，通过分析特征向量来寻找异常声音，确定被检测对象的健康状况。另外日本有科研人员通过对枪声的检测用于环境评判上。该系统主要是先从大量的专业CD上获取枪的声音信号（其中包括手枪、步枪、半自动步枪等），通过提取其中的特征参数建立标准参数库。系统运行时，拾音器实时获取外界声音对其以20ms的帧长进行分帧，实时计算各帧的特征参数，再与标准参数库里面的模版进行匹配以确定环境中是否含有枪声，来评判环境。该方法直接计算每个声音帧的特征参数，计算量大，实时性不好；

9、其次没有对枪声作特征分析，直接就提取其特征参数，该方法的有效性还有待验证。2.3国内现状综述在我国，从七十年代末开始语音技术的研究，但在很长一段时间内，都处于缓慢发展的阶段，直到八十年代后期，随着计算机应用技术在我国的逐渐普及和数字信号处理技术的进一步发展，国内许多单位纷纷投入到这项研究工作中去，其中有中科院声学所，自动化所，清华大学，四川大学和西北工业大学等科研机构和高等院校，大多数研究者致力于语音识别的基础理论研究工作、模型及算法的研究和改进。但由于起步晚、基础薄弱、计算机水平不发达，导致在整个八十年代，我国在语音识别研究方面并没有形成自己的特色，更没有取得显著的成果和开发出大型性能优良的

10、实验系统。但进入90年代后，我国语音识别研究的步伐就逐渐紧追国际先进水平了，在“八五”、“九五”国家科技攻关计划、国家自然科学基金、国家863计划的支持下，我国在中文语音技术的基础研究方面取得了一系列成果。在语音合成技术方面，中国科大讯飞公司己具有国际上最领先的核心技术；中科院声学所也在长期积累的基础上，研究开发出颇具特色的产品；在语音识别技术方面，中科院自动化所具有相当的技术优势；社科院语言所在汉语言学及实验语言科学方面同样具有深厚的积累。但是，这些成果并没有得到很好的应用，转化成产业，相反，中文语音技术在技术、人才、市场等方面正面临着来自国际竞争坏境中越来越严峻的挑战和压力。异常声音方面，

11、国内主要将声音检测技术用在了石油管道的工作状况检测以及轴承质量的检测等。石油管道的异常声音检测系统是通过在石油管道的外壁安装声音传感器实时获取声音并通过专用线路将声音信号传送到控制中心；控制中心的中心处理器对声音信息进行处理、辨识和异常分析；系统通过确定异常声音有无及异常声音的发生源的距离，来判断石油管道的运作情况。该系统只是从系统的角度论述了异常声音检测，但是没有理论上进行异常声音分析与辨识的阐述，缺乏理论依据的支持；对异常声音与正常声音的参数特征等没有叙述，声音信号的处理方式也没有阐述。3研究异常声音识别的意义社会发展了之后，公共场所的安全防护、智能监控受到越来越多的关注。因为公共场所的异常声音能够有效地反应重大事故和危急情况的发生，所以关于异常声音检测识别的研究对公共场所的智能监控和安全防护有着重要的学术意义和实用意义。

展开阅读全文