基于对话型语音的说话人在线识别技术研究

上传人:小** 文档编号:47751183 上传时间:2018-07-04 格式:PDF 页数:55 大小:1.83MB
返回 下载 相关 举报
基于对话型语音的说话人在线识别技术研究_第1页
第1页 / 共55页
基于对话型语音的说话人在线识别技术研究_第2页
第2页 / 共55页
基于对话型语音的说话人在线识别技术研究_第3页
第3页 / 共55页
基于对话型语音的说话人在线识别技术研究_第4页
第4页 / 共55页
基于对话型语音的说话人在线识别技术研究_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《基于对话型语音的说话人在线识别技术研究》由会员分享,可在线阅读,更多相关《基于对话型语音的说话人在线识别技术研究(55页珍藏版)》请在金锄头文库上搜索。

1、黑龙江大学硕士学位论文A b s t r a c tS p e a k e rr e c o g n i t i o nt e c h n o l o g yi sam o r ee f f e c t i v eb i o m e t r i ca u t h e n t i c a t i o nt e c h n o l o g y I ta n a l y z e st h ev o i c et od e t e r m i n ew h oa n dw h e ns p e a k s A n dI th a sv e r yb r o a da p p l i c a t i o

2、 n s E x i s t i n ga p p l i c a t i o n sa r em o s t l ys i m p l es p e a k e rv e r i f i c a t i o na n dr e c o g n i t i o ns y s t e m I nt h i sp a p e r ,as p e a k e rr e c o g n i t i o nt e c h n o l o g yb a s e dc o n v e r s a t i o n a ls p e e c hi sp r o p o s e d ,a n di m p l e

3、 m e n t a t i o no ft h es p e a k e rr e c o g n i t i o ns y s t e m M a i nt a s k sa r es u m m a r i z e da sf o l l o w s :( 1 ) At w o - s t a g eB I Cs e g m e n t a t i o nm e t h o di sp r o p o s e d ,t h ef i r s tp h a s eo ft h el a r g e rw i n d o wl e n g t hp a r t i t i o n i n g

4、s t r a t e g i e st oe n s u r eo n - l i n er e a l - t i m ei d e n t i f i c a t i o nm e t h o d ,t h es e c o n dp h a s eo fB I C b a s e ds e g m e n t a t i o nc r i t e r i at oe n s u r et h ea c c u r a c yo ft h es p e a k e rs e g m e n t a t i o n ( 2 ) AV Q - b a s e ds p e a k e rr

5、e c o g n i t i o ns y s t e mi si m p l e m e n t e d ,w h i c ha i m st oi m p r o v et h et r a d i t i o n a lL B Ga l g o r i t h m ,a n dt om e e tt h es y s t e mo n - l i n ei d e n t i f i c a t i o nf e a t u r eb e t t e r ( 3 ) Ad i f f e r e n c e ss u b s p a c em e t h o di ns p e a k

6、 e rr e c o g n i t i o ni ss u g g e s t e d I ta i m st oe s t a b l i s ht h ec o r r e s p o n d i n gs u b s p a c ef o re a c hs p e a k e r , a n dt os e l e c tt h eh i g h e s ts c o r eo fc o m p a r i n gt h et e s t s p e e c ht ot h et r a i n s p e e c ha st h er e s u l t T h i sm e t

7、 h o di m p r o v e st h es y s t e mr e c o g n i t i o nr a t ea c c u r a t e l y A n di tr e d u c e st h es y s t e m s t i m ec o s t i n g ,t h es y s t e mi ss u i t a b l ef o ro n - l i n ei d e n t i f i c a t i o ns y s t e mU S e S ( 4 ) A no n - l i n es p e a k e rr e c o g n i t i o

8、ns y s t e mb a s e dc o n v e r s a t i o n a ls p e e c hi si m p l e m e n t e da tl a s t K e yw o r d s :C o n v e r s a t i o n a lS p e e c h ;S p e a k e rR e c o g n i t i o n ;V e c t o rQ u a n t i z a t i o n ;D i f f e r e n c eS u b s p a c e- 独创性声明独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的

9、研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得墨蕴迤太堂或其他教育机构的学位或证书而使用过的材料。学位论文作者签名:触剐签字日期砌年彳月,2 - H学位论文版权使用授权书本人完全了解墨蕉堑太堂有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权墨蕉江太堂可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段保存、汇编本学位论文。学位论文作者签名:捌l导师签名:毒纪q 、囝签字日期:加仂年月fy 日签字日期:协年厂月( Z 日学

10、位论文作者毕业后去向:工作单位:通讯地址:电话:邮编:第1 章绪论第1 章绪论1 1 说话人识别技术概述说话人识别技术可定义如下:利用计算机技术对人类的语音数据进行分析,从而确定该语音段是某位说话人所说 1 1 。说话人识别技术就是提取人类语音波形中可以表示出说话人个性特征的语音参数,通过模式识别的方法实现说话人身份的识别和验证1 2 】。说话人识别系统即是分析系统采集到的语音数据资料,以此判别出是哪位说话人在何时发出了声音,或者判别出指定语音是否为指定的某位说话人所说【引。1 1 1说话人识别技术的发展自二十世纪三十年代开始,人们便开始了说话人识别技术的研究,初期工作主要是论证根据声音进行说

11、话人识别的可能性以及人耳听辨实验。计算机软件及硬件的发展,使得人们对语音的研究得以深入进行。二十世纪六十年代初期,声纹概念的提出使得利用声纹特征进行说话人识别成为可能1 4 ,5 】。说话人识别技术在这时期分为说话人确认系统和说话人辨认系统。经过一段时期的研究,人们开始将线性预测编码技术用于说话人识别领域【6 ,7 1 ,同时也提出了多种不同的失真测度准则。在二十世纪七十年代,出现了效率较高的采用动态时间规整( D y n a m i cT i m eW a r p i n g ,D T W ) 的说话人识别技术【8 J 。随后,语音识别领域重要的模型之一,隐马尔可大模型( H i d d e

12、 nM a r k o vM o d e l ,H M M ) 也加入到语音识别相关技术中1 9 ,1 0 】。矢量量化V Q 方法 1 l - 1 3 1 以及L B G 算法【1 4 】的出现使得说话人识别系统具有了比较好的识别性能。随着人工神经网络( A r t i f i c i a lN e u r a lN e t w o r k s ,A m I ) 方法【1 5 ,】1 6 1 的提出,说话人识别技术有了新的发展。二十世纪九十年代以来,因特网的发展使得多媒体信息呈现爆炸式增长,给传统的说话人识别技术带来了巨大的挑战。国内外许多科研黑龙江大学硕士学位论文机构都进行了深入的研究,国

13、外比较著名的有麻省理工学院林肯实验室、I C S I( I n t e r n a t i o n a lC o m p u t e rS c i e n c eI n s t i t u t e ) 、L I A ( L a b o r a t o i r eI n f o r m a t i q u eA v i g o n o n ) 等;国内的说话人识别技术研究起步较晚,但发展迅速,比较著名的研究机构有:中科院声学所、北京大学、中国科技大学、北京理工大学、哈尔滨工业大学等。1 1 2 说话人识别技术的分类根据输出结果,说话人识别技术可做如下划分1 1 7 】:( 1 ) 说话人确认(

14、S p e a k e rV e r i f i c a t i o n ) :确认待测语音是否属于指定的说话人,其输出为是或否。( 2 ) 说话人辨认( S p e a k e rI d e n t i f i c a t i o n ) :辨认待测语音属于多位训练者中的哪一位,输出为某位说话者。由上面的定义不难看出,说话人确认和说话人辨认的输出明显不同,说话人确认的输出为是或否,而说话人辨认的输出训练集中的某位说话者。已有的说话人识别系统中,说话人确认系统的性能普遍优于说话人辨认系统,后者的识别性能与训练集大小有关系,训练集越大系统性能越低,而说话人确认系统就不存在这类问题。根据识别对象,

15、说话人识别技术可做如下划分 1 8 】:( 1 ) 文本相关( T e x t D e p e n d e n t ) :训练及识别过程中,使用者需要按照指定的文本进行发音。( 2 ) 文本无关( T e x t I n d e p e n d e n t ) - 训练及识别过程中,不规定使用者的发音内容。由大量实验可知,文本相关的说话人识别系统性能好于文本无关的说话人识别系统,但由于前者对使用人员的限制较多,灵活性大为降低,因此,文本无关的说话人识别技术的使用更为广泛【19 1 。第1 章绪论1 1 3 说话人识别技术的应用( 1 ) 网络安全领域。互联网的发展使得人们越来越依靠它,网络上用

16、以识别人们身份的是各种密码,传统的键盘输入密码方式已经不能满足互联网安全性的要求。通过声纹密码进行说话人确认的方法可以有效提高安全性能,这种方法在电子商务、网络银行等业务活动中的应用尤其重要1 2 0 1 。( 2 ) 公安领域。在公安领域的案件侦破中,越来越多的依靠监听录音等电子信息化手段判断出嫌疑人的活动及言语等,针对各种场景的说话人识别技术在许多民事、刑事案件中起到了十分重要的作用。( 3 ) 军事领域。现代化的战争离不开军队的现代化,美伊战争中说话人识别技术就被美军广泛采用。此外,在高级指挥官下达军事命令等一系列活动中,说话人识别技术都起到了关键、重大的作用【2 1 1 。( 4 ) 电信领域。随着电信3 G 业务的开展,出现了更多的依赖于语音附加业务如:通过识别用户的声音实现自动业务办理;通过对主叫方声音的识别,将主叫方身份信息发送给被叫方等一系列增值业务【2 2 】。( 5 ) 民用领域。说话人识别技术在民用领域的应用范围相当广泛,如电子玩具中加入了说话人识别功能,深受小朋友们的喜爱;又如高档小区中都装备了基

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 宣传企划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号