语音特征的降维变换与特征鲁棒性_王昆仑

上传人:kms****20 文档编号:46740970 上传时间:2018-06-27 格式:PDF 页数:5 大小:264.03KB
返回 下载 相关 举报
语音特征的降维变换与特征鲁棒性_王昆仑_第1页
第1页 / 共5页
语音特征的降维变换与特征鲁棒性_王昆仑_第2页
第2页 / 共5页
语音特征的降维变换与特征鲁棒性_王昆仑_第3页
第3页 / 共5页
语音特征的降维变换与特征鲁棒性_王昆仑_第4页
第4页 / 共5页
语音特征的降维变换与特征鲁棒性_王昆仑_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《语音特征的降维变换与特征鲁棒性_王昆仑》由会员分享,可在线阅读,更多相关《语音特征的降维变换与特征鲁棒性_王昆仑(5页珍藏版)》请在金锄头文库上搜索。

1、第19卷第3期200 0年9月新吸师范大学学报(自然科学版)JorunalofXinjiangNormalniUversity(NaturalcSiene esEdition)Vol.19,No.3e SP.2000语音特征的降维变换与特征鲁棒性王昆仑(新.师范大学计算机 科学系乌. 木齐8 3。54)摘共本文分析了语 音识别中的特征降维变换方法和特征奋棒性间厄。经实践证明:基于C D N分布的降维方法泛合 非特定人语音识别,其有突出的优越性。通过 调整模型参数并使用含噪 特征训练模互,解决特征奋棒性间厄.关链词语音特征变 换和鲁棒性非特定人语音识别1引言语音特征分时域特征和频域特征两类。时域

2、特征在语音识别研究中一般用于语音预 处理,如短时能量,短时过零率等。频域特征 一般用于语音识别模型的特征参数,如倒谱参数等。使用多种频域特征可以提高识别器的模式划分能力。这种组合特征(大特征向量)的直接使用,使识别器的计算量大大增加。另外,特征的维数一般也较大。因此,语音特征的降维处理方法及其效率,成为语音识别研究中的重要 问题之一。,、 在非特定人语音识别特征提取阶段,不同人、不同性别、不同地域方言、不同背景嗓声等都将对特征 参数产生 影 响,特征参数在模型 特 征空间中如何精确地分类划分,使其分类相对集中,这就是特征鲁棒性问题。本文就这两个问题进行分析,提出解决的方法并在维吾尔语语音识别中

3、应用。2语音特征降维变换频域特征参数如LpgC(L in e arpredietiveCddingCepstram)和 MF C C(Mel一Fr equeneyCep“tu rmCo ei f fci en t)包含着大量的语音特征信息。根据特征参数的提取方法,特征的维数一般较大。在语音识别模型中,特征的各维对模式划分的作用都不相同。降维的效果和降维算法也不相同,下面分析主分量分析降维法和中心距离正态( CDN)分布降维法。2.1主分量分析降维法设F一(f l,几,f, ,)T是D维特征列向量,其各维之间相关,对其进行线性变换得到各维相互独立的向量收稿日期:20 00一04一1 8,本文得到

4、国家自然科学墓金 项目资助新璐师范大学学报(自然科 学版)2000年,矛、少. 、r,土O自八d几了、了几2.、G=AF(91,92,g刀)T对上式两边取转置,与原式相乘,然后取对数期望得到EGG门EAF FTA了AE【FFAT即RcAR尸A了其中R二和RG分别是向量F和G的自相关矩阵。R;可表示为:R夕贵鑫FF万(4)它是由N个训练样本Fn,1簇n簇N估计出来的,是非负定的实对称阵。由于G向量的各维是相互独立的,所以R。是对角阵,其主对角线上的元素是g:,g:,g。的自关函数,也就是R。=及agEg圣,Eg盖,Eg毛(5)因为凡是实对称矩阵,Rc是对角矩阵,所以( 3 )式是正交变换式,即A

5、是正 交 矩 阵。由线性代数理论可 知,非负定 矩 阵R二有D个正 实 特征 根,以它 们为对角元素组成的对角阵 就是Re,即:R。=Dia或Eg凳,Eg至,Eg么Diag仁几1,几2,又。(6)各特征根对应的特征向量就是A中的列向量。由于A是正交矩阵,所以ATA一,所以( 3)式可以变成RAA或(7)(8)一l奋.w el. e s.I奋L,|!|.|l w eD J孟.流队11|百IL对飞8)式展开得到其特征根 由方程久d AdA d1簇d成Dl A人志. RDetR F一几I一。解出。由( 8)式,从D个特征根中选出其中的杯个特征根,其对应的特征向量 杯组成材-xD的变换矩阵,可把D维特

6、征 向量F降为杯维特征向量G枷(9)(10)Ad,1镇d镇(1 1)由(8)式选取M个特征向量时,应选择“贡献”大的。根据多元统计分析理论,(3 )式可表示为宁A.叉_A了-Jd.J,(1 2)其中习。和习二分别是向G和 向量F的协方差 矩阵名。一Dag久;,几2,孟。,:妻几2)“。o(1 3)根据协方差矩 阵的定义,对等于G中第d个分 量的方差,所以习脚可表示 整体方差,哪烈“代表G中第“个分量对整体方差的贡献,若我队”个特征根中选取料特征根第3期王昆仑语音特征的降维变换与特征 普棒性时,使习孟d 夸牛一)T 习耐(14)时,也就是用例闭、主要分量反映D个分量的 贡献,代表D个分量的主要特

7、征。实际中T可取8 0% 或其它值。可以看出,主分量分析降维法对特征 向量的降维有很好的作用。由于其舍去 了其它分量,必然造成特征信息的损失,这对语音识别是不利的。选取多大比例的分量为主分量,这与阐值T有关。在非特定人语音识别中,语音特征受各种地域方言的“干扰”,其 主分量选取更不 易“区别”,舍去的分量造成的特征信息损失更大。另外,由( 4)式可以看出变换矩阵直接受到训练样本的影 响,对非特定人语音识别也是不利 的。2.2中心距离正 态(C DN )分布降维法中 心 距离正 态(CDN,Ce nte r一Disa tc neNo rma l)分布降维是把符合正态分布的向量按与其均值向量的距离

8、降为一维标量,而这样的标量服从 中心距离正态分布。我 们 知道,如 果一维随机变量右服从均值为 材王、均方差值为古二的正 态分布,那么其概率密度函数为N(X,何汾,占二)=1 扼牙占二exp(一(x一x.)2/2古里)(15)如 果定义随机变量刀y代,m、),则刀的概率密 度函数可表示为P(y,占二)2了厄牙古二e二P( 一尹/2此)(1 6)y(x,xZ)定义 为x:与x:之间的 距离。由于粉是正 态随机变量泞与其均值m二的距离,因此把(1后)式称为 中心 距离 正 态忆DN)分布。刀的均值m,为:m一厂y P饥么d x )一会(17)将(17)式代入(16)式有P(y,m,)2汀my尸xP

9、( 一夕2/。圣),少)0(18)根据上述 分析,把一维情况推广 到D维,我 们设服从D维正态分布的随机向量泞离其 中心向量,二的距离d服从cDN分布,则其概率密度函数为:P (x,产,占二) 1 了丽凡1,。,、,_,、 “p、一万a一Lx,产少/乙“训(19)其中d(x,xZ)是两个矢量之间的加权Eu ei lde an距离、陈_,、,“、毛几少一心匕J%、x“一工“2-下d=1(2 0)而产和占可 由下式从k个样本向量xl,xZ,毛中估计出来1召,了薪。1石,、“一灭自r”一乏一康出“又几,阴(2 1)峋 为权函数,可选的有矩形加权,提升正 弦加权,索 引加权等。断班 师范大学学报(自然

10、料 学版)200 0年CDN分布中,其概率密度函数是关于d (x:,x:)的而不是关于x的。因此信息刻 划中包括了距离分布的信息,所以刻划精度较高,再者其降维变化比较简便,只需要一个权向量。降维效率较高,它是一个从D维空间到一维空间的数学变换,使系统的分析复杂度降低。可以着出,该变换对语音个性特征有弱化效果.适合于非特定人语音识别。与主分量分析法相比又不裕要对转换矩阵进行训练。以上特点,作者在维语尔语非特定人语音识别系统中取得很好的刻划效果。3关于语音特征鲁棒性间题在语音识别中,由于现实世界中不同人,不 同性别,不同方言,不同背景嗓 声等都对特征参数的提取造成很大的影响,更进一步将影响识别效果

11、。因此,特征鲁棒性研究,就是要解决在各种情况下对相同识别基元提取的特征,在特 征空间中不至 于太分散而是相对集中,解决此问题,有几种方法或思路。进行嗓声免疫学习,其中著名的有Gish等人提出的概率映射方法,其基本思想是:构造一映射函数把含嗓特征X二映射为干净特征X,其映射关系是:Xcd一习、J叭(X、),z镇dD(22)其 中必()是径向基函数 的转移函数叭X, 一x e戒一烈(Xd一湘)22路,kK(23)这种映射关系必须对特定种类的嗓音进行足够的训 练方能得到 其特征 后才能建立起来,因此在实用中很困难。. 提高特征鲁棒性的另一种方法是模型动态地对特征进行适应.这样就要求把特征与模式划分问

12、题结合起来。在维吾尔语语音识别中,采用 了含嗓语音特征直接对模型进行训练,经过大量实验证明:在以词为识别基元时,调整CL尸M模型状态数N16,混合密度数杯二24,特征与模型模式空间划分达到最佳。4小结在语音识别系统中,特征参数的降维处理对系统分析复杂度有很重要的作用,降维的目的是即要保留特征参数的有效信息,又要减低特征维数,以利于系统分析。主分量分析法虽然方法简单,但 由于其降维后一部分语音特征信息丢失,造成损失。另外,其变换矩阵受训练样本的影响也比较大。CND分布分析法把D维特征按其与均值的距离降维至一维的标量,它是 向量右与中心向量m二之间的距离甲的概率密度函数,与 iFshe r线性判别

13、相比,CDN分布还描述了夕的分布信息,这对模式划分是有益的。另外,其降维处理方法简单,仅要求有一个权向量,实验表明在非特定人语音识别中有很好的识别效果。实验也表明特征鲁律性间题从调态模型参数来适应含噪特征的方法,通过对模型的训练可以达到满意的识别结果。第3期王 昆仑语音特征的降维变换与特征番捧性19今考文献杨叔于,吴稚.时间序列分析 中的工程应用.华 中理工大学 出版社,1 99 2郑方,吴 文虎,方棣粱.Cl) C PM及其在语音识别 中的应用.软件学报.1 9 9 6Gi.h.H,C how.Y.L,Roh lli cek.J.R二Po rbabiliotictora mp pi嗯ofn

14、o认萝一p吧eeh,a rmete r sf orHMM锄d r一加t tig n”.ICASSP一90.1Ro一 eR.C.,Paul,o Dula oB“Ah i d denMa rko vm叼el ba a edkeyw od re reo g垃tion一ystem气C IAS SP一90.1王昆仑.语音识别中的信号特征提取与选择.新班师范大学 学报.2。年第1期THELO、 V E RD IME NSIONT RANSFORMAT IONAN DROBUSTQUAL I T YOFSP E ECHCHAR ACTE RWangKunlu n(C如吵ute rScienc eDe Pa材

15、me nt,Xil n j angNom ralUnive s riy t,Ur“m口i,830 054)AbstraetThispaperhasa n alys edthequ estionwithtransfo rmationofeha r a ete ristielowe rdimensio nandehar aeteristieRobustqu ality.It15e ertifiedbypra etie ethatlowerdi-mensionmeansbasedonC DNdistributions uitsthespe eehre e ognitionofindependentspe aker.Itha soutstandingadvantages.Theproblemofehara eteristieRobustqualityeanbes olved byadjustingmodelparameterandusingle arningmodelwithvoie eeonfusion.KeyWo rdsSpe eeheharaeterTr ansformationandRobustqualitySpeeehre e ogni-tionofindePe nde ntsPe ake r

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号