4.第四章 基于模式匹配方式的语音识别技术

上传人:飞*** 文档编号:5388380 上传时间:2017-08-07 格式:PPT 页数:13 大小:172.50KB
返回 下载 相关 举报
4.第四章 基于模式匹配方式的语音识别技术_第1页
第1页 / 共13页
4.第四章 基于模式匹配方式的语音识别技术_第2页
第2页 / 共13页
4.第四章 基于模式匹配方式的语音识别技术_第3页
第3页 / 共13页
4.第四章 基于模式匹配方式的语音识别技术_第4页
第4页 / 共13页
4.第四章 基于模式匹配方式的语音识别技术_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《4.第四章 基于模式匹配方式的语音识别技术》由会员分享,可在线阅读,更多相关《4.第四章 基于模式匹配方式的语音识别技术(13页珍藏版)》请在金锄头文库上搜索。

1、语音识别基础,上海交通大学计算机系吴亚栋E-mail:Tel: 62932057,第四章 基于模式匹配方式的 语音识别技术,第四章 基于模式匹配方式的 语音识别技术,4.1 语音短点检测*4.2 失真侧度*4.3 动态时间规正法* (DTW:Dynamic Time Warping)4.4 基于DTW技术的语音识别方案*,设待识语音模式为T=accbac,参考模式为R=cbacabc,若a、b 、 c之间的距离分别为 d(a,b)=d(b,a)=2、d(a,c)=d(c,a)=3、 d(b,c)=d(c,b)=1、d(a,a)=d(b,b)=c(c,c)=0 时,1)试用DTW法,在点阵图上画

2、出最佳匹配路径,并计算出最佳匹配距离D(T,R);2)根据1)的结果,试用线条画出与之间的对应关系。 提交时间:,第四章 回家作业,4.1 语音端点检测,4.1.1 语音端点检测的困难性 - 语音端点检测:从包含语音的一段信 号中确定出该语音的起始点及终止点。 - 由于背景噪声或人为呼吸等原因产生 的杂音,使得语音的端点比较模糊。4.1.2 采用能量及过零数参数的检测法*,4.2 失真侧度,4.2.1 距离侧度与失真侧度 - 数学上的距离 (1)正值性 d(x,y)0;当x=y时,有d(x,y)=0; (2)对称性 d(x,y)= d(y,x); (3)三角形不等式性 d(x,y)= d(x,

3、z)+ d(z,y)。 - 失真侧度 (1)正值性 D(x,y)0;当x=y时,有D(x,y)=0; (2)在频域中应具有物理意义。 (3)在实际工程中能有效地计算。4.2.2 几种典型的失真侧独*,4.3 动态时间规正法(DTW),4.3.1 语音模式匹配的问题点 - 匹配时音长不一致问题 - 线性匹配与非线性匹配*4.3.2 DTW的原理*4.3.3 DTW的具体解法*,4.4 基于DTW技术的语音识别方案,词 汇 表:W(n), n=1,2,N参考模式:R(k), k=1,2,N待识模式:T- 利用DTW算法,计算所有Dk(T,R(k)。- 对所有Dk(T,R(k)求其最小值,该最小失真度所对应的下标 n 就为识别结果。 n=argminDk k,采用能量及过零数参数的检测法,时间,ETL,ETU,ZT,N1 N2,NB NE,过零数Zj,能量Ej,N1,N1-25,时间,几种典型的失真侧度,不同音长的匹配距离(D3D2D1),动态时间规正法(DTW)的原理,动态时间规正法(DTW)的具体解法,min,动态时间规正法(DTW)的计算实例,min,FEDCBA,1 2 3 4,R,T,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号