用mel能量谱特征甄别普通话声母舌面前音和舌面后音

上传人:E**** 文档编号:118160049 上传时间:2019-12-11 格式:PDF 页数:3 大小:237.28KB
返回 下载 相关 举报
用mel能量谱特征甄别普通话声母舌面前音和舌面后音_第1页
第1页 / 共3页
用mel能量谱特征甄别普通话声母舌面前音和舌面后音_第2页
第2页 / 共3页
用mel能量谱特征甄别普通话声母舌面前音和舌面后音_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《用mel能量谱特征甄别普通话声母舌面前音和舌面后音》由会员分享,可在线阅读,更多相关《用mel能量谱特征甄别普通话声母舌面前音和舌面后音(3页珍藏版)》请在金锄头文库上搜索。

1、第八届中国语音学学术会议 暨庆贺吴宗济先生百岁华诞语音科学前沿问题国际研讨会 中国北京 2008.4.18-4.20 用 Mel 能量谱特征甄别普通话 声母舌面前音和舌面后音 用 Mel 能量谱特征甄别普通话 声母舌面前音和舌面后音 贾玉博 孟子厚 贾玉博 孟子厚 中国传媒大学传播声学研究所 北京 100024 摘要摘要 通过分析舌面前音和舌面后音的美尔能 量图,发现两者的曲线走势有明显的不同,舌 面前音一直平缓上升,而舌面后音在曲线中间 段出现最大峰值。在此基础上提取了舌面前音 和舌面后音的一个区别特征参数。 1 引言引言 一种语言的区别特征系统就是一套 二元选择的区别对,语音学界称为最小

2、对立体。从纯音系学音位角度考虑,区 别特征参数的个数越少越好;从语音技 术的实用角度来说,区别特征对各音位 越容易区分越好12。普通话辅音声母按 发音部位分为三大类,分别是唇音、舌 尖音、舌面音。其中,舌面音又包括舌 面前音和舌面后音,舌面前音有 j、q、x; 舌面后音有 g、k、h34。辅音的主要知 觉特征中发音部位有前、中、后之分5。 因此,分析舌面前音和舌面后音的区别 特征参数对于基于规则的普通话语音评 测有一定的帮助作用。 2 实验设计实验设计 2.1 实验语料实验语料 实验语料是中国传媒大学播音专业 的 126 个男生和 212 个女生所发的标准 单音节呼读音。信号为舌面前音 j、q

3、、x 和舌面后音 g、k、h 的呼读音。通过人 工切音的方法得到纯净的辅音成分,消 除过渡音和后接元音的干扰。 2.2 实验方法的选取实验方法的选取 在文献6中,作者从三个角度出发, 分别是基于频谱、 基于美尔频谱、MFCC 提取区别特征参数。基于频谱提取的参 数具有声学意义,但是甄别率不高;基 于美尔频谱提取的参数不但具有声学意 义,而且识别率很高;MFCC 参数甄别 率很高,但参数声学意义不太明确。综 合考虑,本文采用基于美尔频谱提取特 征参数。 2.3 实验过程实验过程 将实验语料通过一个 40 阶的美尔滤 波器组,返回 40 个与之对应的参数,计 算其美尔能量值。下面以女声舌面前音 j

4、 为例,分析其能量随时间的变化规律。 将 212 个样本各帧的美尔能量求平均, 得到各帧的能量谱如图 1 所示。 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 051015202530354045 第一帧第二帧第三帧 第四帧第五帧第六帧 图 1:女声 j 音六帧平均美尔能量谱图 第八届中国语音学学术会议 暨庆贺吴宗济先生百岁华诞语音科学前沿问题国际研讨会 中国北京 2008.4.18-4.20 由图 1 可知, 各帧能量谱总体变化趋 势基本一致,其他辅音的能量谱图也具 有相同的特征。由于辅音信号能量随时 间呈上升趋势,故选择能量最大、信噪 比最大的第六帧分析其区别

5、特征参数。 由于大多数发音人的辅音信号进行分帧 后,都在六帧或六帧以内,只有少数存 在第七帧,不具有统计意义,故不选择 第七帧。 通过对样本能量取平均,得到男、 女声舌面前、后音的美尔能量图,如图 2-5 所示。 0 0.5 1 1.5 2 2.5 0510152025303540 女声j女声q女声x 图 2:女声舌面前音 j、q、x 第六帧平均能量谱 0 0.5 1 1.5 2 2.5 0510152025303540 男声j男声q男声x 图 3:男声舌面前音 j、q、x 第六帧平均能量谱 通过对图 2 和图 3 分析, 我们可以看 出,舌面前音(包括男女声)的曲线一 直缓慢上升,在曲线后段

6、虽然存在一些 抖动,但并不影响其总体上升趋势。发 音人的性别对舌面前音美尔能量谱线的 变化趋势影响不大。 0 0.5 1 1.5 2 2.5 3 3.5 0510152025303540 女声-g女声-k女声-h 图 4:女声舌面后音 g、k、h 第六帧平均能量谱 0 0.5 1 1.5 2 2.5 3 0510152025303540 男声-g男声-k男声-h 图 5:男声舌面后音 g、k、h 第六帧平均能量谱 通过对图 4 和图 5 的观察和分析, 发现舌面后音(包括男女声)的曲线大 约在第 13 个参数和第 23 个参数之间出 现曲线的最大峰值,即大约在频域的 1000Hz 和 2000

7、Hz 之间,出现曲线的最 大峰值,然后随之下降,最大峰值后曲 线上虽然仍有峰值出现,但其数值均小 于最大峰值。经过上面的分析,舌面前 音和舌面后音曲线的变化趋势非常不 同,有较大的区别特征。发音人的性别 对曲线的变化趋势几乎无影响。 在美尔能量谱上,舌面前音和舌面 后音的区别特征是在第 13 到第 23 个参 数之间是否存在该曲线的最大峰值。如 果令 a1 为该段的峰值,a2 为整条曲线的 峰值,k=a1/a2,那么我们可以判定,当 k1 时,为舌面前音;当 k=1 时,为舌面 后音。 通过实验对该区别特征参数进行验 第八届中国语音学学术会议 暨庆贺吴宗济先生百岁华诞语音科学前沿问题国际研讨会

8、 中国北京 2008.4.18-4.20 证, 得到女生的甄别结果为, 舌面前音 j、 q、x 的正确甄别率皆为 100%;舌面后音 g、k、h 的正确甄别率分别为 99.02%、 98.58%、99.44%。采用相同的思路,对 男声的舌面前音和舌面后音进行分析, 得到舌面前音 j、q、x 的正确甄别率为 100%、98.84%、99.19%,舌面后音 g、k、 h 的正确甄别率分别为 98.84%、99.19%、 92.80%。 3 实验结果讨论实验结果讨论 综上分析, 判断第 13 个参数和第 23 个参数之间是否存在曲线的最大峰值, 即通过 k 值,进行区分舌面前音和舌面 后音,效果比较

9、理想,但男生舌面后音 h 的甄别率相对较低一些,只有92.8%。甄 别结果见表 1 所示。K 值判断标准为, K1,为舌面前音;K=1,为舌面后音。 表 1 舌面前音和舌面后音甄别结果 发音部位 声母女声甄别率男声甄别率 舌面前音 j 100% 100% 舌面前音 q 100% 99.19% 舌面前音 x 100% 100% 舌面后音 g 99.02% 98.84% 舌面后音 k 98.58% 99.19% 舌面后音 h 99.44% 92.80% 4 结语结语 从发音部位的角度进行区分舌面前音和舌 面后音,有一定的意义。舌面前音和舌面后音 的甄别结果普遍较理想,大部分在 99%附近, 只有男

10、声舌面后音 h 相对较低, 为 92.8%。 其原 因可能是 h 音对该特征参数不太敏感。 参考文献参考文献 1 张家騄, 汉语普通话区别特征系统 , 声 学学报 ,2005,第 6 期。 2 张家騄, 汉语普通话区别特征系统树状 图 , 声学学报 ,2006,第 3 期。 3 普通话水平测试纲要 ,商务印书馆, 2004,北京 4 林焘、王理嘉, 语音学教程 ,北京大学 出版社,1992,北京。 5 张家騄、齐士钤、 吕士楠, 汉语辅音知 觉结构初探 , 心理学报 ,1981,第 1 期。 6 郑冬红 普通话辅音的区别特征参数的测 量和分析,硕士毕业论文,2007,北京 (贾玉博 中国传媒大

11、学传播声学研究 所 100024 suishuiling 孟子厚 中国传媒大学传播声学研究所 100024 mzh) A distinguishing parame- ter between frontal dorsals and lateral of mandarin JIA Yubo MENG Zihou It is very important to extracting distinguishing characters of consonant for building the speech recognition system based regulations of Putong

12、hua. From the frequency domain, it is clear that both curves going are obvious different through analyzing both Mel-spectrum. The curve of fontal dorsals goes up slowly, but the maximum value exists in the middle of the laterals. Therefore it can be considered as a characteristic parameter. By using the parameter extracted, the effect of separating fontal dorsals and laterals is very good. Most of the rate is near 99%.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号