语言清晰度的客观评测

上传人:ji****72 文档编号:51939204 上传时间:2018-08-17 格式:PPT 页数:29 大小:2.49MB
返回 下载 相关 举报
语言清晰度的客观评测_第1页
第1页 / 共29页
语言清晰度的客观评测_第2页
第2页 / 共29页
语言清晰度的客观评测_第3页
第3页 / 共29页
语言清晰度的客观评测_第4页
第4页 / 共29页
语言清晰度的客观评测_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《语言清晰度的客观评测》由会员分享,可在线阅读,更多相关《语言清晰度的客观评测(29页珍藏版)》请在金锄头文库上搜索。

1、LOGO语音清晰度的客观评测语音清晰度的客观评测中国传媒大学中国传媒大学 传播声学研究所传播声学研究所章斯宇章斯宇 2010.5.212010.5.21主要内容1语音清晰度评测的发展概况语音清晰度评测的发展概况2 混响作用下STIPA与清晰度的关系3 噪声环境下STIPA与清晰度的关系4 总结与展望1. 语音清晰度的评测v 语音的清晰度或可懂度是音质评价的重要指标反映厅堂或扩声系统的声音传输质量v 主观评价: 组织测试队伍实地测试(articulation test) 优点:直接、真实 缺点: 耗费人力物力v GB-T 15508-1995 声学 语言清晰度测试方法语音清晰度的客观评价方法ST

2、I%ALconAI主观 测试v 尽可能反映真实 的清晰度水平清晰度指数 AI (Articulation Index)v French v ANSI Std. S3.5-196919861997v 特点:特别适用于评价诸如噪声干扰、有限带通等频域失真引 起的语音清晰度恶化程度,不能反映混响、回声或削峰等时域 或非线性失真的影响。辅音损失率 %ALcon (articulation loss of consonants)v 能不能根据测量房间内的某些物理量估计语音清晰度? v Knudsen(1932), Peutz(1971), Klein(1971) 根据大量的实地测量和清晰度主观评价测试的

3、结果, Peutz发现%ALcon与房间的声学特性相关。Peutz 公式(经验推导)D听音处距声源的距离。单位m。T60混响时间(1400Hz)。单位s。V房间的体积。单位m3。校准值。针对不同水平的听者。1.5%12.5%。Dc临界距离。单位m。 注意: SNR25dB; 单个无指向性的 点声源(Q=1);Klein对Peutz公式的补充v 当房间声学特性难以改善时,采用电声手段提高语音清晰度 。 v 声源个数n;声源指向性因子Q;虽然提高扬声器的Q值有助 于改善语音清晰度,但Q值 与清晰度之间是否成简单 的线性关系并没有实际的 实验数据支持。 Jacob(1985)认为语音清晰 度与Q并无

4、直接的关联。辅音损失率%ALcon的不足 根据实验结果的经验推导, 物理基础不够; 对于信噪比低于25dB的情况 估计不足,不能充分反映噪 声和混响联合作用时的影响 ; 没有考虑早期反射声,单次 回响的作用,且结果仅给出 某个频带的清晰度水平,未 考虑参数的频率特性的影响 ;Jacob(1985)v Hougast & Steeneken (197319801985) v IEC Std. 60268-16 v 充分反映声传递系统性能质量的优劣输入端: 说话人发音语言传输指数STI (speech transmission index)输出端: 听者耳朵语言传输系统: 充分考虑传递过程中 噪声

5、、混响、回响、 系统失真等各种干扰 因素的影响Black Box调制转移函数MTF (modulation transfer function)v 连续的语音可以看成一系 列语音碎片(音位)的组合 。音位又可以看成是发音 器官对某种窄带噪声调制 的结果。音位的时域包络 中包含了所传递的信息。v 传输过程中,噪声、混响 、系统失真等会使得包络 发生变化,从而导致清晰 度恶化,利用MTF描述量 化包络波动性能的变化程 度。MTF的计算v 函数定义为声信号经 传输后接收信号强度 包络的调制度相对于 原信号强度包络调制 度的降低,它随调制 频率不同而变化。STI的计算v 14种调制频率;7种倍频带噪声

6、 作为测试信号v 计算98个MTF结果v 类似AI计算中的加权平均最终得STI 0,1v 根据房间脉冲响应可以直接计算MTFSTI与语语音清晰度Steeneken (1980)v 不论是噪声、带通限制、 削峰、混响等干扰因素, STI与语音清晰度得分之 间始终有着良好的一致性 。v 客观可测的物理参量STI 能良好的反映和预测真实 的语音清晰度水平。语言传输指数STI的简化算法v 限制条件: 无明显非线性失真;环境噪声无脉冲;混响时间频率特 性平滑;宽带语言传输系统;v 1)RASTI (Rapid STI or Room acoustic STI) 适用于不包括扩声系统的厅堂语音传输质量的评

7、价 选取了语言谱中比较有代表性的频带和调制频率500Hz1Hz2Hz4Hz8Hz2KHz0.7Hz1.4Hz2.8Hz5.6Hz11.2Hzv 2)STIPA (STI for public address) 适用于包括扩声系统的厅堂或电声系统的语音传输质量 评价 选取了7种倍频带载波,每种载波对应2中调制频率125Hz250Hz500Hz1KHz2KHz4KHz8KHz1.0Hz1.0Hz0.63Hz2.0Hz1.25Hz0.8Hz2.5Hz5.0Hz5.0Hz3.15Hz1.0Hz6.25Hz4.0Hz12.5Hzv 公共广播系统工程技术规范v STIPA作为评价公共广播语言传输质量的重要

8、指标分类STIPA分类STIPA业务广播 (一级)0.55紧急广播 (一级)0.55业务广播 (二级)0.45 紧急广播 (二级)0.45业务广播 (三级)0.35 紧急广播 (三级)0.402.混响作用下STIPA与汉语汉语 清晰度的关 系v 对对于“声韵调调”结结构语语言汉语汉语 ,情况是怎样样的?v 目的:在实验室条件下对无噪声纯混响作用下STI-PA与普通话单音节清晰度之间的关系进行实验研究。以期对搞清楚在纯混响作用下普通话单音节清晰度与语言传输指数STI-PA的具体关系有所贡献和帮助。对汉语语 音清晰度客观评测 方法的发展有着积极的意义。实验实验 方法v 实验室录音、模拟测试 的方法

9、 v 参照声学 语言清晰度测试方法GB-T 15508-1995v 混响时间:0.5 s6.0 s,步长0.5 s,共12种混响条件; v 发音人2名,听音人11名;声场中心声压级65dBA; v 中、后音节受混响作用更明显;实验结实验结 果v 混响时间与清晰度、STIPA的关系v STIPA与普通话单音节清晰度的关系v 在实验结 果的基础上归纳导出了STI-PA与普通话单音节 清晰度之间的关系,此关系对制定扩声系统的STI-PA指 标具有实用意义。v 实验结 果也揭示出汉语普通话单音节清晰度受混响的影 响与英语清晰度受混响的影响程度有明显的不同。启示我 们在实际工程应用中,在涉及到普通话语音

10、清晰度的评 测问题时 ,对直接引用已有的国际标准或基于外语的研 究结果要十分慎重。3.噪声条件下STIPA与汉语汉语 清晰度的关 系v 在实验室条件下分析了不同频带范围、不同信噪比的噪 声环境下语音清晰度、STI-PA与信噪比的关系,并根据 单音节清晰度与语言可懂度的关系,估计了在满足一定 可懂度条件下的最低信噪比及相应的STI-PA。v 实验室录音、模拟测试 的方法v 参照声学 语言清晰度测试方法GB-T 15508-1995v 采用了全频带白噪声和中心频率为250Hz,500Hz, 1KHZ,2KHz,4KHz,8KHz的倍频带噪声作为干扰噪声 ,各频带噪声分别设置45种信噪比。实验结实验

11、结 果v 1) 信噪比与清晰 度、STIPA的关 系(以白噪声为例)v 2) 等清晰 度曲线v 不同的噪声 条件可能有 着相同清晰 度水平v 工作是在实验室条件下进行的,考虑到实际的应用情况 ,可能还有一些不完善的地方,比如房间冲击响应的结 构是否会对STI-PA与清晰度的关系有明显的影响还需要 探讨。实际环 境中的噪声种类多样,频率范围丰富,由 于条件限制无法一一进行测试。每个频带噪声的信噪比 取值区间可以更加细致以获得更为全面的结果。另外本 次实验只是在65dBA(标准说话声压级)的噪声水平下进 行的,其它噪声水平下的语言清晰度和STI-PA、信噪比的 关系是否同本次实验结 果一致还需要进一步的研究。4. 展望STI for Chinese?STI%ALconAI主观 测试LOGO

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号