扩声系统语言清晰度的测量

上传人:re****.1 文档编号:562138849 上传时间:2022-12-06 格式:DOCX 页数:10 大小:357.25KB
返回 下载 相关 举报
扩声系统语言清晰度的测量_第1页
第1页 / 共10页
扩声系统语言清晰度的测量_第2页
第2页 / 共10页
扩声系统语言清晰度的测量_第3页
第3页 / 共10页
扩声系统语言清晰度的测量_第4页
第4页 / 共10页
扩声系统语言清晰度的测量_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《扩声系统语言清晰度的测量》由会员分享,可在线阅读,更多相关《扩声系统语言清晰度的测量(10页珍藏版)》请在金锄头文库上搜索。

1、扩声系统语言清晰度的测量著:Morten Jorgensen美国BOSE公司扬声器开发、声学部门 经理用户希望自己的扩声系统能够满足多种使用需求;声音均匀覆盖全部区域;便于操作并且维护 简单,其中最重要的评价标准有以下几点:1. 用户希望扩声系统有正确的高频、中频、低频比例即“音色平衡”。2. 扩声系统播放声音的响度要合适,既不能太响也不能太轻。3. 大多数场合,用户希望扩声系统的声音来自正确的方向活动正在进行的方向。比如说, 演讲者在主席台发言时,声音来自于主席台方向,肯定比来自于观众头顶要自然的多。4. 扩声系统播放清晰透彻的音乐和语言声音,没人希望得到乐器音色被染色或者语言很难理解 的扩

2、声系统。5. 另外,用户希望扩声系统要足够稳定可靠,经过长时间使用,性能不会下降、也不需要维 护。万一出现故障,得到的服务是及时并且价格实惠的。关于扩声系统质量评价的各种标准中,语言清晰度无疑是最重要的。实际上,优良的语言清晰 度是所有扩声系统设计的最基本原则。发生紧急情况时,使用扩声系统通知群众,如果语音信号恰 恰模糊难懂,这个扩声系统根本就是设计失败的。因此,语言清晰度已经被列入欧洲和北美洲的一 些强制标准和规范中,并且逐步扩展到全球领域的 IEC 标准中。三十年前,如果您做一个调查,询问大众:“您认为公众场所的扩声系统的声音质量怎么 样?”大家会回答“不理想”。糟糕的是,即使在今天,您做

3、同样的调查,得到的答案仍然相同。 本人就做过这种调查,并且有亲身经历:在美国拉斯韦加斯机场这样的国际级机场,扩声系统的声 音质量也令人难以接受。这里引出一个问题:三十年前公众场所的声音质量令人不满意,如今改观不大,那么三十年以 后的结果难道同样让人失望吗?究竟什么原因导致这种情况发生?人类已经登上月球,微处理技术日新月异,话筒、扬声器等不断有新产品诞生然而,公共 场所扩声系统的语言清晰度却没有大的改观。现实情况是,过去的五十年间,科学家和工程师们付出了极大的努力研究这一课题,发展了预 测语言清晰度的理论,开发了能在系统安装前甚至是建筑建成前就可以预估语言清晰度的 软件程序,这些理论和工具都得到

4、了广泛应用。但是,语言清晰度仍然不理想,为什么?答案其实很简单,如果没有一种简便而精确的手段去测量,我们就无法得到想要的东西。 目前为止,测量语言清晰度的方式仍然非常复杂和昂贵,按照标准理论精确测量 1 个位置的 STI值需要15分钟的时间和一名专家,而这仅仅是一个位置!这就是很少进行语言清晰度测量的原 因。工程上,我们称这种测量方式为“开环Open Loop”程序。这就是今天我们面临的现状。图1实生活中类似的例子还很多。那么在我们关心的扩声领域怎么样呢?举个例子:法律规定了汽车在公路行驶最高 时速限制,例如 75 公里/小时。每辆汽车都有一 个简单、快速、有效,当然也不贵的时速表测量 时速,

5、每名司机随时都知道自己是否违规。非常 简单!我们还有警察,他们也有简单、快速、有 效,当然也不贵的方法测量时速使用测速雷 达,他们确保法律被执行!如果你开得过快,警 察使用测速雷达抓到你,他们会给你开一张罚 单。如果你屡犯不改,警察会吊销你的执照并课 以更高的罚款,甚至把你关进监狱。整个程序工 作得非常完美:规定测量强制执行。现世界上各种标准和规定中设定了语言清晰度的最小值,一般STI最低值为0.5。但是测量既昂 贵又复杂,强制执行几乎是不可能的。我们总是期望有更好语言清晰度的系统,但是我们无法测 量,我们又如何知道是否达到自己的预期呢?更别提改进了!这就是答案:为什么大家都意识到语言清晰度是

6、扩声系统最重要的质量标准,却依旧不断成为 人们抱怨最多的焦点。下面让我们分三个步骤来讨论提高语言清晰度的程序:首先,更加深入的研究语言清晰度的理论知识,什么是语言清晰度?影响因素有哪些?如何测 量?其次,使用设计工具,在建筑还未完成、扩声系统还未安装前,预估整个系统的语言清晰度, 预估系统完成后听到的效果。最后,完成整个“环路” Close the loop。系统安装完成后,使用测量工具验证设计的有效性, 如果出现偏差,则进行调试。语言清晰度不是安培、伏特之类的物理量,它测量的是人们理解语言程度的百分比,受到很多 复杂因素的影响。它经常表示为“%可正确理解的词语”,所以80%的语言清晰度表示1

7、0个词语中可以理解8 个。值得注意的是,足够的音量对于好的语言清晰度是必要条件,但不是充分条件。如同在字迹模 糊的手稿上增加更多的灯光,并不能使文字更清楚一样,在一个充满过度混响、延时和失真的系统 中,增加音量并不能使语言更清晰。图 2 显示了声音从讲话者到达聆听者的流程。图2混响 延时假定为 一般水平假定为 一般水平IS在一个语言清晰度很理想的系统中,说话者发出的所有信息都能被听众收到并理解。然而,实 际信号传输途中,有太多的因素造成清晰度下降。例如,话筒带宽有限,或是失真改变了信号;调 音台发生削波;房间内混响时间过长,或是背景噪音太大总之,测量语言清晰度时,必须把从 说话者到听众之间的所

8、有影响因素都考虑进去。传统的语言清晰度测量方式是怎样的呢?是采用真人测试。在安装了扩声系统的真实房间内, 受测者将听到一系列标准化的词语,受测者写下听到的词语或在表格上打勾选择。对每个人记录的 内容进行统计打分,最后结果以%可正确理解的词语的形式表示。实际上这种测试非常难以实现,太复杂、太昂贵了!首先,需要很多测试人员,一两个人是不 具代表性的。另外,要听上百个词语,以确保结果的准确度。既然真人测试不现实,研究人员从上世纪中叶开始,就致力于开发通过测量声学指标来测试语 言清晰度的理论和工具。过去几年来,多种测试理论被提出, AI(Articulation Index)、RASTI、STI 就是

9、其中一些。STI(Speech Transmission Index)理论是当今世界上广泛应用的测量和预测语言清晰 度的标准,被列入了很多标准规范,并且许多仪器都可以测量STIo STI取值范围从0到1, 0表示 完全不能听懂, 1 表示全部可以理解。影响语言清晰度的因素有背景噪声、混响、延时、系统带宽、失真、说话人讲话能力和听众听 力理解力等等。STI理论作为语言清晰度测量的工业标准,正确考虑了从讲话者到听众之间的所有 影响因素。让我们详细来看一看。图3语音信号的分解(可分解成两种频谱信号)任意语言信号可以看成由两种频谱组成(如图3),首先是可听域频谱(如图3.b)我们能够听 到的声音的频谱

10、,常用到的可听域频谱频率范围很宽,从100Hz至10KHZ,可以用中心频率从 125Hz-8KHz的7个倍频程表示。可听域频谱并不是平坦的,中低频的能量多一些。语言并不仅仅 是由不同频率的声音组成,我们所听到的语言是以“词”或“字”的形式组合成的语句,我们称这 些“词”或“字”为“音素”。我们发出这些“音素”的频率要远低于可听域频率一一每秒钟我们 只能说几个字或词,因此该频率只有几赫兹。我们听到的人类语言,转化成数学模型可以表示成: 以“音素”去调制宽范围的可听域频率。而发出“音素”的频率即调制频率可以用0.63-16HZ的14 个1/3倍频程的中心频率代表(如图3.c)。调制频率也不是平坦的

11、,因为我们更常以中等速度讲话。现在,我们可以利用这两个频谱的信号组成人工测试信号,这个测试信号与人类语言信号有相 同的特性。被调制的可听域频谱采用125Hz-8KHz的7个倍频程的噪声信号,每个倍频程的电平与 真实语言能量分布相同。随后以14个调制频率逐个调制7个可听域频谱,把调制后98种信号组合 起来得到标准测试信号。初始调制信号传输过程各种影响因素损失后的信号M信传输中失从讲话者到听众之间的传输途径中,有很多种因素会降低语言清晰度,对于测试信号来讲,影 响因素会减少原始信号调制的量,通过测量调制信号损失的情况,即可了解语言清晰度损失的情 况。(请参考图4调制信号传输过程中的损失这是STI测

12、试的关键,在一个理想的系统里,输入端的 标准测试信号可以无损失的在听众端接收到。让我们来看一下,其中几个因素是如何影响语言清晰度的。背景噪声图 5 为一段背景噪声信号。讲话者至听众之间的 背景噪声填充了原始信号的部分低谷,测量接收端调 制信号的损失就可以得到背景噪声对语言的影响。图5 调制信号受背景噪声影响的情况信噪比STIANSI评价-6 dB0.3242%0 dB0.5087%6 dB0.7295%oo1.00100%表一图六名字表一为不同信噪比情况下,STI与百分比可懂度 之间的对应关系。中也做应修改表二为不同混响时间情况下,STI与百分比可懂度之T60STIANSI评价5.20.355

13、1%2.60.5087%1.70.5888%0.90.7295%0.60.8398%间的对应关系。表二混响时间图 6 为房间内脉冲信号随时间衰减的曲线,信号不 是突然消失,而是依混响时间曲线衰减(如图 6.a)。我们可以把调制信号看成是由一系列脉冲信号组成的(如图6.b),每一个脉冲信号都依混响时间曲线衰 减,衰减曲线填充了部分低谷(如图6.d)。混响总的影 响是填充了低谷,从而造成调制损失。回声回声是迟达的强能量反射声,几乎是原有信号的拷贝并延迟一段时间(如图7.b),它同样会起到延时时间STIANSI评价150ms0.6351%100ms0.6887%80ms0.7188%60ms0.72

14、95%30ms1.098%表三填充低谷、改变调制信号包络的作用(如图 7.c)。 表三为不同延迟时间情况下, STI 与百分比可懂度之间 的对应关系。以上我们讨论了什么是语言清晰度、如何进行测量、主要的影响因素、以及最通用的测试理论STI。下面介绍几种计算机设计工具,可以预测包括语言清晰度在内的主要声学指标。现今,已经开发出几种计算机模型设计工具,用来设计声学系统,以达到一定程度的语言清晰 度。其中有EASE和ODEON软件,当然还有BOSE Modeler电脑声学设计软件。这些软件通过使 用房间的建筑图纸,在电脑中建立房间的三维模型,根据实际情况选择每个表面的建筑材料,然后 将扬声器放入模型

15、内,来预估主要的声学指标如声压级、语言清晰度等等。10年前,技术又有了新的发展。建筑设计师通过眼睛来判断建筑的视觉效果如何,同样,声学 设计顾问,当然还有业主,如果能在房间还未建成前或决定购买前,使用自己的听觉来判断扩声系 统的声音效果,那是多么自然而又令人开心的事。今天,电脑语音模拟试听系统使其成为现实。该 系统同样首先在电脑中建立声学模型并放置扬声器,然后电脑语音模拟试听系统允许您“跳”入模 型中,任意挑选一个座位,聆听扩声系统在房间内的表现是怎样的。目前为止,出现了几种模拟系统,据我所知,只有一种是经过科学验证,并被证明是准确的。 在你决定使用一套系统之前,您当然应该了解所使用的模拟系统准确度如何。在您购买汽车之前, 您一定会试驾一下。那么,为什么不在购买或安装扩声系统之前,听一听它的效果呢?既然可以在 房间建成音响安装之前,就可以聆听日后的实际效果,为何还要冒险选择一套达不到您要求的系统 呢?接下来,让我来介绍最先进的测量技术,是我们确保能够提高公众场所扩声系统的语言清晰度 水平。前面已经讨论过,如果我们想最终提高语言清晰度,我们就一定需要一种快速、准确、便捷 的测量手段。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号