扩声系统语言清晰度的测量

资源描述

《扩声系统语言清晰度的测量》由会员分享，可在线阅读，更多相关《扩声系统语言清晰度的测量（10页珍藏版）》请在金锄头文库上搜索。

1、扩声系统语言清晰度的测量著：Morten Jorgensen美国BOSE公司扬声器开发、声学部门经理用户希望自己的扩声系统能够满足多种使用需求；声音均匀覆盖全部区域；便于操作并且维护简单，其中最重要的评价标准有以下几点：1. 用户希望扩声系统有正确的高频、中频、低频比例即“音色平衡”。2. 扩声系统播放声音的响度要合适，既不能太响也不能太轻。3. 大多数场合，用户希望扩声系统的声音来自正确的方向活动正在进行的方向。比如说，演讲者在主席台发言时，声音来自于主席台方向，肯定比来自于观众头顶要自然的多。4. 扩声系统播放清晰透彻的音乐和语言声音，没人希望得到乐器音色被染色或者语言很难理解的扩

2、声系统。5. 另外，用户希望扩声系统要足够稳定可靠，经过长时间使用，性能不会下降、也不需要维护。万一出现故障，得到的服务是及时并且价格实惠的。关于扩声系统质量评价的各种标准中，语言清晰度无疑是最重要的。实际上，优良的语言清晰度是所有扩声系统设计的最基本原则。发生紧急情况时，使用扩声系统通知群众，如果语音信号恰恰模糊难懂，这个扩声系统根本就是设计失败的。因此，语言清晰度已经被列入欧洲和北美洲的一些强制标准和规范中，并且逐步扩展到全球领域的 IEC 标准中。三十年前，如果您做一个调查，询问大众：“您认为公众场所的扩声系统的声音质量怎么样？”大家会回答“不理想”。糟糕的是，即使在今天，您做

3、同样的调查，得到的答案仍然相同。本人就做过这种调查，并且有亲身经历：在美国拉斯韦加斯机场这样的国际级机场，扩声系统的声音质量也令人难以接受。这里引出一个问题：三十年前公众场所的声音质量令人不满意，如今改观不大，那么三十年以后的结果难道同样让人失望吗？究竟什么原因导致这种情况发生？人类已经登上月球，微处理技术日新月异，话筒、扬声器等不断有新产品诞生然而，公共场所扩声系统的语言清晰度却没有大的改观。现实情况是，过去的五十年间，科学家和工程师们付出了极大的努力研究这一课题，发展了预测语言清晰度的理论，开发了能在系统安装前甚至是建筑建成前就可以预估语言清晰度的软件程序，这些理论和工具都得到

4、了广泛应用。但是，语言清晰度仍然不理想，为什么？答案其实很简单，如果没有一种简便而精确的手段去测量，我们就无法得到想要的东西。目前为止，测量语言清晰度的方式仍然非常复杂和昂贵，按照标准理论精确测量 1 个位置的 STI值需要15分钟的时间和一名专家，而这仅仅是一个位置！这就是很少进行语言清晰度测量的原因。工程上，我们称这种测量方式为“开环Open Loop”程序。这就是今天我们面临的现状。图1实生活中类似的例子还很多。那么在我们关心的扩声领域怎么样呢？举个例子：法律规定了汽车在公路行驶最高时速限制，例如 75 公里/小时。每辆汽车都有一个简单、快速、有效，当然也不贵的时速表测量时速，

5、每名司机随时都知道自己是否违规。非常简单！我们还有警察，他们也有简单、快速、有效，当然也不贵的方法测量时速使用测速雷达，他们确保法律被执行！如果你开得过快，警察使用测速雷达抓到你，他们会给你开一张罚单。如果你屡犯不改，警察会吊销你的执照并课以更高的罚款，甚至把你关进监狱。整个程序工作得非常完美：规定测量强制执行。现世界上各种标准和规定中设定了语言清晰度的最小值，一般STI最低值为0.5。但是测量既昂贵又复杂，强制执行几乎是不可能的。我们总是期望有更好语言清晰度的系统，但是我们无法测量，我们又如何知道是否达到自己的预期呢？更别提改进了！这就是答案：为什么大家都意识到语言清晰度是

6、扩声系统最重要的质量标准，却依旧不断成为人们抱怨最多的焦点。下面让我们分三个步骤来讨论提高语言清晰度的程序：首先，更加深入的研究语言清晰度的理论知识，什么是语言清晰度？影响因素有哪些？如何测量？其次，使用设计工具，在建筑还未完成、扩声系统还未安装前，预估整个系统的语言清晰度，预估系统完成后听到的效果。最后，完成整个“环路” Close the loop。系统安装完成后，使用测量工具验证设计的有效性, 如果出现偏差，则进行调试。语言清晰度不是安培、伏特之类的物理量，它测量的是人们理解语言程度的百分比，受到很多复杂因素的影响。它经常表示为“%可正确理解的词语”，所以80%的语言清晰度表示1

7、0个词语中可以理解8 个。值得注意的是，足够的音量对于好的语言清晰度是必要条件，但不是充分条件。如同在字迹模糊的手稿上增加更多的灯光，并不能使文字更清楚一样，在一个充满过度混响、延时和失真的系统中，增加音量并不能使语言更清晰。图 2 显示了声音从讲话者到达聆听者的流程。图2混响延时假定为一般水平假定为一般水平IS在一个语言清晰度很理想的系统中，说话者发出的所有信息都能被听众收到并理解。然而，实际信号传输途中，有太多的因素造成清晰度下降。例如，话筒带宽有限，或是失真改变了信号；调音台发生削波；房间内混响时间过长，或是背景噪音太大总之，测量语言清晰度时，必须把从说话者到听众之间的所

8、有影响因素都考虑进去。传统的语言清晰度测量方式是怎样的呢？是采用真人测试。在安装了扩声系统的真实房间内，受测者将听到一系列标准化的词语，受测者写下听到的词语或在表格上打勾选择。对每个人记录的内容进行统计打分，最后结果以%可正确理解的词语的形式表示。实际上这种测试非常难以实现，太复杂、太昂贵了！首先，需要很多测试人员，一两个人是不具代表性的。另外，要听上百个词语，以确保结果的准确度。既然真人测试不现实，研究人员从上世纪中叶开始，就致力于开发通过测量声学指标来测试语言清晰度的理论和工具。过去几年来，多种测试理论被提出， AI(Articulation Index)、RASTI、STI 就是

9、其中一些。STI(Speech Transmission Index)理论是当今世界上广泛应用的测量和预测语言清晰度的标准，被列入了很多标准规范，并且许多仪器都可以测量STIo STI取值范围从0到1, 0表示完全不能听懂， 1 表示全部可以理解。影响语言清晰度的因素有背景噪声、混响、延时、系统带宽、失真、说话人讲话能力和听众听力理解力等等。STI理论作为语言清晰度测量的工业标准，正确考虑了从讲话者到听众之间的所有影响因素。让我们详细来看一看。图3语音信号的分解（可分解成两种频谱信号）任意语言信号可以看成由两种频谱组成（如图3）,首先是可听域频谱（如图3.b）我们能够听到的声音的频谱

10、，常用到的可听域频谱频率范围很宽，从100Hz至10KHZ，可以用中心频率从 125Hz-8KHz的7个倍频程表示。可听域频谱并不是平坦的，中低频的能量多一些。语言并不仅仅是由不同频率的声音组成，我们所听到的语言是以“词”或“字”的形式组合成的语句，我们称这些“词”或“字”为“音素”。我们发出这些“音素”的频率要远低于可听域频率一一每秒钟我们只能说几个字或词，因此该频率只有几赫兹。我们听到的人类语言，转化成数学模型可以表示成：以“音素”去调制宽范围的可听域频率。而发出“音素”的频率即调制频率可以用0.63-16HZ的14 个1/3倍频程的中心频率代表（如图3.c）。调制频率也不是平坦的

11、，因为我们更常以中等速度讲话。现在，我们可以利用这两个频谱的信号组成人工测试信号，这个测试信号与人类语言信号有相同的特性。被调制的可听域频谱采用125Hz-8KHz的7个倍频程的噪声信号，每个倍频程的电平与真实语言能量分布相同。随后以14个调制频率逐个调制7个可听域频谱，把调制后98种信号组合起来得到标准测试信号。初始调制信号传输过程各种影响因素损失后的信号M信传输中失从讲话者到听众之间的传输途径中，有很多种因素会降低语言清晰度，对于测试信号来讲，影响因素会减少原始信号调制的量，通过测量调制信号损失的情况，即可了解语言清晰度损失的情况。（请参考图4调制信号传输过程中的损失这是STI测

12、试的关键，在一个理想的系统里，输入端的标准测试信号可以无损失的在听众端接收到。让我们来看一下，其中几个因素是如何影响语言清晰度的。背景噪声图 5 为一段背景噪声信号。讲话者至听众之间的背景噪声填充了原始信号的部分低谷，测量接收端调制信号的损失就可以得到背景噪声对语言的影响。图5 调制信号受背景噪声影响的情况信噪比STIANSI评价-6 dB0.3242%0 dB0.5087%6 dB0.7295%oo1.00100%表一图六名字表一为不同信噪比情况下，STI与百分比可懂度之间的对应关系。中也做应修改表二为不同混响时间情况下，STI与百分比可懂度之T60STIANSI评价5.20.355

13、1%2.60.5087%1.70.5888%0.90.7295%0.60.8398%间的对应关系。表二混响时间图 6 为房间内脉冲信号随时间衰减的曲线，信号不是突然消失，而是依混响时间曲线衰减（如图 6.a）。我们可以把调制信号看成是由一系列脉冲信号组成的（如图6.b），每一个脉冲信号都依混响时间曲线衰减，衰减曲线填充了部分低谷（如图6.d）。混响总的影响是填充了低谷，从而造成调制损失。回声回声是迟达的强能量反射声，几乎是原有信号的拷贝并延迟一段时间（如图7.b），它同样会起到延时时间STIANSI评价150ms0.6351%100ms0.6887%80ms0.7188%60ms0.72

14、95%30ms1.098%表三填充低谷、改变调制信号包络的作用（如图 7.c）。表三为不同延迟时间情况下， STI 与百分比可懂度之间的对应关系。以上我们讨论了什么是语言清晰度、如何进行测量、主要的影响因素、以及最通用的测试理论STI。下面介绍几种计算机设计工具，可以预测包括语言清晰度在内的主要声学指标。现今，已经开发出几种计算机模型设计工具，用来设计声学系统，以达到一定程度的语言清晰度。其中有EASE和ODEON软件，当然还有BOSE Modeler电脑声学设计软件。这些软件通过使用房间的建筑图纸，在电脑中建立房间的三维模型，根据实际情况选择每个表面的建筑材料，然后将扬声器放入模型

15、内，来预估主要的声学指标如声压级、语言清晰度等等。10年前，技术又有了新的发展。建筑设计师通过眼睛来判断建筑的视觉效果如何，同样，声学设计顾问，当然还有业主，如果能在房间还未建成前或决定购买前，使用自己的听觉来判断扩声系统的声音效果，那是多么自然而又令人开心的事。今天，电脑语音模拟试听系统使其成为现实。该系统同样首先在电脑中建立声学模型并放置扬声器，然后电脑语音模拟试听系统允许您“跳”入模型中，任意挑选一个座位，聆听扩声系统在房间内的表现是怎样的。目前为止，出现了几种模拟系统，据我所知，只有一种是经过科学验证，并被证明是准确的。在你决定使用一套系统之前，您当然应该了解所使用的模拟系统准确度如何。在您购买汽车之前，您一定会试驾一下。那么，为什么不在购买或安装扩声系统之前，听一听它的效果呢？既然可以在房间建成音响安装之前，就可以聆听日后的实际效果，为何还要冒险选择一套达不到您要求的系统呢？接下来，让我来介绍最先进的测量技术，是我们确保能够提高公众场所扩声系统的语言清晰度水平。前面已经讨论过，如果我们想最终提高语言清晰度，我们就一定需要一种快速、准确、便捷的测量手段。

展开阅读全文