掩蔽效应的基本概念

上传人:mg****85 文档编号:45678237 上传时间:2018-06-18 格式:PDF 页数:7 大小:206.67KB
返回 下载 相关 举报
掩蔽效应的基本概念_第1页
第1页 / 共7页
掩蔽效应的基本概念_第2页
第2页 / 共7页
掩蔽效应的基本概念_第3页
第3页 / 共7页
掩蔽效应的基本概念_第4页
第4页 / 共7页
掩蔽效应的基本概念_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《掩蔽效应的基本概念》由会员分享,可在线阅读,更多相关《掩蔽效应的基本概念(7页珍藏版)》请在金锄头文库上搜索。

1、掩蔽效应百科名片百科名片同步掩蔽同步掩蔽(英文名称: Masking Effects,也称为声响掩蔽) ,要描述同步掩蔽效应,最好是通过一个类比。想象一只在太阳前面飞翔的小鸟。你看到小鸟从左边飞到你和太阳之间, 然后小鸟消失,因为太阳光线的亮度太高。当小鸟移出太阳区域,你就又能看到它了。就像在一个安静的环境中, 吉他手的手指轻轻滑过琴弦的响声都能听到, 但如果同样的响声在一个正在播放摇滚乐曲的环境中,一般人就听不到了。目录目录同步掩蔽的定义1 听觉的掩蔽效应综述1 频域掩蔽1 时域掩蔽1 时间掩蔽1 固定比特率和可变比特率1 视觉的掩蔽效应空间域中的掩蔽效应1 时间域中掩蔽效应1 彩色的掩蔽效

2、应人耳的掩蔽效应展开编辑本段同步掩蔽的定义同步掩蔽的定义Mp3编解码器只关心频率之间和音量之间的相互关系。 用 mp3编解码器能够处理的方式描述同步掩蔽如下:你有个声音信号,是个1000赫兹的正弦波:(一),然后我们再来一个1100赫兹的正弦波。(二) ,正弦波二比较弱,-10db。大多数人在这种情况下感知不到正弦波二的存在。但是正弦波二之所以不容易被感知,不仅因为它比较弱,而且还因为它的频率和正弦波一十分接近。为了说明这个现象,我们逐渐增加第二个正弦波的频率,但保持它的音量不变,直到我们能听到它。假定它的频率增加到4000赫兹的时候我们就能听到这个声音了。 当两个正弦波的频率差别逐渐变大,第

3、二个正弦波逐渐可以听得到,直到它的频率增高到某一点之后,绝大多数人都可以听到两个互不相同的音调了,一个比较大声,另一个比较小声。这个过程就是心理声学所说的“同步掩蔽”现象。两个频率相近,但是音量相差很多的声音,很难被人类感知为两个不同的声音。考虑到这种现象,mp3在编码过程中尽量丢弃那些无法被感知的声音,或者分配尽可能少的比特给这些声音。编辑本段听觉的掩蔽效应听觉的掩蔽效应综述综述掩蔽效应指人的耳朵只对最明显的声音反应敏感,而对于不敏感的声音,反应则较不为敏感。例如在声音的整个频率谱中,如果某一个频率段的声音比较强,则人就对其它频率段的声音不敏感了。 应用此原理, 人们发明了 mp3等压缩的数

4、字音乐格式,在这些格式的文件里,只突出记录了人耳朵较为敏感的中频段声音,而对于较高和较低的频率的声音则简略记录,从而大大压缩了所需的存储空间。在人们欣赏音乐时,如果设备对高频响应得比较好,则会使人感到低频响应不好,反之亦然。一种频率的声音阻碍听觉系统感受另一种频率的声音的现象称为掩蔽效应。前者称为掩蔽声音(maskingtone),后者称为被掩蔽声音(maskedtone)。掩蔽可分成频域掩蔽和时域掩蔽。频域掩蔽频域掩蔽一个强纯音会掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽,也称同时掩蔽(simultaneousmasking),如图12-03所示。从图12-03可以看到,声音频率在3

5、00Hz 附近、声强约为60dB 的声音掩蔽了声音频率在150Hz 附近、声强约为40db的声音。又如,一个声强为60dB、频率为1000Hz 的纯音,另外还有一个1100Hz 的纯音, 前者比后者高18dB, 在这种情况下我们的耳朵就只能听到那个1000Hz 的强音。如果有一个1000Hz 的纯音和一个声强比它低18dB 的2000Hz 的纯音,那么我们的耳朵将会同时听到这两个声音。要想让2000Hz 的纯音也听不到,则需要把它降到比1000Hz 的纯音低45dB。一般来说,弱纯音离强纯音越近就越容易被掩蔽。一组曲线分别表示频率为250Hz, 1kHz 和4kHz 纯音的掩蔽效应, 它们的声

6、强均为60dB。从图14-04中可以看到:在250Hz,1kHz 和4kHz 纯音附近,对其他纯音的掩蔽效果最明显,低频纯音可以有效地掩蔽高频纯音,但高频纯音对低频纯音的掩蔽作用则不明显。由于声音频率与掩蔽曲线不是线性关系,为从感知上来统一度量声音频率,引入了“临界频带(criticalband)”的概念。通常认为,在20Hz 到16kHz 范围内有24个临界频带,如表12-01所示。临界频带的单位叫 Bark(巴克),1Bark=一个临界频带的宽度。f(频率)500Hz 的情况下,1Bark9+4log(f/1000)。以上我们讨论了响度、音高和掩蔽效应,尤其是人的主观感觉。其中掩蔽效应尤为

7、重要,它是心理声学模型的基础。表12-01 临界频带16临界频带 频率 (Hz) 临界频带 频率 (Hz)低端 高端 宽度 低端 高端 宽度0 0 100 100 13 2000 2320 3201 100200 100 14 2320 2700 3802 200 300 100 15 2700 3150 4503 300 400100 16 3150 3700 5504 400 510 110 17 3700 4400 7005 510 630 12018 4400 5300 9006 630 770 140 19 5300 6400 11007 770 920 150 206400 770

8、0 13008 920 1080 160 21 7700 9500 18009 1080 1270 190 229500 12000 250010 1270 1480 210 23 12000 15500 350011 1480 1720240 24 15500 22050 655012 1720 2000 280时域掩蔽时域掩蔽除了同时发出的声音之间有掩蔽现象之外,在时间上相邻的声音之间也有掩蔽现象 , 并 且 称 为 时 域 掩 蔽 。 时 域 掩 蔽 又 分 为 超 前 掩 蔽(pre-masking)和 滞 后 掩 蔽(post-masking),如图12-05所示。产生时域掩蔽的主要

9、原因是人的大脑处理信息需要花费一定的时间。一般来说,超前掩蔽很短,只有大约520ms,而滞后掩蔽可以持续50200ms。这个区别也是很容易理解的。时间掩蔽时间掩蔽同步掩蔽效应和不同频率声音的频率和相对音量有关,时间掩蔽则仅仅和时间有关。如果两个声音在时间上特别接近,人类在分辨它们的时候也会有困难。例如如果一个很响的声音后面紧跟着一个很弱的声音,后一个声音就很难听到。但是如果在第一个声音停止后过一段时间再播放第二个声音,后一个声音就可以听到。到底应该间隔多长时间?对纯音一般来讲是5毫秒。当然如果在时序上反过来效果是一样的,如果一个较低的声音出现在一个较高的声音之前而且间隔很短,那个较低的声音你也

10、听不到。JPEG 压缩可以明确控制压缩中的信息丢弃比率,但 Mp3用户不能。可是 mp3用户可以指定每一秒的音乐是用多少个 bit 来存储。最终效果相同。编码过程中,信号中的“无用分量”被拿来和人类心理声学的数学模型,以及压缩使用的彼特率作比较, 以决定要扔掉哪些数据。 当前 mp3压缩使用的比特率一般是128kbps。编码器在输出每一帧数据的时候都会考虑到这个数字,如果比特率比较低,那么 “无关”和“冗余”数据的定义就会被放宽,导致大量的数据被认为是无用数据,此时压缩后的音频会丢失大量细节,导致音质下降。相反,如果使用较高的比特率编码, “无关”和“冗余”的标准就会被限定的更严格,细节会被保

11、留,但是文件更大。注意,mp3文件的比特率指的是所有被编码声道的总比特率。也就是说一个128kbps 立体声mp3文件,和两个同样时间的64kbps 的单声道 mp3文件加起来的大小相同。但是一个128kbps 立体声文件达到的音效,比两个单独的单声道64kbps 文件所达到的音质要好。因为在一个立体声 mp3文件中,所有的 bit 可以被按照需求(不平均地)分配给两个声道, 比如某一个时刻, 一个声道使用其中60%的比特, 另外一个使用剩下40%的比特,只不过总比特数不会超过编码前指定的比特率参数。固定比特率和可变比特率固定比特率和可变比特率我们假定这里讨论的 mp3编码使用的是固定比特率的

12、编码方式, 也就是说编码产生的文件在任何一个时间段内输出的比特率都是你指定的那个数值。固定比特率编码的缺点是,绝大部分声音文件中的信息量并不是固定不变的。使用乐器较多,或者有很多人同时说话的音频片断中,信息量就大,反之就小:类似这样影响音频文件信息量的因素还有很多。可变比特率编码就是为了适应音频文件的这一特点开发的。可变比特率编码,会根据音频数据的动态特性随时调整编码使用的比特率。多数情况下,可变比特率编码能用更小的文件达到和固定比特率编码基本相同的音质。但是可变比特率编码也有其自身的缺点。首先,一些比较古老的播放器根本支持对可变比特率 mp3文件的解码,不能播放这样的文件。第二,解码器播放可

13、变比特率mp3的时候无法确定当前解码(播放)到了什么位置,播放器上显示的“当前播放时间”是不准的。对一个固定比特率压缩的 mp3文件来说,每一帧的头部中的信息都是相同的,但是对可变比特率 mp3编码来说就不是。但是解码的时候,可变比特率编码并不比固定比特率的文件需要更多的计算能力, 因为 mp3解码器即使在播放固定比特率的 mp3文件的时候也要读取全部的帧头部。编码过程中输出任何一帧的时候都必须考虑到,不能超过指定的比特率。由于声音数据的复杂,经常会看到一些帧的数据,不能在满足指定的比特率的前提下,同时达到既定的声音质量。对这样的情况,Mp3标准允许编码器“拆东墙补西墙”,也就是把这一帧里放不

14、下的数据,放到另外一些数据较少、因而有剩余空间的帧内。注意多出来的空间,是别的帧里多出来的富余空间,而不是特别开辟出来的额外空间。编辑本段视觉的掩蔽效应视觉的掩蔽效应空间域中的掩蔽效应空间域中的掩蔽效应视觉的大小不仅与邻近区域的平均亮度有关,还与邻近区域的亮度在空间上的变化(不均匀性)有关。假设将一个光点放在亮度不均匀的背景上,通过改变光点的亮度测试此时的视觉,人们发现,背景亮度变化越剧烈,视觉越高,即人眼的对比度灵敏度越低。这种现象称为空间域中的视觉的掩蔽效应(Masking) 。时间域中掩蔽效应时间域中掩蔽效应影响时间域中掩蔽效应的因素比较复杂,对它的研究还处于初始阶段。这里仅介绍一些实验

15、结果,这些结果可能在数据压缩方面具有潜在的应用价值。实验表明,当电视图像序列中相邻画面的变化剧烈(例如场景切换)时,人眼的分辨力会突然剧烈下降,例如下降到原有分辨力的1/10。也就是说,当新场景突然出现时,人基本上看不清新景物,在大约0.5秒之后,视力才会逐渐恢复到正常水平。显然,在这0.5秒内,传送分辨率很高的图像是没有必要的。研究者还发现,当眼球跟着画面中的运动物体转动时,人眼的分辨率要高于不跟着物体转动的情况。而通常在看电视时,眼睛是很难跟踪运动中的物体的。彩色的掩蔽效应彩色的掩蔽效应在亮度变化剧烈的背景上,例如在黑白跳变的边沿上,人眼对色彩变化的敏感程度明显地降低。类似地,在亮度变化剧

16、烈的背景上,人眼对彩色信号的噪声(例如彩色信号的量化噪声)也不易察觉。这些都体现了亮度信号对彩色信号的掩蔽效应。编辑本段人耳的掩蔽效应人耳的掩蔽效应一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响的现象称为人耳的“掩蔽效应”。 人耳的掩蔽效应 一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响的现象称为人耳的“掩蔽效应”。被掩蔽音单独存在时的听阈分贝值,或者说在安静环境中能被人耳听到的纯音的最小值称为绝对闻阈。实验表明,3kHz5kHz 绝对闻阈值最小,即人耳对它的微弱声音最敏感;而在低频和高频区绝对闻阈值要大得多。在800Hz-1500Hz 范围内闻阈随频率变化最不显著, 即在这个范围内语言可储度最高。在掩蔽情况下,提高被掩蔽弱音的强度,使人耳能够听见时的闻阈称为掩蔽闻阈(或称掩蔽门限),被掩蔽弱音必须提高的分贝值称为掩蔽量(或称阈移)。1掩蔽效应 已有实验表明,纯音对纯音、噪音对纯音的掩蔽效应结论如下: A.纯音间的掩蔽 对处于中等强度时的纯音最有效的掩蔽是出现在它的频率附近。 低频的纯音可以有效地掩蔽高频的纯音, 而反

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号