消费电子应用场合中的音效处理技术

资源描述

《消费电子应用场合中的音效处理技术》由会员分享，可在线阅读，更多相关《消费电子应用场合中的音效处理技术（16页珍藏版）》请在金锄头文库上搜索。

1、消费电子应用场合中的音效处理技术杨飞然杨军中国科学院声学研究所噪声与振动重点实验室中国科学院大学摘要：音效处理作为一种后处理技术, 极大的改善了消费电子产品中播放设备的音质。本文综述了消费电子领域常用的音效处理技术, 重点综述了人工混响、虚拟低音和扬声器以及房间的均衡。我们概述了当前文献中主要的算法, 指出每种算法的优点和问题, 以及实际工程应用面临的挑战。关键词：音效; 小型扬声器; 虚拟低音; 扬声器均衡; 人工混响; 作者简介：杨飞然, 男, 1982 年生, 副研究员, 主要研究方向自适应滤波及其在回声抵消、啸叫抑制和有源噪声控制中的应用, 麦克风阵列信号处理和虚拟环绕

2、声。作者简介：杨军, 男, (通信联系人) , 1968 年生, 研究员, 主要研究方向通信声学、三维音频系统、声信号处理、声场控制和非线性声学。收稿日期：2017-10-06基金：中国科学院战略性先导科技专项子课题“智能电视平台与服务支撑环境研制”, (XDA06040501) Audio Effects Techniques in Consumer Electronics ProductsYANG Feiran YANG Jun Key Laboratory of Noise and Vibration Research, Institute of Acoustics, Chinese A

3、cademy of Sciences; Abstract： The audio effects technique, as a post-processing method, has improved the sound quality significantly in the consumer electronics products. This paper briefly reviews the digital audio effects algorithms in the application of consumer electronics, and, specifically, th

4、e artificial reverberation, virtual bass, and the loudspeaker/room equalization methods are overviewed. We summary the main methods, and point out their advantages, potential problems, and the engineering challenges.Keyword： Audio effects; Small size loudspeaker; Virtual bass; Loudspeaker equalizati

5、on; Artificial reverberation; Received： 2017-10-061 引言音效处理是将声信号进行预处理后再送扬声器或耳机播放1。我们将音效技术分为补偿性音效和修饰性音效两种。修饰性音效是人为的制造原有音频中没有的效果或者加强原有的某种效果, 这类技术主要有人工混响2-25、变调、动态范围压缩26、智能音量控制和立体声增强等。补偿性音效是指通过信号处理手段补偿电声器件或重放环境的缺陷, 使其最终播放效果接近录制时期望值, 这类技术主要包括扬声器、耳机和房间均衡27-54、虚拟低音55-72、串音抵消72-76等。目前消费电子类产品的体积越来越小, 导致这些产品中

6、必须使用小尺寸的扬声器。但是小尺寸扬声器存在低音表现能力弱, 动态范围比较小以及频响曲线不平坦等一系列问题, 对应的解决方案是虚拟低音、动态范围控制和扬声器均衡等。另外, 为了使得重放声场更加开阔和真实, 添加人工混响和进行立体声增强也是常用的手段。2 音效处理关键技术综述2.1 人工混响混响是一个自然的声现象。在房间中, 从声源发出的声音经过房间的反射达到目标点的声音包括直达声、早期反射声和后期混响声。人工混响试图模拟一个实际房间的脉冲响应, 可以分为模拟混响器和数字混响器2。数字混响器具有便携、可重复和易编辑等优点获得了广泛的应用, 本文仅讨论数字混响器。Schroeder 提出了第一个人

7、工数字混响器3, 他采用梳状滤波器和全通滤波器搭建了混响器。Moorer 从两方面改进了 Schroeder 的工作4, 第一是在梳状滤波器中嵌入低通滤波器来模拟实际房间中高频的吸声系数大的特性, 第二是用镜像法确定反射声并利用 FIR 滤波器来实现。Moorer 给出的人工混响器结构如图 1 所示。图 1 中包括6 个嵌套了低通滤波器的梳状滤波器 C1C6和一个全通滤波器 A1。C i的传递函数见式 (1) 。其中 m 对应每个脉冲的延时, g 用来调整衰减, T (z) 是一个低通滤波器, 其传递函数为式 (2) 实际中通过合理设置 g1来模拟不同频率的不同衰减情况。全通滤波器 A1的传递

8、函数为式 (3) 。实践中发现, 全通滤波器的延时设置为 6 ms, 增益 g2设置为 0.7 可达到较好的性能。该人工混响器的缺点是回声密度不够大, 声音听起来比较硬, 有金属感, 参数的调节比较繁琐。这种算法也无法设定混响时间和频率之间的关系。然而它是第一个真正可用的人工混响器, 它被广泛的研究并且它与其他结构相结合得到了质量更好的人工混响器。文献5提出了一种改进的 Schroeder 混响器, 它有 4 个延迟线, 每个延时线后面连接一个低通滤波器模拟高频的衰减和一个全通滤波器来增加混响密度。文献6提出利用 10 个并联的梳状滤波器后面级联嵌套的全通滤波器来产生混响, 并用遗传算法优化这

9、些滤波器的系数。Schroeder 还提出了一种级联全通滤波器的混响算法3, 这种结构被后来的研究者借鉴并且不断加以改进。例如 Gardner 提出了基于嵌套的全通滤波器的混响器结构7。Dattorro 提出了基于全通滤波器设计的立体声混响器8。文献9提出了一种基于所谓吸收的全通滤波器的混响器结构, 这种吸收的全通滤波器是在标准的全通滤波器的延时单元后面级联一个低通滤波器和一个增益。文献10提出了基于双全通滤波器结构的混响器。Stautner 和 Puckette 引入了 (feedback delay networks, FDN) 结构来产生混响信号11, Jot 和 Chaigne 进一步

10、发展了该结构12。FDN 结构可以看作递归梳状滤波器的扩展, 如图 2 所示。该 FDN 结构具有 N 个延时线, 每个延时线的延时记为 mi, 延时线的输出经过一个增益矩阵叠加到延时线的输入。FDN 结构可以用式 (4) 、式 (5) 表示。图 1 Schroeder 混响器下载原图其中 si (n) 是延时线的输出, a i, j是矩阵 A 的元素。在上述的结构中, 矩阵 A是时不变的。但实际的声学环境中的混响是时变的, 例如房间中人的位置的变化及其环境温度的变化都会导致混响脉冲响应的变化。为了模拟这种实际场景, 文献13提出了一种时变的基于 FDN 结构的混响算法, 其思想是设计一个时

11、变的增益矩阵 A (n) 来改变混响。FDN 混响器结构的性质在文献14被进一步深入的讨论。Rubak 和 Johansen 提出了一种递归伪随机混响算法15,16, 如图 3 所示, 其中 h (n) 是按指数衰减的伪随机序列, 其长度为 L。混响部分的传递函数如式 (6) 。图 2 FDN 混响器下载原图其中 H (z) 是 h (n) 的 z 变换, q 是每一个序列的衰减因子。G (z) 对应的时域脉冲响应如式 (7) 。在文献15提出的混响器结构中, 噪声序列 h (n) 是不变的, 最终的混响脉冲是按照梳状滤波器的周期重复并且以指数规律衰减的序列噪声, 这将导致可闻的周期的声音,

12、因此文献17提出切换卷积混响器。文献18引入了所谓的velvet 噪声来扩展基于伪随机序列的混响算法。velvet 噪声是一种听起来非常舒适的稀疏伪随机噪声序列, 该序列只取 0, -1 和 1 三个值, 1 或者-1 以 Tv为间隔出现。为了避免可闻的噪声, 文献18采用 vel-vet 噪声库并且利用交互衰减技术来变换稀疏 FIR 滤波器系数。上世纪 90 年代初出现了用于音乐和电影产品的卷积混响器19。该方法首先测试得到实际的混响脉冲响应, 然后将输入信号和该混响脉冲响应进行卷积得到混响输出。脉冲测试技术的发展20,21推动了卷积混响器的发展。卷积混响器实现简单, 算法延时小。但是时域

13、卷积的方法实现的复杂度很高, 有很多低计算复杂度的方法被提出来22,23。快速卷积技术例如基于重叠保留法的 FFT 技术可以有效的降低计算复杂度, 但是如果只用一个块 FFT 实现的算法延时很大。文献23提出利用分块的 FFT 算法来降低算法的延时。为了彻底消除输入输出之间的延时, 文献24提出将混响脉冲最开始的部分利用时域卷积完成, 后面的部分利用分块的 FFT 完成。文献25提出利用 GPU 来计算快速卷积。图 3 伪随机序列混响器下载原图2.2 扬声器和房间均衡理想的扬声器系统应该具有平坦的频率响应和线性相位, 但是由于在生产过程中制造工艺的不足, 其频响不再是平坦的。实验表明人耳对于

14、 2 d B 以上的失真就能够辨别, 因此需要对扬声器系统进行均衡来弥补扬声器系统自身的缺陷27。对扬声器进行均衡的传统方法是采用音频均衡器, 但是均衡器只能对某些频段进行粗略的调整。采用数字信号处理技术可以对扬声器的频响进行精细均衡。房间中的声源到接收点的传递函数的频响也不是平坦的。在实际应用中, 我们希望通过均衡的方法在声音播放之前进行预处理, 从而去除掉房间的影响。对于房间单个点的脉冲响应进行均衡和扬声器的均衡方法是类似的。在实际应用中, 一般有多个听音位置, 如果仅仅对单一位置点进行均衡, 有可能恶化其他位置点的声重放效果。因此, 需要对空间内多个位置点进行均衡。Neely 和 All

15、en 提出了用数字滤波器对房间脉冲响应进行均衡的概念28。他们分析了房间脉冲响应的特性并利用奈奎斯特原理来判断一个脉冲响应是否是最小相位的, 指出由于房间内墙壁或其他物体的反射, 导致脉冲响应是非最小相位系统。但是当把初始的纯延时去掉后, 合成的房间脉冲响应是最小相位的。他们提出将脉冲响应分解为最小相位系统和全通系统, 分别设计逆滤波器, 这就是所谓的“同态法”。Mourjopoulos 等人29提出了最小二乘法来对非最小相位的房间脉冲响应进行均衡, 并且与同态法均衡进行了对比。定义要均衡的脉冲响应 p (n) , 均衡滤波器为 q (n) , 他们利用最小二乘法求得 q (n) 使得式 (8

16、) 成立。其中参数 k0是人为引入的延时。合理的选择延时参数 k0可以获得更好的均衡效果。进一步的工作30,31采用最小二乘法中滤波器长度和时延对均衡性能的影响。Greenfield 和 Hawksford32指出利用 FIR 作为均衡滤波器复杂度太高, 转而采用 IIR 来实现扬声器均衡。同时指出在扬声器的轴向角度测试的脉冲响应作为均衡目标可能使得旁轴处的脉冲响应均衡效果会变差, 因而他们建议采用限定听音区域测定的脉冲响应取平均作为均衡的目标脉冲响应。他们利用 IIR 滤波器建模扬声器响应, 然后对其最小相位系统和全通系统进行均衡。仅仅用轴向测试的脉冲响应作为均衡目标的缺点在文献33中被进一步指出, 该文建议对扬声器系统在轴向和旁轴多个角度上测量脉冲响应, 对这些脉冲响应进行不同的加权, 最后利用最小二乘法设计均衡器。为了获得更加稳健的结果, 通常建议预先对目标扬声器的

展开阅读全文