用hrtf进行虚拟声源定位报告

资源描述

《用hrtf进行虚拟声源定位报告》由会员分享，可在线阅读，更多相关《用hrtf进行虚拟声源定位报告（8页珍藏版）》请在金锄头文库上搜索。

1、用用 HRTF 进行虚拟声源定位报告进行虚拟声源定位报告介绍介绍：我们日常听到的立体声录音，虽然有左右声道之分，但就整体效果而言，立体声音乐来自听者面前的某个平面。但希望的是一个在虚拟环境中能辨别声源精确位置的声音系统，而当您听到三维虚拟声音时，音乐声是来自围绕您的一个球形中的任何地方，即声音出现在您头的上方、后方或者在您的鼻子前方。我们把在虚拟场景中的能使用户准确地判断出声源精确位置、符合人们在真实境界中听觉方式的声音系统称为三维虚拟声音。1 传统音频定位理论传统音频定位理论耳间时间差（ITD）：从声源发出的声音到达人的左耳和右耳时，有一个先后的过程，这段时间差就是耳间时间差。耳间

2、时间差与声音信号的频率有关，是声源角位置，头部半径和声速的函数，在人类听觉定位中占有重要位置。rc 耳间强度差（IID）：由于声音的传播媒质对声波的衰减作用，声音的强度随距离而变化，再加上耳廓和头部的遮挡，最终到达两耳的声音所经过的路径是不同的，使得距离声源近的耳朵听到的声音要强一些，这就是耳间强度差。在中、低频(f4 kHz), IID 起主要作用1。传统的音频定位理论的缺陷：（1）无法解释单耳条件下的定位机理。（2）存在锥面模糊现象。ITD 和 IID 对左右方位的定位效果非常明显，但对前后和上下方位存在模糊现象。如图 1 中同一垂直面内的 X 和 Y 到达两耳的路径是对称

3、的，以及同一水平面内的 A 和 B 到达两耳的路径也是对称的，这就无法依赖 ITD 和 IID 来进行准确定位。图 1 混淆锥示意图2 用用 HRTF 进行虚拟声源定位进行虚拟声源定位有一种更为完备的音频定位模型，这就是 HRTF。与头部关联的传递函数(Head- Related Transfer Function, HRTF)描述了声波从声源到双耳的传输过程。事实上从某一方位的声源发出的声信号在到达听者的耳膜之前经过了复杂的传输过程，声信号与听者的头部、肩部以及躯干，耳廓发生了反射、折射、衍射和散射等声学作用，人体的这些部位对声信号的调制作用可以统一的用一个函数来表示即与头部关联的

4、传递函数 HRTF。与之相对应的时域表示称为与头部相关联的冲激响应（Head-Related Impulse Response,HRIR）。2.1 HRTF 数据中包含的方位信息数据中包含的方位信息图 2 画出方位角-45,仰角 0时的左右耳 HRIR 波形及对应的频谱图。图 2 方位角-45,仰角 0时的左右耳 HRIR 及对应的 HRTF（1）耳间时间差（ITD）：由于声源靠近左耳，从图 2 可以看出右耳的 HRIR 比左耳的 HRIR 有明显的时间延迟，体现了耳间时间差。（2）耳间强度差（IID）：左耳的 HRTF 比右耳的 HRTF 幅度要强一些，体现耳间强度差。（3）HRT

5、F 会出现明显的峰值点和谷值点，有研究表明峰点频率、谷点频率对前后定位起关键作用，且谷点频率是进行定位的主要依据。（4）HRIR 在某些时刻变化剧烈，这是由于耳廓对入射声波的反射作用，左耳的 HRIR 波形较右耳的 HRIR 波形起伏变化更为剧烈。在频谱特性上则表现为左耳的 HRTF 高频分量要充足些。为了更加突出 HRTF 中的峰值点和谷值点，人们使用了一些方法对 HRTF 数据进行处理。文献3中对不同频率的 HRTF 数据加权，来放大原 HRTF 数据频率间的差异，设为原 HRTF 数据，为处理后的 HRTF 数据，则( )H x( )Hx权函数( )( )( )HxW x H x

6、)( )( )max(iH xW xH xHRTF 反映了人体结构对声音信号的不同响应，因此 HRTF 有明显的个体差异，人们总是希望使用个性化的 HRTF 数据进行 3D 音效的合成，然而对每个人进行 HRTF 数据的测量是不现实的，有学者建议使用非个性化（non-individualized）的 HRTF 数据4。2.2 虚拟听觉空间系统虚拟听觉空间系统 Vasaudio将输入的音频信号分别与指定的方位和距离的左右耳 HRTF 数据进行卷积，然后通过耳机重发就可以得到具有方位信息的双通道音频信号，如式（1）。基于这个原理我们用 VC+编程开发了虚拟听觉空间系统 Vasaudio5可

7、以实时播放 wav 格式的音频文件，图 3 是我们的实现框图。(1)( )( )*( ) ( )( )*( )LLLRRRynGx nhn ynGx nhn A A式中表示乘法，表示卷积，表示输入的音频信号，和分别表示A( )x n( )Lh n( )Rhn左右耳的 HRIR 数据，和分别表示左右耳的增益，和分别表示馈给LGRG( )Lyn( )Ryn耳机的左右声道信号。图 3 虚拟听觉空间系统实现框图3 虚拟声源定位测试实验虚拟声源定位测试实验测试设备为 1 台计算机、1 个高质量声卡、1 幅高质量耳塞式耳机。被测试人员为我们实验室的 5 名听觉正常的同学。同时我们选择音频测试常用的粉

8、红噪声作为测试音源。测试所用的软件系统为本文前面介绍的 VasAudio。我们实验的目的有两个：一是通过测试比较 HRTF 的个体化差异，二是我们希望找出几套对大多数人都相对比较适合的 HRTF 数据，已备我们以后的实验使用。3.1 测试数据测试数据为了比较 HRTF 数据的个体差异，我们使用了 12 套数据进行测量，分别为（1）CIPIC 数据库提供的数据：hrir_final_003, hrir_final_162, hrir_final_163, hrir_final_165；（2）做回归分析得到的数据：hrir_final_h_003, hrir_final_h_162, h

9、rir_final_h_163, hrir_final_h_165；（3）在时域做平均得到的数据：hrir_final_avg；（4）用 PCA 分析综合出来的数据：hrir_final_large_6, hrir_final_middle_6, hrir_final_small_6。3.2 测试步骤和结果测试步骤和结果为减小辨别难度，只对水平面和中垂面上的角度进行定位测试，其中方位角是 15的倍数，角度从180到 180，共有 24 个方位。垂直方位角为 90（正上方）、60、30、0、45共有 5 个方位。（1）水平方位角具体测试步骤：步骤 1：先给测试者听分布在前、后、左、右

10、四个方向的声音信号，并告知实际方向；步骤 2：然后分别在这四个声源的附近位置选择一个方位，要求听者进行判断，并给出四个声源的位置（要求说出具体的方位角度）；步骤 3：重新随机选择分布在前、后、左、右四个方向的声音信号，重复步骤 1，步骤 2。（2）垂直方位角具体测试步骤：步骤 1：对给定的一组数据先给测试者听垂方位 90、60、30、0、45五个方向声音信号；步骤 2：从上述五个方向随机给出一个方向的声音信号，要求听者指出其具体方向角度。重复该步骤五次直至测完一组数据；步骤 3：重复步骤 1，步骤 2，直至测完全部数据。我们给出了数据标号为 hrir_final_162 和

11、hrir_final_163 的测试结果散点图，见图 4 和图 5。图 4 hrir_final_162 测试结果散点图图 5 hrir_final_163 测试结果散点图我们给出水平方位最终的测试统计结果，见表 1。同时我们给出垂直方位最终的测试统计结果，见表 2。表表 1 水平方位测试结果统计表水平方位测试结果统计表表表 2 垂直方位测试结果统计表垂直方位测试结果统计表3.3 测试结果分析测试结果分析（1）HRTF 数据包含了大量的方位信息，用 HRTF 对声源进行定位可以提高定位的准确性，克服传统定位理论的不足。我们在测试中使用的 HRTF 数据是非个性化的，因此 HRTF 数据并不

12、一定对每个人都是适合的，这是造成错误率较高的一个原因，另外测试中只有被测试者认定的方位和我们实际使用的方位完全一致时，我们才认为辨别正确，对试验结果的要求有些苛刻（实际上 5到 20的偏差是允许的），这是造成错误率较高的另一个原因。（2）测试中发现被测试者对标号为 hrir_final_middle_6 的 HRTF 数据的辨别正确率较高，原因可能是 5 位被测试者的头部和外耳尺寸比较中等，与该数据的外耳参数比较吻合。（3）测试中发现声源定位的前后颠倒和上下颠倒比较严重。前后颠倒从图 5 和图 6 可以很明显的看出。垂直方位的测试结果尤为不好，如倾听者 1 号在使用标号为 hri

13、r_final_165 和 hrir_final_h_003 的 HRTF 数据处理过的音频信号进行垂直方位的辨别时， 5 个方位完全辨别错误，其他被测试者也有这样的问题。（4）用耳机重放时存在“头中定位效应” ，倾听者感到声像分布在人头内部，这也影响了定位的准确性。有文献6指出，增加混响可以加强声像的立体感和深度感，从而改善定位效果，这也是音频定位、多媒体和虚拟现实发展的趋势。4. 结束语结束语HRTF 包含了大量的方位信息，用 HRTF 进行虚拟声源定位是当前研究的热点，已经有很多相关成熟的产品和系统出现。本文介绍了 HRTF 包含的方位信息和个体差异，并用我们开发的 Vasau

14、dio 系统进行了虚拟声源定位的实际测试。测试结果表明用非个性化 HRTF 进行定位存在一些问题，如辨别错误率较高，声像的前后混淆和上下混淆比较严重，头中定位效应等，我们的工作仅是初步的，还要采取其他措施来提高虚拟声源定位的准确性。参考文献：参考文献：1 钟小丽，谢菠荪. 头相关传输函数的研究进展(一)J. 立体声与环绕声,2004,12:44-48.2 Algazi V. R., Duda R.O., Thompson D.M., Avendano C. The CIPIC HRTF databaseC. Applications of Signal Processing to Audi

15、o and Acoustics, 2001 IEEE Workshop on the 21-24 Oct,2001, Page(s): 99 -102.3 赵自力，黄成伟，高宏，李庆祥. HRTF 在虚拟 3D 立体声中的应用及实验J.清华大学学报(自然科学版)，2001,41(11):7476.4 Elizabeth M. Wenzel, Marianne Arruda, Doris J. Kistler, and Frederic L. Wightman. Localization using nonindividualized head-related transfer functionsJ, J.Acoust. Soc. Am, ,July ,1993, 94 (1):111-123.5 王生九.虚拟听觉空间和虚拟环绕声技术的研究及其 DSP 实现D.东南大学硕士学位论文，2006.3.6 张承云，谢菠荪，谢志文.立体声耳机重发中头中定位效应的消除J.电声技术，2000, 8: 4-6.

展开阅读全文