自然状态动物鸣声录音信号中有效声信号提取的研究

资源描述

《自然状态动物鸣声录音信号中有效声信号提取的研究》由会员分享，可在线阅读，更多相关《自然状态动物鸣声录音信号中有效声信号提取的研究（2页珍藏版）》请在金锄头文库上搜索。

1、自然状态动物鸣声录音信号中有效声信号提取的研究田华林书玉（陕西师范大学应用声学研究所，西安 710062） Research on signal extraction in recording of animal calls signal TIAN Hua, LIN Shuyu ( Institute of Applied Acoustics, Shaanxi Normal University, Xian 710062, China) 1 概述动物鸣声是动物的一种很重要的生物行为，动物的声信号包含着很重要的、丰富的生物含义1-3。然而只有在自然状态下，动物的鸣声才能最本质地体现、反

2、映出所代表的生物含义，所以我们需要录制动物在不受干扰的自然状态下的声信号。这时我们面临的问题是，在无人状态下的录音，将是长时间的录音，数据量庞大，而在漫长的录音中只有很短的有效的有动物发出的声信号，而且其中通常还会掺杂很多的并非有动物产生或发出的声信号，即环境中的一些其他声信号。如何快速，有效的截取有效声信号成为动物鸣声研究中的一个重要问题。本文讨论了在鼠类鸣声的录音信号中发现有效信号、截取有效信号的方法。 2 信号采集声信号的采集方法可以分为以下两大类：一、采用传统的录音机+磁带的模拟信号式录制方法。这时录音时间较短，一般录音磁带单面录音时长约为 30 分钟，需要手动的启动、换面

3、等操作，对于较大或较小的声音录制效果很差，录制后要还原录制的信号需要用录音机把声音再回放出来，机械的转动使精确快速地定位难以实现；二、采用含 A/D 转换模块的数字信号式录制方法。由于存储的是数字录音数据，从而可以方便精确地实现裁剪，复制等处理，同时也便于后期利用现代数字信号处理技术对信号进行处理。录音设备没有机械部分，运行几乎没有任何声音，可以用于录制很微小的声音。对于数字式信号录制可以有两类方案：方案一是选用通用的大容量数字录音设备，把录制期间的采集到的声信号全部存储下来，如大容量数字录音笔等。它们有大容量的存储空间，可以长时间录音，品质好的也能保证一定的录音质量，但其带宽有

4、限，很难达到 20-20KHz 的带宽，更不要说对稍微超出可听声频率范围的次声及超声信号的录制了。另外这类录音设备往往内置音频压缩（有损）功能，往往会造成声信号有用信息的丢失。方案二是自己设计专用录音系统，在这样的系统中设计时能充分考虑信号的带宽，在录制过程中系统实时地发现、截取并存储有效的声音信号，而放弃那些无效的声音信号无有效声信号期间的音频数据（以下称环境杂声）。自然状态下声信号的采集要求采集动物在不受人为因素干扰的状态下的声音，因此在相当长的时间内，工作人员不能接近动物，从而让动物感觉不到人的存在。这样录音时大部分时间里将没有动物发出的声信号，所以在完成录音之后需要对

5、录制的声音信号进行处理，从中截取有效的声信号，以便进一步处理。不论是以上的方案一还是方案二，要得到有效的声信号都会经过有效声信号的发现和截取的过程。只是在方案二中，由于可以在录音时实时地发现、截取并存储有效的声音信号，从而节省存储空间和后期处理时间，并极大地延长录音时间。 3 信号截取 3.1 信号的特征提取在录制过程中，拾音器采集到的声信号可以分成三类：一、可以被肯定是环境杂声的声信号，通常是动物所处环境里的其他动物或非生物产生的声音，将被直接丢弃，需要注意的是应该要保证丢掉的是无用的信号。二、可以被肯定是有效声信号的声信号，将保留下来做进一步研究。三、不能被肯定的信号，应

6、该保留下来做进一步确认或研究。任何我们要录制的声音信号，总存在一些特点或特征4-6。动物鸣声信号尽管在时域上存在一定的规律性，但其时域上的特点并不是信号唯一的或本质的特点，而且通常很难确定。在绝大多数情况下，频域上的特点才是声信号最本质的特点，那么我们在有效信号的发现中，所凭借的依据就将主要是信号的频域特征，再辅以时域上的某些特征来实现有效信号的发现。人们的研究发现，通过动物声信号的频带、主要频率（主能量区及其宽度），持续时间等能够很容易的区分出不同的信号来。这样我们实现对环境杂声以及所要采集的声信号进行分析，提取上述特征，就可以以这些特征为依据来区分以上三类信号。在提取信号

7、频域特征时，通常采用 FFT 变换，以得到信号的功率谱。这里把信号分成一定点数 N 的分段，对每一段图 1 一个叫声信号起始位置的确定 a 信号的分段 b 各分段频谱中峰值功率作 N 点的 FFT 变换，点数 N 的选择与要采集的信号的最小持续时间 T 以及采样频率 Fs 有关，NFs T，过大或过小的都难以提取到有效信号的特征。 3.2 有效信号的发现在信号的发现过程中，将录制得到的声信号以 N 为分段大小，提取特征，并与已知的特征作粗略的匹配，从而可以确定该分段信号有无声信号，若有，声信号是否是有效声信号等。若检测到的声信号不是环境杂声，就需要进行信号截取了。信号的截取

8、指的是确定叫声确切*的起止位置，以便将该段信号完整地截取出来，作进一步处理。 3.3 找到包含信号确切起止点的分段。首先，对于找确切起始位置来说，若在前面信号发现过程中，分段时刚好使声信号从前一段信号中最后的一小部分（510%）开始，此时声信号在整段信号中的功率将会很小很不明显，而使得前一段信号被认为不含有叫声。若此时仅从后一段信号开始来找叫声的确切起始位置，将不能找到正确的起点。将这两段信号连接起来之后，就一定包含了声的确切起始位置。对于找确切结束位置来说，情况与这里是类似的。 3.4 确定信号确切的起止点。在确定一段信号中一定含有声信号起始点时，我们知道了该声信号功率谱在具

9、体的哪个能量区上与前一段信号有很大的差别，这个能量区就应该是该段声信号的主能量区。在包含起始点的信号分段中等间隔地选取1n个分割点，得到n信号段，对这n段信号再作FFT变换并得到n个能量谱，这n个能量谱中主峰能量从最大值降至约 5%时，所对应的分割点就可以被认为是信号确切的分界点。图 1.a 是在分段大小 N=256 情况下的一个包含信号起始点的两段信号，它被进一步分成 20 个点构成的信号小段，图 1.b 是各分段作 256 点 FFT 变换得到的功率谱的 4 个主要峰值。主峰能量在第 20 分割点处降为峰值的约 5%，因此确定该点为信号的起始分割点。确定信号结束分割

10、点时，只需要将信号在时域翻转，就转换成了求起始分割点问题。在确定了信号的起止点之后，就可以将对应的信号截取出来。这里的截取方法不仅适合于在通用系统中先录音后截取的情况，也适合自制专用系统中，在录音的同时实时截取有效信号的情况。 4 结论本文讨论了自然状态动物鸣声录音信号中有效声信号提取的方法，提出了两类可行的方案，并提出了同时适合于这两类方案的有效信号发现及截取方法，极大的方便了动物鸣声研究中有效声信号的录制和截取。参考文献 1 姜仕仁，丁平，诸葛阳等，白头鹎繁殖期鸣声行为的研究, 动物学报 1996 ,42(3),253259. 2 Marchant-Forde Ruth M.

11、,Responses of dairy cows and calves to each others vocalizations after early separation, Applied Animal Behaviour Science，2002,78(1),19-28. 3 Weary, Daniel M.，Fraser. David，Vocal response of piglets to weaning: effect of piglet age，Applied Animal Behaviour Science，1997，54（2），153-160 4 姜仕仁，丁平，诸葛阳，三种蛙鸣声特征比较研究，动物学研究，1995，16(1)，75-81 5 何其超，房斌，龙建忠等，草原鼠兔鸣叫声的观察和声学特征分析，声学学报， 1996， 21(4)， 679-684. 6 韩春琏，陕方，曹家林，大熊猫“唔”叫声的时域和频域特征，声学学报，2000，25（4），264-270. * 这里的确切很显然不是绝对的精确，也不可能有绝对的精确起止点。作者简介：田华（1975），女，博士研究生，研究方向为声信息处理。

展开阅读全文