第3章数字音频处理技术

资源描述

《第3章数字音频处理技术》由会员分享，可在线阅读，更多相关《第3章数字音频处理技术（60页珍藏版）》请在金锄头文库上搜索。

1、第 3 章数字音频处理技术,3.1 音频处理概述 3.1.1 什么是声音 3.1.2 声音的基本参数 3.1.3 人的听觉特性 3.1.4 音频信号处理过程 3.2 音频的数字化 3.2.1 音频的采样 3.2.2 音频的量化 3.2.3 声道数 3.2.4 音频的编码与压缩技术 3.2.5 数字音频的质量,3.3 音频文件格式及标准 3.3.1 波形文件格式 3.3.2 MPEG音频文件格式 3.3.3 流媒体音频文件格式 3.3.4 MIDI 3.4 音频软件的使用 3.4.1 常见音频软件简介 3.4.2 Cool Edit简介 3.5 音频效果处理技巧 3.5.1 常用音频编辑命令

2、3.5.2 常用音效命令 3.5.3 特殊音频的生成,3.1 音频处理概述,物理学角度：声音是一种由物体振动产生的机械波，并在弹性介质（如空气等）中传播。可以用“声波”来表示声音，声波是一条随时间变化的连续曲线。,3.1.1 什么是声音,声音信号的波形,单音信号波形由单一频率和振幅组成的声音信号。一般只有电子仪器才能产生。,复合信号波形由若干频率和振幅各不相同的正弦波组成。自然界存在的声音大多是复合音。,3.1.2 声音的基本参数,声音的基本参数：频率和振幅,人耳的听觉范围在听阈与痛阈之间。听阈：人耳刚刚能听到的最低声音，如0dB。痛阈：当声强过高，超过120dB时，会使人耳感到疼痛。,

3、3.1.3 人的听觉特性,一种音频信号会阻碍听觉系统感受另一种音频信号的现象，前者称为“掩蔽音”，后者称为“被掩蔽音”。,2. 掩蔽效应,在一定频率范围内，强音频信号会掩蔽在其附近同时存在的弱音频信号，使得弱音被强音“掩蔽”掉。,除了同时发出的声音之间有掩蔽现象之外，在时间上相邻的声音之间也有掩蔽现象。包括超前掩蔽和滞后掩蔽。,频域掩蔽,时域掩蔽,3.1.4 音频信号处理过程,将时间和幅度都连续的模拟音频信号，经过一定的变化和处理，使其变成时间和幅度都离散的二进制数字信号的过程。,音频数字化过程,3.2 音频的数字化,把模拟音频信号在时间域上，按照设定的时间间隔，读取音频信号波形的幅度值，再用

4、若干位二进制数表示此幅度值的过程。,3.2.1 音频的采样,采样时间间隔称“采样周期” 采样周期的倒数称“采样频率”，单位为Hz。采样频率决定每秒钟所取声波幅度样本的次数。隔相等的时间间隔的采样称为“均匀采样”；采样时间间隔不恒定的，称“非均匀采样”。,采样周期和采样频率,采样频率与声音质量的关系,采样频率直接影响到声音的质量，采样频率高，每秒采集的样本多，声音保真度越好，但数据存储量也越大。,几种常用的采样频率,人类话音频率范围：300Hz3 000Hz 人耳能听到的声音频率范围：20Hz20KHz,3.2.2 音频的量化,量化是对采样后信号幅度值进行离散化处理。,1量化过程, 划分量化

5、阶距。将声波幅度值划分为有限个小幅度（量化阶距）的集合：量化阶距2 Xmax / 2B，其中：Xmax 声波最大幅值；B 二进制量化值的位数, 赋量化值。把落入某个量化界线1/2范围内的采样值归为一类，赋予同样的量化值。,均匀量化与非均匀量化,采用相等的量化阶距处理采样得到的信号值称为均匀量化（线性量化）。,实际量化中，通常会以人的听力敏感度为准来设定更适合且不同大小的量化阶距，这种方式称为非均匀量化。,指量化后二进制样本值的位数（bit/s或b/s）。,2.量化精度,量化位数越多，声音质量越高，但数据量也越大。,量化精度用信噪比SNR（单位：分贝dB）表示：其中：Vsignal 信号电压

6、Vniose 噪声电压,量化后的样本值Y与原始值X的差EYX。量化误差随量化阶距变大而增加，样本位数的大小影响声音质量，位数越多，声音还原越真实。,量化误差（量化噪声）,3.2.3 声道数,一次采样记录的声音波形个数决定声道数多少。声道数多，音质音色更好更真实，存储容量也要相应增加。,立体声Stereo：记录声音时，每次生成两个声波数据。,3.2.4 音频的编码与压缩技术,音频质量,数据量,计算复杂度,音频压缩编码时考虑的因素：,常见音频编码算法和标准,基于音频数据的统计特性进行的编码，其目标是使重建语音波形保持原波形的形状。特点：算法简单，易于实现，可获得高质量语音。,1.波形编码,将音频

7、信号以某种模型表示，再抽出合适的模型参数和参考激励信号进行编码；播放声音时，使用这些参数通过话音生成模型重构声音信号。特点：算法复杂，计算量大，音质比较差，但保密性能好，压缩率高，常用在军事上。,将波形编码的高质量和参数编码的低数据率结合在一起的编码方式。特点：效果较好。,3.混合编码,利用人耳的听觉特性，如掩蔽效应等，在编码过程中保留人耳可以听到（感知）的部分，而忽略人耳听不到（不能感知）的部分，将听众察觉不了的信号去除。特点：属于有损压缩编码。,3.2.5 数字音频的质量,音质与数据率,3.3 音频文件格式及标准,CDA文件 CD唱片采用的格式音质好无法复制,3.3.1 波形文件格式,

8、WAV文件微软和IBM公司联合开发的通用音频文件基本无数据压缩声音效果好数据量大,VOC文件 Creative公司开发声霸卡使用的音频文件格式带有浓厚的硬件相关色彩,MPEG运动图像专家组（ Moving Pictures Experts Group）1988年由国际标准化组织ISO和国际电工委员会IEC联合成立，负责开发电视图像数据和声音数据的编码、解码和同步等标准。,3.3.2 MPEG音频文件格式,现有的MPEG标准： MPEG-1：数字电视标准 MPEG-2：数字电视标准 MPEG-4：多媒体应用标准 MPEG-7：多媒体内容描述接口标准,全称“MPEG-1 Layer 3

9、”音频文件。MP3声音文件存储空间只相当于WAV文件的十分之一，但音质与CD唱片大体接近，因此在网络、可视电话、通信方面应用十分广泛。,MP3声音文件,MPEG-1标准提供三个独立的压缩层次，各层压缩率：,3.3.3 流媒体音频文件格式,主要有： RealNetwork公司的RealMedia（*.RA，*.RAM或*.RM） Microsoft的Windows Media（*.asf和*.wmv） Apple公司的QuickTime（*.MOV）,采用流式传输的方式在Internet播放的各种媒体信息，如音频、视频、动画等。相对于传统的下载后播放方式，流媒体使得用户可以边接收边播放，减少了大

10、量的等待时间。,流媒体,电子乐器数字接口（Musical Instrument Digital Interface）的缩写，一种定义MIDI电子音乐设备与计算机之间交换音乐信息的国际标准协议，规定了使用数字编码来描述音乐乐谱的规范。常见的MIDI文件：*.MID、*.RMI等,MIDI音频文件是一个脚本语言，它通过对“事件”编码，产生声音。一个MIDI事件包含一个音阶的音调、持续时间和音量等参数。,3.3.4 MIDI,MIDI,原理：根据傅立叶级数理论，任何一种波形信号都可被分解成若干个频率不同的正弦波,1MIDI乐音合成方法,频率调制（FM）合成法,FM声音合成器波形,也称波形表合成法。原

11、理：先记录各种乐器的真实声音，并进行数字化处理，形成波形数据，存储在ROM中。发音时通过查表找到所选乐器的波形数据，再经过调制、滤波、再合成等处理形成立体声回放。优点：直观、真实，更接近自然的声音。,乐音样本合成法,2MIDI系统简介,当作乐器使用的设备，如乐器键盘。 MIDI控制器产生一套指示电子音乐合成器要做什么、怎么做（如演奏某个音符、加大音量、生成音响效果）的标准指令。,MIDI控制器,与其他设备的接口，包括MIDI In输入、MIDI Out输出、MIDI Thru传输三种。,MIDI端口,为MIDI作曲而设计的计算机程序或电子装置，用于记录、编辑、播放MIDI声音文件。分硬件和软件

12、两种，目前大多数为软件音序器。,音序器,集成在声卡上。利用数字信号处理器或其他芯片产生音乐或声音的电子装置。功能：解释MIDI文件中的指令符号，然后生成所需要的声音波形，经放大后由扬声器播出。,合成器,两种合成器,说明：音色：声音的音质音调：指合成器能够播放的音符数。,播放音频的设备。,扬声器,3MIDI乐音特点,生成的文件比较小。,容易编辑。,适合重现打击乐。,需要长时间播放高质量音乐时；,需要以音乐为背景的音响效果，同时从CDROM中装载其他数据时；,需要以音乐为背景的音响效果，同时播放波形音频或实现文-语转换，实现音乐和语音同时输出时。,MIDI音乐适合的情况,3.4 音频软件的使用,

13、专业级多轨录音和音频处理软件。Syntrillium Software Corporation公司开发。功能强大、效果出色。详见下节介绍。,1.Cool Edit Pro,3.4.1 常见音频软件简介,Windows操作系统附带的声音处理软件，支持 *.WAV格式文件，功能简单：设置不同的参数录音；使用不同的算法压缩声音，向文件中添加、删除部分声音；更改声音回放速度和音量；更改或转换声音文件格式类型；添加回音，反转声音。,2.Windows录音机,共享软件，小巧，即拷即用。主要功能：可将文件保存成MP3、WAV、AU、SND、RAW、AFC等多种格式；从CD、DVD、VCD及其

14、它视频文件中获取声音；以不同的采样频率录制声音信号；声音剪辑，如删除、复制和连接声音片段；增加特殊效果，如混响、回音、变频、淡入淡出、反转等。,3.GoldWave,Sonic Foundry 公司开发，具有全套的音频处理、工具和效果制作等功能，界面简单、可操作性强。,4.SoundForge,Cakewalk。最著名的MIDI工具软件，功能强大，可编辑、创作、调试MIDI音乐。 Midisoft Studio。专业MIDI制作软件，能够录制、播放MIDI等格式的乐曲，并能够编辑可打印乐谱（五线谱）。,5.MIDI音乐软件,录制音频文件；多文件、多音轨操作。剪切、粘贴、合并、混合音频；

15、提供多种特效，如降噪、回声、延迟、调整音调等；可生成噪音、静音、电话信号等声音；自动静音检测和删除，自动节拍查找；多种文件格式转换。,软件功能,3.4.2 Cool Edit简介,分为“波形文件编辑界面”和“多音轨编辑界面”两种。用功能键F12或切换按钮进行切换。,Cool Edit界面,1.Cool Edit界面波形文件编辑界面,1.Cool Edit界面多音轨编辑界面,2.菜单结构,2.菜单结构,3.5 音频效果处理技巧,3.5.1 常用音频编辑命令,1.声音的插入、混合和替换,插入：将数据插入到当前文件插入点之后，原波形文件数据后移。,替换：被插入的数据替换原波形数据。,混合：

16、被粘贴的数据与当前选定的部分叠加。,操作步骤,拖动鼠标，选择需要混缩粘贴的声音波形，单击【编辑】【复制】；单击【编辑】【混合粘贴】，打开【混缩粘贴】对话框。,【编辑】【转换音频格式】,2.将单声道转为立体声,3.调整采样率,【编辑】【调整采样率】,3.5.2 常用音效命令,1.菜单栏【效果】的常用命令,反相：将波形振幅交换。,静音：产生无声音的波形,倒置：把声波从后往前，反向播放,反相前,反相后,【效果】【变速变调】【变速器】,2.改变声音频率和节拍,预设框,【效果】【波形振幅】【渐变】恒量改变：改变声波振幅，即改变音量淡入淡出：声音波形振幅逐渐增大或减小,3.调节音量大小,【效果】【噪音消除】可降低背景噪音，并进行破音修复等操作。,4.特殊音效,5.噪音消除,【效果】【波形振幅】【渐变】房间回声：产生在房间中的回声效果延迟：产生一个滞后播放的声音,

展开阅读全文

第3章 数字音频处理技术

第3章数字音频处理技术