常见音频文件格式和处理工具

上传人:cn****1 文档编号:567994584 上传时间:2024-07-23 格式:PPT 页数:78 大小:820KB
返回 下载 相关 举报
常见音频文件格式和处理工具_第1页
第1页 / 共78页
常见音频文件格式和处理工具_第2页
第2页 / 共78页
常见音频文件格式和处理工具_第3页
第3页 / 共78页
常见音频文件格式和处理工具_第4页
第4页 / 共78页
常见音频文件格式和处理工具_第5页
第5页 / 共78页
点击查看更多>>
资源描述

《常见音频文件格式和处理工具》由会员分享,可在线阅读,更多相关《常见音频文件格式和处理工具(78页珍藏版)》请在金锄头文库上搜索。

1、第第4章章 多媒体音频信号处理多媒体音频信号处理第第4章章 多媒体音频信号多媒体音频信号处理处理4.1 音频信号概述音频信号概述4.2 音音频频信信号号的的获获取取与与处理处理4.3 话话音音信信号号的的参参数数编编码码4.4 乐乐 器器 数数 字字 接接 口口MIDI4.5 声卡概述声卡概述1第第4章章 多媒体音频信号处理多媒体音频信号处理4.1 音频信号概述音频信号概述n n4.1.1信号的描述及分类n n1.确定信号及随机信号n n能够用一确定的时间函数来表示的信号就是确定信号。这种信号对应某一时刻都有一个确定的信号值。n n有一些信号具有不可预知的不确定性,这种信号就是随机信号。n n

2、我们将要研究的音频信号、视频信号以至计算机中的数字信号均为确定信号。2第第4章章 多媒体音频信号处理多媒体音频信号处理n n2.周期信号与非周期信号n n按一定时间间隔周而复始重复的信号就是周期信号,而在时间上不具有周而复始的重复特性的信号就是非周期信号。n n3.连续信号与离散信号n n信号随时间的取值是连续的,这样的信号就是连续信号。如果信号在时间上的取值是离散的,则这种信号就称为离散信号。可见,离散信号在时间上是离散的,但信号在幅度上可以是连续的,也可以是离散的。3第第4章章 多媒体音频信号处理多媒体音频信号处理n n4.模拟信号与数字信号n n如果信号在时间上和幅度上都是连续的,那么这

3、样的信号就是模拟信号。模拟信号以一定时间间隔取值,则可获得离散信号,又称之为采样信号。若将离散信号进行二进制编码,以二进制编码来表示离散值的幅度,那么这种二进制编码信号叫做数字信号。n n在本书后面的讨论中可以看到,话筒或摄像机产生的信号为模拟信号。模拟信号经过采样可获得离散信号,离散信号经A/D转换变成二进制的数字信号,数字信号就可以由计算机直接进行处理了。n n模拟信号、离散信号与二进制编码的数字信号之间的关系表示在图4-1上。4第第4章章 多媒体音频信号处理多媒体音频信号处理图4-1模拟信号、离散信号及数字信号5第第4章章 多媒体音频信号处理多媒体音频信号处理n n图4-1中,用连续变化

4、的曲线表示模拟信号;用圆点表示以相等时间间隔取值而得到的离散信号;图4-1的纵坐标上标的是幅度的二进制编码值。n n4.1.2采样定理及信号重构n n1.采样定理n n设输入信号是带宽有限的信号,最高信号频率为fm,则从采样得到信号序列(离散信号)重构(复现)连续信号的条件是采样频率fs2fm,否则,将产生混迭效应,而使信号失真。频率2fm称为奈奎斯特(Nyquist)频率fq,fq=2fm。n n时域信号与它的傅立叶变换频谱密度如图4-2所示。6第第4章章 多媒体音频信号处理多媒体音频信号处理图4-2时域信号及其频谱密度7第第4章章 多媒体音频信号处理多媒体音频信号处理n n2.信号重构n

5、n设时域信号为x(t),对应的频谱密度为X(f),若时域采样脉冲序列为n nn n是等间隔(T)的单位脉冲序列,由信号理论可知对应的频谱为n nn n是一个等间隔(fs)频域冲激序列。其中T是时域采样序列的周期,即采样频率n nn n8第第4章章 多媒体音频信号处理多媒体音频信号处理n n可以写出时域采样序列的表达式,即n nn nx*(t)就是x(t)在t=nT处的离散序列。n n由卷积定理,时域的乘积对应频域的卷积,即n nn n因为是一个冲激序列,卷积的结果相当于X(f)搬移至序列出现的地方,从而成为周期函数。x(t)在时域的采样与X(f)在频域卷积(搬移)的关系如图4-3所示。9第第4

6、章章 多媒体音频信号处理多媒体音频信号处理图4-3时域采样与频域卷积10第第4章章 多媒体音频信号处理多媒体音频信号处理n n可见,若fs=1/T不是足够大,采样以后对应的频谱就会产生混迭,用矩形(带通)滤波器滤波所得的主频谱就会失真,恢复到时域以后,时域连续信号也将失真。因此,采样频率fs必须满足采样定理的要求,即fs2fm。图4-4音频信号的带宽11第第4章章 多媒体音频信号处理多媒体音频信号处理4.2 音频信号的获取与处理音频信号的获取与处理n n4.2.1音频信号n n1.常见音频信号n n常见的音频信号主要有电话音频信号、调频、调幅无线电广播音频信号和高保真数字的立体声音频信号。由于

7、用途不同,这些音频信号频带宽度也各不相同,而且,在音响设备中,通常以音频信号的带宽来衡量声音的质量。图4-4中表示了这4种常见音频信号的带宽。12第第4章章 多媒体音频信号处理多媒体音频信号处理n n图4-4表示了人们公认的音频信号的质量标准。其中,等级最高的是激光唱盘的音频信号;其次是调频无线电广播,调幅无线电广播;最低的是电话话音的频带,从0.2kHz到3.4kHz,带宽只有3.2kHz。n n2.声音的特性n n1)声音的波动性n n任何物体的振动通过空气的传播都会形成连续或间断的波动,这种波动引起人的耳膜的振动,变为人的听觉。因此,声音是一种连续或间断的波动。n n13第第4章章 多媒

8、体音频信号处理多媒体音频信号处理n n2)声音的三要素n n音调、音强和音色称为声音的三要素。其中,音调与声波的频率相关,频率高则音调高,频率低则音调低。音调高时声音尖锐,俗称高音;音调低时声音沉闷,俗称低音。人的耳朵对于声音的感知频率范围为20Hz20kHz之间。低于20Hz的声波为次声波,高于20kHz的声波称为超声波。音强取决于声波的幅度,振幅高时音强强,振幅低时音强弱。音色则由叠加在声音基波上的谐波所决定,一个声波上的谐波越丰富,音色越好。14第第4章章 多媒体音频信号处理多媒体音频信号处理n n3)声音的连续谱n n声音信号一般为非周期信号,包含有一定频带的所有频率分量,其频谱是连续

9、谱。声波的连续谱成分使声音听起来饱满、生动。n n4)声音的方向性n n声音的传播是以弹性波形式进行的,传播具有方向性,人通过到达左右两耳声波的时间差及声音强度差异来辨别声音的方向。声音的方向性是产生立体声效果和空间效果的基础。15第第4章章 多媒体音频信号处理多媒体音频信号处理n n3.音频的种类n n在自然界中,声音包含声响、语音和音乐等三种形式。在多媒体系统中,声音不论是何种形式都是一种装载信息的媒体,统称为音频。由产生音频的方式不同音频被分为波形音频,MIDI音频和CD音频三类。n n1)波形音频n n以声波表示的声响、语音、音乐等各种形式的声音经过声音获取设备(例如麦克风)和声音播放

10、设备(例如录音机、CD唱机等)输入,并通过声卡控制采样,由A/D转换将模拟信号转变成数字信号,然后以*.WAV文件格式存储在硬盘上,这种声音媒体称为波形音频。波形音频重放时,必须经过D/A转换将数字信号转换成模拟信号,由声卡上的混音器混合后生成声波,再由音箱输出声音。16第第4章章 多媒体音频信号处理多媒体音频信号处理n n波形音频的*.WAV文件中记录的是数字信号,可以使用计算机对*.WAV文件进行各种处理,并像其他数据文件一样被存取、复制和传输。n n2)MIDI音频n n将电子乐器演奏时的指令信息(例如音高、音长和力度等)通过声卡上的MIDI控制器输入计算机,或者利用一种称为音序器的计算

11、机音乐处理软件编辑产生音乐指令集合,以*.MID文件格式存储在硬盘上,这种声音媒体称为MIDI音频。MIDI音频重放时,必须经过合成器将MIDI指令译成相应的声音信号,再由声卡上的混音器混合后生成声波,最后由音箱播出音乐。n n17第第4章章 多媒体音频信号处理多媒体音频信号处理n nMIDI音频的*.MID文件中可以包含多达16种不同乐器的声音定义。MIDI文件记录的不是乐曲本身,而是一些描述乐曲演奏过程中的指令,因此,MIDI音频是乐谱的数字化描述。MIDI文件的存储量比较小,因此,它可以满足较长时间音乐播放的要求,但是MIDI文件的录制工作较为复杂,需要使用MIDI创作并改编作品的专业知

12、识以及专门化工具,例如键盘合成器等。n n3)CD音频n nCD音频是指以44.1kHz频率、16位精度采样而获得的一种立体声数字化声音。18第第4章章 多媒体音频信号处理多媒体音频信号处理n n4.2.2音频信号的获取与处理n n1.音频信号的获取n n音频信号的获取框图如图4-5所示。图4-5音频信号获取框图19第第4章章 多媒体音频信号处理多媒体音频信号处理n n2.音频信号的处理n n在第3章里已经提到,不管多媒体信息是音频信号还是视频信号,其数据量都是十分巨大的。如果像图4-5所示的那样,经A/D转换的数字化音频信号直接进入计算机进行存储(记录)或进行传送,是不可取的。n n3.音频

13、信号的回放n n经压缩的音频信号以一定的格式记录在有关的媒体上,例如,磁带、磁盘及光盘等,或者以一定的格式传送到接收端。n n在音频信号接收端或由媒体回放音频信号时,首先由专用的硬件或软件对压缩数据进行解压缩,恢复音频数字信号,然后,经由图4-6所示的电路框图对音频信号进行放音。20第第4章章 多媒体音频信号处理多媒体音频信号处理图4-6音频信号的回放框图21第第4章章 多媒体音频信号处理多媒体音频信号处理n n4.有关音频信号的标准及规范n n在第1章中,已经特别说明标准及规范在多媒体世界中的重要性。这里,首先阐明数字电话音频信号的数据压缩标准。在表4-1中列出了国际电报电话咨询委员会(CC

14、ITT),欧洲移动通信专家组(GSM),美国移动通信标准(CTIA)及美国国家安全局各自制定的有关电话通信的编码标准。表中还给出了各种标准的大致使用领域以及它们的质量,其中,质量是以最高为5.0分来表示的。n n22第第4章章 多媒体音频信号处理多媒体音频信号处理n n除了上面所提到的数字电话编码标准外,调幅广播的音频信号范围为50Hz7kHz,又称“7kHz音频信号”,其最高频率为7kHz,当使用16kHz对其采样并进行14位二进制编码时,其数据的传送速率为224KB/s。为了对最高频率进行压缩,CCITT于1988年为其制定了G.722标准,标准规定这种信号的数据传送率为64KB/s。23

15、第第4章章 多媒体音频信号处理多媒体音频信号处理表4-1数字电话的编码标准组织ISOCCITT标准G.711G.712G.728制定时间1992197219841992传送速率(Kb/s)128643216编码算法PCMADPCMLDCELP质量5.04.34.14.0使用场合CD长途电话网络24第第4章章 多媒体音频信号处理多媒体音频信号处理GSMCTIANSAGSMGIA19831989198919821384.82.4RPELTVSELPCELPLPC3.73.83.22.5移动通信保密电话25第第4章章 多媒体音频信号处理多媒体音频信号处理n n5.常用语音文件格式n n在多媒体计算机

16、的语音处理或在后面将要说明的声卡中所用到的操作系统或工具软件为我们提供了语音文件。这些语音文件都有各自的标准,以便于用户使用和相互转换。在这里将简要介绍目前最常见的语音文件格式。n n1)VOC语音文件格式n nVOC语音文件由文件头和数据块两大部分组成。其中VOC语音文件的文件头如表4-2所示。26第第4章章 多媒体音频信号处理多媒体音频信号处理表4-2VOC语音文件的文件头偏移地址内容0013H文件类型1415H从VOC文件开始到数据块的偏移量1617HVOC文件版本号1819HVOC文件标志1AHVOC文件的数据块标志1B1DH数据块长度1EH数据采样率27第第4章章 多媒体音频信号处理

17、多媒体音频信号处理n n由表4-2看到,VOC文件的文件头主要是对VOC文件的类型、版号及标志做出说明,同时,指出了数据块的起始地址、数据块长度及采样率。n nVOC文件中数据块由性质不尽相同的子块组合而成。各子块的功能及其长度也各不相同,例如有语音数据子块、静音标志子块、ASCII码字符子块、循环重复子块、终止子块及用于立体声音响的扩展子块等。VOC文件中数据子块的长度及主要功能列于表4-3中。28第第4章章 多媒体音频信号处理多媒体音频信号处理表4-3VOC文件中数据子块的长度及主要功能数据子块号长度功能01B(字节)终止块17B+?语音数据25B+?语音数据37B静音46B标志56B+?

18、ASCII字符66B循环重复74B循环结束87B+?扩展块29第第4章章 多媒体音频信号处理多媒体音频信号处理n n不同子块的开始几个字节除前面4个如上所述外,剩下的就不太相同,表4-3中用?表示。例如,1号数据子块的开始字节中,有规定本数据块的数据压缩比的字节。知道了压缩比,就可以解压缩恢复原始的语音数据。n n2)WAV语音文件格式n n在多媒体应用中被广泛使用的是RIFF(ResourceInterchangeFileFormat)标准给出的WAV语音文件。n n与VOC文件类似,WAV文件也是由文件头和数据块两部分组成。其中文件头所规定的内容如表4-4所示。30第第4章章 多媒体音频信

19、号处理多媒体音频信号处理表4-4WAV语音文件的文件头偏移地址字节数类型内容00H03H4B字符RIFF04H07H4B长整数从下一个地址(08H)开始到文件结束的总字节数08H0BH4B字符WAVE0CH0FH4B字符fmt31第第4章章 多媒体音频信号处理多媒体音频信号处理10H11H2B整数文件标志12H13H2B整数目前为114H15H2B整数声道数16H19H4B长整数采样率1AH1DH4B长整数每秒平均字节数32第第4章章 多媒体音频信号处理多媒体音频信号处理n n由表4-4可见,WAV语音文件头也是对文件设置了一些标志并确定了对语音信号的采集速率。单声道语音信号用11.025kH

20、z的采样率采样,采样值为8bit二进制编码,双声道语音信号用44.1kHz采样率采样,即左右声道各为22.05kHz采样,每声道采样值用8bit二进制编码表示,这样一来,每个语音采样值要用16bit表示,且高8位放左声道的数据,低8位放右声道的数据。具体数据块的存放情况如表4-5所示。n n表4-5表明,数据块紧跟在文件头的后面,其偏移地址从1EH开始,前面是数据块的标志和数据块的总长度。从偏移地址26H开始存放语音数据。33第第4章章 多媒体音频信号处理多媒体音频信号处理表4-5WAV文件中的数据块存放偏移地址字节数(B)类型内容1EH21H4B字符data22H25H4B长整数采样数据总字

21、节数26H8位整数采样数据34第第4章章 多媒体音频信号处理多媒体音频信号处理n n以上我们简单地介绍了两种语音文件VOC和WAV。前者是我们在本章后面要介绍的声霸卡所形成的文件格式,后者是Microsoft的语音文件格式。在实际应用中,经常需要知道这些语音文件的格式,而且也经常会遇到由WAV文件向VOC文件的转换或由VOC文件向WAV文件的转换。所幸的是这两种文件的相互转换已有现成的程序可供调用,这就省了许多麻烦。使用者只要用一条简单的命令即可方便地完成它们之间的相互转换。但是,由于两种文件的复杂性,在利用软件命令进行两种文件格式转换时,应注意,WAV文件只支持11.025kHz、22.05

22、kHz和44.1kHz采样率,因此,在形成VOC文件时也要采用这样的采样率才能顺利地进行相互转换。35第第4章章 多媒体音频信号处理多媒体音频信号处理n nVOC文件中可包括多个数据块,而WAV文件只支持一个数据块,且只能用一种采样速率播放出来。因此,在WAV和VOC文件相互转换时,只能是功能强的VOC文件来适应WAV文件的规定。n n同时,WAV文件不支持压缩文件,因此,当VOC文件向WAV文件转换时,VOC文件中的压缩数据块将被忽略。n n3.AU声音文件格式n nAU文件是使用于UNIX操作系统下的一种波形文件。其格式如表4-6所示。36第第4章章 多媒体音频信号处理多媒体音频信号处理表

23、4-6AU文件格式偏移量内容偏移量内容03AU文件标志1619数据采样频率47文件头长度2023声道数N(1为单声道、2位双声道)811数据长度24(x1)附加描述信息(其中x为文件头长度)1215波形格式文件x声音数据37第第4章章 多媒体音频信号处理多媒体音频信号处理n n4.MID文件格式n nMID文件是一种记录数字化音乐的MIDI文件,由一个文件头块和多个音轨块组成。文件头块记录了MIDI文件的描述信息,而音轨块记录了MIDI通道的数据流信息。文件头块和音轨的格式分别如表4-7和4-8所示。38第第4章章 多媒体音频信号处理多媒体音频信号处理表4-7MID文件头偏移量内容03MID文

24、件头标识47文件头块长度815记录格式。格式0:文件由包含所有16个通道数据的一个音轨组成。格式1:文件由一个或多个同步的音轨组成。格式2:文件由一个或多个独立的音轨组成1617音轨号1819时间分割,规定了形成1/4音符节拍的时间长度39第第4章章 多媒体音频信号处理多媒体音频信号处理表4-8MID音轨偏移量内容偏移量内容03MID音轨标识8音轨数据47音轨块长度40第第4章章 多媒体音频信号处理多媒体音频信号处理4.3 话音信号的参数编码话音信号的参数编码n n4.3.1话音源n n通过对人的话音生成机理研究,人们认为,人的话音由声道产生,可分为浊音和清音两种类型。n n1.浊音n n浊音

25、由声带振动产生的准周期脉冲引起,每次振动使一股空气从肺部流进声道并激励声道,各股空气之间的间隔称为音调间隙或音调周期T。或者说,激励的速度就是音调。41第第4章章 多媒体音频信号处理多媒体音频信号处理n n2.清音n n清音由空气通过声道时,受声道某些部分压缩引起,较浊音更具有随机性。话音信号的频谱间隔对应音调周期T,包络信号是浊音在时域中实际波形的函数(音量大小),上限频率fm34kHz,一般取3.4kHz,存在三个峰点F1、F2、F3,即谐振峰,话音信号的时域波形及其频谱如图4-7所示。n n通过对话音信号的分析可知,同一个人的话音信号的周期T大致是不变的。42第第4章章 多媒体音频信号处

26、理多媒体音频信号处理图4-7话音信号的时域波形及其频谱(a)话音信号(浊音)的时域波形;(b)(b)话音信号(清音)的时域波形;(c)(c)话音信号(浊音)的频谱43第第4章章 多媒体音频信号处理多媒体音频信号处理n n4.3.2话音参数的编码及声码器n n1参数编码n n在分析合成法中,根据话音生成模型,从话音波形中提取的参数,主要有以下4种:n n(1)浊音和清音。浊音用脉冲源模拟;清音用噪声源模拟。n n(2)浊音的基本频率,或音调周期T。n n(3)音源的幅度(音量大小)。n n(4)线性滤波器的特性参数。它反映话音频谱的包络信息,表示发音器官发音的符性(不同的音符),用线性滤波器模拟

27、发音。频谱的包络用于表征各个音符的区别。44第第4章章 多媒体音频信号处理多媒体音频信号处理n n分析合成法编码步骤如下:n n(1)从话音波形中提取携带重要听觉信息的参数;n n(2)对这些参数进行编码;n n(3)利用这些参数,尽可能准确、自然地重构原始话音。n n2.声码器的工作原理n n1)工作原理n n利用滤波器组把话音频率分成几个相应的频带,然后传送各频带的话音成分(话音频谱的包络线),采样(频率较低)、编码传送到合成器的各频段,控制(调制)脉冲发生器或噪声发生器的各频段的包络,从而合成语音。45第第4章章 多媒体音频信号处理多媒体音频信号处理n n2)声码器结构n n声码器结构如

28、图4-8所示。它的工作过程如下:n n(1)在发送端,话音信号加到分析器上,带通滤波器将话音频率范围分为若干相邻频段,并由整流器和低通滤波器组成的包络检测器检出各频段时域合成信号包络(反映时域语音包络强度),并对包络进行采样、编码,由于包络变化比较慢,因而采样速度比较低,为50Hz/s。音调检测器确定话音的基音频率1/T(决定音调周期)和浊/清音。n n46第第4章章 多媒体音频信号处理多媒体音频信号处理n n(2)接收端为话音合成器。n n当接收到浊音时,脉冲发生器工作,它的信号强度由各频段上的包络控制,多频段合成后便得到合成后的语音。n n当接收到清音时,噪声发生器工作。47第第4章章 多

29、媒体音频信号处理多媒体音频信号处理图4-8声码器结构图48第第4章章 多媒体音频信号处理多媒体音频信号处理4.4 乐器数字接口乐器数字接口MIDIn n4.4.1计算机音乐n n计算机音乐也称为电子音乐,是由计算机音乐软件创作、修改和编辑乐谱,通过合成器把数字乐谱变换成声音波形,再经过混音器混合后送到音箱播放的乐曲。计算机的数字合成技术可以模拟传统乐曲的音色,也可以通过计算机的编辑功能合成不是自然乐器发出的声音。计算机音乐改变了传统音乐的创作和演奏方式的概念。49第第4章章 多媒体音频信号处理多媒体音频信号处理n n1.乐音的几个要素n n一个乐音主要由3个要素组成。n n1)音高n n音高指

30、声波的基频。各音阶的对应频率如表4-9所示。表4-9音阶与频率的对应关系音阶CDEFGAB简谱1234567频率(Hz)26129333034939244049450第第4章章 多媒体音频信号处理多媒体音频信号处理n n2)音色n n有时,具有固定音高和相同谐波的乐音给人的感觉有很大差异。n n3)响度和时值n n响度是对声音强度的衡量,它是听判乐音的基础。n n2.计算机音乐的生成n n计算机音乐系统由演奏控制器、音源和MIDI接口几部分组成。n n1)演奏控制器n n演奏控制器是一种输入和记录实时乐曲演奏信息的设备,例如钢琴模拟键盘。51第第4章章 多媒体音频信号处理多媒体音频信号处理n

31、n2)音源n n音源是计算机音乐系统的核心,是具体产生声音波形的部分。n n(1)数字合成音源。n n合成FM音乐是使高频振荡波的频率按调制信号规律变化的一种调制方式。在考虑音乐合成时,可以用频率的单音调制信号去调制基波的相角,即n nn n52第第4章章 多媒体音频信号处理多媒体音频信号处理n n对F(t)进行第一类贝塞尔函数展开可知,该调频波F(t)由载波基频c和无数对边频(m,2m,)分量所组成,各谐波分量的幅值由调制指数I的值确定。因此,采用不同的调制波频率m和调制指数I,就可以方便地合成不同频谱分布的波形,再现某些乐器的音乐,还可以得到非真实乐器的“电子模拟声”。53第第4章章 多媒

32、体音频信号处理多媒体音频信号处理n nFM音乐合成单元电路的典型形成如图4-9所示,只要给出c、m、A(t)、I(t)各项参数,这个单元电路就能输出某一特定的调角波F(t)。n nn n图4-9FM音乐合成单元电路54第第4章章 多媒体音频信号处理多媒体音频信号处理n n图中PG是相位产生器,用于为所需频率载波计算相位值,它通过累加每个单位时间的增量来实现;EG是载频包络产生器,电路由c、A控制产生正弦载波信号,它的相角由m和I控制产生正弦调制信号决定。n nYM3812是一种广泛使用的FM音乐合成芯片,能够在软件的控制下产生变化极为丰富的各种音色。它的主要性能是:n n以FM方式产生真实音响

33、;n n具有两种工作模式,9声道同时发音,可以产生6种旋律和5种节奏乐;n n内置颤音振荡器/调幅(AM)振荡器;n n可采用正弦波组合方式合成语音;n n输入/输出为TTL电平。55第第4章章 多媒体音频信号处理多媒体音频信号处理n n使用YM3812构成的音乐系统如图4-10所示。n nn n图4-10使用YM3812构成的音乐系统框图56第第4章章 多媒体音频信号处理多媒体音频信号处理n n该系统由微机通过总线传输必要的数据,由YM3812转换成相应的音高、音色、响度等数字信号,经过数/模转换器DAC变成模拟量,并经音频功率放大器驱动音响输出。n n很多声卡使用YM3812产生FM音乐,

34、典型的产品是SoundBlaster。n n厂家为这些产品配置了相应的驱动软件,用户可以借助开发工具提供的高级语言界面进行音乐创作或演奏乐曲。n n(2)采样音源。使用FM合成法来产生逼真的乐音是不甚理想的,有些乐音几乎不能产生,只在低档声卡采用。中、高档声卡采用乐音样本合成法,即波表合成法。57第第4章章 多媒体音频信号处理多媒体音频信号处理n n(3)物理模型化音源。n n物理模型化音源与合成音源和采样音源有着本质的区别,音源中既没有波形发生器也不存在采样波形,而是利用计算机的强大的处理功能和高速的实时响应能力模拟出各种演奏信息的相应声波。n n4.4.2MIDI接口n nMIDI(Mus

35、icalInstrumentDigitalInterface)即乐器数字接口,是音乐与计算机结合的产物。它是一种计算机与MIDI设备之间连接的硬件,同时也是一种数字音乐的国际标准。58第第4章章 多媒体音频信号处理多媒体音频信号处理n n1.MIDI基本概念n nMIDI接口规范由两部分组成。n n1)硬件连接端口n n规定了乐器间的物理连接方式,要求乐器必须带有MIDI端口,并对连接两个乐器的MIDI电缆及传输电信号作了规定。n nMIDI接口具有三种输入/输出端口,它们分别是MIDIIN、MIDIOUT和MIDITHRU。n n(1)MIDIIN:MIDI输入端口,MIDI设备用MIDII

36、N端口接受MIDI信息。n n59第第4章章 多媒体音频信号处理多媒体音频信号处理n n(2)MIDIOUT:MIDI输出端口,MIDI设备用MIDIOUT端口送出MIDI信息。n n(3)MIDITHRU:MIDI转接端口,MIDI设备利用MIDITHRU端口起到中继和桥接的作用。n nMIDI接口的IN、OUT、THRU端口均是一个圆形的5孔接头,如图4-11所示。n n最常用的MIDI设备连接方法是用一根MIDI电缆将演奏控制器的MIDIOUT端口与计算机(内有音序器)的MIDIIN端口相连接,同时用另一根MIDI电缆将计算机的MIDIOUT端口与音源MIDIIN端口相连接,这样由演奏控

37、制器发出的演奏信息便可被计算机接收和存储,经过处理后送到音源去演奏。60第第4章章 多媒体音频信号处理多媒体音频信号处理图4-11MIDI接口示意图61第第4章章 多媒体音频信号处理多媒体音频信号处理n n2)数据传输格式n nMIDI标准规定了硬件上传输的信息的编码方式。n n2.MIDI设备n n通过MIDI接口,计算机可以控制各个乐器的输出。n n1)MIDI合成器n n已经指出,MIDI声音产生和记录的方法与波形声音产生和记录的方法是不同的,MIDI文件记录的内容是音乐演奏的一系列指令。n n2)MIDI音序器n n音序器又称声音序列发生器,是一种记录、编辑和播放MIDI文件的软件,是

38、为MIDI作曲而设计的计算机程序。62第第4章章 多媒体音频信号处理多媒体音频信号处理n n3)MIDI键盘n n演奏者使用键盘可以直接控制合成器的输出。n n4)微处理器n n微处理器的任务是接收和发送MIDI信息。n n5)控制面板n n控制面板控制那些不直接由键盘产生的音符和与持续时间有关的一些其他量,如控制总音量的滑动条,控制合成器开关的按钮,以及一组确定声音生成器音调的声音选择按钮。n n还可以通过辅助控制器调节合成器的音调或加入特殊效果。n n另外,MIDI用时钟表示音符的长度,并实现发送端与接收端的同步。n n63第第4章章 多媒体音频信号处理多媒体音频信号处理n n3.MIDI

39、软件n n计算机通过MIDI接口与各种MIDI乐器连接后,就可以使用各种各样的MIDI软件。n nMIDI软件可以分为以下4类:n n(1)音乐记录和演奏软件。n n(2)乐谱创作与打印软件。n n(3)合成器片断编辑或管理软件。n n(4)音乐教学软件。64第第4章章 多媒体音频信号处理多媒体音频信号处理4.5 声卡概述声卡概述n n4.5.1声卡的结构与工作原理n n1.声卡的结构n n计算机处理声音的硬件设备是声卡,尽管声卡的类型很多,但声卡的基本结构和功能都是类似的。声卡的主要组成部分如图4-12所示。n n65第第4章章 多媒体音频信号处理多媒体音频信号处理图4-12声卡的功能结构模

40、型66第第4章章 多媒体音频信号处理多媒体音频信号处理n n1)音源n n声卡可以接受话筒的信号输入(MICIN),外部的音频信号输入(LINEIN),或是内部连接的CD音频信号。n n2)混音器(Mixer)n n混音器芯片可以混合各种音源,包括数字化声音、MIDI(合成)音乐、CD音频输入、LINEIN、MICIN以及PC扬声器,并通过软件控制多种音源的音量,实现混合录音。3)前置放大器n n在有些声卡上有独立的音频前置放大器芯片,它是一块模拟信号处理芯片,其主要任务是将各种音源的微弱信号放大到一定的电平,或进行选择、补偿、控制等处理,使其足以推动后级电路。67第第4章章 多媒体音频信号处

41、理多媒体音频信号处理n n4)DSP(DigitalSignalProcessing,数字信号处理)芯片n nDSP是声卡的核心部件,是处理速度高、集成度大的可编程芯片,能把数据及时处理并以所需要的方式传送给用户。n n5)音乐合成芯片n n音乐合成芯片是处理MIDI音乐的关键,合成音乐有两种方式:频率调制(FM)和波形表(WaveTable)合成方式。n n6)波形表ROMn n并不是所有的波形表都能达到相同的效果,取得成功的关键在于提供足够多的音色样本数据。68第第4章章 多媒体音频信号处理多媒体音频信号处理n n7)CD-ROM驱动器接口n n声卡上含有一个或多个CD-ROM驱动器接口,

42、如SoundBlaster系列的一些声卡在卡上安排了Panasonic、Sony和Mitsumi三种接口,有一些声卡必须与特定的CD-ROM驱动器相连,采用SCSI-2标准CD-ROM驱动器的接口卡,使得用户可以使用丰富的CD节目。69第第4章章 多媒体音频信号处理多媒体音频信号处理n n8)功率放大器n n音频信号在输出之前必须经过功率放大。声卡一般把信号放大到4W输出,输出的立体声音频信号可以接到耳机、有源音响或是功率较大的立体声功放。n n9)总线连接n n声卡插在电脑的总线扩展槽上,为了实现高速传输数据的要求,声卡和电脑内存之间采用DMA传输方式,当传输完毕时声卡向CPU发送一个中断请

43、求信号(IRQ)。n n70第第4章章 多媒体音频信号处理多媒体音频信号处理n n2.声卡的基本工作原理n n声卡有4种常见的处理声音信号的方式,在不同处理方式下,音频信号(数字的及模拟的)所通过的路径是不同的。声卡的工作原理如图4-13所示。n n1)纯模拟音频通道n n外界的各种模拟音频信号,包括LINEIN、MICIN及CD音频信号通过相应的输入插座送到声卡的混音器芯片,通过软件,可以控制混音器芯片对各种音源的选取、放大和混合比例,以及控制左右声道的输出平衡。71第第4章章 多媒体音频信号处理多媒体音频信号处理图4-13声卡的工作原理72第第4章章 多媒体音频信号处理多媒体音频信号处理n

44、 n2)数字录音n n外界音频信号经过混音器及前置放大器的混合放大,进入DSP。n n3)数字声音的回放n n在播放声音文件时,数字化的声音调入内存,通过DMA方式输入声卡的DSP。n n4)MIDI的播放n nMIDI文件首先从硬盘调入内存,传送给声卡,音乐合成芯片根据MIDI文件的内容,从波形表中获取有关的预存放的声音样本,经过变换和加工产生模拟音频信号,此后通过混音器及功放向外界输出。73第第4章章 多媒体音频信号处理多媒体音频信号处理n n4.5.2声卡的主要性能指标和功能n n1.声卡的主要性能指标n n(1)信噪比SNR(SignaltoNoiseRatio)是对声卡抑制噪音能力的

45、评价。n n(2)总谐波失真THD+N(TotalHarmonicDistortion+Noise)是对声卡保真度的总体评价。n n(3)频率响应FR(FrequencyResponse)是对声卡D/A与A/D转换器频率响应能力的评价。n n2.声卡的功能n n声卡必须配有功能强大的软件,这些软件在操作系统支持下运行,实现声卡的基本功能。74第第4章章 多媒体音频信号处理多媒体音频信号处理n n1)录制、编辑和回放数字声音文件n n来自麦克风、录音机、收音机及激光唱盘等音源的声音信号,经采样、编码、处理后以数字声音文件的形式存储。n n2)对数据进行压缩和对压缩的数据进行解压的功能在记录数字声

46、音信号时,应先进行数据压缩。在进行数字声音文件的回放时,应先进行解压。n n3)语音合成技术的使用n n现在大多数声卡都具备语音合成的功能,能够将文字直接转换成声音。75第第4章章 多媒体音频信号处理多媒体音频信号处理n n4)语音识别功能n n目前,声卡所具备的语音识别功能还只是初步的,而且不是每种声卡都具备这样的功能。n n5)音量控制n n在声卡中,混声器集成电路芯片与软件相结合,可以对各种声源以及数字的、模拟的声音信号的音量进行控制。n n6)具有MIDI接口(乐器数字接口)n n利用MIDI接口,计算机可以控制多台具有MIDI接口的乐器。乐器可由MIDI接口产生MIDI文件。这种文件比WAV文件更节省内存,而且也可以对MIDI文件进行编辑和回放。n n7)多媒体制作及演示n n有关多媒体软件的制作是本书后面要讲的内容。76第第4章章 多媒体音频信号处理多媒体音频信号处理n n8)软件开发工具n n凡是功能强的声卡,均配有十分完备的软件,其中包括用于二次开发(制作)的工具软件。77谢谢观赏!谢谢观赏!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号