3.2 音频数据的制作.doc

上传人:cn****1 文档编号:545967155 上传时间:2022-11-13 格式:DOC 页数:23 大小:670.01KB
返回 下载 相关 举报
3.2 音频数据的制作.doc_第1页
第1页 / 共23页
3.2 音频数据的制作.doc_第2页
第2页 / 共23页
3.2 音频数据的制作.doc_第3页
第3页 / 共23页
3.2 音频数据的制作.doc_第4页
第4页 / 共23页
3.2 音频数据的制作.doc_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《3.2 音频数据的制作.doc》由会员分享,可在线阅读,更多相关《3.2 音频数据的制作.doc(23页珍藏版)》请在金锄头文库上搜索。

1、3.2 音频数据的制作3.2.1 声音信号数字化声音是空气的振动而发出的,通常用模拟波的形式来表示。它有两个基本参数:振幅和频率。振幅反映声音的音量;频率反映声音的音调。频率在20Hz20kHz的波称为音频波;频率小于20Hz的波称为次音波;频率大于20kHz的波则称为超音波。声音的质量是根据声音的频率范围来划分的:电话质量:200Hz3.4kHz;调幅广播质量:50Hz7kHz;调频广播质量:20Hz15kHz;数字激光唱盘(CD-DA)质量:10Hz20kHz。声波的包络线(envelope)是包裹整个波形的一条理想曲线。该曲线随着声音振幅的每个波峰发展。音频是连续变化的模拟信号,而计算机

2、只能处理数字信号,要使计算机能处理音频信号,必须把模拟音频信号转换成用“0”、“1”表示的数字信号,这就是音频的数字化。音频的数字化涉及到采样、量化及编码等多种技术。1. 采样音频是随时间变化的连续信号,要把它转换成数字信号,必须先按一定的时间间隔对连续变化的音频信号进行采样。一定的时间间隔T为采样周期,1/T为采样频率。根据采样定理:采样频率应大于等于声音最高频率的两倍。采样频率越高,在单位时间内计算机取得的声音数据就越多,声音波形表达得就越精确,而需要的存储空间也就越大。2. 量化声音的量化是把声音的幅度划分成有限个量化阶距,把落入同一阶距内的样值归为一类,并指定同一个量化值。量化值通常用

3、二进制表示。表达量化值的二进制位数称为采样数据的比特数。采样数据的比特数越多,声音的质量越高,所需的存储空间就越多;采样数据的比特数越少,声音的质量就越低,而所需的存储空间就越少。市场上销售16位的声卡(量化值的范围065536),比8位的声卡(0256)质量高。声音的存储量可用下式表示:式中:v为存储量;Fc为采样频率;B为量化位数;S为声道数3. 编码计算机系统的音频数据在存储和传输中必须进行压缩,但是压缩会造成音频质量下降及计算量的增加。音频的压缩方法有很多,音频的无损压缩包括不引入任何数据失真的各种编码,而音频的有损压缩包括波形编码、参数编码和同时利用这两种技术的混合编码。波形编码方式

4、要求重构的声音信号尽可能接近采样值。这种声音的编码信息是波形,编码率在9.6kbps64kbps之间,属中频带编码,重构的声音质量较高。波形量化法易受量化噪音的影响,数据率不易降低。这种波形编码技术有PCM(脉冲编码调制)、DPCM(差分脉冲编码调制)、ADPCM(自适应差分脉冲编码调制)及属于频域编码的APC(自适应预测编码)、SBC(子带编码)、ATC(自适应变换编码)。参数编码以声音信号产生的模型为基础,将声音信号变换成模型后再进行编码。参数编码的参数有共振峰、线性预测(LPC)、同态等。这种编码方法的数据率低,但质量不易提高,编码率为0.8kbps4.8kbps,属窄带编码。混合编码是

5、把波形编码的高质量与参数编码的低数据率结合在一起的编码方式,可以在4.8kbps9.6kbps的编码率下获得较高质量的声音。较成功的混合编码技术有:多脉冲线性预测编码(MPLPC)、码本激励线性预测编码(CELPC)和规则脉冲激励LPC编码(RPELPC) 等。3.2.2 声音文件的格式和存储文本文件一样,存储声音数据也需要有存储格式。目前比较流行的以wav、au、aiff、snd 、rm、mp3、mid、mod等为扩展名的文件格式。wav格式主要用在PC上,au主要用在Unix工作站上,aiff和snd主要用在苹果机和美国视算科技有限公司(Silicon Graphics,Inc,SGI)的

6、工作站上,rm和mp3是因特网上流行的音频压缩格式,mid、mod以*.MID命名的MIDI音频文件按MIDI数字化音乐的国际标准来记录和描述音符、音道、音长、音量和触键力度等音乐信息的指令。用wav为扩展名的文件格式称为波形文件格式(WAVE File Format)。波形文件格式支持存储各种采样频率和样本精度的声音数据,并支持声音数据的压缩。波形文件有许多不同类型的文件构造块组成,其中最主要的两个文件构造块是Format Chunk(格式块)和Sound Data Chunk(声音数据块)。格式块包含有描述波形的重要参数,例如采样频率和样本精度等,声音数据块则包含有实际的波形声音数据。RI

7、FF中的其他文件块是可选择的。它的简化结构如图319所示。 图319 WAVE文件结构为便于辨认文件的属性,表32列出了部分声音文件的类型。表32常见的声音文件文件扩展名说 明auSun和NeXT公司的声音文件存储格式aif(Audio Interchange)Apple计算机上的声音文件存储格式cmf(Creative Music Format)声霸(SB)卡带的MIDI文件存储格式mctMIDI文件存储格式mff(MIDI Files Format)MIDI文件存储格式1/2mid(MIDI)Windows的MIDI文件存储格式mp2MPEG Layer I , IImp3MPEG Lay

8、er IIImod(Module)MIDI文件存储格式rm(RealMedia)RealNetworks公司的流放式声音文件格式ra(RealAudio)RealNetworks公司的流放式声音文件格式rolAdlib声音卡文件存储格式snd(sound)Apple计算机上的声音文件存储格式seqMIDI文件存储格式sngMIDI文件存储格式voc(Creative Voice)声霸卡存储的声音文件存储格式wav(Waveform)*Windows采用的波形声音文件存储格式wrkCakewalk Pro软件采用的MIDI文件存储格式3.2.3 MIDI声音MIDI(Musical Instru

9、ment Digital Interface)是音乐器数字接口的缩写,泛指数字乐器接口的国际标准,它始建于1982年。多媒体Windows支持在多媒体节目中使用MIDI文件。标准的多媒体PC平台能够通过内部合成器或连到计算机MIDI端口的外部合成器播放MIDI文件。利用MIDI文件演奏音乐,所需的内存量最少。如演奏2分钟乐曲的MIDI文件仅需不到8K的存储空间。MIDI标准规定了不同厂家的电子乐器与计算机连接的电缆和硬件。它还指定从一个装置传送数据到另一个装置的通信协议。这样,任何电子乐器,只要有处理MIDI信息的处理器和适当的硬件接口都能变成MIDI装置。MIDI之间靠这个接口传递消息(Ma

10、ssage)而进行彼此通信。实际上消息是乐谱(Score)的数字描述。乐谱由音符序列、定时和称作合成音色(Patches)的乐器定义所组成。当一组MIDI消息通过音乐合成芯片演奏时,合成器解释这些符号,并生产音乐。1. MIDI的术语。 MIDI文件:存放MIDI信息的标准文件格式。MIDI文件中包含音符、定时和多达16个通道的演奏定义。文件包括每个通道的演奏音符信息:键、通道号、音长、音量和力度(击键时,键达最低位置的速度)。 通道(Channels):MIDI可为16个通道提供数据。每个通道访问一个独立的逻辑合成器。Microsoft使用110通道扩展合成器,1316用作基本合成器。 音序

11、器(Sequencer):这是为MIDI作曲而设计的计算机程序或电子装置。音序器能够用来记录、播放、编辑MIDI事件。大多数音序器能输入、输出MIDI文件。 合成器(Synthesizer):利用数字信号处理器或其它芯片来产生音乐或声音的电子装置。数字信号处理器产生并修改波形,然后通过声音产生器和扬声器发出声音。合成器发声的质量和声部取决于以下因素:合成器能够同时播放的独立波形的个数。它控制软件的能力,合成器电路中的存储空间。 乐器(Instrument):合成器能产生特定声音。不同的合成器,乐器音色号不同,声音质量也不同。如,多数乐器都能合成钢琴的声音,不同乐器使用的音色不同,它们输出的声音

12、是有差异的。 复音(Polyphony):这指的是合成器同时支持的最多音符数。如一个能以6个复音合成4种乐器声音的合成器,可同时演奏分布于4种乐器的6个音符。它可能是4个音符的钢琴和弦、一个长笛和一个小提琴的音。 音色(Timber):音色指的是声音的音质。音色取决于声音频率。在非正式的用法中,它指的是与特定乐器相关的特定声音,如低音提琴、钢琴、小提琴的声音均有各自的声音。 音轨(Track):一种用通道把MIDI数据分隔成单独组、并行组的文件概念。0号格式的MIDI文件把这些音轨合并成一个。1号格式MIDI文件支持不同的音轨。 合成音色映射器(Patch Appear):它是一种软件。为了适

13、应Microsoft MIDI合成音色,分配表规定了合成音色编号。软件要为特定的合成器重新分配乐器合成音色编号,Windows的多媒体映射器可将乐器的合成音映射到任意MIDI装置上。(10)通道映射(Channel Mapping):通道映射把发送装置的MIDI通道号变换成适当的接收装置的通道号。例如编排在16号通道的鼓乐,对于仅接收6号通道的鼓来说,就被映射成6号通道。2. MIDI的特点(1)生成的文件较小,节省内存空间,因为MIDI文件存储的是命令,而不是声音数据。(2)容易编辑,因为编辑命令比编辑声音波形容易。(3)可和其他媒体如数字电视、图形、动画、话音等起播放,以加强演示效果。MI

14、DI的缺点是处理话音的能力较差3.2.4 数字化声音与MIDI的比较数字化声音是采样得到的声音经数字化后的数值,而MIDI是让合成器发声的指令。MIDI与数字化声音相比,其文件紧凑,所占空间小。MIDI文件的大小与回放的质量完全无关。通常MIDI文件比CD质量的数字化声音文件小2001000倍,它不占许多内外存空间和CPU资源。在某些情况下,如果用的MIDI声源较好,MIDI有可能发出比数字化声音更好的质量。在不需要改变音调或降低音质的情况下,可以改变MIDI的文件长度(通过改变其速度)。MIDI数据完全是可编辑的,可以用多种方法来处理它的每一个细节(可达亚毫秒的精度),甚至可修改音乐的乐谱。

15、而在处理数字化声音时,这些方法完全用不上。但是因为MIDI数据并不是声音,当MIDI回放设备与产生时所指定的设备相同时,回放的结果才是精确的。另外,MIDI不适合回放语言对话。数字化声音可根据需要调整采样的大小和频率,以获得不同质量的声音,因此其质量的一致性和可靠性都比较好,而MIDI在这一点上就比较差。另外,数字化声音有更多的应用软件和系统支持,为了创建数字化声音所要求的准备与编辑工作不需要掌握许多音乐理论知识,而MIDI则要求掌握比较多的音乐理论知识。3.2.5 常用音频编辑工具介绍音频编辑工具使用用来录放、编辑、加工和分析声音文件。声音工具使用得相当普遍,但它们的功能相差很大。下面列出了比较常见的几种工具。1. Cakewalk Pro Audio (Cakewalk SONAR)早期Cakewalk,它是专门进行MIDI制作、处理的音序器软件,自4.0版本后,增加了对音频的处理功能。目前,它的最新版本是Cakewalk SONAR,国内使用最普遍的版本是9.0X。虽然Cakewalk在音频处理方面有些不尽人意之处,但它在MIDI制作、处理方面,功能超强,操作简便,具有无法比拟的绝对优势。如图3-20所示是Cakewalk Pro 9.0的操作界面。图320 Cakewalk Cakewalk Pro 9.0操作界面2.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号