常见音频 编码格式 解析

上传人:小** 文档编号:89138401 上传时间:2019-05-19 格式:DOC 页数:6 大小:23KB
返回 下载 相关 举报
常见音频 编码格式 解析_第1页
第1页 / 共6页
常见音频 编码格式 解析_第2页
第2页 / 共6页
常见音频 编码格式 解析_第3页
第3页 / 共6页
常见音频 编码格式 解析_第4页
第4页 / 共6页
常见音频 编码格式 解析_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《常见音频 编码格式 解析》由会员分享,可在线阅读,更多相关《常见音频 编码格式 解析(6页珍藏版)》请在金锄头文库上搜索。

1、常见音频编码格式解析常见音频编码格式解析2011-11-0211:56有关音频编码自然界中的声音非常复杂,波形极其复杂,通常我们采用的是脉冲代码调制编码,即PCM编码。PCM通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。1、什么是采样率和采样大小(位/bit)?声音其实是一种能量波,因此也有频率和振幅的特征,频率对应于时间轴线,振幅对应于电平轴线。波是无限光滑的,弦线可以看成由无数点组成,由于存储空间是相对有限的,数字编码过程中,必须对弦线的点进行采样。采样的过程就是抽取某点的频率值,很显然,在一秒中内抽取的点越多,获取得频率信息更丰富,为了复原波形,一次振动中,必须有2个点

2、的采样,人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至少每秒进行40k次采样,用40kHz表达,这个40kHz就是采样率。我们常见的CD,采样率为44.1kHz。光有频率信息是不够的,我们还必须获得该频率的能量值并量化,用于表示信号强度。量化电平数为2的整数次幂,我们常见的CD位16bit的采样大小,即2的16次方。采样大小相对采样率更难理解,因为要显得抽象点,举个简单例子:假设对一个波进行8次采样,采样点分别对应的能量值分别为A1-A8,但我们只使用2bit的采样大小,结果我们只能保留A1-A8中4个点的值而舍弃另外4个。如果我们进行3bit的采样大小,则刚好记录下

3、8个点的所有信息。采样率和采样大小的值越大,记录的波形更接近原始信号。2、有损和无损根据采样率和采样大小可以得知,相对自然界的信号,音频编码最多只能做到无限接近,至少目前的技术只能这样了,相对自然界的信号,任何数字音频编码方案都是有损的,因为无法完全还原。在计算机应用中,能够达到最高保真水平的就是PCM编码,被广泛用于素材保存及音乐欣赏,CD、DVD以及我们常见的WAV文件中均有应用。因此,PCM约定俗成了无损编码,因为PCM代表了数字音频中最佳的保真水准,并不意味着PCM就能够确保信号绝对保真,PCM也只能做到最大程度的无限接近。我们而习惯性的把MP3列入有损音频编码范畴,是相对PCM编码的

4、。强调编码的相对性的有损和无损,是为了告诉大家,要做到真正的无损是困难的,就像用数字去表达圆周率,不管精度多高,也只是无限接近,而不是真正等于圆周率的值。3、为什么要使用音频压缩技术要算一个PCM音频流的码率是一件很轻松的事情,采样率值采样大小值声道数bps。一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的WAV文件,它的数据速率则为44.1K162=1411.2Kbps。我们常说128K的MP3,对应的WAV的参数,就是这个1411.2Kbps,这个参数也被称为数据带宽,它和ADSL中的带宽是一个概念。将码率除以8,就可以得到这个WAV的数据速率,即176.4KB/s。

5、这表示存储一秒钟采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的音频信号,需要176.4KB1分钟则约为10.34M,这对大部分用户是不可接受的,尤其是喜欢在电脑上听音乐的朋友,要降低磁盘占用,只有2种方法,降低采样指标或者压缩。降低指标是不可取的,因此专家们研发了各种压缩方案。由于用途和针对的目标市场不一样,各种音频压缩编码所达到的音质和压缩比都不一样,在后面的文章中我们都会一一提到。有一点是可以肯定的,他们都压缩过。4、频率与采样率的关系采样率表示了每秒对原始信号采样的次数,我们常见到的音频文件采样率多为44.1KHz,这意味着什么呢?假设我们有2段正弦波信号,分别为20

6、Hz和20KHz,长度均为一秒钟,以对应我们能听到的最低频和最高频,分别对这两段信号进行40KHz的采样,我们可以得到一个什么样的结果呢?结果是:20Hz的信号每次振动被采样了40K/20=2000次,而20K的信号每次振动只有2次采样。显然,在相同的采样率下,记录低频的信息远比高频的详细。这也是为什么有些音响发烧友指责CD有数码声不够真实的原因,CD的44.1KHz采样也无法保证高频信号被较好记录。要较好的记录高频信号,看来需要更高的采样率,于是有些朋友在捕捉CD音轨的时候使用48KHz的采样率,这是不可取的!这其实对音质没有任何好处,对抓轨软件来说,保持和CD提供的44.1KHz一样的采样

7、率才是最佳音质的保证之一,而不是去提高它。较高的采样率只有相对模拟信号的时候才有用,如果被采样的信号是数字的,请不要去尝试提高采样率。5、流特征随着网络的发展,人们对在线收听音乐提出了要求,因此也要求音频文件能够一边读一边播放,而不需要把这个文件全部读出后然后回放,这样就可以做到不用下载就可以实现收听了。也可以做到一边编码一边播放,正是这种特征,可以实现在线的直播,架设自己的数字广播电台成为了现实。四、各种主流音频编码(或格式)的介绍1、PCM编码PCM脉冲编码调制是PulseCodeModulation的缩写。前面的文字我们提到了PCM大致的工作流程,我们不需要关心PCM最终编码采用的是什么

8、计算方式,我们只需要知道PCM编码的音频流的优点和缺点就可以了。PCM编码的最大的优点就是音质好,最大的缺点就是体积大。我们常见的AudioCD就采用了PCM编码,一张光盘的容量只能容纳72分钟的音乐信息。2、WAVE这是一种古老的音频文件格式,由微软开发。WAV是一种文件格式,符合PIFFResourceInterchangeFileFormat规范。所有的WAV都有一个文件头,这个文件头音频流的编码参数。WAV对音频流的编码没有硬性规定,除了PCM之外,还有几乎所有支持ACM规范的编码都可以为WAV的音频流进行编码。很多朋友没有这个概念,我们拿AVI做个示范,因为AVI和WAV在文件结构上

9、是非常相似的,不过AVI多了一个视频流而已。我们接触到的AVI有很多种,因此我们经常需要安装一些Decode才能观看一些AVI,我们接触到比较多的DivX就是一种视频编码,AVI可以采用DivX编码来压缩视频流,当然也可以使用其他的编码压缩。同样,WAV也可以使用多种音频编码来压缩其音频流,不过我们常见的都是音频流被PCM编码处理的WAV,但这不表示WAV只能使用PCM编码,MP3编码同样也可以运用在WAV中,和AVI一样,只要安装好了相应的Decode,就可以欣赏这些WAV了。在Windows平台下,基于PCM编码的WAV是被支持得最好的音频格式,所有音频软件都能完美支持,由于本身可以达到较

10、高的音质的要求,因此,WAV也是音乐编辑创作的首选格式,适合保存音乐素材。因此,基于PCM编码的WAV被作为了一种中介的格式,常常使用在其他编码的相互转换之中,例如MP3转换成WMA。3、MP3编码据说MP3的由来是由德国某工作室在研究如何抓取CD音轨时衍生出的计算机文件格式。MP3本身是一种压缩与解压缩的计算方式,用来处理高比率的声音信息。它所生成的声音文件音质接近CD,而文件大小却只有其十二分之一。MP3是MPEG1Layer3的缩写,也就是MPEG-1AudioLayer-3的缩写。而MPEG这名词的含义是动态影像压缩,它是MovingPictureExp-ertsGroup的缩写。我们

11、所了解的VCD就是使用MPEG-1技术,而DVD则是使用更进一步MPEG-2的技术。MP3是MPEG里的一项技术分支,主要用来压缩声音。一共分三个等级(Layer),分别是Layer-1(MP1),Layer-2(MP2)和Layer-3(MP3)。MP3是利用MPEGAudioLayer3的技术,将声音用1:10甚至1:12的压缩率,变成容量较小的文件。以一张光碟容量为650M为例,若以CD格式,它只能容纳最多74分钟的音乐;如果做成MP3格式,一张光碟就能放一百多首歌曲。由于MP3的体积小,音质有非常接近CD,所以在国际互联网上很快流行起来,也成为个人电脑上重要的音频格式。由于人耳只能听到

12、一定频段内的声音,因此在人耳听起来,MP3与CD却没有什么不同。当然,MP3一种失真压缩,就像图形文件JPG一样,因为失真压缩,所以可以压得很多,也可以调整压缩比率,压得越多失真也越多。从技术层面来看,MP3是一种音频压缩技术的简称。由于这种压缩方式的全称叫MPEGAUDIOLAYER3,所以人们把它简称为MP3。MP3的音频压缩基于这样一种考虑:因为人耳只能听到一定频段内的声音,而其他更高或更低频率的声音对人耳是没有用处的,所以MP3技术就把这部分声音去掉了,从而使得文件体积大为缩小,但在人耳听起来,却并没有什么失真。同时,MP3格式音乐的流行也带动了MP3专用播放装置的出现,并在近年来得到

13、快速发展。目前市场上流行的MP3设备从功能和性能上已经远远超出了原来播放器的范畴,逐步发展成为集音频播放(包括MP3之外的音乐格式)、录音复读、文本阅读、移动存储、FM收音等功能为一体的多媒体掌上设备。有的高端MP3设备甚至还集成了音频编辑处理、电影播放等功能。MP3的优点由于大大压缩了文件的体积,所以相同的空间能存储更多的信息。由于没有机械元件,全部是电子元件,所以不存在防震问题,更加适合运动时欣赏音乐。另外,MP3可以随心所欲的进行音频编辑处理,编辑自己喜爱的歌。MP3的缺点MP3音频压缩技术是一种失真压缩,因为人耳只能听到一定频段内的声音,而其他更高或更低频率的声音对人耳是没有用处的,所

14、以MP3技术就把这部分声音去掉了,从而使得文件体积大为缩小。虽然听上去MP3音乐仍旧具有接近CD的音质,但毕竟要比CD稍逊一些。4、OGG编码网络上出现了一种叫OggVorbis的音频编码,号称MP3杀手!OggVorbis究竟什么来头呢?OGG是一个庞大的多媒体开发计划的项目名称,将涉及视频音频等方面的编码开发。整个OGG项目计划的目的就是向任何人提供完全免费多媒体编码方案!OGG的信念就是:OPEN!FREE!Vorbis这个词汇是特里普拉特柴特的幻想小说SmallGods中的一个花花公子人物名。这个词汇成为了OGG项目中音频编码的正式命名。目前Vorbis已经开发成功,并且开发出了编码器

15、。OggVorbis是高质量的音频编码方案,官方数据显示:OggVorbis可以在相对较低的数据速率下实现比MP3更好的音质!OggVorbis这种编码也远比90年代开发成功的MP3先进,她可以支持多声道,这意味着什么?这意味着OggVorbis在SACD、DTSCD、DVDAUDIO抓轨软件(目前这种软件还没有)的支持下,可以对所有的声道进行编码,而不是MP3只能编码2个声道。多声道音乐的兴起,给音乐欣赏带来了革命性的变化,尤其在欣赏交响时,会带来更多临场感。这场革命性的变化是MP3无法适应的。和MP3一样,OggVorbis是一种灵活开放的音频编码,能够在编码方案已经固定下来后还能对音质进

16、行明显的调节和新算法的改良。因此,它的声音质量将会越来越好,和MP3相似,OggVorbis更像一个音频编码框架,可以不断导入新技术逐步完善。和MP3一样,OGGVBR。5、MPC编码MPC又是另外一个令人刮目相看的实力派选手,它的普及过程非常低调,也没有什么复杂的背景故事,她的出现目的就只有一个,更小的体积更好的音质!MPC以前被称作MP+,很显然,可以看出她针对的竞争对手是谁。但是,只要用过这种编码的人都会有个深刻的印象,就是她出众的音质。6、mp3PRO编码2001年6月14日,美国汤姆森多媒体公司(ThomsonMultimediaSA)与佛朗赫弗协会(FraunhoferInstitute)于6月14日发布了一种新的音乐格式版本,名称为mp3PRO,这是一种基于mp3编码技术的改良方案,从官方公布的特征看来确实相当吸引人。从各方面的资料显示,mp3PRO并不是一种全新的格式,完全是基于传统mp3编码技术的一

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号