数字音频-wing

上传人:子 文档编号:52146932 上传时间:2018-08-18 格式:PPT 页数:31 大小:1.64MB
返回 下载 相关 举报
数字音频-wing_第1页
第1页 / 共31页
数字音频-wing_第2页
第2页 / 共31页
数字音频-wing_第3页
第3页 / 共31页
数字音频-wing_第4页
第4页 / 共31页
数字音频-wing_第5页
第5页 / 共31页
点击查看更多>>
资源描述

《数字音频-wing》由会员分享,可在线阅读,更多相关《数字音频-wing(31页珍藏版)》请在金锄头文库上搜索。

1、 数字音频Prepared By Wing.LeiPrepared By Wing.LeiDate: Dec.16.2005Date: Dec.16.2005数 字 音 频基础介绍早期数字音频新型数字音频流媒体常见视频伴音数字音频基础介绍早期用模拟方式来记录音频,但它存在着复制失真和因介质磨损 而失效的问题,为避免这些问题,数字音频出现了!将模拟声 音数字化最早采用PCM (pulse code modulation)编码,即是脉 冲编码调制,它几乎是所有数字音频格式的始祖。PCM:脉冲编码调制(pulse code modulation,)是概念上最简单 、理论上最完善的编码系统,是最早研制

2、成功、使用最为广泛 的编码系统,但也是数据量最大的编码系统。数字音频基础介绍1 1、PCMPCM:脉冲编码调制脉冲编码调制 由于模拟声音信号非常复杂,由于模拟声音信号非常复杂,PCMPCM需要通过采样、量化、编码三个步骤将连需要通过采样、量化、编码三个步骤将连 续变化的模拟信号转换为数字编码。续变化的模拟信号转换为数字编码。数字音频基础介绍2、采样率和量化级声音数字化有两个步骤:第一步是采样,就是每隔一段时间间隔读一次声音的幅度。第二步是量化,就是把采样得到的声音信号幅度转换成数字值。人耳的听觉要求,需要至少40K/s次采样,用40kHz来表示,这个40kHz就是 采样率。正弦线代表原始音频;

3、黄色的方正弦线代表原始音频;黄色的方 格代表采样后得到的结果,二者格代表采样后得到的结果,二者 越吻合说明采样结果越好。横坐越吻合说明采样结果越好。横坐 标表示采样率;纵坐标是量化级。标表示采样率;纵坐标是量化级。 格子从左到右,逐渐加密,可见格子从左到右,逐渐加密,可见 采样率越大则音质越有保证;同采样率越大则音质越有保证;同 样,当纵坐标的单位越小则越有样,当纵坐标的单位越小则越有 利于音质的提高,即采样量化级利于音质的提高,即采样量化级 越大越好越大越好数字音频基础介绍数字音频基础介绍3、有损压缩与无损压缩存储1分钟采样率为44.1KHz,量化级为16bit,双声道的PCM编码的音频信号

4、 ,需要10.34MB的空间。在所有的数字音频编码中,PCM编码代表了最高的保 真水平,因此,被约定俗成为无损编码。我们而通常上讲的有损音频编码, 只是相对于PCM编码而言的。有损压缩:是指使用压缩后的数据进行重构,重构后的数据与原来的数据有 所不同,但不影响人对原始资料表达的信息造成误解。有损压缩适用于重构 信号不一定非要和原始信号完全相同的场合。数字音频基础介绍数字音频基础介绍4、压缩率和码率 压缩率:通常指音乐文件压缩前和压缩后大小的比值 .用来简单描述数字声 音的压缩效率。码率:也称比特率,也是一种表示数字音乐压缩效率的重要指标,它表示记 录音频数据每秒钟所需要的比特值(bit),通常

5、用Kbps(即每秒1024bit) 作为单位。CD中的数字音乐码率为1411.2Kbps,而MP3音频的码率为112Kbps 128Kbps。数字音频基础介绍数字音频基础介绍早期数字音频格式(1)PCM 编码老而弥坚的始祖 PCM 即Pulse Code Modulation(脉冲代码调制编码)的缩写,它可以算 做数字音频的鼻祖。它的最大的优点就是保真度高,缺点就是体积庞大。常见的Audio CD就采用了PCM编码,一张光盘的容量只能容纳72分钟的音 乐信息。 最新DVD-Audio也是使用PCM编码,其指标相当高,采样率最高可达192KHz ,量化级为24bit。早期数字音频格式(2)WAV

6、E格式庞大的日不落帝国 WAV:由微软开发的,现在它已经成为了事实上的通用音频格式。WAVE文件 作为最经典的Windows多媒体音频格式。使用三个参数来表示声音:采样位数、采样频率和声道数。声道有单声道 和立体声之分,采样频率一般有11025Hz(11kHz)、22050Hz(22kHz)和 44100Hz(44kHz)三种。WAVE文件所占容量=(采样频率采样位数声道 )时间/8(1字节=8bit)。 WAV格式是非常灵活的,它对音频流的编码没有硬性规定,除了PCM之外, 几乎所有支持ACM(Audio Compression Manager)规范的编码都可以为WAV 的音频流进行编码。基

7、于PCM编码的WAV还常常被当作一种中介格式,用于不同编码的相互转换 当中,如将MP3转换成Ogg格式。早期数字音频格式(3)AIFF/AU格式割据一方的诸侯AIFF是苹果电脑中的标准音频格式,属于QuickTime技术的一部分。它和 WAV非常类似,实际上WAV格式就是由它克隆而来。不过AIFF远不如WAV盛 行,但由于苹果电脑在多媒体领域里的领导地位,所以,大部的音频编 辑软件和播放软件都对它提供了支持,可以说只要有Apple还存在一天, AIFF就不会消亡AU则是Unix平台下一种常用的音频格式,起源于Sun 公司的Solaris系统 。AU格式本身也支持多种压缩方式,但文件结构的灵活性

8、就比不上AIFF 和WAV。早期数字音频格式(4)MIDI通向音乐创作的桥梁MIDI文件本身只是一堆数字信号而已,不包含任何声音信息,它记录的是在音乐 的什么时间用什么音色发多长的音等等。由于MIDI记录的并不是真正的声音,所以不同的声卡,不同软波表,不同硬件音 源的音色是不相同的,相同的MIDI文件在不同的设备上播放会有不同的效果。普 通的MIDI文件许多播放器都支持,但要达到好的效果就必须安装软波表。Microsoft已经在DirectX里面增加了软波表,使之成为Windows系统的标准配置 了。早期数字音频格式新型数字音频格式(1)MP3当今的江湖老大 MP3是MPEG-1/MPEG-2

9、 Audio Layer 3的简称,属于MPEG-1/2的派生音频 方案。 MP3采用的是一种有损压缩方式,第一个实用的有损音频压缩方案,MP3 可以实现12:1的压缩比。 MP3使用的是知觉音频编码技术,它利用了人耳的特性,削减音频中人耳 听不到的成分,同时尽可能地维持原来的声音质量,这是它实现高压缩 比,保持较高音质的一个关键。新型数字音频格式(2)mp3Pro技术先进的尴尬汤姆森多媒体公司(Thomson Multimedia SA)与佛朗赫弗协会 (Fraunhofer Institute)发布了一种新的音乐格式mp3PRO,mp3PRO其实 是一种mp3信号流和SBR信号流的混合数据

10、流编码。它能在64kbps码率下 提供近似于CD的音质(mp3是128kbps)。mp3PRO采用了新的SBR(Spectral Band Replication 频段复制)音频编 码增强算法,SBR最大的优势就是在低数据速率下实现非常高效的编码。新型数字音频格式“频带重现 Spectral Band Replication”,简称SBR。SBR是一种非 常有效的生成声音中高频率成分的方法。 新型数字音频格式(3)Ogg Vorbis(OGG)自由与开放的声音 OGG的信念就是:OPEN!FREE OGG是一个庞大的多媒体开发计划的项目名称,将涉及视频音频等方面的编 码开发。OGG计划的目的就

11、是向任何人提供完全免费多媒体编码方案! Ogg Vorbis只是Ogg计划的一部分.Ogg Vorbis是高质量的音频编码方案,在相对较低的数据速率下实现比 MP3更好的音质!Ogg Vorbis是一种灵活开放的音频编码,能够在编码方案已经固定下来 后还能对音质进行明显的调节和新算法的改良。压缩技术上,Ogg Vorbis的最主要特点是使用了VBR(可变比特率)和 ABR(平均比特率)方式进行编码。Ogg Vorbis这种编码可以支持多声道,这意味着Ogg Vorbis在抓轨软件 (目前这种软件还没有)的支持下,可以对所有的声道进行编码,尤其 在欣赏交响时,会带来更多临场感。新型数字音频格式(

12、4)FLAC (PCM)一切为了音质 和Ogg Vorbis一样,FLAC也属于OGG计划的一部分,它的全称是Free Lossless Audio Codec.FLAC是世界上第一个完全开放和免费的无损音频 压缩格式 FLAC支持大多数的操作系统, Windows, “unix“ (Linux, *BSD, Solaris, OS X, IRIX), BeOS, OS/2, 和Amiga。 FLAC其压缩率接近2:1.FLAC更看重解码的速度。解码只需要整数运算,并且相对于大多数编码 方式而言,对计算速度要求很低。在很普通的硬件上就可以轻松实现实 时解码。 播放时占用系统的资源较少,在文件有

13、点损坏的情况下依然能够正常播 放。新型数字音频格式(5)Monkeys Audio(APE)音乐迷的新欢 Monkeys Audio也是一种无损压缩音频编码,它出现得比FLAC早,支持 它的音频软件要超过FLAC。 APE(Monkeys Audio文件的扩展名),因为它既可无损的保持WAV文件 的音质,而大小仅有WAV的一半。压缩之后的APE音频文件是可以直接被 播放的。 新型数字音频格式(6)MusePack(MPC)低调的优质音乐 MusePaCk(.mpc)(.mp+),是由德国人Andree Buschmann开发的一种 完全免费的高品质音频格式。 160Kbps码率以上的MPC表现

14、好过任何其他的有损压缩格式,不仅仅是音 质,MPC还有编码速度快的优点。 250kbps左右MPC表现非常的出众,很难分辨它和原始信号有多少区别。 但作为个人研发的音频格式,MPC缺乏软硬件支持和市场推广,知名度较 低。无法编码48KHz采样率的曲子。 新型数字音频格式(7)AAC媒体巨头的新宠 AAC是高级音频编码(Advanced Audio Coding)的缩写,它属于MPEG2国 际标准的一部分。 AAC是高压缩比的音频压缩算法,压缩比可达20:1,远远超过了AC-3、MP3 等音频压缩算法。96Kbps码率的表现超过了128Kbps的MP3音频。 AAC另一个引人注目的地方就是它的多

15、声道特性,它支持148个全音域音轨 和15个低频音轨。 AAC支持96KHz的采样率,其解析能力足可以和DVD-Audio的PCM编码相提并 论,成为了下一代DVD的标准音频编码。 另一方面,低码率下的高音质则使它也适合移动通讯、网络电话、在线广 播等领域。 苹果、AT&T和RealNetworks等已经开始提供收费的AAC编码服务。 新型数字音频格式(8)Real Audio流式音频的代表 它是流媒体行业中的霸主RealNetworks的产品, RealMedia 音频部分采用的 是Real Audio,该编码在低带宽环境下的传输性能非常突出。 Scalable Video Technolo

16、gy可伸缩视频技术可以根据用户电脑速度和连接 质量而自动调整媒体的播放质素。 Two-Pass Encoding两次编码技术通过对媒体内容进行预扫描,再根据扫描 的结果来编码从而提高编码质量。 SureStream自适应流技术,可通过一个编码流提供自动适合不同带宽用户 的流播放。 RealMedia 音频部分采用的是Real Audio,该编码在低带宽环境下的传输 性能非常突出。RealMedia通过基于 SMIL并结合自己的RealPix和RealText 技术来达到一定的交互能力和媒体控制能力。新型数字音频格式(9)Windows Media Audio(WMA)微软野心的代表 音频方面采用的是微软自己开发的 Windows Media Audio技术 Windows Media 的关键核心是MMS协议和ASF数据格式,MMS用于网络传输控 制,ASF则用于媒体内容和编码方案的打包。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号