数字音频技术综述

上传人:油条 文档编号:26262176 上传时间:2017-12-24 格式:DOC 页数:5 大小:76KB
返回 下载 相关 举报
数字音频技术综述_第1页
第1页 / 共5页
数字音频技术综述_第2页
第2页 / 共5页
数字音频技术综述_第3页
第3页 / 共5页
数字音频技术综述_第4页
第4页 / 共5页
数字音频技术综述_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《数字音频技术综述》由会员分享,可在线阅读,更多相关《数字音频技术综述(5页珍藏版)》请在金锄头文库上搜索。

1、数字音频编码技术综述摘要:本文介绍了常用的数字音频编码方式,包括 MPEG 系列伴音标准及 Dolby Digital标准的原理,并对这几种重要的音频编码技术的多方面性能进行了比较,最后,对数字音频压缩编码技术进行了展望。 关键词:数字音频编码;MPEG;Dolby DigitalOverview of Digital Audio Coding Technology 【Abstract】 In this paper, some usual digital audio coding methods are discussed, including MPEG standard and Dolby

2、Digital standard. And comparisons in many aspects are made between these audio coding methods. Finally, it discussed the prospect of digital audio compression.【Key Words】digital audio coding;MPEG;Dolby Digital1 引言数字音频是多媒体业务的重要组成部分,数字音频编码技术已经成为多媒体的一个重要研究领域,并已被广泛地应用于数字音频广播(DAB) 、高清晰度电视(HDTV) 、多媒体网络通信等

3、领域中。数字音频编码技术按数据量的压缩性能可分为非压缩音频(如波形音频、MIMI 音频和 CD 音频)和压缩音频(如 MEPG 音频、杜比 AC-3 等)两类。而在网络应用中,为了提高带宽的利用率,增强数据的安全性和传输的可靠性,往往需要对数字音频进行压缩处理。一般地,根据压缩后的音频能否完全重构出原始声音可将音频压缩技术分为无损压缩及有损压缩两大类。而按压缩方案的不同,又可讲其划分为时域压缩、变换压缩、自带压缩,以及多种技术相互融合的混合压缩等等。数字音频的发展最初是从无损压缩开始的,如 70 年代开始采用的类似 PCM 的瞬时压扩技术和块压扩技术,这种技术的编码效率低。80 年代末至 90

4、 年代初,研究者利用人耳的掩蔽效应和临界频带的特性来进行子带编码和变换编码,出现的系统有:MUSUCAM 系统、128kps 的 AC-2 系统、AC-3 系统等。90 年代至今,有损压缩把音频数据的压缩率提高到 12:1,也带来了音频质量的下降。比较著名的是:MP3,AAC,RM 等。2 MPEG数字音频编码标准ISO/IEC 的 MPEG 音频编码的标准采用了 2 种编码算法:MUSICAM 和 ASPEC。以这两种算法为基础形成了三个不同层次的音频压缩算法,三种算法对应不同的应用要求并具有不同的编码复杂度。子代掩蔽编码标准 MUSICAM 的编码器框图如图 1 所示。MUSICAM 采用

5、了多项滤波器,将信号分割成带宽统一的 32 个子带。它增强了心理声学模型分析,1024 点 FFT 是心理声学模型时域分析工具。由于 MUSICAM 的音质好、合理的算法复杂度和适中的时延等有点,使得它被 ISO/IEC 选用为 MPEG 音频编码的主要算法。滤 波 器 组3 2 个 子 频 带线 性 量 化 器块 形 成比 例 因 子 提 取选 择辅 助信 息编 码F F T 1 02 4 点心 理 声 学模 型动 态 比 特分 配数据帧比特流数 据 库A u x 附 加数 据数 字 音 频P C M 信号 取样 频率4 8 k H z输 出 码 流图 1 MUSICAM 编码器原理图2.1

6、 MPEG-1在 MPEG-1 的音频编码标准中,按照复杂度规定了三种模式(层 I,层 II,层 III) 。层I 是 MUSICAM 编码方法的简单型( MP1) ,VCD 的音频压缩方案即为层 1。层 II 为MUSICAM 标准型(MP2 ) ,典型码流 128kps。广泛应用与数字音频广播、数字演播室等数字音频专业的制作、交流、存储和传送。层 III 是综合了层 II 和 ASPEC 的有点提出的混合压缩技术(MP3) ,它的复杂度相对较高,编码不利于实时,它是 MUSUCAM 和 ASPEC两个算法的结合,典型码流是 64kbps。低码率仍有高品质的音质,因此成为广泛应用于网络音频。

7、MP3 编码器的框图如图 2 所示。子带滤波器组 M D C T比特和比特因子分配与编码哈夫曼编码F F T 心理声学模型 比特流组装边信息信掩比P C M 音频采样信号已编码数据流图 2 MP3 编码器的框图2.2 MPEG-2MPEG-2 的音频编码标准,是在 MPEG-1 音频编码标准的基础上由双声通道扩展到多通道。声道数扩展到 5.1,即左中右三个主声道,左环、右环两个环绕声道和一个重低音(LEF)声道。为了与 MPEG-1 后向兼容(BC) ,MPEG-2 帧基本结构对应于在 MPEG-1中的规定,多声道扩展是插入到 MPEG-1 音频帧,用于传送附加数据的区域中,信号兼容利用多声道

8、信号的矩阵组合来实现,如果需要更高比特率,则产生一个附加的第二个扩展比特流,为了降低整体比特流,MPEG-2 采用了自适应预测、限制中心声道频率等措施。MPEG-2 有一种 AAC(Advanced Audio Coding)模式,它不后向兼容 MPEG-1。在MPEG-2 的正式听音测试中,数据流速率为 320kbps 的 AAC 可以提供比数据流速率为640kbps 的 MPEG-2BC 更好的音质。因此,AAC 是一种比 MPEG-2BC 编码算法更好的音频压缩算法,而且可以使用于各种环境下,如可以做电视信号的伴音等。AAC 的编码器框图如图 2 所示。图 2 AAC 的编码器框图2.3

9、 MPEG-4MPEG-4 音频编码对音频的低比特率编码进行了大幅度的强化。相对于 MPEG-1,MPEG-2 而言,MPEG-4 增加了通信用途并设想应用与各种信息压缩率、各种传输线路形式(包括记录媒体)以及联系连接形式(1 对 1,N 对 1,1 对 N 等) 。3 杜比数码 Dolby DigitalDolby Digital 是一种多路数字音频格式,由 Dolby 公司研制开发。它可将音频与元数据以尽可能的数据率送至接收机,从而为视频数据与其他 DTV 服务项目保存宝贵的空中频谱。其中,AC-1 用于卫星通信和数码有线广播, AC-2 用于专业音频的传输和存储。AC-3 是在 AC-1

10、 和 AC-2 基础上发展起来的多通道编码技术,保留了原 AC-2 中如窗函数处理、指数变换编码、自适应比特分配等许多特点,还新增了运用立体声多声道的编码技术策略的 coupling 和 rematrix 算法。一般而言,立体声的左声道和右声道的信号在听觉上十分相似,存在着许多重复的冗余信息,将这两个声道的信号联合起来加以编码,便可除去冗余的信号且不会影响原来的音质。 其编码器框图如图 3 所示。编 码 频 谱 包络滤 波 器 组比 特 分 配 器核 心 比 特 分 配器多 路 复用量 化输 入信 号比 特 分 配 附 加信 息已 编 码 的比 特 流图 3 AC-3 编码器原理图AC-3 又

11、被称为感觉编码系统, 它将每一声道的音频根据人耳听觉特性划分为许多最优的狭窄频段,利用音响心理学“听觉掩蔽效应”,删除人耳所听不到或可忽略的部分,并采用数字信号压缩编码。同时,利用狭窄频段的划分使部分频段噪声在编码时可被几乎全部滤除,使其余噪声的频谱靠近在信号频谱附近,而这些噪声可被信号所抑制。因此杜比AC-3 系统实际上是一种具选择性及强抑噪的系统,以较低的码率支持全音频多声道,并具优良的回放音质和效果。AC-3 采用全音域 5.1 声道运行方式,即 左、右、中置、左环绕、右环绕,再加上一个超重低音的声道,故又称作 5.1 声道。其中前 5 个声道的频响范围都是音频全频带即 3HZ-20kH

12、z,而 LEF 声道的频响范围是 3-120Hz,仅占整个频谱的十分之一,因此又称为 5.1 声道环绕声系统。AC-3 传输速率为 32-640kbit/s,动态范围为 20bit,采样频率支持 32kHz,44.1kHz 和48kHz,输出声道数目可变。AC-3 的压缩比可以达到 1: 12,能够以 384kbit/s 的速率播放5.1 声道声音。可见,AC-3 确是一种完善而又灵活的编码方案。3 总结随着人类听觉特性理论的深入发展和数字化技术的广泛应用,以及市场对消费类音乐质量的趋高要求,数字音频编码技术已经成为多媒体的一个重要研究领域,并已被广泛地应用于数字音频广播(DAB) 、高清晰度

13、电视(HDTV ) 、多媒体网络通信等领域中。数字音频压缩算法种类繁多,从上文的分析中可以看出,根据不同的应用场合和对传输速率及音质的特殊要求,可以组合出不同的标准或规范。未来,一方面继续研究新的音频压缩算法,另一方面,根据不同的应用要求改进现行规范或提出新的技术方案。参考文献1 Peter Noll. MPEG Digital Audio CodingJ. IEEE Signal Processing Magazine, 1997,(9).2 Stephen Li,June Rowlands,etc.An AC-3/MPEG Multi-standard Audio Decoder ICC.IEEE 1997 Custom Integrated Circuits Conference.3 林胜,杨成军,全子一.MPEG 声音编码标准简介J.数字声频,2001, (2).4 郑世宝.网络多媒体课程.上海交通大学.

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号