【2017年整理】常用的音频知识

上传人:豆浆 文档编号:999757 上传时间:2017-05-25 格式:DOCX 页数:6 大小:22.60KB
返回 下载 相关 举报
【2017年整理】常用的音频知识_第1页
第1页 / 共6页
【2017年整理】常用的音频知识_第2页
第2页 / 共6页
【2017年整理】常用的音频知识_第3页
第3页 / 共6页
【2017年整理】常用的音频知识_第4页
第4页 / 共6页
【2017年整理】常用的音频知识_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《【2017年整理】常用的音频知识》由会员分享,可在线阅读,更多相关《【2017年整理】常用的音频知识(6页珍藏版)》请在金锄头文库上搜索。

1、常用音频协议常用音频协议介绍【整理者】6 【提供者】MAICK【详细说明】常用音频协议介绍会议电视常用音频协议介绍及对比白皮书一、数字化音频原理:声音其实是一种能量波,因此也有频率和振幅的特征,频率对应于时间轴线,振幅对应于电平轴线。通常人耳可以听到的频率在20Hz 到 20KHz 的声波称为为可听声,低于 20Hz 的成为次声,高于 20KHz 的为超声,多媒体技术中只研究可听声部分。可听声中,话音信号的频段在 80Hz 到 3400Hz 之间,音乐信号的频段在20Hz-20kHz 之间,语音(话音)和音乐是多媒体技术重点处理的对象。由于模拟声音在时间上是连续的,麦克风采集的声音信号还需要经

2、过数字化处理后才能由计算机处理。通常我们采用 PCM 编码(脉冲代码调制编码),即通过采样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。1、采样采样,就是每隔一段时间间隔读一次声音的幅度。单位时间内采样的次数称为采样频率。显然采样频率越高,所得到的离散幅值的数据点就越逼近于连续的模拟音频信号曲线,同时采样的数据量也越大。为了保证数字化的音频能够准确(可逆)地还原成模拟音频进行输出,采样定理要求:采样频率必须大于等于模拟信号频谱中的最高频率的 2 倍。常用的音频采样率有:8kHz、11.025kHz、22.05kHz 、16kHz、37.8kHz、44.1kHz、48kHz。例如:话音

3、信号频率在 0.33.4kHz 范围内,用 8kHz 的抽样频率(fs ),就可获得能取代原来连续话音信号的抽样信号,而一般 CD 采集采样频率为44.1kHz。2、量化量化,就是把采样得到的声音信号幅度转换成数字值,用于表示信号强度。量化精度:用多少个二进位来表示每一个采样值,也称为量化位数。声音信号的量化位数一般是 4,6,8,12 或 16 bits 。由采样频率和量化精度可以知道,相对自然界的信号,音频编码最多只能做到无限接近,在计算机应用中,能够达到最高保真水平的就是 PCM 编码,通常 PCM 约定俗成了无损编码。3、编码一个采样率为 44.1kHz,量化精度为 16bit,双声道

4、的 PCM 编码输出,它的数据速率则为 44.1K162 =1411.2 Kbps,存储一秒钟需要 176.4KB 的空间,1 分钟则约为 10.34M,因此,为了降低传输或存储的费用,就必须对数字音频信号进行编码压缩。到目前为止,音频信号经压缩后的数码率降低到 32 至 256kbit/s,语音可以低至 8kbit/s 以下。对数字音频信息的编码进行压缩的目的是在不影响人们使用的情况下使数字音频信息的数据量最少。通常用如下 6 个属性来衡量:比特率;信号的带宽。主观/ 客观的语音质量;延迟;计算复杂度和对存储器的要求;对于通道误码的灵敏度;为使编码后的音频信息可以被广泛地使用,在进行音频信息

5、编码时需要采用标准的算法。传统会议电视设备主要采用 ITU-T 推荐的G.711、G.722、G.728 和 AAC_LD 等音频标准。二、常用音频协议简介:1、ITUT G.7281992 年 ITU-T 发布的电话声音信号编码方式推荐标准。采用 LD-CELP 编码方式,采样率为 8KHz,以 16kb/秒的速度传送声音信号,传送延迟时间极短,仅有 0.625 ms 的算法编码延迟。2、ITUT G.711标准公布于 1972 年,其语音信号编码是非均匀量化 PCM。语音的采样率为 8KHz,每个样值采用 8bit 量化,输出的数据率为 64kbps。这种窄带编码支持对 300 到 3,4

6、00 赫兹的音频进行压缩。但虽然压缩质量不错,但是消耗的带宽相对较大,主要用于数字 PBX/ISDN 上的数字式电话。3、ITUT G.722ITUT G.722 标准是第一个用于 16 KHZ 采样率的标准化宽带语音编码算法,1984 年被 CCITT 定义为标准,而且现今还在使用。.G.722 编解码器在 16 kHz 频率上接收 16 位数据(带宽从 50 Hz 至 7 kHz),并将其压缩为 64、56 与 48 Kbit/s,其总延迟约 3 ms,能够提供更好的通话质量。G.722 的优点是延时和传输位误差率非常低,且没有任何的专利技术,费用低廉。因此 G.722 在无线通信系统,V

7、oIP 生产商,个人通信服务,视频会议应用等广泛应用。4、G.722.1G.722.1 基于 Polycom 的第三代 Siren 7 压缩技术,1999 年被 ITU-T 批准为 G.722.1 标准。G.722.1 采用 16 KHZ 采样频率,16 位数据量化,支持从 50 Hz 至 7 kHz 频率范围的音频采样,并将其压缩为 32 与 24 Kbit/s。它采用 20 ms 封帧,提供 40ms 的算法延迟。G722.1 可实现比 G.722 编解码器更低的比特率以及更大的压缩。目标是以大约一半的比特率实现与 G.722 大致相当的质量。这种编码使用许可需要获得 Polycom 公司

8、的授权。5、G722.1 Annex CG722.1 Annex C 基于 Polycom 的 Siren 14 压缩技术, 采用 32kHz 采样频率,支持从 50 Hz 至 14 kHz 频率范围的音频采样,并将其压缩为 24、32或 48 kbps。采用 20ms 封帧,提供 40 毫秒演算延迟。2005 年中,国际电信联盟(ITU )批准 Polycom Siren 14?技术为 14 kHz 超宽带音频编码新标准。同时进入作为 ITU-T 建议的G.722.1 Annex C。G722.1 Annex C 具有低运算能力,低带宽的优点。适于处理语音、音乐与自然界声音。6、AAC-LD

9、AAC(Advanced Audio Coding,高级音频编码)是由 Fraunhofer 研究院(MP3 格式的创造者)、杜比(DOLBY )试验室和 AT&T(美国电话电报公司)共同研发出的一种音频压缩格式,是 MPEG-2 规范的一部分,并在 1997 年 3月成为国际标准。随着 MPEG4 标准在 2000 年成型后,MPEG2 AAC 也被作为核心编码技术,并增加了一些新的编码特性,又叫 MPEG-4 AAC。MPEG-4 AAC 家族目前共有九种编码规格, AAC-LD(Low Delay,低延迟规格)是用在低码率下编码。它支持 8K48K 采样率的,可以 64Kbps 的码率输

10、出接近 CD 音质的音频,并支持多声音通道,AAC-LD 算法延迟仅为 20ms。AAC 因为其模块化设计,功能更为强大。本身的框架结构能够被不断的新的东西填充,这就使得不同发展方面的内核相互融合,彼此吸收精华成为可能。7、各种音频协议的主要参数对比:采样频率支持音频带宽输出码率最低算法延迟G7118KHz300 Hz 3,400 Hz64 Kbps1msG72216kHz50 Hz 7 kHz64 Kbps3msG722.116kHz50 Hz 7 kHz24、32 Kbps40msG722.1 C32kHz50 Hz14 kHz24、32、48Kbps40msAAC-LD48kHz20 H

11、z20kHz4864 Kbps20ms三、AAC_LD 与 G722. Annex C 优缺点对比:G722.1 C AAC_LD采样音频频率范围支持 50 Hz14 kHz,接近 CD 音质,但丢失了高频部分。支持 20 Hz20kHz 全频段的采样,音频更加接近 CD 音质。输出码率 24、32、48Kbps,带宽低于 AACLD,但是以牺牲高频为代价的。4864 Kbps,并支持大于 64Kbps 的输出,为更好的音频质量提供了可能。算法复杂性算法复杂度低,CPU 占用率略好于 AAC-LD模块化设计,功能更为强大,有 TI 等专用芯片支持最低延迟采用 20ms 封帧,40ms 算法延迟

12、20ms 算法延迟,好于 G722.1 C多声道可以支持双声道AAC 支持多达 48 个音轨、15 个低频音轨标准通用性 G722.1-C 由 Polycom 制定开发,使用需要 Polycom 授权,目前只有 Polycom 和极少数会议电视厂商使用。作为 MPEG4 核心标准,受到 Apple、诺基亚、松下等支持,并被泰德等众多会议电视厂商所采用,应用前景更广阔。由 Fraunhofer 研究院的调查对比图可以知道,在相同的采样频率下,AAC-LD 可以提供比 G722.1 C、MP3 等更好的音质。AAC-LD 实现了超宽频音频编码中最短的延时,并保证接近 CD 的音质,达到音质、比特率和延时三者的最佳组合,是会议电视领域的最优选择。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号