《数字音频技术》PPT课件.ppt

上传人:工**** 文档编号:576147757 上传时间:2024-08-19 格式:PPT 页数:39 大小:1.56MB
返回 下载 相关 举报
《数字音频技术》PPT课件.ppt_第1页
第1页 / 共39页
《数字音频技术》PPT课件.ppt_第2页
第2页 / 共39页
《数字音频技术》PPT课件.ppt_第3页
第3页 / 共39页
《数字音频技术》PPT课件.ppt_第4页
第4页 / 共39页
《数字音频技术》PPT课件.ppt_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《《数字音频技术》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《数字音频技术》PPT课件.ppt(39页珍藏版)》请在金锄头文库上搜索。

1、第六章第六章 数字音数字音频频技技术术Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.音音频频信号信号Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.6.1.1 音音频频信号的特点信号的特点1、声音信号的形式、声音信号的形式 声音在物理学上

2、称之为声波,是通过一定介质(如空声音在物理学上称之为声波,是通过一定介质(如空气、水等)传播的一种连续振动的波。气、水等)传播的一种连续振动的波。 声源所引起的空气压力变化,被耳朵的耳膜所检测,声源所引起的空气压力变化,被耳朵的耳膜所检测,然后产生电信号刺激大脑的听觉神经,从而使人们能感然后产生电信号刺激大脑的听觉神经,从而使人们能感觉到声音的存在。觉到声音的存在。语音信号:语音信号:语言的物质载体,具有复杂的语法和语义,语言的物质载体,具有复杂的语法和语义,难于识别。难于识别。 非语音信号:非语音信号:音乐,自然界的声音,信息量低,识别音乐,自然界的声音,信息量低,识别简单。简单。Evalu

3、ation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.音音频频信号信号1、声音信号的形式、声音信号的形式在自然界,声波与水波一样都是一种振动波在自然界,声波与水波一样都是一种振动波Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.音音频频信号信号用声音录制软

4、件记录的英文单词用声音录制软件记录的英文单词”Hello”语音的实际波形。语音的实际波形。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.音音频频信号信号2、模拟音频信号的物理特征、模拟音频信号的物理特征频率:体现音调的高低,单位频率:体现音调的高低,单位Hz幅度:体现声音的强弱,单位幅度:体现声音的强弱,单位dB谐波:体现音色的优美程度。谐波:体现音色的优美程度。可听可听频率带宽频率带宽(音频):(音频): 20H

5、z20kHzEvaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.音音频频信号信号频带频带带宽应用应用抽样频率抽样频率窄带语音窄带语音300Hz3.4kHz3.1 kHz电话通信电话通信8kHz宽带语音宽带语音54Hz 7kHz7kHz电话会议、视频会电话会议、视频会议议16kHz数字音频广播数字音频广播()信号()信号20Hz 15kHz15kHz声音广播和电视伴声音广播和电视伴音广播音广播32kHz高保真立体声音高保真

6、立体声音频信号频信号20Hz 20kHz20kHzVCD、DVD、CD唱唱片、片、HDTV伴音伴音44.1kHz或48kHz按声音所占频带区分音频信号:按声音所占频带区分音频信号:Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.音音频频信号信号2、模拟音频信号的物理特征、模拟音频信号的物理特征Evaluation only.Created with Aspose.Slides for .NET 3.5 Client

7、Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.音音频频信号信号2、模拟音频信号的物理特征、模拟音频信号的物理特征Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.音音频频信号信号次声波次声波人耳可听域人耳可听域超声波超声波20Hz20,000Hz20,000Hz 20,000Hz女性语音150Hz 150Hz 10,000Hz 10,000Hz电话语音200Hz

8、200Hz 3,400Hz 3,400Hz调幅广播(AM)50Hz 50Hz 7,000Hz 7,000Hz调频广播(FM)20Hz 20Hz 15,000Hz 15,000Hz高级音响10Hz 10Hz 40,000Hz 40,000Hz男性语音100Hz 100Hz 9,000Hz 9,000Hz声声源源种种类类频频带带宽宽度度Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.音音频频信号信号2、模拟音频信号的物理

9、特征、模拟音频信号的物理特征Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.6.1.2 音音频频信号的数字化信号的数字化借助于借助于A/DA/D或或D/AD/A转换器,模拟信号和数字信号可以互相转换转换器,模拟信号和数字信号可以互相转换Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 200

10、4-2011 Aspose Pty Ltd.6.1.2 音音频频信号的数字化信号的数字化Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.6.1.2 音音频频信号的数字化信号的数字化1、声音信息的冗余度、声音信息的冗余度幅度分布的非均匀性幅度分布的非均匀性样值间的相关性样值间的相关性周期间的相关性周期间的相关性话音间隙冗余话音间隙冗余Evaluation only.Created with Aspose.Slides

11、for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.6.1.2 音音频频信号的数字化信号的数字化2、听觉的掩蔽效应、听觉的掩蔽效应在安静的环境中人耳刚能够感觉到的最小声音强度成为在安静的环境中人耳刚能够感觉到的最小声音强度成为静掩蔽门限。静掩蔽门限。图6-1 静掩蔽门限曲线图当有一个强度为70dB、频率为1kHz的纯音出现时,与静掩蔽门限曲线混合,形成新的同掩蔽门限曲线.Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profi

12、le 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.6.1.2 音音频频信号的数字化信号的数字化2、听觉的掩蔽效应、听觉的掩蔽效应1)频谱掩蔽效应频谱掩蔽效应图6-2 同掩蔽门限曲线图Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.6.1.2 音音频频信号的数字化信号的数字化2、听觉的掩蔽效应、听觉的掩蔽效应2)时间掩蔽效应时间掩蔽效应声压强度大的声音信号出现之前和之后的短暂时

13、间内已声压强度大的声音信号出现之前和之后的短暂时间内已存在的弱音信号也会被强音信号掩蔽掉,分别称为前掩存在的弱音信号也会被强音信号掩蔽掉,分别称为前掩蔽蔽(20ms)(20ms)和后掩蔽和后掩蔽(100200ms)(100200ms)。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.6.1.3 音音频压缩编码频压缩编码方法方法1、依据:、依据:声音信息中存在着多种冗余声音信息中存在着多种冗余 听觉器官的不敏感性听觉器

14、官的不敏感性 采样的标本中存在着相关性采样的标本中存在着相关性2、 压缩算法通常应能满足下列需求:压缩算法通常应能满足下列需求: 压缩倍数高,压缩后的数据率低;压缩倍数高,压缩后的数据率低; 解码后的信号失真小,质量高;解码后的信号失真小,质量高; 算法简单,执行速度快,延迟时间短;算法简单,执行速度快,延迟时间短; 编码器、解码器的成本低。编码器、解码器的成本低。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.6.

15、1.3 音音频压缩编码频压缩编码方法方法简单地说,压缩就是设法降低码率,使有限的传输简单地说,压缩就是设法降低码率,使有限的传输信道能有效加以利用。目前常用的音频压缩编码方信道能有效加以利用。目前常用的音频压缩编码方法分为以下三类:法分为以下三类:1、波形压缩编码方法、波形压缩编码方法2、分析合成编码法、分析合成编码法3、混合编码压缩方法、混合编码压缩方法Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.6.1.3 音

16、音频压缩编码频压缩编码方法方法1、波形压缩编码方法、波形压缩编码方法原理:依据人类的听觉心理,去除冗余。 特点:码率较高,且可高质量还原声音信号。 压缩编码方法:DPCM、ADPCM Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.6.1.3 音音频压缩编码频压缩编码方法方法2、分析合成编码法、分析合成编码法原理:利用电学模型和电器参数模拟发音器官,提原理:利用电学模型和电器参数模拟发音器官,提取必要的模型参数和激励

17、信号。取必要的模型参数和激励信号。特点:数据量小,计算量大,保真难度大,适合于特点:数据量小,计算量大,保真难度大,适合于窄带应用场合(电话通信)。窄带应用场合(电话通信)。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.6.1.3 音音频压缩编码频压缩编码方法方法、混合编码压缩方法、混合编码压缩方法混合编码压缩波形压缩法分析合成编码法混合编码压缩波形压缩法分析合成编码法常用技术:以线性预测构成声道模型,传送预测参常

18、用技术:以线性预测构成声道模型,传送预测参数同时也传送预测误差信息。数同时也传送预测误差信息。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.6.1.3 音音频压缩编码频压缩编码方法方法音乐信号常用的编码技术:音乐信号常用的编码技术:熵编码熵编码自适应变换编码(频域编码)自适应变换编码(频域编码)心理声学模型心理声学模型子带压缩子带压缩Evaluation only.Created with Aspose.Slide

19、s for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.音音乐乐信号常用的信号常用的编码编码技技术术熵编码熵编码原理:根据信息出现概率的分布特性进行编码。原理:根据信息出现概率的分布特性进行编码。特点:压缩编码过程中不丢失信息,能够完全恢复原始特点:压缩编码过程中不丢失信息,能够完全恢复原始信息,无损压缩。信息,无损压缩。常用方法:霍夫曼编码和算术编码。常用方法:霍夫曼编码和算术编码。Evaluation only.Created with Aspose.Slides for .NET 3.5 Clien

20、t Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.音音乐乐信号常用的信号常用的编码编码技技术术自适应变换编码自适应变换编码原理:利用正交变换,把音频信号由时域变换到另一个原理:利用正交变换,把音频信号由时域变换到另一个域,对变换域系数量化,可压缩码率。域,对变换域系数量化,可压缩码率。特点:采用自适应比特分配和自适应量化技术对频域数特点:采用自适应比特分配和自适应量化技术对频域数据进行量化。据进行量化。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profil

21、e 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.音音乐乐信号常用的信号常用的编码编码技技术术心里声学模型心里声学模型原理:对信息量加以压缩,同时利用人耳的掩蔽效应使原理:对信息量加以压缩,同时利用人耳的掩蔽效应使失真尽可能不被察觉。失真尽可能不被察觉。特点:利用高压比效应,给不同频率的信号分配不同的特点:利用高压比效应,给不同频率的信号分配不同的量化比特数,使噪声能量地狱人耳听力阈值。量化比特数,使噪声能量地狱人耳听力阈值。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Pr

22、ofile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.音音乐乐信号常用的信号常用的编码编码技技术术子带压缩技术子带压缩技术原理:将信号分解为若干子频带内的分量之和,对各子原理:将信号分解为若干子频带内的分量之和,对各子带分量根据不同的分布特性采取不同的压缩策略以降低带分量根据不同的分布特性采取不同的压缩策略以降低码率。码率。特点:划分多个子带,各频带内噪声受到限制,不会相特点:划分多个子带,各频带内噪声受到限制,不会相互干扰,动态分配比特数,压缩效率高。互干扰,动态分配比特数,压缩效率高。Evaluation only.Created with As

23、pose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.6.2 模模拟电视拟电视的数字音的数字音频频技技术术(数字丽音)特点:可用于地面广播及卫星电视广播,可传送立体声和双语节目,传送声音动态范围大、音质好、信噪比高、串音小。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.-6.3 高保真音高保真音频频信号信

24、号压缩编码标压缩编码标准准Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.MUSICAM(掩蔽型自适应通用子带综合编码和复用)特点:利用人的听觉特性,把声音分成多个子带,以不同的量化特性对各子带加以量化。MUSICAM压缩编码过程可分为四个阶段:6.3.1 MUSICAMEvaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2

25、.0.0.Copyright 2004-2011 Aspose Pty Ltd.图12-8 MUSICAM的编、解码原理方框图 (a)编码器;(b) 解码器1.时间/频率映射:分割成32个子带,并进行FFT计算。2.求出各子带的掩蔽门限的估值:确定最大电平,产生比例因子;确定掩蔽门限,自适应分配比特,压缩数据.3.对各子带进行量化编码:根据各自带的掩蔽阈值及分配的量化比特数进行量化编码。4.按帧打包形成码流:将压缩的数据、比例因子和比特分配信息符合打包到一起,形成实际码流。6.3.1 MUSICAMEvaluation only.Created with Aspose.Slides for .

26、NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd. MPEG强调人的听觉心理声学模型的利用。可利用估计听觉掩蔽阈值、量化精度、尺度化等各种压缩手段进行压缩编码。 6.3.2 MPEG音音频压缩编码标频压缩编码标准准MPEG系统的基系统的基本框架本框架层次层次 ,用混合带通滤波器提高频率分配,用混合带通滤波器提高频率分配率,采用非均匀量化、自适应分段和量化值率,采用非均匀量化、自适应分段和量化值熵编码技术。每通道熵编码技术。每通道64k bit/s.层次层次,采用自适应的比特分配,子带低频量,采用自适应的比特分配,

27、子带低频量化精度为化精度为4bit,中频段为,中频段为3bit,高频段为,高频段为2bit;比例因子为比例因子为6bit;高保真度码率为;高保真度码率为128k bit/s.层次层次,将音频信号输入按一定格式固定分,将音频信号输入按一定格式固定分割成割成32个子带,子带系数的量化精度为个子带,子带系数的量化精度为4bit,比例因子为,比例因子为6bit,单声道码率为,单声道码率为192k bit/s.Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011

28、 Aspose Pty Ltd.6.3.2 MPEG音音频压缩编码标频压缩编码标准准层次号层次号层次层次层次层次层次层次在比较好的质量下每声道的数码率(kbit/s)19212864压缩比1:3.61:5.61:11编码特点子带编码子带编码子带编码+变换编码频谱分辨率32个子带32个子带32个子带(每个子带18条)特征基本(简单)算法最佳编码滤波器组和熵编码的联合应用应用VCDDABDVB-CDVB-S计算机多媒体通过ISDN传送声音广播节目MPEG-1音频编码三个编码层次主要技术特点音频编码三个编码层次主要技术特点Evaluation only.Created with Aspose.Sli

29、des for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.6.3.2 MPEG音音频压缩编码标频压缩编码标准准MPEG音频层次音频层次的简化帧格式的简化帧格式MPEG音频层次音频层次的简化帧格式的简化帧格式帧头帧头CRC音频数据音频数据AD系统32位纠错校验16位分配位SBS选择SCFSI尺度因子子带取样(SBS)附加数据帧头帧头CRC音频数据音频数据AD系统32位纠错校验16位分配位SBS尺度因子子带取样(SBS)附加数据Evaluation only.Created with Aspose.Slid

30、es for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.6.3.2 MPEG音音频压缩编码标频压缩编码标准准子带分析滤波器比特分配心理声学模型帧打包量化&编码数据流数据流32 32 子带子带边信息编码声音比特码流声音比特码流2 x32-192kb/s2 x32-192kb/s2 x 768 kb/s2 x 768 kb/sn多相滤波器组:将 PCM 样本变换到 32 个子带的频域信号n心理声学模型 (Psychoacoustic Model):计算信号中不可听觉感知的部分n比特分配器:根据心理声学模型的

31、计算结果,为每个子带信号分配比特数n装帧:产生 MPEG-I 兼容的比特流Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.AC-3编码杜比AC-3编码是美国数字电视系统采用的音频编码方式,是与MPEG/Audio不同的编码格式,故不能实现对MPEG/Audio的后向兼容,不过其它功能与MPEG/Audio大致相同。如就同步来说,因为含有MPEG系统的时间标志,故可与MPGE视频同步。AC-3系统的方框图如图12-9所

32、示。 6.3.3 杜比杜比AC-3数字音数字音频编码频编码Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.图6-11 AC-3编码器方框图6.3.3 杜比杜比AC-3数字音数字音频编码频编码谱包络(指数)编码尾数量化比特分配分析滤波器组AC-3帧格式形成PCM音频指数尾数比特分配信息AC-3码流编码的谱包络Evaluation only.Created with Aspose.Slides for .NET 3.5

33、Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.6.4 数字音数字音频频广播广播音频广播的三个阶段:音频广播的三个阶段:1.调幅广播调幅广播(AM)2.调频广播调频广播(FM)3.数字音频广播数字音频广播DAB传送中波和短波频段窄,高音不丰富,音色较差频带较宽,声音比较丰富、逼真杂音较小 以数字技术为基础可获得与原始信息相同质量的节目内容Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.6.4.1 数字音频广播的特点数字音频广播的特点DAB与模拟广播(AM/FM)相比有很多优点:音质纯净,声音质量高抗干扰能力强频带利用率高业务多样化,声色俱全、图文并茂多种数据业务,可实现交互功能Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.Copyright 2004-2011 Aspose Pty Ltd.

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号