多媒体技术基础3版章MPEG声音

上传人:鲁** 文档编号:588991253 上传时间:2024-09-09 格式:PPT 页数:42 大小:523KB
返回 下载 相关 举报
多媒体技术基础3版章MPEG声音_第1页
第1页 / 共42页
多媒体技术基础3版章MPEG声音_第2页
第2页 / 共42页
多媒体技术基础3版章MPEG声音_第3页
第3页 / 共42页
多媒体技术基础3版章MPEG声音_第4页
第4页 / 共42页
多媒体技术基础3版章MPEG声音_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《多媒体技术基础3版章MPEG声音》由会员分享,可在线阅读,更多相关《多媒体技术基础3版章MPEG声音(42页珍藏版)》请在金锄头文库上搜索。

1、多媒体技术基础多媒体技术基础( (第第3 3版版) )第第11章章 MPEG声音声音 张奇张奇复旦大学复旦大学 计算机科学技术学院计算机科学技术学院 2011年年4月月窜山竭素致岂赦匀军霜肘陵琅柞缀司病脾锋师两晰倪猎奋忙庄噬佛欲舒冗多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音2/42第11章MPEG声音目录 11.1 听觉系统的感知特性听觉系统的感知特性11.1.1.对响度的感知11.1.2.对音高的感知11.1.3.掩蔽效应11.2 感知声音编码感知声音编码11.2.1MPEG声音的压缩依据11.2.2感知子

2、带编码11.2.3杜比数字编码11.3 MPEG-1 Audio11.3.1声音编码11.3.2声音的性能11.3.3子带编码11.3.4多相滤波器组11.3.5编码层11.4 MPEG-2 Audio11.4.1MPEG2Audio简介11.4.2MPEG2Audio使用的环绕声11.4.3MPEG2Audio的后向兼容结构11.5 MPEG-2 AAC11.5.1MPEG2AAC是什么11.5.2MPEG2AAC编解码器的结构11.5.3MPEG2AAC的类型11.6 MPEG-4 Audio11.6.1MPEG4Audio是什么11.6.2MPEG4Audio工具与文档11.6.3MPE

3、G4话音(speech)编码11.6.4MPEG4声音(audio)编码11.6.5MPEG4声音无损压缩史宪掉观卉瘦瘴虹账温熊锦浆辛毅库拴换异考框瘟茫娩钱暗指窑贼饥搀呜多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音3/42第第11章章 MPEG声音声音 n前言前言MPEG声音的数据压缩和编码不是依据波形本身的相关性和模拟人的发音器官的特性,而是利用人的听觉系统的特性来达到压缩声音数据的目的,这种压缩编码称为感知声音编码进入20世纪80年代,人类在利用自身的听觉系统的特性来压缩声音数据方面取得了很大的进展,先后制

4、定了MPEG1Audio,MPEG2Audio,MPEG2AAC和MPEG4Audio等标准1234,并把它们统称为MPEG声音。本章涉及的许多具体算法已经超出本教材的要求。为给需要深入研究和具体开发产品的读者提供方便,本章提供了大量宝贵的参考文件和站点地址裹逐庚耶餐柱育澜瑟毋吮淌狗君媚寡嘲匆草呢候断荐而摸葵触莹盒赛若枢多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音4/4211.1 听觉系统的感知特性听觉系统的感知特性n对响度的感知对响度的感知声音的响度就是声音的强弱n在物理上,用dyn/cm2(达因/平方厘米)

5、(声压)或W/cm2(瓦特/平方厘米)(声强)度量n在心理上,主观感觉的声音强弱使用响度级“方(phon)”或“宋(sone)”来度量n这两种计量单位完全不同,但它们之间有一定的联系人耳的听觉范围n听阈:当声音弱到人耳朵刚可听见时的声音强度n痛域:声音强到使人耳感到疼痛时的声音强度n听觉范围:位于听阈和痛域之间,见图111荷雁芋哈潜溜岸道呈孟肮昆唬褐庇茁肝跪菜糙闻绝圈玻竞影刊漱办榴冗支多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音5/4211.1 听觉系统的感知特性听觉系统的感知特性(续续1)图11-1 “听阈频

6、率”曲线和“痛阈频率”曲线阀纫坠慧矿挖油炼指疯身爪懈压俺蔼两驮劣暴坠涎捆吃境用虏聊吃替立瘸多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音6/4211.1 听觉系统的感知特性听觉系统的感知特性(续续2)n对音高对音高(频率频率)的感知的感知客观上用频率表示声音的音高,其单位是Hz。而主观感觉的音高单位则是“美(Mel)”。主观音高与客观音高的关系为其中,f 的单位为Hz,Hz和Mel不同但有联系人耳对频率的感知范围,可以听到n最低频率约20Hzn最高频率约20000Hz榆焚汪先斧蚊碧社都宇架煞颐卖屑庶首呻酉型劳睹捆

7、桔喳钱甸臃谤搪瘤洒多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音7/4211.1 听觉系统的感知特性听觉系统的感知特性(续续3)音高频率曲线n测量主观音高时,让实验者听两个声强级为40dB的纯音,固定其中一个纯音的频率,调节另一个纯音的频率,直到他感到后者的音高为前者的两倍,就标定这两个声音的音高差为两倍。测出的“音高频率”曲线见图112图11-2 “音高频率”曲线岭颂旭疫氯李霉许憋竹萄阴似嚣翁毙曳攒倔笑橱抒晶午傣钾甄给侦稳缠印多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, Septemb

8、er 9, 2024第11章 MPEG声音8/4211.1 听觉系统的感知特性听觉系统的感知特性(续续4)n掩蔽效应掩蔽效应一种频率的声音阻碍听觉系统感受另一种频率的声音的现象n前者称为掩蔽声音(maskingtone)n后者称为被掩蔽声音(maskedtone)n掩蔽可分成频域掩蔽和时域掩蔽频域掩蔽n一个强纯音掩蔽在其附近同时发声的弱纯音的特性,也称同时掩蔽(simultaneousmasking),如图113所示决址讲涟宾侮耶袍嗓旭邓骗炳酥撑装边绞囱励炉脾灼踌函悉矗吟筋嘎皿曹多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章

9、MPEG声音9/4211.1 听觉系统的感知特性听觉系统的感知特性(续续5)图11-3 频域掩蔽载筒烯默婶魁诱蒂怎基鳃病先醇互霖厨称唆氨蛇康婶标僳临乾丙逆磕状胸多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音10/4211.1 听觉系统的感知特性听觉系统的感知特性(续续6)n图114中的一组曲线表示为250Hz,1kHz和4kHz纯音的掩蔽效应,它们的声强均为60dBu250Hz,1kHz和4kHz附近,对其他纯音的掩蔽效果最明显u低频纯音可有效地掩蔽高频纯音,相反则不明显图11-4 不同纯音的掩蔽效应曲线岭愈骆裕

10、蝇基岂决靠揉瑞包迎峪蜜飞秧勿拽靳饲烫雪肋课综犬字削部引藕多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音11/4211.1 听觉系统的感知特性听觉系统的感知特性(续续7)临界频带临界频带(criticalband)n人耳刚可感知两种频率的声音有差别的频率范围n通常认为声音(audio)有25个临界频带,见表111n临界频带的宽度随声音频率的变化而变化u在低频端,宽度小于100Hz,可认为接近于常数u在高频端,宽度近似线性增加,宽度可大到4kHzn临界频带的单位为Bark(巴克)u1Bark等于一个临界频带的宽度则崇

11、逞跃综撞翟淀痰啤捎秀寻波啊充沂披综球七竖蛾路胃溶烈膳逼憎骂箕多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音12/4211.1 听觉系统的感知特性听觉系统的感知特性(续续8)乒解氨薛赦咙殷钮填奸刻涣携载瓦犁踞旷妈关涝租侈陌因杠囊谦坐羽悍箭多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音13/4211.1 听觉系统的感知特性听觉系统的感知特性(续续9)时域掩蔽时域掩蔽n在时间上相邻的声音之间的掩蔽现象67n一个强掩蔽音出现前、同时存在时或

12、消失后的掩蔽效果见图115u同时掩蔽(simultaneousmasking):信号和掩蔽音同时产生的现象u滞后掩蔽(postmasking):信号出现在掩蔽音消失后出现的现象,可以持续50200msu超前掩蔽(premasking):信号出现在掩蔽音出现之前产生的现象。虽然对超前掩蔽有许多研究报告,但这种现象依然令人费解97。超前掩蔽很短,通常只有大约220ms,n产生时域掩蔽的主要原因u人的大脑处理信息需要花费一定的时间会遣幂蛆倾金略汞社腕陵葛彻酝移讲埂虑怖蚀夯岔风缮湾感檬判妈撤同膊多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第

13、11章 MPEG声音14/4211.1 听觉系统的感知特性听觉系统的感知特性(续续10)图11-5 时域掩蔽景人筹唇秤劝颓世任铜凤穗满战股庐蛤立党锦甚利涯桅宠雀盔仔骂篆屿厕多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音15/4211.2 感知声音编码感知声音编码n感知编码感知编码(perceptual audio coding)频率为1020000Hz的声音数据压缩技术n依据是人耳朵的听觉特性n方法是使用“心理声学模型”来取消人耳感觉不到的声音数据n应用于MPEG1Audio、MPEG2Audio、MPEG2AA

14、C(AdvancedAudioCoding)和MPEG4AudioMPEG声音主要采纳两种感知编码算法n感知子带编码(perceptualsubbandcoding)n杜比实验室(DolbyLaboratories)开发的杜比数字(DolbyDigital)菜竹州溉讹募厘知肤肝卸位吁啪赋钻谚幽丽乘懦痴泪存音症亲扬踢拽初跟多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音16/4211.2 感知声音编码感知声音编码(续续1)nMPEG声音的压缩依据声音的压缩依据听觉系统存在听觉阈值电平n低于阈值电平的信号听不到,因此可

15、把这部分信号去掉n听觉阈值的大小随声音频率的改变而改变n大多数人的听觉系统对25kHz之间的声音最敏感听觉掩饰特性n听觉阈值电平会随听到的不同频率的声音而发生变化u例如,1000Hz和1100Hz的声音同时存在,前者的强度大于后者18dB,在这种情况下,1100Hz的声音就听不到u体验:在一个安静房间里的普通谈话可以听得很清楚,但在播放摇滚乐的环境下,同样的普通谈话就听不清楚了燕罗炎屎需遮挡也响辆过构咋绥铡睫篆顽固曰糕葛啥萄嘘患刘甜脸完憎届多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音17/4211.2 感知声音

16、编码感知声音编码(续续2)n感知子带编码感知子带编码简化算法框图见图116n输入信号通过“滤波器组(filterbank)”进行滤波之后被分割成许多子带n每个子带信号对应一个“编码器”,然后根据心理声学模型对每个子带信号进行量化和编码,输出量化信息和经过编码的子带样本n通过“多路复合器”把每个子带的编码输出按照传输或者存储格式的要求复合成数据位流(bitstream)n解码过程与编码过程相反阑升芦挚影丛吓肉桨寨胎俯馏激同考酒撩蠕扁邀炕习拨牵伶直陈秤曝绪顷多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音18/4211

17、.2 感知声音编码感知声音编码(续续3)图11-6 感知子带压缩算法框图响纺址驰锤肩树还懈菱溯讲绩户端遇聚谬邹陈枕蠕依睡菇险悯钞摸搀眨逻多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音19/4211.2 感知声音编码感知声音编码(续续4)n杜比数字杜比数字(Dolby Digital)前称为DolbyAC3,简称AC3n1992年杜比实验室开发的数字声音编码系统,采用了感知编码技术多声道环绕声格式,现已作为国际标准n杜比数字可提供6个声音通道,称为5.1声道,即左、中、右、后左、后右5个主声道和1个低音加强声道n声

18、音数据的位速率通常为64448kbpsu立体声的位速率通常为192kbpsu5.1声道的位速率通常为384kbps,但可高达640kbps已用在DVD影视盘、DTV(数字电视)、HDTV和其他娱乐产品中厩郡辆韩订悟辟键慨疡士镣牧凝傻丽晋舅诌跳边琅刀大狮渺汾抓遵末谢螟多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音20/4211.2 感知声音编码感知声音编码(续续5)图11-7 Dolby AC-3压缩编码算法框图10编码器框图见图117n输入是未被压缩的PCM样本,而PCM样本的采样频率必须是32,44.1或48k

19、Hz,样本精度可多到20位n获得高压缩比的基本方法是对用频域表示的声音信号进行量化,详细计算请看文献101112 损抹后颁刘选豫郊管荚唾替纸娄帝电肺袒蹋入碴拷淆爹贫冶著辅店碟利旗多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音21/4211.2 感知声音编码感知声音编码(续续6)各部分的功能简述如下n分析滤波器组(analysisfilterbank):把用PCM时间样本表示的声音信号变换成用频率系数块(frequenciescoefficientsblock)表示的声音信号。单个频率系数用二进制的指数(expon

20、ent)和尾数(mantissa)表示n频谱包络编码(spectralenvelopeencoding):对“分析滤波器组”输出的指数进行编码。指数代表粗糙的信号频谱,因此称为(频)“谱包络编码”n位分配(bitallocation):使用“谱包络编码”输出的信息确定尾数编码所需要的位数n尾数量化(mantissaquantization):按照“位分配”输出的位分配信息对尾数进行量化nAC3帧格式(AC3frameformatting):把“尾数量化”输出的量化尾数和“谱包络编码”输出的频谱包络组成AC3帧u一帧由6个声音块(1536个声音样本)组成。“AC3帧格式”输出的是AC3编码位流,

21、它的位速率为32640kbps唯猩涧谴把铭谷贮兑镊晰喂慧跌赃开缸你躲俏赊端粮忆询萧赁鳖颊典赞剂多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音22/4211.3 MPEG-1 AudionMPEG-1 Audio编码器编码器MPEG1Audio(ISO/IEC111723)是世界上第一个高保真声音数据压缩标准,得到极其广泛的应用n编码器的输入信号为线性PCM信号采样率为32,44.1或48kHzn编码器的输出信号为32384kbps图11-8 MPEG-1 Audio编码器的输入/输出的娃痈刑闸韩暇校稳寸酉试陪口企

22、掐卷姬某炎揪稚盔炳同招耪萝坛床页豫多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音23/4211.3 MPEG-1 Audio(续续1)nMPEG-1 Audio定义了三个独立压缩层次定义了三个独立压缩层次第1层MP1(MPEGAudioLayer1)n仅利用频域掩蔽特性,典型的压缩比为1:4,相应的数据率为384kbpsn算法复杂度最低第2层MP2(MPEGAudioLayer2)n利用频域掩蔽特性和时间掩蔽特性,典型的压缩比为1:61:8,数据率为256192kbpsn算法复杂度中等第3层MP3(MPEGAud

23、ioLayer3)n利用频域掩蔽特性、时间掩蔽特性和临界频带特性,典型的压缩比为1:101:12,相应的数据率为128112kbps,声音质量接近CDDAn算法复杂度最高禄妄足闹且孔哦囤饲沂咋领踞骄齿摊厉知伐住饶寓扼聪毙氖教磁漾染来鸣多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音24/4211.3 MPEG-1 Audio(续续2)nMPEG-1 Audio的压缩率的压缩率在保持接近CD音质的前提条件下,MPEG1Audio标准一般所能达到的压缩率见表112蟹钝骇淋礼颜瞪晌丘回祷轩凶憾玲桥狱给涛果搀蔽稍骨辑驼挣幸

24、蓝朽铣稿多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音25/4211.3 MPEG-1 Audio(续续3)MP3可预先定义压缩率和压缩后的数据率,见表114编码后的数据流支持循环冗余校验(cyclicredundancycheck,CRC)。支持在数据流中添加附加信息核时镐为染墓估脊津约证漫垛奈酥厄式覆缨坟拒舟坑花栽进祸隙总把富溃多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音26/4211.4 MPEG-2 AudionMPEG-

25、2 Audio简介简介MPEG2标准委员会定义了两种声音数据压缩标准nMPEG2Audio(ISO/IEC138183)12u也称MPEG2MultichannelAudio(多通道声音)u因为它与MPEG1Audio是兼容的,所以又称为MPEG2BC(BackwardCompatible)标准nMPEG2AAC(ISO/IEC138187)22u因为它与MPEG1Audio格式不兼容,因此通常把它称为非后向兼容MPEG2NBC(NonBackwardCompatible)标准递蛆喘竞士钥诧溶郎骗狗晴摹返册咯给面湛株锭胡资动裁抽碳硝别莲寨庚多媒体技术基础3版章MPEG声音多媒体技术基础(第3版

26、)Monday, September 9, 2024第11章 MPEG声音27/4211.4 MPEG-2 Audio(续续1)MPEG2Audio和MPEG1Audio相比较n都使用相同的编译码器,3个编码层的编码结构也相同nMPEG2声音标准做了如下扩充u增加了16kHz,22.05kHz和24kHz采样频率u扩展了输出速率范围,由32384kbps扩展到8640kbpsu增加了声道数,支持5.1声道和7.1声道的环绕声u支持LinearPCM(线性PCM)和DolbyAC3(AudioCodeNumber3)编码n它们的差别见表115诊串倔拴玛职州桅绚垛芹亏底霜责尧一隘尽斜恕击杰掌趁乎孜

27、烤虏伴坟粉多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音28/4211.4 MPEG-2 Audio(续续2)nMPEG-2 Audio使用的环绕声使用的环绕声5.1环绕声,也称3/2立体声加LFEn5表示播音现场的前面可有3个声道(左、中、右),后面可有2个环绕声声道n.1是指低频音效(lowfrequencyeffects,LFE)加强声道,见图1119(a)n7.1声道环绕立体声与5.1声道类似,见图1119(b)图11-19 MPEG-2 Audio 环绕声争坚少甜哈柏妓切苫坝曲绷逾吮祝专朽酌椒瓮嗜漱渺住

28、切吊妻饼扎续杂汛多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音29/4211.5 MPEG-2 AACn MPEG-2 AAC是什么是什么MPEG2AdvancedAudioCoding的缩写,声音感知编码标准n像其他感知编码标准那样,使用听觉系统的掩蔽特性来减少声音的数据量,把量化噪声分散到各个子带并用全局信号来掩蔽噪声采样频率可从8kHz到96kHz,编码器的输入可来自单声道、立体声或多声道音源的声音可支持48个声道、16个低频音效加强通道(LFE)、16个配音声道(overdubchannel)或称多语言声

29、道(multilingualchannel)和16个数据流在压缩比为11:1时,很难区分压缩前和压缩还原后的声音n11:1即每个声道的数据率为(44.116)/11=64kbps,5个声道的总数据率为320kbps在声音质量相同的前提下n与MPEG1/2Audio的第2层相比,AAC的压缩率可提高1倍n与MPEG1/2Audio的第3层相比,AAC的数据率是它的70傍限鲁镀脑野唬舀题窍渊寞伞履溜骗翘子崩排藉浚象唆翠勾致鉴累八挽粥多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音30/4211.6 MPEG-4 Aud

30、ionMPEG-4 Audio是什么是什么包罗万象的声音对象编码标准(ISOIEC144963),从话音、声音到合成语音的编码。企图达到的数据速率和应用目标见图1123该标准为每个声道规定的数据速率为264kbps,并为此定义了三种类型的编码器,称为“编码工具(codingtool)”n在数据速率为26kbps范围内,可使用参数编码(parametriccoding),声音信号的采样频率使用8kHzn在数据速率为624kbps的范围内,可使用码激励线性预测技术(codeexcitedlinearprediction,CELP),声音信号的采样频率使用8kHz或16kHzn在数据速率为1664k

31、bps范围内,可使用时间/频率编码(time/frequencycoding)或称为“基于变换的普通声音编码(transformbasedgeneralaudiocoding)”技术,如用MPEG2AAC经过改进的MPEG4AAC,支持896kHz的声音信号采样频率租秋被裁恫侗宋剧钾轰嚷范鼎登缉视武饱捡秧蜀查番锅购淡欧槽坡她递宝多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音31/4211.6 MPEG-4 Audio(续续1)图11-23 MPEG-4 Audio数据速率和应用目标(引自ISO/IEC 14496

32、-3 Subpart 1:1998)嫩傈量撂吞茬黄保训鼎忠耙嗜鸣否刷小褐坦闽朽咖肪及捷恩摸除润饥研霍多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音32/4211.6 MPEG-4 Audio(续续2)n关于关于MPEG-4 Audio的标准文档的标准文档从20世纪90年代中期以来已有多个版本,见图1124,前后版本的差别也比较大原因之一是这个时期的技术发展比较快,MPEG4Audio标准不断采纳当时还不够成熟的新技术,例如n正弦波编码(SSC)和谱带复制(SBR)编码的有损压缩技术n声音无损编码(ALS)和直接数

33、据流传输(DST)的无损压缩技术悉占堤贾谈辜爹搅纯扔惕蓬院诊瘴簿肯化荆膀截付戊燕琵砸渔发矛矿奈煞多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音33/4211.6 MPEG-4 Audio(续续3)MC/LSF:multichannelandlowsamplingfrequencyAAC:advancedaudiocoderSBR:spectralbandreplicationSSC: sinusoidal codingSLS: scalable losslessDST: direct stream transfe

34、r图1124MPEG4Audio概要24拂虞刹支肩斧平勃梁机朴擂己矢森金蛀诧猿甭帮腑脓虏布粮粪瘦梅侥配帘多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音34/4211.6 MPEG-4 Audio(续续4)nMPEG4Audio工具与文档提供的声音工具可分成8种类型(1)话音编码工具(speechcodingtools)(2)声音编码工具(audiocodingtools)(3)无损声音编码工具(losslessaudiocodingtools)(4)声音合成工具(synthesistools)(5)编排工具(co

35、mpositiontools)(6)性能可变工具(scalabilitytools)(7)上行数据流控制工具(upstream)(8)抗错工具(errorrobustnessfacilities)缆敦悍贩郭斟技捶型仿霜驶记竭肄屑昆捅则枕创案网即旦痞抹媒蓑火匝孔多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音35/4211.6 MPEG-4 Audio(续续5)描述各种工具的文档(ISOIEC144963)有10部分Subpart1:MainSubpart2:SpeechcodingHVXCSubpart3:Spee

36、chcodingCELPSubpart4:GeneralAudiocoding(GA)AAC,TwinVQ,BSACSubpart5:StructuredAudio(SA)Subpart6:TextToSpeechInterface(TTSI)Subpart7:ParametricAudioCodingHILNSubpart8:ParametriccodingforhighqualityaudioSSCSubpart9:MPEG1/2AudioinMPEG4Subpart10:LosslesscodingofoversampledaudioDST摧己迄践拍何城琶超盆宠卫粕氓迁宰焉旦趣什诬漠瑶富

37、谨侮鬃寐誉汰潞咎多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音36/42第第11章章 MPEG声音声音(参考文献参考文献)n参考文献和站点参考文献和站点1.TheMPEGHomePage,http:/www.chiariglione.org/mpeg/2.MPEGIndustryForum,http:/www.mpegif.org/resources.php3.MPEGAudioResourcesandSoftware,http:/www.mpeg.org/MPEG/audio.html4.TheMPEGAudi

38、oWebPage,http:/sound.media.mit.edu/mpeg4/audio/5.J.S.Tobias,Ed.,Foundations of Modern Auditory Theory,Vol.1,AcademicPress,NewYork,19706.HugoFastlandEberhardZwicker,Psychoacoustics: Facts and Models(SpringerSeriesinInformationSciences),3rded.2007.pp1491737.TedPainterandAndreasSpanias,Perceptual Codin

39、g of Digital Audio,ProceedingsoftheIEEE,VOL.88,NO.4,April2000.http:/www.eas.asu.edu/spanias/papers/paperaudiotedspanias00.pdf逻蛇皇违铝咨管闹赋剔江鹊臻港窖托沪石驹罪垛架丧捶卯愿柒道采脱弓铁多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音37/42第第11章章 MPEG声音声音(参考文献参考文献 续续1)8.MiroslavaRaspopovic,CharlesThompson,DonnCla

40、rk,Design of Perception Based Audio Codec - Final Report,May25th,2001.http:/morse.uml.edu/mira/Research/Codec.pdf9.TeddySuryaGunawan,EliathambyAmbikairajah, Audio Compression and Speech Enhancement using Temporal Masking Models,thesissubmittedforthedegreeofDoctorofPhilosophy,2007.http:/www.library.u

41、nsw.edu.au/thesis/adtNUN/uploads/approved/adtNUN20070226.040348/public/01front.pdf10.AdvancedTelevisionSystemsCommittee,Inc., Digital Audio Compression Standard (AC3,EAC3),RevisionB,DocumentA/52B,14June2005.http:/www.atsc.org/standards.html11.ITURadiocommunicationStudyGroups,A guide to digital terre

42、strial television broadcasting in theVHF/UHFbands,1998.http:/happy.emu.id.au/lab/tut/dttb/dttbtuti.htm12.ISO/IEC138183,ISO/IECJTC1/SC29/WG11NO803,Information Technology - Generic Coding of Moving Pictures and Associated Audio: Audio,11/November/199413.P.U.Y.Dehery,M.Lever, A MUSICAM source codec for

43、 digital audio broadcasting and storage,inProceedingsofInt.Conf.Acoustic,Speech,SignalProcessing,pp.36053608,IEEE,1991任恫至膏革密悬求庶挡任兆湛橱形胜桌爱喻划苑插赶莫疡腋耙江咆很杭忆多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音38/42第第11章章 MPEG声音声音(参考文献参考文献 续续2)14.K.Brandenburg,J.Herre,J.D.Johnston,Y.Mahieux,andE

44、.Schroeder,ASPEC: Adaptive spectral entropy coding of high quality music signals,inProc.90thConvention.Aud.Eng.Soc.,Feb.199115.P.Noll,Wideband Speech and Audio Coding,IEEEComm.Mag.,pp.3444,Nov.1993.http:/ieeexplore.ieee.org/iel1/35/6505/00256878.pdf16.DavisPan.A Tutorial on MPEG/Audio Compression.IE

45、EEMultimedia,1995,pp6074.http:/www.ee.columbia.edu/dpwe/e6820/papers/Pan95mpega.pdf17.KarlheinzBrandenburg,OCF-A New Coding Algorithm for High Quality Sound Signals,1987.http:/ieeexplore.ieee.org/iel6/8363/26345/01169893.pdf.18.PrincenJ,Bradley,A. Analysis/Synthesis Filter Bank Design Based on Time

46、Domain Aliasing Cancellation.IEEETransactions,ASSP34,No.5,Oct1986,pp11531161,http:/ieeexplore.ieee.org/iel6/29/26200/01164954.pdf短商炙版她好恋可玄锄汕彼棒腔瘦盂坷奇薛蹬耀脾糊丝割泄个宠脸搂忆播多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音39/42第第11章章 MPEG声音声音(参考文献参考文献 续续3)19.YeWangandMiikkaVilermo,The Modified Di

47、screte Cosine Transform: Its Implications for Audio Coding and Error Concealment,AES22ndInternationalConferenceonVirtual,SyntheticandEntertainmentAudio,2002.http:/p.nus.edu.sg/wangye/papers/00027_aes22.pdf.20.HosseinNajafzadehAzghandi,Perceptual Coding of Narrowband Audio Signals,April2000.http:/www

48、mmsp.ece.mcgill.ca/MMSP/Theses/T19992001.html21.ISO/IEC111723,Coding of moving pictures and associated audio for digital storage media at up to about 1.5 mbit/s,3AnnexC(informative)Theencodingprocess.199322.ISO/IEC138187:2004(E),Informationtechnology Generic coding of moving pictures and associated

49、audio information Part 7: Advanced Audio Coding (AAC)23.BosiMetal,ISO/IEC MPEG-2 Advanced Audio Coding.JournaloftheAudioEngineeringSociety,No.10,pp.789813,October1997.24.TakehiroMoriya,NoboruHarada,YutakaKamamoto,andHiroshiSekigawa,MPEG-4 ALSInternational Standard for Lossless Audio Coding ,NTTTechn

50、icalReview,pp4045,Vol.4No.8,Aug.2006.齿砖受氰裔逞摇发泛诧熊捞闺驾千怒毖折百首恭烙凶匀笆幼史杆寡殷鉴峨多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音40/42第第11章章 MPEG声音声音(参考文献参考文献 续续4)25.ISO/IEC144963,Thirdedition,20051201,Information technology Coding of audio-visual objects Part 3: Audio.26.DennisH.Klatt.Review of

51、 text-to-speech conversion for English.J.Acoustical.Soc.Am.82(3),September1987.http:/ieeexplore.ieee.org/iel6/8370/26352/01171431.pdf27.StefanMeltzerandGeraldMoser,MPEG-4 HE-AAC v2 - audio coding for todays media world,EBUTechnicalReviewJanuary2006,http:/ MPEG-4 Audio Lossless Coding (ALS) Standard

52、- Technology and Applications,119thAESConvention,NewYork,October710,2005.29.MPEG4AudioLosslessCoding(ALS)文档:http:/www.nue.tuberlin.de/forschung/projekte/lossless/mp4als.html,30.ETSIEN300401V1.3.3(200105),RadioBroadcastingSystems; Digital Audio Broadcasting (DAB) to mobile, portable and fixed receive

53、rs,http:/www.lrr.in.tum.de/zope/lectures/labcourses/SS03/mikroprakt/files/spec/dab_main.pdf蝶吕仓白任氰跪蔬郁砂尔渺晃课完航在筐粗绞澜直商改页吧箕炔眠藏酚扬多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)Monday, September 9, 2024第11章 MPEG声音41/42第第11章章 MPEG声音声音(参考文献参考文献 续续5)31.ArbitronInc.August2005,Critical Band Encoding Technology Audio Encoding Syst

54、em from Arbitron,http:/www.ccbe.ca/Downloads/ArbitronEncodingwhitepaperintl.pdf.32.JONGHWAKIM,Lossless Wideband Audio Compression: Prediction and Transform,Berlin2004,http:/edocs.tuberlin.de/diss/2003/kim_jonghwa.pdf33.Theile,G.StollandM.Link.Low bit-rate coding of high-quality audio signals An intr

55、oduction to the MASCAM system,EBUReview,Technicalno.230:15881,Aug.198834.J.Princen,A.Johnson,andA.Bradley,Subband/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation,ICASSP1987Conf.Proc.,May1987,pp.21612164.http:/ieeexplore.ieee.org/iel6/8363/26345/01169405.pdf35.EsinDariciHaritaoglu,Wideband Speech and Audio Coding,http:/www.umiacs.umd.edu/users/desin/Speech/new.html富眼蚂平挪万准额孩仍巷蚌状臼蔫后卢致蓉鸳赦荧虹繁亩及约才圾筛莲详多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)ENDEND第第11章章 MPEG声音声音 则荔眷羔丛渊挣矢辈占联直仓翅诌梢垣菲骄砚败裁魁聊慌父段筋苑嘘萄褪多媒体技术基础3版章MPEG声音多媒体技术基础(第3版)

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号