多媒体技术与应用 普通高等教育“十一五”国家级规划教材 教学课件 ppt 作者 张小川 邵桂芳 黄同愿1第3章 音频处理

上传人:w****i 文档编号:94481964 上传时间:2019-08-07 格式:PPT 页数:55 大小:1.85MB
返回 下载 相关 举报
多媒体技术与应用 普通高等教育“十一五”国家级规划教材  教学课件 ppt 作者  张小川 邵桂芳 黄同愿1第3章 音频处理_第1页
第1页 / 共55页
多媒体技术与应用 普通高等教育“十一五”国家级规划教材  教学课件 ppt 作者  张小川 邵桂芳 黄同愿1第3章 音频处理_第2页
第2页 / 共55页
多媒体技术与应用 普通高等教育“十一五”国家级规划教材  教学课件 ppt 作者  张小川 邵桂芳 黄同愿1第3章 音频处理_第3页
第3页 / 共55页
多媒体技术与应用 普通高等教育“十一五”国家级规划教材  教学课件 ppt 作者  张小川 邵桂芳 黄同愿1第3章 音频处理_第4页
第4页 / 共55页
多媒体技术与应用 普通高等教育“十一五”国家级规划教材  教学课件 ppt 作者  张小川 邵桂芳 黄同愿1第3章 音频处理_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《多媒体技术与应用 普通高等教育“十一五”国家级规划教材 教学课件 ppt 作者 张小川 邵桂芳 黄同愿1第3章 音频处理》由会员分享,可在线阅读,更多相关《多媒体技术与应用 普通高等教育“十一五”国家级规划教材 教学课件 ppt 作者 张小川 邵桂芳 黄同愿1第3章 音频处理(55页珍藏版)》请在金锄头文库上搜索。

1、,3.1 概述,3.1.1 声音的基本特征 3.1.2 声音的三要素 3.1.3 音频的分类 3.1.4 常见音频文件格式,3.2 声音数字化过程,3.2.1 音频的数字化 3.2.2 音乐合成 3.2.3 MIDI,实验三 音频数据的采集与使用、编辑、转换,3.3 音频处理软件,3.3.1 Goldwave 3.3.2 Audio Editor 3.3.3 SoundForge 3.3.4 Cool Edit 3.3.5 Cakewalk,本章重点难点,重点:声音的基本概念、音频处理方法,难点:声音的数字化过程,3.1.1 声音的基本特征,声音是振动波,具有振幅、周期和频率。,振幅(Ampl

2、itude)描述声波的高低幅度,即声音信号的强弱程度,3.1.1 声音的基本特征,次声主要来自大自然,如地震、火山、台风、海啸、 大气湍流等自然现象 ; 超声既可以来自大自然的风声、水浪,又可以来自 一些动物的发声器官,还可以来自各种人造超声源;,次声波长最小也大于17米,可以走曲线,绕过高山 ; 超声波长最大也不过17毫米 ;波长很短,可以走直线;,穿透障碍,3.1.1 声音的基本特征,次声1883年我从印尼一个火山口出发,绕地球一直转 了三圈多,历经108个小时 。 超声从超声波发生器发出来,可以穿过5米厚的钢块, 只要千分之一秒的时间;,次声可以引起人体内脏器官的共振,造成眩晕, 甚至内

3、脏出血,使人丧命 ; 超声可以为病人透视、按摩、治疗疾病,使人健康 ;还 可以清洗、除尘,乳化、粉碎,割焊、钻孔、消毒、杀 菌,促进化学反应,影响生物生存 。,3.1.2 声音的三要素,音调(高低) 音强(强弱) 音色(特质),又称音品,主要由声音波形的谐波频谱和包络决定,也称音高,表示人耳对声音调子高低的 主观感受。客观上音高大小主要取决于声波 基频的高低,频率高则音调高,反之则低。,又称响度或音量,它表示声音能量的强弱程度,主 要取决于声波振幅的大小。音强与声波的振幅成正比, 振幅越大,强度越大。,3.1.2 声音的三要素,声音波形的基频所产生的听的最清楚的音称为基音, 各次谐波的微小振动

4、产生的声音称为泛音 。,所谓纯音或单音,是指单一频率、或振幅和频率不变的 声音信号,单音一般只能由专用电子设备产生;,在日常生活中,我们听到的自然界的声音一般都属于 复音,其声音信号由不同的振幅与频率合成而得到。,音质与频率范围成正比,频率范围越宽音质越好,3.1.3 音频的分类,按用途分类,语音是人类发音器官发出的具 有区别意义功能的声音。,语音的物理基础主要有音 高、音强、音长、音色,音乐是指有旋律的乐曲,一般采用MID文件。,音效是指有特殊效果的声音,例如,汽 车声、鼓掌声、打碎碗、玻璃声音等。,3.1.3 音频的分类,数字化声波。即将麦克风插在计算机的声卡上,利用录音软 件,将语音、音

5、乐等波形信息经模/数转换,得到数字化形式 进行存储、编辑,需要时再经过数/模转换还原成原来的波形。,MIDI合成。利用连接电脑的MIDI(乐器数字化接口),弹 奏出曲子,或合成音效录入计算机,再用声音软件编辑。,来源于声音素材库。将录音带或CD唱盘等声音素材库中的 曲子,用放音设备通过转接线转录到计算机,再用声音软件 加以编辑,存成多媒体著作软件可以读取的文件格式。,按来源分类,3.1.3 音频的分类,按格式分类,3.1.3 音频的分类,频带关系,女性语音,150Hz 10,000Hz,电话语音,200Hz 3,400Hz,调幅广播(AM),50Hz 7,000Hz,调频广播(FM),20Hz

6、 15,000Hz,高级音响,10Hz 40,000Hz,男性语音,100Hz 9,000Hz,声 源 种 类,频 带 宽 度,3.1.4 常见音频文件格式,Windows存放数字声音的标准格式,用于记录声音的波形,WAV,声音效果稳定,一致性好 ; 可真实地记录任何一种声源发出的声音,如乐器、人 声、鸟鸣、海涛声等 ; 数据记录详实,音频数据基本上没有经过压缩处理, 数据量大。,不适于在网络上传播,3.1.4 常见音频文件格式,提供了电子乐器与计算机内部之间的连接界面和信息交流方式,MIDI,文件的数据量很小 可以作为背景音乐 编辑方便,优 点,声卡需有音序器 播放效果因软、硬件而异 支持波

7、表功能,播放效果才好,缺 点,MIDI记录的是一串时 序命令,如按键音符,3.1.4 常见音频文件格式,根据MPEG-1视频压缩标准中,对立体声伴音进行 三层压缩的方法所得到的声音文件,MP3,声卡需有音序器 播放效果因软、硬件而异 支持波表功能,播放效果才好,缺 点,在运算时剔除了人耳听不到的太高(超过20kHz) 或者太低(低于20Hz)频率的声音特性,3.1.4 常见音频文件格式,因为音频信息本身并不是一成不变的,有的部分(如 多重声音同时出现和高音等环节)就需要比较多的码 率来描述,而有的部分(如空白、独唱和相对比较简 单的低频信号等)却不需要太多码率来表现,如果采 用恒定比特率来对整

8、段音乐进行编码,会造成声音还 原不够准确,信息丢失比较多。,MP3,文件编码,3.1.4 常见音频文件格式,MP3首先以44.1kHz的采样频率对模拟音频信号进行采 样,然后用16位的数值来量化采样点的信号强度,最后 利用可变比特率(VBR,Variable Bit Rate)的编码方 式来对整段音乐进行编码。,MP3,文件编码,3.2.1 音频的数字化,声音采样,声音采样,11011100 11001101,把声音(模拟量)按照固定时间间隔,转换成有限个数字表示的离散序列,每隔一定时间间隔不停地间断性地在模拟音频的波形上 采取一个幅度值,这一过程我们称之为采样; 为了把采样得到的离散序列信号

9、存入计算机,必须将其 转换为二进制数字表示,我们称这一过程为量化编码 。,模拟,数字,3.2.1 音频的数字化,声音采样,采样频率是指计算机每秒钟对声波幅度值样本采样的次 数,是描述声音文件的音质、音调,衡量声卡、声音文 件的质量标准,计量单位为Hz(赫兹) ; 采样通常采用三种频率:11.025KHz、22.05KHz、44.1KHz。,语音效果,称为电话音质,音乐效果,称为广播音质,高保真效果,CD唱盘,模拟,数字,3.2.1 音频的数字化,声音量化,采样得到的样本需要量化,所谓的量化位数也称“量化精 度”,是 描述每个采样点样本值的二进制位数。,常用的量化位数为8位、12位、16位。量化

10、级大小决定了 声音的动态范围,即被记录和重放的声音最高与最低之 间的差值。量化位数越高音质越好,数据量也越大。,模拟,数字,3.2.1 音频的数字化,声音通道的个数称为声道数,是指一次采样所记录产生的 声音波形个数。,记录声音时,如果每次生成一个声波数据,称为单声道; 每次生成两个声波数据,称为双声道(立体声)。,相关概念,随着声道数的增加,音频文件所占用的存储 容量也成倍增加,同时声音质量也会提高。,模拟,数字,3.2.1 音频的数字化,(1) 声音适配器 (声卡) 8bit、16bit、 128bit ¥ 80.003800.00 (2) 声卡驱动软件以及各种声音处理软件,声音重放,数字,

11、模拟,声音重放,11011100,把数字化声音转换成模拟量,经过音响单元重放出来,设备和软件,3.2.1 音频的数字化,数字,模拟,采样频率 Hz,数据长度 bit,数据量分钟,11,025,8,0.66 MB,22,050,8,1.32 MB,44,100,8,2.64 MB,11,025,16,1.32 MB,22,050,16,2.64 MB,44,100,16,5.29 MB,音质评价,低,一般,良好,中,良好,优秀,音质与数据量,重放频率 采样频率 2,重放频率 (模拟量)与采样频率 (数字量)的关系:,例 采样频率为44,100Hz的数字音频信号还原成声音后,为22,050Hz,3

12、.2.1 音频的数字化,数字,模拟,音质与数据量,未经压缩的WAV音频文件容量计算公式: 存储容量(字节)=采样频率量化位数/8声道数时间,【例3.1】一段持续1分钟的双声道声音文件,若采样频率为 22.05kHz,量化精度为8位,数字化后需要的存贮容量为多少?,22.051038/8260=2.646MB,计 算,3.2.2 音乐合成,使用电子元器件(或计算机)生成音乐的技术称为电子音乐合成,模拟式电子合成器是通过对震荡器的控制来实现音乐合成的, 主要有减法合成和加法合成两种。,数字式合成器不是由电子元器件制成的信号发生器来产生声音 中的各种频率成分,而是直接通过数字的方法来造出波形,然 后

13、转换为声音信息。其实数字式合成器就是一台特殊的计算 机,也是软硬件的综合体。,数字合成法主要有FM(Frequency Modulation) 频率调制合成和音乐样本合成两种。,3.2.2 音乐合成,用数字信号来表示不同乐音的波形,然后把它们组合起来, 再通过数模转换器(DAC)生成乐音播放。,FM频率调制合成,特点:结构简单,成本低,模仿能力很差,用FM合成法产生各种逼真的乐音很困难,有些乐音几乎不能 产生,目前只有低档次的声卡采用FM合成法。中高档的声音 卡一般采用乐音样本合成法,即波表(Wave Table)合成法。,3.2.2 音乐合成,波表合成采用一种称之为“波表查找”技术来产生MI

14、DI音 乐,其实它是将各种真实乐器(如大提琴、小提琴、钢 琴、鼓等)所能发出的所有声音(包括各个音域、声调) 录制下来,存贮为一个波表文件。,波表合成,播放时,根据MIDI文件记录的乐曲信息向波表 发出指令,从波表库逐一找出对应的声音信息, 经过合成、加工后回放出来。,3.2.3 MIDI,MIDI是Musical Instrument Digital Interface的缩写,意为 “乐器数字化接口”,是计算机和MIDI设备之间进行信息交 换的一整套规则,包括各种电子乐器之间传送数据的通信协议,在演奏与MIDI相连接的乐器时,键盘的按键、用力大小、 时间长短等信息被传送到MIDI设备中,形成

15、与乐器键盘 相对应的数字键盘信息。 当需要播放时,只需从相应的MIDI文件中读出MIDI消息, 生成所需要的声音波形,经放大后由扬声器输出。,3.2.3 MIDI,MIDI键盘是用于MIDI乐曲演奏的,MIDI键盘本 身并不发出声音,当作曲人员触动键盘上的按键时, 就发出按键信息(包括 按键力度、时长等),这些按键 信息组成了MIDI音乐消息,通过MIDI接口后,传给音序 器,从而录制生成MIDI文件。,MIDI键盘,3.2.3 MIDI,根据标准,MIDI乐器之间的连接依靠三种连接器, 分别称为MIDI In、MIDI Out、MIDI Thru。,MIDI接口,利用这三个连接器,可与外部的

16、乐器,如电子琴等乐器相连接,输入接口,负责接收其他MIDI设备发出的信息,输出端口,负责把乐器的MIDI信息传送出去。,扩展端口,通过该端口,把乐器从输入端口得到的信息直接传递到其他MIDI乐器的输入端上,起到乐器串联的作用。,3.2.3 MIDI,音序器由计算机程序或电子设备组成,主要用于 MIDI作曲,可记录、编辑和播放MIDI的声音文件。 音序器可捕捉MIDI消息,将其存入MIDI文件,MIDI 文件扩展名为.MID。,音序器,3.2.3 MIDI,MIDI文件的播放是通过MIDI合成器完成的,合成 器解释MIDI文件中的指令符号,生成所需要的声音 波形,经放大后由扬声器输出,声音的效果比较丰富。,合成器,3.3 音频处理软件,Goldwave Audio Editor SoundForge CoolEdit C

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号