梁倩《多媒体技术》第2章多媒体音频技术

上传人:xian****812 文档编号:290317755 上传时间:2022-05-09 格式:PPTX 页数:76 大小:2.17MB
返回 下载 相关 举报
梁倩《多媒体技术》第2章多媒体音频技术_第1页
第1页 / 共76页
梁倩《多媒体技术》第2章多媒体音频技术_第2页
第2页 / 共76页
梁倩《多媒体技术》第2章多媒体音频技术_第3页
第3页 / 共76页
梁倩《多媒体技术》第2章多媒体音频技术_第4页
第4页 / 共76页
梁倩《多媒体技术》第2章多媒体音频技术_第5页
第5页 / 共76页
点击查看更多>>
资源描述

《梁倩《多媒体技术》第2章多媒体音频技术》由会员分享,可在线阅读,更多相关《梁倩《多媒体技术》第2章多媒体音频技术(76页珍藏版)》请在金锄头文库上搜索。

1、第第2 2章章 多媒体音频技术多媒体音频技术声音与听觉特性声音信号数字化采样定理数字音频的文件格式音频信号的特点电子乐器数字接口(MIDI)声卡主要学习内容:多媒体技术一、声音信号两个基本参数一、声音信号两个基本参数一、声音信号两个基本参数一、声音信号两个基本参数1、声音与听觉器官 声音是通过空气传播的一种连续的波,叫声波。声音是纵波,其基本形式是正弦波。它是随时间连续变化的物理量。声音的强弱体现在声波压力的大小上,音调的高低体现在声音的频率上。声波具有普通波的所有特性,如反射、折射和衍射等。如图2-1所示。 图2-1声音是一种连续的波2.1 2.1 声音与听觉特性声音与听觉特性多媒体技术2、

2、声音信号的两个基本参数 声音信号的两个基本参数是频率和振幅。振幅:波的高低幅度,表示声音的大小。频率:每秒钟振动的次数,以Hz为单位,表示音调的高低。注:周期:两个相邻波之间的时间长度,为频率的倒数。多媒体技术多媒体技术多媒体技术多媒体技术 声音信号由许多频率不同的信号组成,这类声音信号称为复合信号,用来描述组成复合信号的频率范围称为带宽,也叫频带宽度。一般而言,声源的频带越宽表现力越好、层次越丰富。语音带宽:3003400Hz女高音: 22011000Hz电话声音:2003400Hz电台调幅广播:2015000Hz高级音响: 2020000Hz宽带音响:10 40000Hz多媒体技术二、频率

3、信号的分类与听觉系统的感知特性二、频率信号的分类与听觉系统的感知特性二、频率信号的分类与听觉系统的感知特性二、频率信号的分类与听觉系统的感知特性1、频率信号的分类 次声波:0 20Hz 人耳能听到的声音:20Hz 20KHz 超声波:20KHz 1GHz 高超声波:1GHz 10THz多媒体技术2、声音媒体的种类 凡是通过声音形式以听觉传递信息的媒体都属于听觉媒体,主要有波形声音、语音和音乐。 (1)波形声音 包含了所有的声音形式,它可以把任何声音都进行采样量化,并恰当地恢复出来。 (2)语音 构成人类语言信号的各种声音。人的说话声虽是一种特殊的媒体,但也是一种波形,所以和波形声音的文件格式相

4、同。 (3)音乐 可以用符号来表示,可看作符号化的声音媒体,比较规范的是MIDI。多媒体技术3、听觉系统的感知特性 (1)方位感: (2) 响度感 (3)音调感 记忆力 分辨力 音色感 (4)聚焦效应多媒体技术 4、声音三要素: 音调 音强 音色 5、声音的连续性 声音是一种弹性波,声音信号可以分成周期信号与非周期信号两类。 周期信号是单一频率音调的信号,其频率是线性谱; 非周期信号包含一定频带的所有频率分量,其频谱是连续谱。 6、声音的方向性 声音的传播是以声波形式进行的。 根据声音的方向性可判断声音来源;也可造成声音的特殊效果。多媒体技术一、从模拟过渡到数字一、从模拟过渡到数字一、从模拟过

5、渡到数字一、从模拟过渡到数字优点:优点: 数字信号计算是一种精确的运算方法,它不受时间和环境变化数字信号计算是一种精确的运算方法,它不受时间和环境变化的影响;的影响; 表示部件功能的数学运算不是物理上实现的功能部件,而是表示部件功能的数学运算不是物理上实现的功能部件,而是仅用数学运算去模拟,其中的数学运算也相对容易实现;仅用数学运算去模拟,其中的数学运算也相对容易实现; 可以对数字运算部件进行编程。可以对数字运算部件进行编程。二、模拟信号与数字信号二、模拟信号与数字信号二、模拟信号与数字信号二、模拟信号与数字信号 把在时间和幅度上都是连续的信号称为模拟信号。把在时间和幅度上都是连续的信号称为模

6、拟信号。 把在时间和幅度上都用离散的数字表示的信号称为数字信号。把在时间和幅度上都用离散的数字表示的信号称为数字信号。 声音信号数字化声音信号数字化声音信号数字化声音信号数字化多媒体技术三、声音信号数字化三、声音信号数字化三、声音信号数字化三、声音信号数字化1 1、什么是数字音频、什么是数字音频 声音是机械振动,振动越强,声音越大。话筒把机械振动转换成电信号,模拟音频技术中以模拟电压的幅度表示声音强弱。 在数字音频技术中,把表示声音强弱的模拟电压用数字表示,如0 .5V 电压用数字20表示,2V电压用80表示。模拟电压的幅度,即使在某电平范围内,仍然可以有无穷多个,如1.2V 、。而用数字来表

7、示音频幅度时,只能把无穷多个电压幅度用有限个数字表示。即把某一幅度方位内的电压用一个数字表示,这称之为量化。 计算机内的基本数制是二进制,为此我们也要把声音数据写成计算机的数据格式,这称之为编码。多媒体技术模拟声音在时间上是连续的,而以数字表示的声音是一个数据系列。模拟电压幅度、量化、编码的关系如表2-2多媒体技术2、音频数字化 计算机内的音频必须是数字形式的,因此必须把模拟音频信号转换成有限个数字表示的离散序列,即实现音频数字化。在这一处理技术中,涉及到音频的采样、量化和编码。 多媒体技术 计算机处理声音的第一步,是将自然转换成数字音频信号,这就是声音的数字化过程,也叫做音频数据采样过程。数

8、字化实际上就是采样和量化。 如前所述,连续时间的离散化通过采样来实现,就是每隔相等的一小段时间采样一次,这种采样称为均匀采样(uniform sampling);连续幅度的离散化通过量化(quantization)来实现,就是把信号的强度划分成一小段一小段,如果幅度的划分是等间隔的,就称为线性量化,否则就称为非线性量化。多媒体技术图2-2表示了声音数字化的概念。 图2-2声音的采样和量化多媒体技术 声音数字化需要回答两个问题:(1):每秒钟需要采集多少个声音样本,也就是采样频率(fs)是多少?(2)每个声音样本的位数应该是多少,也就是量化精度。多媒体技术、采样定理、采样定理 声音采样的基本原理

9、是:把自然界中模拟声音转换成计算机能够处理的数字化声音,该过程称为“A/D转换(模/数转换)”。 多媒体技术一、数字采样一、数字采样一、数字采样一、数字采样 声音采样的基本原理是:首先输入模拟声音信号,然后按照固定的时间间隔截取该信号的振幅值,每个波形周期内截取两次,以取得正、负向的振幅值。该振幅值采用若干位二进制数表示,从而将模拟声音信号变成数字音频信号。模拟声音信号是连续变化的振动波,而数字音频信号是阶跃变化的离散信号。 截取模拟声音信号振幅值的过程叫做“采样”,得到的振幅值叫做“采样值”,采样值用二进制数的形式表示,该表示形式叫做“量化编码”。 多媒体技术二、采样频率二、采样频率二、采样

10、频率二、采样频率 在一定的时间间隔内采集的样本数叫做采样频率,即一秒钟采样的次数。 采样频率越高,在一定的时间间隔内采集的样本数越多,音质就越好,同时数字化声音的数据量也越大。 多媒体技术奈奎斯特理论: 采样频率不应低于声音信号最高频率的两倍,这样就能把以数字表达的声音还成原来的声音,这叫做无损数字化(lossless digitization)。 采样定律用公式表示为: fs 2f 或者T T/2 其中f为被采样信号的最高频率。多媒体技术 采样过程所应遵循的规律,又称取样定理、抽样定理。采样定理说明采样频率与信号频谱之间的关系,是连续信号离散化的基本依据. 采样定理是1928年由美国电信工程

11、师H.奈奎斯特首先提出来的,因此称为奈奎斯特采样定理。1933年由苏联工程师科捷利尼科夫首次用公式严格地表述这一定理,因此在苏联文献中称为科捷利尼科夫采样定理。1948年信息论的创始人C.E.香农对这一定理加以明确地说明并正式作为定理引用,因此在许多文献中又称为香农采样定理。 采样定理在数字式遥测系统、时分制遥测系统、信息处理、数字通信和采样控制理论等领域得到广泛的应用。三、采样定理三、采样定理三、采样定理三、采样定理多媒体技术四、采样精度四、采样精度四、采样精度四、采样精度 样本大小是用每个声音样本的位数(bit/s或b/s)表示的,它反映度量声音波形幅度的精度。例如,每个声音样本用16位(

12、2字节)表示,测得的声音样本值是在065536的范围里,它的精度就是输入信号的1/65536。样本位数的大小影响到声音的质量,位数越多,声音的质量越高,而需要的存储空间也越多;位数越少,声音的质量越低,需要的存储空间越少。 多媒体技术 采样精度的另一种表示方法是信号噪声比,简称为信噪比并用下式计算:其中: 表示信号电压, 表示噪声电压;SNR的单位为分贝(db) 例1 假设Vnoise=1 ,采样精度为1位, ,它的信噪比SNR=6db。 例2 假设Vnoise=1 ,采样精度为16位, ,它的信噪比SNR=96db。 一般来说,信噪比越大,说明混在信号里的噪声越小,声音回放的音质量越高,否则

13、相反。信噪比一般不应该低于70dB,高保真音箱的信噪比应达到110dB以上。多媒体技术五、声音质量与数据率五、声音质量与数据率五、声音质量与数据率五、声音质量与数据率 根据声音的频带,通常把声音的质量分成5个等级,由低到高分别是电话(telephone)、调幅(amplitude modulation,AM)广播、调频(frequency modulation,FM)、光盘(compact disc,CD)和数字录音带(digital audio tape,DAT)的声音。在这5个等级中,使用的采样频率、样本精度、通道数和数据率列于表2-3. 表2-3 声音质量和数据率质量 采样频率/kHz

14、采样精度b/s 单声道/ 立体声 数据率(未压缩) kB/s 频率范围/Hz电话 8 8 单声道 8 2003 400 AM 11.025 8 单声道 11.0 507 000 FM 22.050 16 立体声 88.2 2015 000 CD 44.1 16 立体声 2020 000 DAT 48 16 立体声 2020 000 数据率=采样频率*采样精度*声道数/8多媒体技术四、数字音频文件格式四、数字音频文件格式 声音文件的格式很多,如同存储文本文件一样,存储声音数据也需要有存储格式,在多媒体技术中存储声音信息的文件格式主要有: WAV文件,VOC文件,MIDI文件,AIF文件,SND文

15、件、RMI文件、mp3文件等。1.1.1.1.WAVWAVWAVWAV文件文件文件文件 波形文件格式:一种直接的表达声波的数字形式,用.wav为扩展名的文件格式称为波形文件格式(wave file format)。 Wav文件是由采样数据组成的,所以它所需要的存储容量很大。 用下列公式可以简单地推算出wav文件所需的存储空间的大小。Wav文件的字节数/每秒采样频率(Hz)量化位数(位)声道数/8例如:用的采样频率对声波进行采样,每个采样点的量化位数选用16位,则录制1秒的立体声节目,其波形文件所需的存储容量为: 44 100162/8176 400(字节)多媒体技术文件文件文件文件 VOC V

16、OC VOC VOC文文文文件是Creative公司波形音频文件格式,也是声霸卡声霸卡(sound blaster)使用的音频文件格式。 每个VOC文件由文件头块(header block)和音频数据块(data block)组成。文件头包含一个标识、版本号和一个指向数据块起始的指针。数据块分成各种类型的子块,如声音数据、静音、标记、ASCII码文件,重复的结束,重复以及终止标志,扩展块等。 利用声霸卡提供的软件可以实现VOC和WAV文件的转换。 注:Sound BlasterSound Blaster(声霸卡声霸卡)是一个电脑声卡系列产品,曾经是IBM个人电脑声效的非正式标准,由新加坡创新科技(Creative)开发。现时Sound Blaster主要生产较高价的声卡产品,提供3D立体声等特殊音效。多媒体技术3. MIDI3. MIDI3. MIDI3. MIDI文件文件文件文件 MIDI(masical instrument digitat intantace)音频文件一种计算机数字音乐接口生成的数字描述音频文件,扩展名是“.mid”。4. RMI4. RMI4. RMI4. RM

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号