多媒体技术基础及应用 刘建第4章数字音频信息处理

上传人:E**** 文档编号:89108186 上传时间:2019-05-18 格式:PPT 页数:131 大小:2.55MB
返回 下载 相关 举报
多媒体技术基础及应用 刘建第4章数字音频信息处理_第1页
第1页 / 共131页
多媒体技术基础及应用 刘建第4章数字音频信息处理_第2页
第2页 / 共131页
多媒体技术基础及应用 刘建第4章数字音频信息处理_第3页
第3页 / 共131页
多媒体技术基础及应用 刘建第4章数字音频信息处理_第4页
第4页 / 共131页
多媒体技术基础及应用 刘建第4章数字音频信息处理_第5页
第5页 / 共131页
点击查看更多>>
资源描述

《多媒体技术基础及应用 刘建第4章数字音频信息处理》由会员分享,可在线阅读,更多相关《多媒体技术基础及应用 刘建第4章数字音频信息处理(131页珍藏版)》请在金锄头文库上搜索。

1、第4章 数字音频信息处理,4.1 音频的概念 4.1.1 声音处理技术历史回顾 语言、音乐和各种自然声音是以声波为载体传递信息的基本形式。人类很早就开始研究声音,并利用当时已掌握了的声音产生和传送的某些规律来制造乐器、进行建筑设计或传声装置设计,使发出的声音传得更远。可是几千年来,人类只能凭耳朵来辨别声音的高低、强弱,而不能把声音记录和储存起来。所以与其他研究领域相比,声学的研究相对滞后。直到19世纪爱迪生发明了留声机(图4.1所示),人们才能用机械的方法把各种声音记录在唱片上。可是声音、机械振动不容易传递,也不容易放大,机械方法很不方便。随着电学、电子学的发展,人们开始尝试记录下这些真实的声

2、音,利用把声的振动转换成电信号的原理,使声音的记录成为可能,使电声技术获得了迅速发展。,语言、音乐和各种自然声音是以声波为载体传递信息的基本形式。人类很早就开始研究声音,并利用当时已掌握了的声音产生和传送的某些规律来制造乐器、进行建筑设计或传声装置设计,使发出的声音传得更远。可是几千年来,人类只能凭耳朵来辨别声音的高低、强弱,而不能把声音记录和储存起来。所以与其他研究领域相比,声学的研究相对滞后。直到19世纪爱迪生发明了留声机(图4.1所示),人们才能用机械的方法把各种声音记录在唱片上。可是声音、机械振动不容易传递,也不容易放大,机械方法很不方便。随着电学、电子学的发展,人们开始尝试记录下这些

3、真实的声音,利用把声的振动转换成电信号的原理,使声音的记录成为可能,使电声技术获得了迅速发展。,图4.1早期的留声机,电声技术是研究可听声频率范围内声音的产生、传播、存储、重放和接收的技术。顾名思义,电声技术是依靠电来记录并播放声音的,其基本原理是通过电压来产生模拟声波变化的电流信号,并记录下来,灌录成早期的唱片或磁带,这种电流信号便被称为模拟信号。传统的声音记录方式就是将模拟信号直接记录下来,例如磁带录音和密纹唱片就是将声音拾取处理后以磁记录或机械刻录的方式记录下来,此时磁带上磁极的变化或密纹唱片音槽内的纹路起伏变化都是与声音信号的变化对应成正比的。这里,密纹唱片、盒式磁带等是记录储存这种模

4、拟声音信号的载体,而能够播放和(或)记录这些软件的信号处理设备,诸如电唱机、磁带录音机(图4.2所示)等,则称为模拟音响设备。,图4.2磁带录音机,随着计算机技术的发展,特别是海量存储设备和大容量内存在计算机上的实现,对音频媒体进行数字化处理便成为可能。数字化处理的核心是对音频信息的采样,通过对采集到的样本进行加工,生成各种效果。音频信息在多媒体中的应用极为广泛,当计算机配有声卡和音箱后(图4.3所示),就能够发出各种悦耳的声音,尤其是视频图像配以娓娓动听的音乐和语音,使得计算机的操作由于有视觉以外的听觉加以辅助而成为一种愉快的过程。静态或动态图像配以解说和背景音乐,可使图像充满生气;立体声音

5、乐可增加空间感,使人身临其境、语音电子邮件,听声如见其人,使人倍感亲切;游戏中的音响效果起到渲染气氛的重要作用,此外,在多媒体通信中,可视电话、电视会议等都离不开数字化音频处理技术。,图4.3声卡和音箱是多媒体计算机的基本配置,4.1.2音频信号的形式 在日常生活中,音频(Audio)信号可分为两类:语音信号和非语音信号。语音是语言的物质载体,是社会交际工具的符号,它包含了丰富的语言内涵,是人类进行信息交流所特有的形式。非语音信号主要包括音乐和自然界存在的其他声音形式。非语音信号的特点是不含复杂的语义和语法信息,其信息量低、识别简单。,图4.4用WAVECN软件记录的录制 “明月几时有,把酒问

6、青天”的语音波形,4.1.3模拟音频信号的物理特征 模拟音频信号有两个重要参数:频率和幅度。声音的频率体现音调的高低,声波幅度的大小体现声音的强弱。 一个声源每秒钟可产生成百上千个波,通常人们把每秒钟波峰所发生的数目称之为信号的频率,单位用赫兹(Hz)或千赫兹(kHz)表示。例如一个声波信号在一秒钟内有5,000个波峰,则可将它频率表示为 5,000 Hz或5 kHz。人们在日常说话时的语音信号频率范围在33 Hz3,000 Hz之间。频率小于20Hz的信号称为亚音(Subsonic);频率范围为 20 Hz-20kHz的信号称为音频(Audio);高于20kHz的信号称为超音频(Ultras

7、onic)。 与频率相关的另一个参数是信号的周期。它是指信号在两个峰点或谷底之间的相对时间(图4.5所示)。周期和频率之间的关系是互为倒数的。 信号的幅度是从信号的基线到当前波峰的距离。幅度决定了信号音量的强弱程度。幅度越大,声音越强。对于音频信号,它的强度用分贝(dB)表示。分贝的幅度就是音量。,图4.5声音的幅度和周期,4.1.4声音的A/D转换和 D/A转换 模拟信号很容易受到电子干扰,因此随着技术的发展,声音信号就逐渐过渡到了数字存储阶段,A/D转换和D/A转换技术便应运而生。这里,A代表Analog(模拟),D代表Digital(数字),A/D转换就是把模拟信号转换成数字信号的过程,

8、模拟电信号变为由0和1组成的信号。A/D转换芯片如图4.6所示。这样做的好处是显而易见的,声音存储质量得到了提高,数字化的声音信息使计算机能够进行识别处理和压缩。A/D或D/A转换的变换波形如图4.7所示。这也就是为什么如今磁带逐渐被淘汰CD唱片却趋于流行的原因。,图4.6可编程A/D转换芯片,图4.7,模拟信号和数字信号可以互相转换,4.1.5声音有关的术语,音高是人对声波频率的主观属性,它首先与声波的频率有关。声波的振动频率高,人耳听到的声音就高,反之亦然,但它们之间并非线性关系。 音色是声波波形的主观属性。不同的发音体所发出的音波都有自己的特异性。声波的类型是多种多样的,一般可分为纯音和

9、复合音两大类。 语音是特殊的复合音。语音由元音和辅音所构成。元音是一种能连续发出的乐音,辅音主要是不能连续发出的短促的噪音,元音与辅音合成汉语音节。 响度是声波振幅的主观属性,它是由声波的振幅引起的。振幅越大,则响度越大,但它们之间也不是线性关系。,4.1.6声音质量的评价,声波的测量与分析,传统的方法是先用机电换能器把声波转换为相应的电信号,然后用电子仪表放大到一定的电压级进行测量与分析。由于计算技术的发展,使许多计算和测量工作都使用了计算机或程序实现。这些带计算机处理系统的高级声学测量仪器,能完成下列一些测量工作: 评价值的测量响度和响度级、噪音级、清晰度指数、噪音评价数; 声源的测量频谱

10、的时间变化、声功率、指向性、效率、频谱特征、幅值分布等; 音质的测量混响时间、隔音量、吸音量。,采用客观标准方法很难真正评定编码器的质量,在实际评价中,主观的质量度量比客观质量的度量更为恰当和合理。通常是对某编码器的输出的声音质量进行评价,例如播放一段音乐,记录一段话,然后重放给实验者听,再由实验者进行综合评定。可以说,人的感觉机理最具有决定意义。当然,可靠的主观度量值是较难获得的。 评分过程是召集一批实验者,请每个实验者对某个编/解码器的输出进行质量判分,采用类似于考试的5级分制,不同的评分对应的质量级别和失真级别见表4.1所示。,声音的质量与它所占用的频带宽度有关,频带越宽,信号强度的相对变化范围就越大,音响效果也就越好。按照带宽可将声音质量分为4级: 数字激光唱盘质量,通常又称CD-DA质量,这种质量也就是人们常说的超高保真,即 Super HiFi(High Fidelity); 调频无线电广播,简称FM(Frequency Modulation)质量; 调幅无线电广播,简称AM(Amplitude Modulation)质量; 电话(Telephone)质量。 在这4级质量中,以CD-DA的声音质量等级最高,其余次之。图4.8所示为这4级声音的频率范围。,图4.8 4级声音质量的频率范围,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号