《声音媒体信息》由会员分享,可在线阅读,更多相关《声音媒体信息(65页珍藏版)》请在金锄头文库上搜索。
1、声音是人们用来传递信息的一种方式,是携带大量信息的及其重要的媒体,因此音频信息的处理在多媒体技术中是十分重要的。,3.1 声音及其分类 3.1.1 声音的概念 声音是通过空气传播的一种连续的波,当物体振动时会激励它周围的空气质点振动,由于空气的惯性和弹性,在空气质点的相互作用下,振动就会逐渐向外传播而产生声波。声音属于听觉媒体,其频率范围大约在20Hz20KHz。,几个重要参数: 1. 周期:声波每完成一次振动需要的时间称为周期,通常用T表示,单位是秒。 2. 频率:每秒钟所完成的振动次数称为频率,用来体现音调的高低,单位是赫兹(Hz)。 3. 振幅:振幅是指声波的高低幅度,表示声音的强弱。振
2、幅用来定量研究空气受到压力的大小。 4. 带宽:带宽指频率覆盖的范围。,3.1.2 声音的分类 在多媒体技术中,将声音媒体分为语言、音乐和音响三类。 1. 语言:指具有人类约定成俗的和语言内涵的特殊媒体。 2. 音乐:是指规范的符号化了的声音。 3. 音响:是指人们熟悉的其他声音,包括自然界的风声、雨声以及机器发出的声音等。,3.1.3 声音的要素 1. 音调:人耳对声音频率高低的感觉称为音调。音调由声源振动频率所决定。 2. 音色:音色是用来描述声音品质的,主要决定于声音频谱结构中的泛音多少。 3. 音强:音强是衡量声波在传播过程中声音强弱的物理量,即与声音信号的幅度成正比。,3.2 数字音
3、频基础知识 3.2.1 声音信号数字化过程 1采样(sampling) 采样是将声音信号在时间上离散化,即每隔一定的时间间隔对模拟信号进行取样。,2. 量化 (quantization) 是对采样后的声音样本在幅值上离散化,即把信号强度划分为不同的等级,然后将每一个样本归入预先编排的量化等级上。,3. 编码: 是将量化后的离散值用二进制代码表示。,3.2.1数字化声音的技术指标 1. 采样频率:单位时间内采样的个数称为采样频率,用fs表示。奈奎斯特定理,即fs2fmax。 2. 量化位数:每个取样点能够表示的数据范围。 3. 声道数:指一次同时产生的声波组数。 4. 数据文件格式: 数据量(B
4、yte)=(采样频率量化位数声道数声音持续时间)/8,表 采样频率、量化位数、声道数及存储容量,表 数字音频等级,3.2.3 声音质量的度量 声音质量的两种方法: 一种是客观评价,即音频信号的技术指标,如:频带宽度、动态范围和信噪比; 另一种是主观评价。 对于语音和图像信号使用主观评价更恰当一些。,1. 音频信号的技术指标: 频带宽度:音频信号的频率范围,是衡量音质的标准。 动态范围: 音频信号最大强度与最小强度之比。 信噪比:有用信号的平均功率与噪音的平均功率之比。,2. 主观评价法:声音质量主观评价评分标准,3.2.4 数字音频的文件格式 1. 波形文件 扩展名为*.wav,是通过对模拟音
5、频以不同的采样频率、不同的量化位数进行数字化而得到的数字信号存入磁盘而形成的波形文件。 适用于:记录讲话语音、CD音质的音乐、单声道或立体声的声音信息,并能保证声音不失真。 缺点是未经压缩的声音文件占用存储盘空间太大。,2. PCM: 由模拟音频信号直接通过A/D转换而形成的二进制序列文件,特点是保真度高,解码速度快,但编码后数据量大。 3. AIFF文件:.AIF/.AIFF 苹果公司开发的一种声音文件格式,被Mac平台及其应用程序所支持,Netscape Navigator浏览器中的LiveAudio也支持AIFF格式,SGI及其他专业音频软件包也同样支持这种格式。,4. VOC: 多用于
6、保存Creative Sound Blaster系列声卡所采集的声音数据,被Windows平台和DOS平台所支持。 5. AU: Sun Microsystems公司推出的一种经过压缩的数字声音格式,在Internet中经常使用。 6. RM: Real Networks公司开发的一种适合于网络实时流技术的音频文件格式,主要用于在低速率的广域网上实时传输音频信息。,7. MP3: MPEG Audio Layer 3的简写,压缩率高达101121,音质基本保持不失真。 8. CD: 一种数字化的声音,其采样频率为44.1KHz,量化位数为16bit,可以高质量地重现原始声音。 9. MIDI:
7、 文件本身不包含任何的音频信息,主要记录指令和数据,文件所占用的空间非常小。,MIDI文件与Wave文件的区别: 首先,Wave文件是通过直接对模拟声波进行数字化得到的音频信号数据。而MIDI文件只是记录了一系列乐谱指令。 其次,Wave文件是直接通过声卡输入端口获取的音源,并可从输出端口直接播放。而MIDI 是通过MIDI接口由音序器记录电子乐谱的指令数据。 最后,采用MIDI格式记录比采用Wave格式记录的数据量小两个数量级以上。,3.2.5 音频信号处理的特点 由于音频信息是在时间上连续的信号,因此在处理时对时序性的要求很高。 由于人有左耳和右耳,类似于两个通道,因此计算机输出的声音应该
8、是立体声的。 由于语音信号携带了情感意向,因此对语音信号的处理还要抽取语意等其它信息。,3.3 音频卡及其应用 3.3.1 音频卡功能 声卡主要是用来对不同来源的音频信号进行采集与回放,其功能就是使计算机能够处理音频信号。 声卡负责录音、播音和声音合成。,声卡的功能主要有以下几点: 录制、编辑与回放声音文件。 在采集和回放过程中对文件进行压缩和解压缩。 编辑与合成音乐文件。 文本转换和语音识别。 MIDI音乐的合成。,3.3.2 音频卡工作原理 声卡的主要作用是实现对音频信息的采集与回放。音频信息有很多来源,如磁带录音机、CD、录像机等等。,声卡的工作原理,声卡的外部接口,1. 声卡处理需要的
9、基本条件: 采样频率: 一般的声卡均支持双声道立体声信号的采集。 量化位数: 声卡中的量化位数一般为8位、16位、32位以及64位,量化位数越高,声音质量越好。 声道数:单声道或立体声。 实时硬件压缩/软件压缩:,2-25,2. 混音器 音频卡上的混音器Mixer主要目的是将不同输入音源的信号进行混音,并且提供音量的软件控制功能。通过I/O端口(地址和数据端口)可对混音器的各种功能进行可编程设置。,3. MIDI合成器与接口 MIDI是一种用于在不同制造商的电子乐器设备和计算机之间进行数据交换的国际标准。它指定硬件接口,同时指定通信协议,可以将数据从一个设备传输到另一个设备。,3.4 音频信息
10、的采集 音频文件的采集方法有以下几种: 1. 音频文件的直接采集 2. 利用Windows自带的“录音机”来录制声音。,利用录音机录音的操作步骤如下: 准备一份需要录制的材料。 将麦克风插到声卡上的MIC IN接口上。 选择Windows中的【开始】菜单,在【程序/附件/娱乐】下面选择【录音机】,打开录音机,单击红色的【录音】按钮开始录音。当录制结束后单击【停止】按钮。 执行菜单中【文件/另存为】命令,在出现的【另存为】对话框中单击【格式】选项,选择【更改】。在【声音选定】对话框中选择【属性】项更改声音的采样频率、量化位数、声道数和数据率,单击【确定】按钮返回。选择文件保存的路径、保存的类型,
11、并命名。,记录失败时检查一下系统右下角任务栏中声音图标是否设置正确。将【回放】选项改为“录音】,并在下方【显示下列音量控制】中选择【麦克风】选项,就可以正常录音了。,3. 用其它音频设备输入 录像机、磁带录音机、电视机等都能提供不同内容的音频节目。这些设备需要通过线路输入的方式(LINE IN)连接到计算机的声卡上,通过相应的软件将音频信号采集进来,并以数字音频的形式存储在计算机中。,3.5 音频信息处理编辑,Adobe Audition是一款功能强大的音频编 辑软件,其前身是Cool Edit Pro。可以实现: 音频的录制: 波形文件的存储: 文件的编辑:,利用软件制作音频节目时需要注意以
12、下几点: 一般大段的旁白和背景音乐采用MIDI格式存储,这样不仅可以减少存储空间,而且处理的速度比较快。 注意音乐和音响效果的选择应该和节目的主题相一致,特别是背景音乐,一定不要喧宾夺主。,2-35,音频的基本操作 1.声音的录制 Options/Windows Mixer音量控制 从麦克风中输入 File/NewNew Waveform对话框 语音:11025Hz、Mono、8-bit 音乐:44100Hz、Stereo、16-bit 从CD唱机中输入 CD唱机(波形输出混音),2-36,2.音频的编辑 选择 删除(选区、非选区) 复制 粘贴 混合粘贴,2-37,3.音频文件管理 新建文件
13、打开文件 保存文件 另存为(其它格式) 保存选择区,下面就介绍Adobe Audition的使用方法。 实例一:声音的降噪处理:在这个实例中要将录制好的一段带有噪声的语音做降噪处理。 操作步骤: 1. 选择【开始/程序/Adobe Audition 1.5】启动软件,Adobe Audition 1.5基本的文件操作包括新建,打开,保存,剪切、复制和粘贴等。,2. 降噪处理。降噪处理是将噪音的样本特征提取出来,然后将噪音从原始音频信号中去除,使声音清晰自然。通常用于录制的音频信号,特别是通过麦克风录制的人声或者是磁带录音中的噪声。,最关键的一步就是选择噪声样本。为了便于观察,将波形放大,选择窗
14、口下面的缩放工具即可。将噪声区内波形最平稳且最长的一段选中。然后执行菜单中【效果/降噪/降噪】命令,进入降噪窗口。,单击【捕捉线图】按钮采集噪声样本,几秒钟后就会出现噪声样本轮廓图。在降噪控制面板中将“降噪电平”数值改为80,“FFT 大小”数值改为8192。“精度系数”数值改为9。“平滑总计”数值改为9左右。 当各个参数都设置好之后,单击【OK】按钮,就开始进行降噪处理了。,3进行多轨混音编排。选择【编辑/混合粘贴】命令,在这个功能中提供了混合时的音量设置和混合方式。其混合方式共有4种:插入、覆盖(混合)、替换以及调制。四个方式中覆盖(混合)方式便是需要的混合功能。,选择【来自剪贴板】选项,
15、从剪贴板中获得要混入的音频数据。最后选择【循环粘贴】选项并设置循环次数,以一次操作便可多次重复混入同一音频数据。,实例二:回声效果的制作。 操作步骤: 1. 打开需要做回声处理的素材,见光盘中浮躁1.mp3。执行菜单【效果/延迟效果/回声】命令。,2. 在弹出的对话框中进行参数设置,包括左右声道的衰减量、延迟量和初始回声音量,在连续回声均衡中将各个频率段的声音按照图示进行设置,就可以得到具有回声效果的一段音乐。,实例三:混响效果的制作。 操作步骤: 1. 打开需要做混响处理的素材,见光盘中浮躁.mp3。执行菜单【效果/延迟效果/混响】命令。,2. 在弹出的对话框中进行参数设置,混响时间、高频吸
16、收时间以及混响湿式如图参数所示,就可以得到具有混响效果的一段音乐。,实例四:声音变调效果的制作。 操作步骤: 1. 打开需要做变调处理的素材,见光盘中浮躁.mp3。,2. 执行菜单【效果/节拍和音调/变调】命令。,3. 在弹出的对话框中进行参数设置,选择唱盘缺少功率来模拟类似于电量不足的效果。然后选择音频的质量等级,就可以得到具有变调效果的一段音乐。,4. 改变速度:执行菜单【效果/节拍和音调/伸展】命令。,5. 在弹出的对话框中进行参数设置,这里利用默认的参数设置即可,就可以得到具有变速效果的一段音乐。,实例五:合唱效果的制作。 操作步骤: 1. 打开需要做合唱处理的素材,见光盘中浮躁1.mp3。 2. 执行菜单【效果/延迟效果/合唱】命令。,3. 在弹出的对话框中进行参数设置,选择原声二重唱效果,其他参数默认即可,就可以得到具有合唱效果的一段音乐。,实例六:声音均衡效果的制作。 操作步骤: 1. 打开需要做声音均衡效果处理的素材,见光盘中浮躁.mp3。 2. 执行菜单【效果/滤波器/图示均衡器】命令。,