数字声音及应用汇编

资源描述

《数字声音及应用汇编》由会员分享，可在线阅读，更多相关《数字声音及应用汇编（26页珍藏版）》请在金锄头文库上搜索。

1、5.3 数字声音及应用,5.3.1 波形声音的获取与播放 5.3.2 波形声音的表示与应用 5.3.3 波形声音的编辑 5.3.4 计算机合成声音,5.3.1 波形声音的获取与播放,声音的特性和类型,声音由振动产生，通过空气进行传播声音是一种波，它由许多不同频率的谐波组成谐波的频率范围称为声音的“带宽”,计算机处理的声音类型：话音或语音(speech)，专指人的说话声音，带宽仅为3003400Hz 全频带声音(如音乐声、风雨声、汽车声等)，其带宽可达到20Hz20kHz 人耳可听到的声音统称“可听声”(audio) ，20Hz20kHz,数字波形声音的获取,步骤：,2. 量化（quant

2、ization，模数转换 ),3. 编码（encoding）,1. 取样（sampling）,数字波形声音的获取设备,声音的联机获取设备(声卡),声波转换为电信号,声音的脱机获取设备：数码录音笔,取样、量化和编码,声音的重建与播放,计算机输出声音分为两步： 1 声音的重建：把声音从数字形式转换成模拟信号形式，由声卡完成,2 声音播放：将模拟声音信号经处理和放大后送到音箱(扬声器) 关于音箱：普通音箱接收的是重建的模拟声音信号数字音箱直接接收数字声音信号，失真更小,声卡的功能与逻辑组成,波形声音的获取与编码波形声音的重建与播放 MIDI消息的输入 MIDI音乐的合成,选讲：声卡的物理实现

3、,声卡主要由2块芯片组成：主处理芯片：包括数字信号处理器、MIDI控制、I/O控制等 CODEC芯片：负责多声道取样、A/D与D/A转换、混音处理等,当前PC机的声卡大多已不再做成独立的插卡形式，而是与主板集成在一起，称为集成声卡,选讲：声卡的几种类型,硬声卡：除CODEC芯片外，主板上还有1块音频主处理芯片，很多音效处理任务无需CPU参与就可独立完成,声卡的类型,独立声卡：以扩展卡形式插在机箱中使用,集成声卡,软声卡：主板上仅1块CODEC芯片，负责取样与量化处理，I/O控制器部分集成在主板上的南桥芯片中，DSP的功能需由CPU协助完成,声卡的组成部分均集成在主板上,5.3.2 波形声音

4、的表示与应用,数字波形声音的表示及其参数,数字波形声音是使用二进位表示的一种串行比特流，其数据按时间顺序进行组织，文件扩展名为“.wav” 数字波形声音的主要参数有：取样频率：语音的取样频率低，一般为8k 16k Hz 全频带声音(如音乐)取样频率高，一般为44.1k 48k Hz 量化位数：通常为8位、12位或16位声道数目：单声道为1，双声道为2 码率(比特率)，每秒钟的数据量,数字波形声音码率的计算,未压缩时数字波形声音的码率计算公式码率 = 取样频率量化位数声道数例：,压缩编码之后数字波形声音的码率为：压缩后的码率 = 未压缩时的码率/压缩比例：上面CD唱片的立体声

5、音乐压缩为MP3后，若压缩比是12，则该MP3音乐的码率是：1411.2 /12118 kb/s左右,数字波形声音的数据压缩,数据压缩的必要性：为了降低存储成本和提高在网络上的传输效率数据压缩的可能性：声音中包含有大量冗余信息；人耳灵敏度有限，允许有一定失真而不易察觉数字波形声音压缩编码的方法：全频带声音：国际标准MPEG；工业标准Dolby AC-3 数字语音：固定电话使用ADPCM编码手机使用高效率的混合编码技术,所谓“MP3音乐”，它是一种采用MPEG-1层3编码的高质量数字声音, 压缩比大约1012倍，使一张普通CD光盘上可以存储大约100首MP3歌曲，可连续播放10小时

6、。,选讲： MP3播放器的结构与原理,嵌入式处理器用于运行控制程序，控制各个部件协调工作：它接收控制按键的操作命令，从闪烁存储器读取MP3音乐数据送到DSP去解码；显示播放器的工作状态；负责与主机连接并交换数据等等,数字信号处理器DSP完成MP3数据流的解码操作，并输出波形格式的数字音频信号，经数模转换和功率放大之后，用户即可听到声音,存放MP3音乐数据，容量越大，可存放的歌曲数目就越多,固定存放MP3播放器的控制程序,显示MP3播放器的工作状态和歌曲的歌词,波形声音的文件类型及其应用,什么是流媒体？,在因特网上收听(看)音(视)频节目的2种方式：下载存储方式：先下载存储在计算机中，下载完毕

7、后再播放（缺点：需要等待较长时间，并需要较大的存储容量）流式传输方式：边下载、边播放（优点：只需要下载一部分数据之后, 就可以开始一边播放一边下载，等待时间短、存储需求小）流媒体就是一种允许在网络上让用户一边下载一边收看(听)音视频媒体的媒体分发(delivery)技术目前流行的主要有3个公司的流媒体技术： Real Networks公司的 Real Media （RealAudio和RealVideo）微软公司的 Windows Media Services (WMA、WMV和ASF) 苹果公司的 Quick Time,选讲：流媒体是如何工作的？,流媒体播放软件,Web服务器,W

8、eb 浏览器,网页,（客户计算机）,http协议,3 点击流媒体节目，启动流媒体播放程序,RTSP/TCP,RTP/UDP,6 播放器可以边播放边接收数据，并可以控制播放、暂停、快进、快倒等,5 将音(视)频节目传输给客户计算机,RTCP/UDP,HTML网页,1 请求网页,2 服务器送回网页,4 向流媒体服务器发出请求,5.3.3 波形声音的编辑,波形声音编辑软件的功能,主要功能： 1 编辑声音：如声音剪辑、复制、调节音量 2 声音的效果处理：如混响、回声、淡入、淡出等 3 录音 4 声音的格式转换 5 播放声音,声音编辑软件的典型用户界面,5.3.4 计算机合成声音,什么是计算机合成声

9、音？,计算机合成声音就是计算机模仿人说话或演奏音乐计算机合成声音有两类：计算机合成话音（语音）：计算机模仿人把一段文字朗读出来，即把文字转换为说话声音（简称为 TTS）应用：有声查询、文稿校对、语言学习、语音秘书、自动报警、残疾人服务等计算机合成音乐（MIDI）：计算机模拟各种乐器发声并按照乐谱演奏音乐应用：计算机作曲、配器等,例：计算机合成的语音,Hello，everybody （1）你好，我是贝尔实验室的中文语音合成系统（BellTTS1）南京大学计算机系2002年招收了202名本科生，22名博士生，130多名硕士生。（中科大讯飞公司）（Bell）安徽中科大讯飞信息科

10、技有限公司是专门从事中文语音及语言技术软件（讯飞）我们都是同行，我们一路同行，去参加人参培植研讨会（讯飞）（Bell）,需要进一步提高之处：发音和断句要正确，提高自然度，丰富表现力,计算机合成音乐（MIDI）,计算机合成音乐需要三个要素：乐器、乐谱和 “演奏员”,声卡上的音乐合成器能像电子琴一样模仿几十种不同的乐器发出声音，它按照MIDI消息合成出不同音色和音调的音符，通过扬声器播放出音乐来,乐谱在计算机中使用一种叫做MIDI的音乐描述语言来表示。使用MIDI描述的音乐称为MIDI音乐。一首乐曲对应一个MIDI文件，其文件扩展名为 .MID或 .MIDI,媒体播放器软件相当于“演奏员”

11、。播放MIDI音乐时，它先从磁盘上读入.MID文件，解释其内容，然后以MIDI消息的形式向声卡上的音乐合成器发出各种指令,选讲：音乐合成器,PC机声卡一般都带有MIDI音源（音乐合成器） MIDI音源有两种：调频合成器（一种受控的电子振荡器）。音色单调，效果较差，已很少使用波表合成器。音色丰富，效果很好，可扩展，现广泛使用波表合成器的原理预先将真实乐器演奏的各个音符的波形数字化，把它们组织成一个个波表文件存放在存储器中播放时合成器软件根据乐器类型和音符参数等将相应的波形数据修饰成所要求的音强和时长，然后合成、加工后播放,例：计算机合成的MIDI音乐,例1 音乐之声（6KB）例2 军港之夜（7KB） MIDI的优点：数据量极小（比CD立体声少3个数量级，比MP3少3个数量级）易于制作和编辑修改可以与波形声音同时播放 MIDI的不足：只能合成音乐，不能合成歌曲和语言音质与硬件设备相关,小结：计算机中的数字声音,数字声音的特点：是一种连续媒体，传输与播放有实时性要求数据量大，对存储和传输的要求比较高，必须进行压缩数字声音的类型：取样（波形）声音数字语音：应用于电话、手机、多媒体配音等全频带声音：CD和DVD音乐，数字电视伴音等计算机合成声音合成语音合成音乐（MIDI）,

展开阅读全文