第二章 模拟音频和数字音频.doc- 1 -第二章第二章 模拟音频和数字音频模拟音频和数字音频 人耳是声音的主要感觉器官,人们从自然界中获得的声音信号和通过传声器得到的声音电信号等在时间和幅人耳是声音的主要感觉器官,人们从自然界中获得的声音信号和通过传声器得到的声音电信号等在时间和幅度上都是连续变化的,时间上连续、而且幅度随时间连续变化的信号称为模拟信号度上都是连续变化的,时间上连续、而且幅度随时间连续变化的信号称为模拟信号 (例如声波就是模拟信号,音响例如声波就是模拟信号,音响系统中传输的电流、电压信号也是模拟信号系统中传输的电流、电压信号也是模拟信号 ),记录和重放信号的音源就是模拟音源,例如磁带/录音座、,记录和重放信号的音源就是模拟音源,例如磁带/录音座、 LP// LP电唱机等;时间和幅度上不连续或是离散的,只有电唱机等;时间和幅度上不连续或是离散的,只有 0和和 l两种变化的信号称为数字信号,记录和重放数字信号的音源两种变化的信号称为数字信号,记录和重放数字信号的音源叫做数字音源,例如叫做数字音源,例如 CD// CD机、机、 DVD// DVD播放机等究竟模拟音频与数字音频有什么不同呢播放机等。
究竟模拟音频与数字音频有什么不同呢 ?数字音频究竟有数字音频究竟有些什么优点呢些什么优点呢 ?这些都是下面要介绍的这些都是下面要介绍的 模拟音频信号记录模拟音频信号记录 录音泛指把声能转变为其他形式的能量而加以存储,录音时采用的存储媒介主要是磁性材料,如磁带、磁盘等,录音泛指把声能转变为其他形式的能量而加以存储,录音时采用的存储媒介主要是磁性材料,如磁带、磁盘等,也可以是感光材料,如光盘等由此录音技术也可分为磁记录和光记录两种另外,近年来半导体内存件发展很快,也可以是感光材料,如光盘等由此录音技术也可分为磁记录和光记录两种另外,近年来半导体内存件发展很快,成为一种新型的记录和存储设备成为一种新型的记录和存储设备在本节中将重点介绍磁带录音技术在本节中将重点介绍磁带录音技术 一、磁带录音装置的基本结构一、磁带录音装置的基本结构磁带录音装置一般由磁头、机械传动磁带录音装置一般由磁头、机械传动 (称为称为 “机芯机芯 ”)机构和电路三部分组成机构和电路三部分组成二、模拟录音载体二、模拟录音载体 ---磁带磁带三、录音和放音的基本原理三、录音和放音的基本原理1.消音原理.消音原理磁带在录音前,必须将原有的声音信号磁带在录音前,必须将原有的声音信号 (剩磁剩磁 )抹去,称之为消音或消磁。
抹去,称之为消音或消磁2.录音与录音偏磁原理.录音与录音偏磁原理录音是将声音电信号以剩磁的形式保存在磁带上录音是将声音电信号以剩磁的形式保存在磁带上3. 放音原理放音原理放音是将磁带上保存的剩磁信号还原成相应的声音电信号放音是将磁带上保存的剩磁信号还原成相应的声音电信号 .第二节数字音频基础第二节数字音频基础传统的信号都是以模拟手段进行处理的,称为模拟信号处理所谓模拟音频是指用电信号传统的信号都是以模拟手段进行处理的,称为模拟信号处理所谓模拟音频是指用电信号 (电压、电流电压、电流 )来模仿声来模仿声音物理量的变化因为声音是在时间和幅度上都连续变化的信号,所以模拟电信号在时间和幅度上也是连续变化的,音物理量的变化因为声音是在时间和幅度上都连续变化的信号,所以模拟电信号在时间和幅度上也是连续变化的,故称之为模拟音频信号故称之为模拟音频信号模拟音频信号处理有很多弊端,如抗干扰能力差,容易受机械振动、模拟电路的影响产生失真,远距离传输受环模拟音频信号处理有很多弊端,如抗干扰能力差,容易受机械振动、模拟电路的影响产生失真,远距离传输受环境影响较大等境影响较大等数字信号是以数字化形式对模拟信号进行处理,它在时间和幅度上都是离散的。
数字信号是以数字化形式对模拟信号进行处理,它在时间和幅度上都是离散的随着大规模集成电路以及计算机技术的飞速发展,加之数字信号处理理论和技术的成熟和完善,数字信号处理已随着大规模集成电路以及计算机技术的飞速发展,加之数字信号处理理论和技术的成熟和完善,数字信号处理已逐渐取代了模拟信号处理因为数字音频信号抗干扰性强,逐渐取代了模拟信号处理因为数字音频信号抗干扰性强,无噪声积累可做到多代复制和长距离传输无失真无噪声积累可做到多代复制和长距离传输无失真 !数字音频信号的优点主要有以下几个方面:数字音频信号的优点主要有以下几个方面:①① 精度高:模拟信号处理的精度主要由元器件决定,很难达到精度高:模拟信号处理的精度主要由元器件决定,很难达到 0.001而数字信号处理的精度主要决定于字长,而数字信号处理的精度主要决定于字长,14位字长就可达到位字长就可达到 0.0001的精度②② 灵活性高:数字信号处理系统的性能主要决定于乘法器的系数,而系数存放于内存中,因而只需改变存储的系灵活性高:数字信号处理系统的性能主要决定于乘法器的系数,而系数存放于内存中,因而只需改变存储的系数就可得到不同的系统,比改变模拟系统方便得多。
数就可得到不同的系统,比改变模拟系统方便得多第二章 模拟音频和数字音频.doc- 2 -③③ 可靠性强:因为数字系统只有可靠性强:因为数字系统只有 “o”和和 “1”两种信号,因而受周围环境的温度及噪声的影响较小而模拟系统的各两种信号,因而受周围环境的温度及噪声的影响较小而模拟系统的各元器件都有一定的温度系数,且电平是连续变化的,易受温度、噪声、电感效应等的影响元器件都有一定的温度系数,且电平是连续变化的,易受温度、噪声、电感效应等的影响④④ 易于大规模集成:由于数字化部件具有高度规范性,便于大规模集成、大规模生产,而对电路参数要求不如模易于大规模集成:由于数字化部件具有高度规范性,便于大规模集成、大规模生产,而对电路参数要求不如模拟装置苛刻,故产品成品率高拟装置苛刻,故产品成品率高⑤⑤ 可实现时分复用:可利用数字信号处理器同时处理几个信道的信号可实现时分复用:可利用数字信号处理器同时处理几个信道的信号⑥⑥ 便于处理、存储和交换,实现二维甚至多维信号的处理,包括二维或多维滤波、频谱分析等便于处理、存储和交换,实现二维甚至多维信号的处理,包括二维或多维滤波、频谱分析等把模拟的电信号变为数字电信号这一过程称为模拟信号数字化,即模/数转换把模拟的电信号变为数字电信号这一过程称为模拟信号数字化,即模/数转换 (A// D)。
A// D转换通常采用转换通常采用 PCM(脉冲编码调制脉冲编码调制 )技术来实现技术来实现 A// D转换过程包括三个阶段,即取样、量化、编码下面转换过程包括三个阶段,即取样、量化、编码下面分别介绍分别介绍一、取样一、取样取样也叫采样,是指将时间轴上连续的信号每隔一定的时间间隔抽取出一个信号的幅度样本,把连续的模拟量用取样也叫采样,是指将时间轴上连续的信号每隔一定的时间间隔抽取出一个信号的幅度样本,把连续的模拟量用一个个离散的点来表示,使其成为时间上离散的脉冲序列显然,取样点需要足够密集,才能很好地表达原始模拟一个个离散的点来表示,使其成为时间上离散的脉冲序列显然,取样点需要足够密集,才能很好地表达原始模拟信号的特征信号的特征每秒钟取样的次数称为取样频率或取样率,比如:每秒钟取样的次数称为取样频率或取样率,比如: CD的取样率为的取样率为 44.. 1kHz,表示每秒钟取样,表示每秒钟取样 44 100次某一数字取样系统的取样频率为某一数字取样系统的取样频率为 44kHz,假定有一个,假定有一个 36kHz (>22kHz)的频率进入取样器,则依据上式,在得到的的频率进入取样器,则依据上式,在得到的样品中就会包括有样品中就会包括有 36kHz、、 8kHz的两个频率信号,取样输出电路中有一个过滤的两个频率信号,取样输出电路中有一个过滤 22kH:以上频率的滤波器进行滤波,:以上频率的滤波器进行滤波,结果结果 36kHz的信号被滤掉,而的信号被滤掉,而 8kHz的信号保留了下来,成为干扰信号,这就是信号混叠现象的信号保留了下来,成为干扰信号,这就是信号混叠现象 .大家可以发现,上下波形之所以不吻合,是因为取样点不够多,或严谨一点说,是取样频率不够高。
这种情况,大家可以发现,上下波形之所以不吻合,是因为取样点不够多,或严谨一点说,是取样频率不够高这种情况,我们称之为低频失真我们称之为低频失真一个常见的低频失真的例子如电影上车辆行驶时车轮转动的情况一个常见的低频失真的例子如电影上车辆行驶时车轮转动的情况 (一个典型的一个典型的 “马车轮效应的例子马车轮效应的例子 ),飞速转动的车,飞速转动的车轮有时看起来似乎是静止不动甚至会向反方向转动轮有时看起来似乎是静止不动甚至会向反方向转动 (类似的情况也发生在直升飞机的翼片和螺旋桨上面类似的情况也发生在直升飞机的翼片和螺旋桨上面 )二、量化二、量化所谓量化,就是度量采样后离散信号幅度的过程,度量结果用二进制数来表示量化精度就是度量时分级的多少所谓量化,就是度量采样后离散信号幅度的过程,度量结果用二进制数来表示量化精度就是度量时分级的多少模拟信号通过取样已变成一个时间上离散的脉冲样品序列,但在电平幅度上仍会在其动态范围内有连续变化,即模拟信号通过取样已变成一个时间上离散的脉冲样品序列,但在电平幅度上仍会在其动态范围内有连续变化,即可能出现任意幅值可能出现任意幅值1.量化比特数.量化比特数量化等级通常用二进制的位数咒表示,称为量化比特数。
以位的二进制数字可以有量化等级通常用二进制的位数咒表示,称为量化比特数以位的二进制数字可以有 2n个量化级数,比如个量化级数,比如 8位位 (8bit),,并不是把纵坐标分成并不是把纵坐标分成 8份,而是分成份,而是分成 28—256份;同理份;同理 16位是把纵坐标分成位是把纵坐标分成 216—65 536份;而份;而 24位则分成位则分成 224=16 777 216份CD的量化精度为的量化精度为 16bit(16位二进制数位二进制数 ),换算为十进制,分级数等于,换算为十进制,分级数等于 65 536(216)也就是说,以也就是说,以 CD的标准,可以的标准,可以分辨出分辨出 1// 65 536级的幅度变化但如果信号的幅度变化比级的幅度变化但如果信号的幅度变化比 1// 65 536级还小呢级还小呢 ?答案很简单:量不出结果,就像用答案很简单:量不出结果,就像用精细到精细到 1mm的尺子去量一根头发的直径一样量不出结果就没有资料,将来还原成模拟信号时就会形成背景噪声,的尺子去量一根头发的直径一样量不出结果就没有资料,将来还原成模拟信号时就会形成背景噪声,专业术语叫量化噪声量化噪声是数字音源信噪比提高的主要限制,对于专业术语叫量化噪声。
量化噪声是数字音源信噪比提高的主要限制,对于 CD规格,假设最强信号为一个单位,噪规格,假设最强信号为一个单位,噪声大小就是声大小就是 1// 65 536个单位,因此,它的信噪比为个单位,因此,它的信噪比为 65 536(216),即,即 96dB1.为什么要压缩.为什么要压缩标准的标准的 CD音质处理,也就是说音质处理,也就是说 1秒钟内取样秒钟内取样 44.. 1千次,每次的资料量千次,每次的资料量 16×2=32bit(因为立体声是两个声道因为立体声是两个声道 )而一个字节而一个字节 (Byte)含有含有 8位位 (bit),那么,那么 1秒钟内的资料量则为秒钟内的资料量则为 44.. 1k×.. 32bit// (8bitByte)=176.. 4kB一个汉字在计一个汉字在计算机中占用两个字节,那么算机中占用两个字节,那么 176.4kB的空间可以存储的空间可以存储 176.. 4k// 2—88 200个汉字,也就是说个汉字,也就是说 1秒钟的数字音频资料秒钟的数字音频资料量与近九万个汉字量。