数字音频处理(第二次课)

上传人:平*** 文档编号:47625646 上传时间:2018-07-03 格式:PPT 页数:89 大小:1.26MB
返回 下载 相关 举报
数字音频处理(第二次课)_第1页
第1页 / 共89页
数字音频处理(第二次课)_第2页
第2页 / 共89页
数字音频处理(第二次课)_第3页
第3页 / 共89页
数字音频处理(第二次课)_第4页
第4页 / 共89页
数字音频处理(第二次课)_第5页
第5页 / 共89页
点击查看更多>>
资源描述

《数字音频处理(第二次课)》由会员分享,可在线阅读,更多相关《数字音频处理(第二次课)(89页珍藏版)》请在金锄头文库上搜索。

1、 第2章 数字音频处理本章重点:n模拟音频与数字音频的概念n数字音频的获取n音频信号压缩编码标准n音乐合成和语音识别第2章 数字音频处理n2.1概述n2.2数字音频的获取n2.3音频信号压缩编码标准n2.4音乐合成和MIDIn2.5语音识别n2.6实例 VC+播放声音的实现n2.7本章小结2.1概述声音是携带信息的重要媒体。研究表明,人类 从外部世界获取的信息中,10%是通过听觉获得 的,因此声音是多媒体技术研究中的一个重要内 容。声音是由物体振动产生的,这种振动引起周围 空气压强的振荡,从而使耳朵产生听觉的印象 。声音的种类繁多,人的语音是最重要的声音。 此外,还有动物、乐器等发出的声音,风

2、声、 雨声、雷声等自然声音,以及机器合成产生的 声音等。 2.1概述幅 值t一个周期+空气压强图2.1 空气压强振荡的波形示意图0人耳能识别的声音频率范围大约在2020kHz,通常称为音频(audio)信号。 2.1概述声音包含三个要素:音调、音强和音色。基频与音调:一个声源每秒钟可产生成百上 千个波,通常把每秒钟波峰所产生的数目称之为 信号的频率,单位用赫兹(Hz)或千赫兹(kHz)表 示。人对声音频率的感觉表现为音调的高低,在 音乐中称为音高。音调正是由频率所决定的。 2.1概述音乐中音阶的划分是在频率的对数坐标 (20log)上取等分而得的。如表所示, 20log261=48.3,20l

3、og293=49.3等。音阶阶CDE FGAB简谱简谱 符号1234567频频率(HZ)261293330349392440494频频率(对对 数)48.349.350.350.851.852.853.82.1概述谐波与音色:no称为基波o的n次谐波分量 (n就是高次谐波的方次,n o就是基波o的n次 谐波),也称为泛音。音色是由混入基音的泛音所决 定的 。幅度与音强:信号的幅度是从信号的基线到当前 波 峰的距离。幅度决定了信号音量的强弱程度。幅度 越 大,声音越强。一般用动态范围定义相对强度: 动态范围20log(信号的最大强度/信号的最小强度) (dB)2.1概述音宽与频带:频带宽度,也称

4、为带宽,它是 描 述组成复合信号的频率范围。客观上,通常用频带宽度、动态范围、信噪 比 等指标衡量音频信号的质量。音频信号的频带 越 宽,所包含的音频信号分量越丰富,音质越好 。 动态范围越大,信号强度的相对变化范围越大 , 音响效果越好。 CD-DA数字音乐、FM广播、AM广播和电话的带宽10 20 50 200 3.4 K 7K 15K 22K f(Hz)电话AM广播CDDAFM广播图2.3 几种音频业务的频带宽度10 20 50 200 3.4K 7K 15K 22K f(Hz)电话AM广播CDDAFM广播图2.3 几种音频业务的频带宽度2.1概述声音的质量可以通过信噪比来度量。信噪比

5、(SNR,Signal to Noise Ratio)是有用信号与噪声 之比的简称,定义为: 信噪比越大,声音质量越好。2.2数字音频的获取n2.2.1采样n2.2.2量化n2.2.3数字音频的技术指标n2.2.4数字音频的文件格式音频信息处理结构框图 2.2.1采样图2.5 模拟信号的采样所谓采样就是在某些特定的时刻对模拟信号进 行取值,如上图所示。采样的过程是每隔一个时 间间隔在模拟声音的波形上取一个幅值,把时间 上的连续信号变成时间上的离散信号。2.2.1采样采样时间间隔称为采样周期t,其倒数为采样 频 率fs=1/t。一般来讲,采样频率越高,则在单位 时 间内计算机得到的声音样本数据就

6、越多,对声音 波形的表示也越精确,声音失真越小,但用于存 储音频的数据量越大。 根据奈奎斯特定理,只有采样频率高于声音 信 号最高频率的两倍时,才能把数字信号表示的声 音还原为原来的声音。2.2.2量化每个采样值在幅度上进行离散化处理的过程 称 为量化 。量化可分为均匀量化和非均匀量化。均匀量化 是把将采样后的信号按整个声波的幅度等间隔分 成有限个区段,把落入某个区段内的样值归为一 类,并赋于相同的量化值。以8bit或16bit的方式 来 划分纵轴为例,其纵轴将会被划分为28个和216个 量化等级,用以记录其幅度大小。均匀量化 2.2.2量化非均匀量化是根据信号的不同区间来确定量 化 间隔。对

7、于信号值小的区间,其量化间隔也小 ; 反之,量化间隔就大。量化会引入失真,并且量化失真是一种不可 逆失真,这就是通常所说的量化噪声。 模拟信号经过采样和量化,形成一系 列离散信号。这种数字信号可以以一定 方式进行编码,形成计算机内部存储运 行的数据,经过编码后的声音信号就是 数字音频信号。2.2.3数字音频的技术指标衡量数字音频的主要指标包括:采样频率量化位数 通道(声道)个数数据传输率是计算机处理时基本参数。未经压 缩的数字音频数据传输率可按下式计算:数据传输率=采样频率量化位数声道数 2.2.3数字音频的技术指标例:假定语音信号的带宽是50 Hz10kHz,而音乐信号的 是 15Hz 20

8、 kHz。采用奈奎斯特频率,并用12bit表示语音 信 号样值,用16bit表示音乐信号样值,计算这两种信号数字 化 以后的比特率以及存储一段10分钟的立体声音乐所需要的 存 储器容量。 解:语音信号:取样频率210kHz20kHz;比特率=20k12240 kbit/s音乐信号:取样频率220kHz40kHz;比特率40kl6bit/s21280kbits(立体声-双声道 )所需存储空间1280k 600896MB2.2.4数字音频的文件格式WAV文件格式简介 WAV是Microsoft Windows提供的音频格式。这个 格式是目前通用音频格式,它通常用来保存一些没 有压缩的音频。目前所有

9、的音频播放软件和编辑软 件都支持这一格式。WAV文件由三部分组成:文件头(标明是WAV文件 、 文件结构和数据的总字节数)、数字化参数(如采样 频率、声道数、编码算法等),最后是实际波形数 据 。一般来说,声音质量与其WAV格式的文件大小成 正 比。nWAVE(Waveform Audio File Format)文 件是多媒体中使用的声音文件格式之一 ,它以RIFF格式为基础,每个WAVE文件 的头四个字节为“RIFF”。WAVE文件的 扩展名为“.WAV”。WAVE WAVE 文件格式文件格式WAVE WAVE 文件格式文件格式Format 块Sound 数据块RIFF WAVE Chun

10、k WAVE文件由文件头和数据两部分组成。最小的最小的 WAVEWAVE文件结构文件结构_ | RIFF WAVE Chunk | | groupID = RIFF | | riffType = WAVE | _ | | Format Chunk | | | | ckID = fmt | | | |_| | _ | | Sound Data Chunk| | | | ckID = data | | |_| |_ _| RIFF WAVE RIFF WAVE 块头块头块标志 RIFF 块大小 (32-bits) Wave类型标志 WAVEThe Format The Format ( (fmtf

11、mt) ) Chunk Chunk 格式块(fmt)是WAVE文件必选项,描述波形文件的基本参数,如 采样率、位分辨率以及通道数等。 #define FormatID fmt /* chunkID for Format Chunk.*/ typedef struct ID chunkID; long chunkSize; short wFormatTag; /* currently PCM */unsigned short wChannels; /* num of channels */unsigned long dwSamplesPerSec;/* sample rate in Hz */u

12、nsigned long dwAvgBytesPerSec; /* xxx Bytes/s */unsigned short wBlockAlign;/*1/2/48/16 mono/stereo */unsigned short wBitsPerSample;/* bits in a sample */* 根据 wFormatTag不同,可以有附加字段. */ FormatChunk; Data ChunkData Chunk数据块包含实际的波形数据:#define DataID data /* chunk ID for data Chunk */ typedef struct ID chu

13、nkID;long chunkSize;unsigned char waveformData; DataChunk; Offset DescriptionOffset Description- Offset Contents - 0x00 chunk id RIFF 0x04 chunk size (32-bits) 0x08 wave chunk id WAVE 0x0C0x0C format chunk id format chunk id fmtfmt 0x10 0x10 format chunk size (32-bits)format chunk size (32-bits) 0x14 format tag ( currently PCM ) 0x16 number of channels 1=mono, 2=stereo 0x18 sample rate in Hz 0x1C average bytes per second - Offset Contents -0x20 number of bytes per sample1 =8-bit mono2 =8-bit stereo or16-

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号