《数字语音处理》实验指导书

上传人:桔**** 文档编号:485465804 上传时间:2023-12-04 格式:DOC 页数:18 大小:171.02KB
返回 下载 相关 举报
《数字语音处理》实验指导书_第1页
第1页 / 共18页
《数字语音处理》实验指导书_第2页
第2页 / 共18页
《数字语音处理》实验指导书_第3页
第3页 / 共18页
《数字语音处理》实验指导书_第4页
第4页 / 共18页
《数字语音处理》实验指导书_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《《数字语音处理》实验指导书》由会员分享,可在线阅读,更多相关《《数字语音处理》实验指导书(18页珍藏版)》请在金锄头文库上搜索。

1、数字语音处理实验指导书学校:中国地质大学 院系:机械与电子工程学院专业:电子信息工程编制:电信教研室版本:2005目录前言单元1 MATLAB练习单元2 综合分析实验附录1 MATLAB软件简介附录2 MATLAB基本使用方法附录3 wavread函数附录4 specgram函数参考文献单元1 MATLAB练习实验目的l 了解信号谱分析特点,掌握各种窗函数功率谱的异同及其对短时信号谱分析的作用。l 明确短时傅立叶变换与声谱图的关系,理解其对语音信号的时频分析作用。l 学习音频文件的基本操作方法。l 学习用MATLAB实现基本的语音信号处理,提高自学和动手能力,培养学习兴趣。实验原理1、 离散频

2、谱、幅度谱和功率谱离散频谱是信号序列的离散傅立叶变换,常用快速傅立叶变换(FFT)计算。离散频谱描述的是信号在频率采样点上的幅度和相位值,包括幅度-频率关系和相位频率关系,幅度谱就是前者。功率谱是幅度平方频率关系。由于语音的对数听觉效应,幅度谱和功率谱常用对数形式表达,单位为分贝。对数幅度谱=10lg幅度谱,对数功率谱=10lg幅度谱2=20 lg幅度谱。由此可见,对数幅度谱与对数功率谱在谱形上是相似的,只不过谱的幅度方向相差一倍。对于窗序列的离散频谱、幅度谱和功率谱,结论也是类似的。2、 短时傅立叶变换和声谱图短时傅立叶变换的实质,是在时间和频率上同时对信号序列进行分解,使得信号被分解成若干

3、个时段和频段上的分量(即分信号)。根据微分原理,若每个时段和频段都很小,对具体某个时段和频段上的分信号进行抽样,无论具体的抽样时点和频点如何选取,抽样值都不会有大的差异,因而一个分信号可以仅用一个该分信号的抽样值来表示。短时傅立叶变换的值X(n, k)实际上就是n时段和k频段上信号分量的幅度和相位抽样,这个抽样值大体代表了n时段和k频段上信号分量的幅度范围和相位范围。n和k的含义见下表。表1数字参数与模拟参数的对应关系数字时间模拟时间(s)数字频率模拟频率(HZ)nt = n/fsKf=kfs/L注:L窗序列长度 fs信号采样频率 应用在语音处理方面,声谱图就是语音信号的短时傅立叶变换,其图形

4、化显示往往只表示各个时段和频段上的分信号幅度抽样值。3、WAVE文件的基本操作WAVE是Windows操作系统支持的一种标准的数字波形音频文件格式。通常我们用麦克风和Windows 录音机采集到计算中的声音就是WAVE格式的,WAVE文件后缀为.wav,多采用PCM格式或ADPCM格式,支持单声道或多声道数字音频数据采集和回放。与MP3等其它格式相比,WAVE格式尽管压缩比不好,却非常直观(除文件头外,实际上就是所有通道的采样数据按时间顺序交错排列),适合于数据量不大的音频录放(例如Windows提示音)。因此,对WAVE文件进行读取、保存、剪辑、播放等基本操作相对容易些。软件基础较好,有志于

5、开发自己的音频应用的读者可到网上下载WAVE等文件的存储格式。实验器材l 多媒体计算机l 预装Windows 98/2000/XP操作系统l 预装MATLAB6.5软件l 预装“数字语言处理实验”软件包l 自带移动存储实验内容1、输入并运行以下MATLAB代码:%(1)信号波形和对数功率谱示例% 波形:100样点,抽样频率Fs=8kHz,信号频率f=2kHzx=sin(2*pi*(0:99)*2000/8000);% 频谱:是波形的快速傅立叶变换X=fft(x);% 对数功率谱:功率谱取10lg或幅度谱取20lgP=20*log10(abs(X);% 绘制波形和对数功率谱(注意观察25和75处

6、的尖峰)figure(1);plot(x);title(信号的波形);figure(2);plot(P);title(信号的对数功率谱);%(2)窗函数的对数幅度谱示例% 避免对0取对数floor=0.1;% 图1:矩形窗W_rec=10*log10(abs(fft(boxcar(512),1024)+floor); figure(1); plot(W_rec(1:end/2);title(矩形窗的对数幅度谱);% 图2:海明窗W_hamming=10*log10(abs(fft(hamming(512),1024)+floor);figure(2);plot(W_hamming(1:end/

7、2); title(海明窗的对数幅度谱);% 图3:汉宁窗 W_hanning=10*log10(abs(fft(hanning(512),1024)+floor); figure(3); plot(W_hanning(1:end/2);title(汉宁窗的对数幅度谱);2、编程绘制以下窗序列的对数幅度谱:(1)指数窗(2)矩形窗(3)海明窗(4)汉宁窗选N=512,用MATLAB编程绘制以上窗序列的幅度谱。3、编程读取WAVE文件并显示声谱图(取1024点汉宁窗)提示:主要涉及的M函数有figure、plot、wavread、specgram等,理解如何使用它们。 4、 编程实现对WAVE文

8、件的剪辑、保存和播放提示:主要涉及的M函数wavread、wavwrite、wavplay等,使用MATLAB帮助系统了解其用法。报告要求1、包括实验名称、实验目的、实验内容标题。2、在相应内容标题下:(1) 拷贝内容1的各个图形,标出谱零点。(2) 写出内容2的程序清单,说明几种窗函数谱的不同特点和对短时谱分析性能的影响。(3) 写出内容3的程序清单,拷贝声谱图图形,说明此声谱图形的物理意义。(4) 写出内容4的程序清单,说明你的程序是如何使用M函数实现WAVE文件的剪辑、保存和播放的。单元2 综合分析实验实验目的1、 掌握利用短时自相关检测基音周期的原理,了解基音检测在清音段、谐音段、纯音

9、段及其混杂信号段的适用情况。2、 掌握短时傅立叶变换的实现原理,理解并掌握数字频率与模拟频率间的对应关系,理解SFT对语音信号的时频分析作用。3、 初步了解线性预测的特点。实验原理1、 短时自相关基音检测设信号采样序列长度为M:x(m)|0mM,采样周期为fs矩形窗序列长度为N:w(m)|0mn,NM则短时自相关为:其有效计算区间为:l 因此,对于矩形窗而言,短时自相关Rn(k)相当于取序列段x(m)|n-Nmn作自相关计算,最大值为Rn(0)。l 若所取序列段具有周期性,则Rn(k)将在k 为序列段周期Tn 时取得次大值Rnmax,因而取得Rnmax时的k值即为所取序列段周期:当Rn(k)=

10、 Rnmax时, Tn=kTs=k/fs。l 若Rnmax与Rn(0)相比相差太大,则表明所取序列段没有相关性,为清音帧。2、 短时傅立叶变换(1) SFT的傅立叶解释 X(m)w(n-m) w(m) x(m) 0 n-N 窗选时间段 n m 注:SFT是窗选信号段的离散傅立叶变换,它反映窗选信号段的离散频谱; SFT系数Xn(ejk)是n-N n时段信号在数字角频率k处的频谱抽样,含有该单频分量的幅度 和相位信息,该单频分量用以反映所在频段的频谱特征。图1SFT的傅立叶解释(2) SFT的滤波器解释W(n) X(n) Xn(ejk) e-jkn 窗选信号频谱 频率窗 移频- f 0 B f

11、f+B注:Xn(ejk)是数字信号X(n)被载波e-jkn调制移频后经过数字低通滤波器W(n)的输出。 设k对应的模拟频率为f(HZ),低通滤波器通频带为0B(HZ) 则只有频率范围在ff+B(HZ)的信号分量能通过低通滤波器。 因此Xn(ejk)是频率范围在ff+B(HZ)內的信号频谱抽样。图2SFT的傅立叶解释(3)数字信号与模拟信号的参数对应关系对于矩形窗而言,数字参数与模拟参数存在以下对应关系:表1数字参数与模拟参数的对应关系数字时间模拟时间(s)数字频率模拟频率(HZ)数字角频率模拟角频率(rad/s)nt=n/fskf=kfs/Lk=2k/L=2kfs/L注:L窗序列长度 fs信号

12、采样频率 (4)时频分辨率关系l 对于矩形窗,时间窗宽度=L/fs;频率窗宽度B=fs/L;时频窗面积常数K=B=1。l Xn(ejk)是(n-L)/fsn/fs时段的信号在kB(k+1)B频段的频谱抽样,抽样频率为kB。l Xn(ejk)反映了在上述模拟时段和频段內的信号分量特征,若时间窗宽度越小,则时间分辨率越高,频率分辨率越低;反之,若时间窗宽度越大,则时间分辨率越低,频率分辨率越高。l SFT系数的集合Xn(ejk)是关于数字时间n和数字频率k的二维阵列,n、k的取值为: Xn(ejk) | n = N,3N/2,2N.M-1;k=0,1,2,N-1 。其中M是语音信号的序列长度。3、

13、线性预测(1)线性预测定义用短时窗选取一段信号序列 x ( m ) | 0mN ,利用如下线性预测方程进行预测:其中N是窗序列长度,权系数 ak | 1 k p 是预测器参数(2)预测系数选取原则满足信号序列与其预测值序列间的均方预测误差最小准则。(3)窗长和预测阶数N过大,预测时段超出了语音信号的短时平稳区间,将使预测精度降低;而N过小, 则不能由过少的信号样点得到其变化规律,同样将使预测精度降低。类似地预测阶数 P的选取也应恰当。实验器材l 多媒体计算机l 预装Windows 98/2000/XP操作系统l 预装Visual Basic 6.0软件l 预装Visual C+ 6.0 软件l 预装“2005数字语言处理实验”软件包l 自带移动存储实验内容1、 短时自相关基音检测(1) 打开“2005数字语音处理实验单元2:综合分析实验”文件夹,运行其中的VoiceProcess.exe实验程序,打开Sample.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 模板/表格 > 财务表格

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号