语音处理实验报告

上传人:博****1 文档编号:497252258 上传时间:2023-01-17 格式:DOC 页数:28 大小:399KB
返回 下载 相关 举报
语音处理实验报告_第1页
第1页 / 共28页
语音处理实验报告_第2页
第2页 / 共28页
语音处理实验报告_第3页
第3页 / 共28页
语音处理实验报告_第4页
第4页 / 共28页
语音处理实验报告_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《语音处理实验报告》由会员分享,可在线阅读,更多相关《语音处理实验报告(28页珍藏版)》请在金锄头文库上搜索。

1、语音处理实验报告实验一 语音信号的端点检测一、实验目的1、掌握短时能量的求解方法2、掌握短时平均过零率的求解方法3、掌握利用短时平均过零率和短时能量等特征,对输入的语音信号进行端点检 测。、仪器设备 实验仪器设备及软件HP计算机,MATLAB三、实验原理端点检测是语音信号处理过程中非常重要的 一步,它的准确性直接影响到语音信号处理的速 度和结果。本次实验利用短时过零率和短时能量 相结合的语音端点检测算法利用短时过零率来 检测清音,用短时能量来检测浊音,两者相配合 便实现了信号信噪比较大情况下的端点检测。算法对于输入信号的检测过程可分为短时能 量检测和短时过零率检测两个部分。算法以短时 能量检测

2、为主,短时过零率检测为辅。根据语音 的统计特性,可以把语音段分为清音、浊音以及 静音(包括背景噪声)三种。在本算法中,短时 能量检测可以较好地区分出浊音和静音。对于清 音,由于其能量较小,在短时能量检测中会因为 低于能量门限而被误判为静音;短时过零率则可 以从语音中区分出静音和清音。将两种检测结合 起来,就可以检测出语音段(清音和浊音)及静 音段1短时能量计算定义n时刻某语言信号的短时平均能量En为:r:nEn 二 a x(m)w(nm)?二 x(m)w(nm)2二:m -n .(N J)式中N为窗长,可见短时平均能量为一帧 样点值的平方和。特殊地,当窗函数为矩形窗 时,有 En = 丫 x2

3、(m)mr 4NV)2、短时过零率过零就是指信号通过零值。过零率就是每秒 内信号值通过零值的次数。对于离散时间序列,过零则是指序列取样值 改变符号,过零率则是每个样本的改变符号的 次数。对于语音信号,则是指在一帧语音中语音信号波形穿过横轴(零电平)的次数。可以用相邻两个取样改变符号的次数来计算。如果窗的起点是n=0,短时过零率Z为波形穿过横轴(零电平)的次数1 N JZo= |Sgn(Sw(n)-Sgn(Sw(n-1) |2心t x0sgn(x)=x:o短时过零可以看作信号频率的简单度量浊音的短时平均幅度最大,无声的短时平均 幅度最小,清音的短时过零率最大,无声居中, 浊音的短时过零率最小。3

4、、短时自相关函数N丄Rw(k)二sw(n)sw(n k)n =0 是偶函数; s(n)是周期的,那么 R(k)也是周期 的; 可用于基音周期估计和线性预测分析4、判断语音信号的起点和终点禾U用短时平均幅度和短时过零率可以判断语 音信号的起点和终点。语音端点检测方法可采用 测试信号的短时能量或短时对数能量、联合过零 率等特征参数,并采用双门限判定法来检测语音 端点,即利用过零率检测清音,用短时能量检测 浊音,两者配合。首先为短时能量和过零率分别 确定两个门限,一个是较低的门限数值较小,对 信号的变化比较敏感,很容易超过;另一个是比 较高的门限,数值较大。低门限被超过未必是语 音 的开始,有可能是

5、很短的噪声引起的,高门 限被超过并且接下来的自定义时间段内的语音。四、实验步骤及程序(1)实验步骤:1、取一段录音作为音频样本。2、利用公式分别编程计算这段语音信号的短 时能量和短时过零率,然后分别画出它们的曲 线。3、调整能量门限。4、进行幅度归一化并设置帧长、短时能量阈值、过零率阈值等参数。5、编写程序实现语音端点检测。6、最后得到语音端点检测图像。(2)语音信号的端点检测程序流程图:输入幅度计算短时能丿T 1丿输出样本端图1.1语音信号的端点检测程序流程图(3) 语音信号的端点检测实验源程序:clc;clear;c=wavread(55.wav);/读语音文件波形e_x=frame(c(

6、:,1),energy);/分析语音文件短时能量z_x=frame(c(:,1),zc);/分析语音文件过零率subplot(5,1,1);plot(c(:,1);subplot(5,1,2);plot(e_x);subplot(5,1,3);plot(z_x);wvywen-R1 Obceep图1.2语音信号的端点检测实验结果输出图像六、实验体会这次试验,让我掌握了调用 matlab函数的结 构体,一开始没学过 matlab语言,所以,学这 门课很吃力,好多语句都不知道,所以,无从下 手去通过语言实现功能,只能一边学语句的涵义哦,一边摸索功能的实现,相当费劲。以后,不 知道还有没有机会系统的

7、了解,学习matlab语言,不过,还是从这个试验学到一部分关于 matlab的知识,以及用matlab实现语音信号处 理的应用技巧。实验二语音信号的特征提取一、实验目的1、掌握语音信号的Mel倒谱特征(MFCC的求解方法2、掌握语音信号的线性预测原理以及LPC特征的求解方法、仪器设备HP计算机、Matlab软件三、实验原理MFCC :语音识别和说话人识别中,常用的语 音特征是基于Mel频率的倒谱系数(即MFCC 。MFCC参数是将人耳的听觉感知特性和语音的产 生机制相结合。Mel频率可以用如下公式表 示:A = 2595x log(l + f 700)在实际应用中,MFCC到谱系数计算过程如下

8、;1、将信号进行分帧,预加重和加汉明窗处理, 然后进行短时傅里叶变换并得到其频谱。2、求出频谱平方,即能量谱,并用 M个 Mel 带通滤波器进行滤波;由于每一个频带中分量的 作用在人耳中是叠加的。因此将每个滤波器频带 内的能量进行叠加,这时第k个滤波器输出功率 谱x(k)。3、将每个滤波器的输出取对数,得到相应频 带的对数功率谱;并进行反离散余弦变换,得到 L个MFCC系数,一般L取1216个左右。MFCC系 数6 = V log v ()cos,r(i -4、将这种直接得到的MFCC特征作为静态特 征,再将这种静态特征做一阶和二阶差分, 得到 相应的动态特征。四、实验内容(1)、实验步骤1、

9、输入样本音频2、给样本音频预加重、分帧、加窗3、将处理好的样本音频做傅里叶变换4、进行Mel频率滤波5、进行Log对数能量6、对样本求倒谱7、输出MFCC图像(2)、MFCC提取程序流程图s (n)10-1200-202468101210020030040050024681012实验三语音信号的基频提取一、实验目的1、掌握语音信号基频的概念,加深对基频刻画声调特征作用的理解。2、掌握语音信号基频特征的典型求解方法、实验仪器设备及软件HP计算机,MATLAB三、实验原理浊音信号的自相关函数在基因周期的整数倍 位置上出现峰值,而清音的自相关函数没有明显 的峰值出现。因此检测自相关函数是否有峰值就

10、可以判断是清音还是浊音,而峰-峰值之间对应 的就是基音周期。影响从自相关函数中正确提取基音周期的最 主要原因是声道响应。当基音的周期性和共振峰 的周期性混在一起时,被检测出来的峰值可能会 偏离原来峰值的真实位置。另外,在某些浊音中, 第一共振频率可能会等于或低于基音频率。此时,如果其幅度很高,它就可能在自相关函数中 产生一个峰值,而该峰值又可以同基音频率的峰 值相比拟。1自相关函数对于离散的语音信号x(n),它的自相关函数定 义为:R(k)= 2 x(n)x(n-k),如果信号x(n)具有周期性,那么它的自相关 函数也具有周期性,而且周期与信号 x(n) 的周期性相同。自相关函数提供了一种获取

11、周期 信号周期的方法。在周期信号周期的整数倍上, 它的自相关函数可以达到最大值,因此可以不考 虑起始时间,而从自相关函数的第一个最大值的 位置估计出信号的基音周期,这使自相关函数成 为信号基音周期估计的一种工具。2、短时自相关函数语音信号是非平稳的信号,所以对信号的处理 都使用短时自相关函数。短时自相关函数是在信 号的第N个样本点附近用短时窗截取一段信号, 做自相关计算所得的结果Rm(k)=工 x(n)x(n-k)式中,n表示窗函数是从第n点开始加入3、算法通过对自相关基音检测原理的分析,考虑到检 测准确度和检测速率 2方面的因素,提出了算法 实现方案,并对算法进行了 Matlab编程实现。算

12、 法包含6个功能模块:带通滤波、取样、分帧、 短时能量分析、相关运算、基音检测。因周-H-P 带图2.1基音检测框图四、实验步骤1、取一段录音作为音频样本2、对样本音频进行采样。3、对采样后样本音频进行分帧。4、对每一帧求短时自相关函数5、算出对应周期。6、进行带通滤波去除野点。(2)语音信号基音周期提取的程序流程图:输入语分短时扌 自J带苹通11输图2.2语音信号基音周期提取的程序流程图(3)实验源程序fun cti onpitchx=wavread( 1.wav); %读取声音文件figure(1);stem(x, .);%显示声音信号的波形n=160;%取 20ms的声音片段,即160个

13、样点for m=1:le ngth(x)/n;%寸每一帧求短时自相关函数for k=1: n;Rm(k)=0;for i=(k+1): n;Rm(k)=Rm(k)+x(i+(m-1)* n)*x(i-k+(m- 1)*n);endendp=Rm(10: n);误判,去掉前边10个数值较大的点%防止Rmax,N(m)=max(p);取第一个自相关函数的最大点%读end边去掉的10个点N=N+10;%补回前T=N/8;应的周期%算出对figure(2);stem(T, len gth(T) 0 10););axis(Oxlabel(帧数(n) );ylabel( 周期 (ms) );title( 各帧基音周期);T1= medfilt1(T,5);野点%去除figure(3);stem(T1, len gth(T1) 0 10););axis(0xlabel( 帧数(n) );ylabel( 周期 (ms) );title( 各帧基音周期);Q I|1| 0200040006000600010000120001400016000各帧基音周期图2.4滤波前各帧基音周期20各帧基音周期帧数(n)图2.5滤波后各帧基音周期哈尔滨工程大学班 级:学 号:操作过程试验报告合计语音信号的端点检测语首信号的特征提取语音信号

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号