信息工程学院2014届毕业论文(设计)模板

资源描述

《信息工程学院2014届毕业论文(设计)模板》由会员分享，可在线阅读，更多相关《信息工程学院2014届毕业论文(设计)模板（21页珍藏版）》请在金锄头文库上搜索。

1、2014 届本科毕业论文（设计）届本科毕业论文（设计）题目: 系别: 信息工程学院班级: 2010 级计算机科学与技术(嵌入式技术方向) 学号: 201060861? 姓名: 指导教师: 职称起讫日期: 2013 年 10 月 16 日-2014 年 5 月 31 日文档页面设置约定：一律用 A4 纸规范打印，左边距为 2.8cm，右边距为 2.2cm，上边距都为 2.5cm，下边距都为 2.4cm。页眉、页脚边距分别为 1.7cm 和 1.5cm，行间距均为固定行距 22 磅，文中公式均为单倍行距.字间距为默认值奇数页眉内容为：届专业毕业设计（论文），偶数页眉的内容为：（作

2、者姓名）：（论文题目），均采用宋体小五号居中。中、置于目录页之前。页码从正文开始编排。英文摘要单独一页置于正文参考文献后，致谢语单独一页置于英文摘要后，英文摘要、致谢语不需要页眉、页脚。噪声环境下语音特征参数鲁棒性的研究张三丰三明学院信息工程学院 2010 级计算机科学与技术（嵌入式技术方向）摘要：实用有效的说话人识别系统越来越成为研究的重点。语音特征参数的鲁棒性直接影响一个说话人识别系统的具体性能，过去主要针对移动通信环境下存在信道失真的问题，研究差分倒谱的鲁棒性。文中则主要在加性白噪声环境下研究 Mel 倒谱参数、Mel 差分倒谱参数的顽健性以及它们经过倒谱系数零均值化(CMN)处理后识

3、别性能的改进。从仿真结果可以看出：在加性白噪声环境下，差分倒谱参数具有很好的鲁棒性；倒谱系数零均值化能有效的除去加性白噪声。关键词：语音识别；鲁棒性；Mel倒谱参数；Mel差分倒谱；倒谱系数零均值化摘要以简要文字介绍研究课题的目的、方法、内容及主要成果，中文摘要字数一般不超过400 字。关键词是表述毕业论文（设计）主题内容信息的单词或术语，应尽量从汉语主题词表中选取，第一关键词应能体现出文章的学科分类。关键词数量一般为 35 个。论文中英文字体均用 Times New Roman 字体。注：所有文字内容仅做样板。1.设计（论文）题目为四号黑体字，可以分为 1 或 2 行居中打印；设计（论文）

4、题目下空一行打印作者姓名（单独一行，小四号宋体，居中）；下行打印“三明学院信息工程学院 XX 级 XX 专业”（五号宋体，居中）；再下行打印摘要。2.摘要二字为小四号黑体，“摘要：”二字后打印内容(五号宋体)；摘要内容下空一行打印关键字，“关键词：”三字为小四号黑体，其后的内容为五号宋体，关键词之间用分号隔开， 3.英文摘要题目和关键字全部采用小四号 Times New Roman 字体，摘要内容和关键字内容均用五号 Times New Roman 字体。题目黑体四号字，应以简明、确切、有概括性的词语反映文章内容。字数要适当，一般不宜超过 20 个汉字。姓名：宋体小四号字。目录第一章绪论

5、.11.1 语音识别简介.11.1.1 什么是语音识别.11.1.2 语音识别的应用及分类.11.2 国内外语音识别技术的发展历史及现状.11.3 语音识别面临的问题.21.4 本课题研究背景及内容.2第二章语音识别基础理论.32.1 语音信号产生的机理.32.2 语音信号的预处理.42.2.1 预滤波、采样、A/D 转换.42.2.2 预加重.42.2.3 分帧加窗.52.3 端点检测.52.3.1 短时能量.62.3.2 短时平均过零率.7第三章常用的语音识别模型.8第四章噪声下语音特征参数的提取识别.9第五章结论.10参考文献.11附件语音“0”的各状态频谱图.132014 届

6、计算机科学与技术(嵌入式技术方向)专业毕业论文（设计）1第一章绪论语言，是人类进行行为沟通和思想交流最重要的工具1，也是人类最重要的信息载体。随着信息科技的快速发展，计算机的越来越便携化和应用的复杂化，在越来越多的领域有了让计算机听懂人言的要求，这样，就引出了语音处理技术这门交叉学科。语音识别技术，是语音处理技术中的一个重要组成。1.1 语音识别简介1.1.1 什么是语音识别所谓的语音识别是指利用计算机自动识别语音的技术，有狭义和广义之分。狭义的语音识别特指利用计算机识别出语音信号所表达的内容，其目的是要准确地理解语音所蕴含的含义，例如将语音转换成其所对应的文字。而广义的语音识别则泛指利用语

7、音信号识别出其中所包含的“任何感兴趣”的内容的一种技术，例如利用语音信号中所包含的特定人的信息进行说话人身份辨认的说话人识别技术2。1.1.2 语音识别的应用及分类语音识别的应用范围十分广泛，遍及各行各业。如智能家居、语音拨号、信息通讯、自动应答系统、工业控制、机器人、交通导航等等。语音识别是一门新兴的交叉性学科，它广泛涉及声学、语音学、语言学、数字信号处理、通信学、网络技术、电子技术、计算机科学、模式识别和人工智能等众多学科。如前所述，语音识别系统有广义和狭义之分，这里所讨论的语音识别分类特针对狭义的语音识别而言3。由文献4, 5-8可知“从不同角度，语音识别系统可以分为以下几类：按词汇量大

8、小，可分为小词汇量、中等词汇量、大词汇量及无限词汇量语音识别系统；按对说话人的依赖程度可以分为特定人和非特定人语音识别系统；按对说话人说话方式的要求，可以分为孤立词语音识别系统、连接词语音识别系统及连续语音识别系统；按识别的目的来分，可以分为说话人语音识别系统和语音内容理解的语音识别系统” 。1.2 国内外语音识别技术的发展历史及现状语音识别的历史可以追溯到 20 世纪 50 年代。1952 年 AT如果声道中某处面积很小，气流高速冲过此处时产生湍流，当气流速度与横截面积之比大于某个门限时便产生摩擦音，即清音。如果声道某处完全闭合建立起气压，然后突然释放而产生的声音就是爆破音。语音的产生机理可

9、以由图 2-1 来描述6。冲击序列发生器 Z声门脉冲模型 G（Z）随机噪声发生器声道模型声道参数辐射模型图 2-1 语音产生机理2.2 语音信号的预处理系统要想获得一个比较理想的处理对象，对原始信号进行预处理是必要的。在语音信号处理中，预处理包括预滤波、采样、A/D 转换、分帧加窗、预加重及端点检测。2.2.1 预滤波、采样、A/D 转换预滤波的目的有两个：（1）抑制输入信号各频域分量中频率超出/2 的所有分量（为采样sfsf频率），以防止混叠干扰。（2）抑制 50Hz 的电源工频干扰。这样，预滤波必须是一个带通滤波器，设其上、下截止频率分别是，和，则对于绝大多数语音编译码器，HfLf=3

10、400Hz，=60100Hz，采样频率为=8kHz；而对于语音识别而言，当用于电话用户时，指标HfLfsf与语音编译码器相同。当使用要求较高或很高的场合时，=4500Hz 或Hf8000Hz，=60Hz，=10kHz 或 20kHz。语音信号经预滤波和采样后，由 A/D 转换器转换为二进Lfsf制数字码。2.2.2 预加重由于语音信号的平均功率谱受声门激励和口鼻辐射的影响，语音信号从嘴唇辐射后，高频端大约在 800Hz 以上按 6dB/倍频程跌落7，即语音信号的频谱产生高频衰落现象。所以系统得到语音信号频谱时，频率越高响应的成分越少，高频部分的频谱比低频部分的难求。因此，为抵消这种影响，就在对

11、语音信号分析前进行预加重（Pre-emphasis）处理。预加重的目的是提升高频部分，使信号2014 届计算机科学与技术(嵌入式技术方向)专业毕业论文（设计）5的频谱变得平坦，保持在低频到高频整个频带中，能用同样的信噪比求频谱，以便于频谱分析或声道参数分析。预加重一般是在语音信号数字化之后、参数分析之前在计算机里用具有提升高频特性的预加重数字滤波器来实现，它一般是一个一阶的数字滤波器，其函数为：（2.1）11)(zzH其中，为预加重滤波器的系数，决定截止频率，取值范围一般在 0.940.97，本文的取值为 0.95。图 2-2 为数字 3 的原始语音信号与预加重后的信号对照图，其语音采样频率为

12、 16K。从图中可以看出，预加重后，清音段的能量得到了提升，甚至接近浊音段的能量。图 2-2 数字“3”的原始语音信号与预加重后的信号对照2.2.3 分帧加窗语音信号是一种非平稳信号，但其具有短时平稳的特点。因此，为了能对语音信号进行处理，我们需将语音信号划分为一个一个的短时段，每一个短时段称为一帧。通过对语音的分帧操作，可以撮其适时特性，便于模型的建立。数据帧长一般可取为 2030ms，前一帧与后一帧的交叠部分称为帧移，帧移与帧长的比例一般取为 00.5。分帧可用移动的有限窗口进行加权的方法来实现的，从2.3 端点检测端点检测在语音识别中有着重要的作用。其目的是从包含语音的一段信号中检测出语音信号段和噪声段，确定语音段的起点和终点。准确的端点检测不仅可以减少计算量，而且能排除无声段的噪声干扰，从而提高系统的识别率。下面，简单介绍几种目前常用的检测方法。张三丰：噪声环境下汉语语音特征提取方法研究62.3.1 短时能量能量是语音的一个

展开阅读全文