505编号基于BP神经网络的语音识别技术

上传人:玩*** 文档编号:146965741 上传时间:2020-10-05 格式:PDF 页数:28 大小:606.47KB
返回 下载 相关 举报
505编号基于BP神经网络的语音识别技术_第1页
第1页 / 共28页
505编号基于BP神经网络的语音识别技术_第2页
第2页 / 共28页
505编号基于BP神经网络的语音识别技术_第3页
第3页 / 共28页
505编号基于BP神经网络的语音识别技术_第4页
第4页 / 共28页
505编号基于BP神经网络的语音识别技术_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《505编号基于BP神经网络的语音识别技术》由会员分享,可在线阅读,更多相关《505编号基于BP神经网络的语音识别技术(28页珍藏版)》请在金锄头文库上搜索。

1、上海海事大学上海海事大学 神经网络与语音识别神经网络与语音识别 院 系: 物流工程学院 院 系: 物流工程学院 课 程 名 称: 制造与物流决策支持系统 课 程 名 称: 制造与物流决策支持系统 学 生 姓 名: 学 生 姓 名: 学 号: 学 号: 时 间: 时 间: 目录目录 一 绪论.3 1.1 研究背景及意义.3 1.2 语音识别的国内外研究现状.3 1.3 研究内容.4 二 语音识别技术.5 2.1 语音信号.5 2.2 语音信号的数学模型.5 2.3 语音识别系统结构.6 2.4 语音信号预处理.7 2.4.1 语音信号的采样.8 2.4.2 语音信号的分帧.8 2.4.3 语音信

2、号的预加重.9 2.4.4 基于短时能量和过零率的端点检测.9 2.5 特征参数提取.12 三 基于 BP 神经网络语音识别算法实现.14 3.1 BP 神经网络原理.14 3.2 输入层神经元个数的确定.14 3.3 网络隐含层数的确定.15 3.4 隐含层神经元个数的确定.15 3.5 BP 神经网络构造.15 3.6 BP 神经网络的训练.16 3.6.1 训练样本集合和目标值集合.16 3.6.2 网络训练.16 3.7 网络训练.17 3.8 语音的识别结果.18 四总结.19 参考文献.20 附录.21 一一 绪论绪论 计算机的飞速发展,使人们的生活方式发生了根本性的改变,鼠标、键

3、盘, 这些传统的人机接口使人们体会到了生活的便利。 科学技术日新月异, 假如让 “机 器”能够听懂人的语言,并根据其信息去执行人的意图,那么这无疑是最理想的 人机智能接口方式,因此语音识别作为一门极具吸引力的学科应运而生,很多专 家都指出语音识别技术将是未来十年信息技术领域十大重要的科技发展技术之 一。 语音识别(Speech Recognition)是指,计算机从人类获取语音信息,对语音信 息进行分析处理,准确地识别该语音信息的内容、含义,并对语音信息响应的过 程。语音信号具有非稳定随机特性,这使得语音识别的难度大。目前人类甚至仍 没有完全理解自身听觉神经系统的构造与原理, 那么要求计算机能

4、像人类一样地 识别语音信号很有挑战性。 1.1 研究背景及意义研究背景及意义 语言在人类的智能组成中充当着很重要的角色, 人与人之间的交流和沟通大 部分是通过语言的方式有效的完成。作为人与人之问交流最方便、自然、快捷的 手段,人们自然希望它成为人与计算机交流的媒介。随着数字信号处理及计算机 科学的飞速发展,人们对实现人机对话产生越来越迫切的要求,使得语音识别技 术近年来得到了迅速的发展,语音识别技术的研究进入了一个比较成熟的时期。 语音识别是一门交叉科学,它综合了声学、语言学、语音学、生理科学、数字信 号处理、通信理论、电子技术、计算机科学、模式识别和人工智能等众多学科。 也是人机交互最重要的

5、一步。 1.2 语音识别的国内外研究现状语音识别的国内外研究现状 通过语音传递信息是人类最重要,最有效,和最方便的交换信息的形式,语 音识别主要指让机器转达人说的话, 即在各种情况下, 准确的识别出语音的内容, 从而根据其信息,执行人的各种意图。 广义的语音识别包括说话人的识别和内容的识别两部分。 这里所说的语音识 别,是指内容识别方面。采用计算机进行语音识别到现在已经发展了 50 年。 从特征参数上改进,采用各种办法进行语音增强是一个研究方向,但是到目 前为止,还没有一种办法能把语音信号完美地从噪音环境提取出来。语音识别有 广泛的商业化运用前景,主要可以分为通用场合和专用场合两个方面。 1.

6、3 研究内容研究内容 本文研究的主要内容是结合模式识别的基本理论,研究 BP 神经网络孤立词 语音识别的问题,实现 1-5 共 5 个数字的识别。分析了语音信号的预处理,特征 提取及 BP 神经网络算法实现。 二二 语音识别技术语音识别技术 2.1 语音信号2.1 语音信号 语音信号是随时间变化的一维信号,由一连串的音素组成,各个音素的排列 有一定的规则。语音具有声学特征的物理性质,声音质量与它的频率范围有关, 语音信号的频谱分量主要集中在 2003400Hz 的范围内。语音信号的另一个重要 特点是它的短时性。语音信号的特征是随时间变化而变化,只有在一段很短的时 间间隔中,才保持相对稳定的特性。研究表明,在 5ms40ms 的范围内语音信号 的频谱特性和一些物理特征基本保持不变。 语音信号短时特征和短时参数包括它 的短时能量

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 心得体会

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号