语音信号数字处理:13 语音识别 简化

上传人:ni****g 文档编号:569759928 上传时间:2024-07-30 格式:PPT 页数:21 大小:804.50KB
返回 下载 相关 举报
语音信号数字处理:13 语音识别 简化_第1页
第1页 / 共21页
语音信号数字处理:13 语音识别 简化_第2页
第2页 / 共21页
语音信号数字处理:13 语音识别 简化_第3页
第3页 / 共21页
语音信号数字处理:13 语音识别 简化_第4页
第4页 / 共21页
语音信号数字处理:13 语音识别 简化_第5页
第5页 / 共21页
点击查看更多>>
资源描述

《语音信号数字处理:13 语音识别 简化》由会员分享,可在线阅读,更多相关《语音信号数字处理:13 语音识别 简化(21页珍藏版)》请在金锄头文库上搜索。

1、1Speech signal processing语音识别语音识别1 12 23 3语音识别基本概念语音识别基本概念语音识别的应用语音识别的应用语音识别的方法语音识别的方法2Speech signal processing语音识别(语音识别(speech recognitionspeech recognition)语音识别(Speech Recognition):机器通过识别和理解过程把人类的语音信号转变为相应的文本或命令的技术。根本目的是研究出一种具有听觉功能的机器,能直接接受人的语音,理解人的意图,并做出相应的反映。从技术上看,它属于多维模式识别和智能接口的范畴。3n语音识别与合成作为一个

2、独立的研究领域已经有近五六十年历史。语音识别作为一个跨学科的技术,是在人们几个世纪以来对语言学、声学、生理学及自动机理论研究的基础上发展而来的。但这些理论实现起来仍然面临着以下困难:n不同的说话者有不同的说话方式;n在含噪音环境中引入的噪声在很大程度上干扰了原始语音信号;n连续语音中音素、音节或单词之间的调音结合引起的音变使基元模型之间的边界不明确;n语法语义规则的建立与理解很难;n语音信息的变化很大,不同人不同,同一个人也不同;n语音的模糊性;n单个字母及单个词发音时的语音特性受上下文环境的影响,音量、音调、重音、音速等都可不同;n环境噪声和干扰对语音识别有严重影响;语音识别(语音识别(sp

3、eech recognitionspeech recognition)4Speech signal processing语音识别分类语音识别分类q按词汇表(Vocabulary)的大小分 小词汇表系统:包括10100个词条 中词汇表系统:包括1001000个词条 大词汇表系统:至少包含1000个以上的词条q按照发音方式分 孤立词(Isolated Word )识别 连接词(Connected Word)识别 连续语音(Continuous Speech)识别 语音理解(在识别的基础上用语言学知识推断语音含义)、 会话语音识别(书写语音识别) 5Speech signal processing语

4、音识别分类语音识别分类q按说话人的限定范围分 特定人(Speaker Dependent,SD)识别 非特定人(Speaker-Independent ,SI)识别q 按照识别方法分 模板匹配方法:DTW 概率模型方法:HMM、 ANN 、SVM6n语音识别的发展现状语音识别的发展现状n从理论到产品走过了50多个春秋;n现有很多实际应用系统;n有可能成为下一代操作系统和应用程序的用户界面;n远没有达到计算机与人类自然交流的终极目标;n实用的语音识别技术研究极具市场价值和挑战;n重点:大词汇、非特定人、连续语音识别。7n汉语语音识别n与其他语言没有本质区别;n汉语的特点使其识别难度更大。n交叉学

5、科:n计算机、通信、语音语言学、数理统计、信号处理、神经生理心理、人工智能等8n语音打字机(听写机,键盘输入的34倍);n电话查询自动应答系统(语音界面);n语音命令的控制系统(释放手脚);n信息查询(股票、天气、航班)n人机界面(新一代操作系统、智能家居)n听写机(文字输入、记录)n数据库管理(语音检索)n说话人识别(安全应用)n关键词检出(多媒体数据检索)n语音识别应用人机交互:9n语音识别方法:n模版匹配法特定人、小词汇、孤立人识别系统Dynamic Time Warpingn随机模型法主流,HMM语音:从一个相对稳定的状态过渡到另一个状态n概率语法分析法区别性特征(语法、语义、语用)规

6、则知识n基于ANN的方法、基于模糊数学的方法、句法语音识别等10语音识别典型系统语音识别典型系统IBM ViaVoice 听写机AT&T VRCP系统(自助话务员协助呼叫)NTT ANSER 语音识别银行服务系统SONY AIBO 机器狗11语音识别的性能评价语音识别的性能评价原句:我我 们们 明明 天天 去去 天天 安安 门门识别:我我 明明后后天天 去去 天天 坛坛 删除错误删除错误 Deletion 插入错误插入错误 Insertion 替换错误替换错误 Substitution正确率正确率: : 准确率准确率: : 12语音识别技术面临的问题语音识别技术面临的问题n数据资源 (年龄、性

7、别、语言、方言、主题、情绪、地域切分、标注体系)n抗噪性能(背景噪声、信道噪声、干扰)n协同发音(Co-articulation)n口语现象(重复、顿措、语序颠倒)n说话人变异(口音、情绪、年龄)n听觉机理(音量、频率、抗噪、区分)13语音识别语音识别层次模型层次模型14统一层次模统一层次模型型系统设系统设计计15语音识别原理语音识别原理n模式匹配原理:未知语音模式与已知语音模式逐一比较,最佳匹配的参考模式作为识别结果。n识别步骤:1.学习训练分析语音特征参数,建立模板库;2.识别测试按照一定的测度和准则与系统模型进行比较,通过判决得出结果;n语音识别本质就是模式识别16语音识别系统基本构成语

8、音识别系统基本构成17n预处理n反混叠滤波;n模/数转换;n自动增益控制;n去除声门激励和口腔辐射;n正确选择识别单元;18n特征提取n从波形信号获取一组描述语音信号特征的参数;n参数的好坏对识别精度影响很大;n识别参数:平均能量、过零率、频谱、共振峰、倒谱、线性预测系数、HMM的概率函数、矢量量化的矢量n可以一种或多种参数并用;n需要考虑参数的稳定性、识别率、计算量等;n对于汉语还存在声调的提取(超音段信息);19n距离测度n欧氏距离及其变形;n对数似然比失真测度;n加权超音段信息识别测度;nHMM之间的距离测度;n主观感知距离测度;20n参考模式库n声学参数模板(训练聚类得到的)n训练与识别方法n动态时间规整(DTW)n矢量量化(VQ)n有限状态矢量量化(FSVQ)nHMMn时延神经网络(TDNN)n模糊逻辑算法等21n专家知识库n存储各种语言学知识;n判决n根据各种距离测度选择适当的门限值;n检验结果n识别率

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号