单片机课程设计（论文）基于语音识别技术的门禁系统

资源描述

《单片机课程设计（论文）基于语音识别技术的门禁系统》由会员分享，可在线阅读，更多相关《单片机课程设计（论文）基于语音识别技术的门禁系统（21页珍藏版）》请在金锄头文库上搜索。

1、目录第一章绪论21.1概述21.2语音识别的研究历史及现状31.3语音识别技术及其原理31.4语音识别的分类41.5语音识别技术的前景展望41.6语音识别芯片AP7003简介41.7系统总体方案5第二章硬件电路设计72.1 AT89S52单片机电路设计72.1.1 AT89S52简介72.1.2AT89S52引脚说明72.1.3基于AT89S52的语音识别模块电路设计102.2 S3C2410硬件设计122.2.1 S3C2410芯片简介122.2.2 S3C2410引脚图142.2.3 S3C2410硬件设计142.3电机电路设计15第三章系统软件设计153.1 linux和QT153

2、.1.1 嵌入式linux 简介153.1.2 QT简介173.2 系统软件的实现183.2.1 S3C2410的软件实现183.2.2单片机软件的软件实现19第四章总结21基于语音识别技术的门禁系统摘要：通过对语音识别原理的系统分析，结合特定人语音识别的具体情况，阐了基于语音识别的门禁系统的设计思路，介绍了其中的几个关键性技术要点。应用ARM芯片S3C2410,51单片机，从硬件、软件、算法优化等方面实现了基于语音识别门禁系统的总体设计，在S3C2410-S平台上完成了原型系统的开发，并从应用的角度阐明了本系统理论上的合理性与可行性。关键词：语音识别 s3c2410 ARM 门禁系统单

3、片机第一章绪论1.1概述综合集成计算机、通讯、自动识别、机械工程和安全管理系统等相关技术的门禁系统有效地解决了重要部门和场所的安全访问控制问题，已得到广泛的应用，成为日常工作和生活中的电子门卫。目前，门禁系统采用较多的是非接触式RF卡、生物识别技术、IC卡、密码输入等方式。然而随着科学技术的发展，综合应用语音识别、指纹识别、虹膜识别、红(热)感应等最新生物识别技术，结合电磁锁等技术的门禁系统已广泛吸引了人们的注意，并将逐步成为门禁系统发展的主流与最终目标之一。利用语音识别技术来实现门禁系统不用像其他方式一样需要触摸，具有方便、安全、准确、信息完整、独立性强、反应速度快等优点。因此，基于语音

4、识别技术的门禁系统有着非常独特的优势和发展前景。1.2语音识别的研究历史及现状语音识别的研究工作始于20世纪50年代，1952年Bell实验室开发的Audry系统是第一个可以识别10个英文数字的语音识别系统。1959年，Rorgie和Forge采用数字计算机识别英文元音和孤立词，从此开始了计算机语音识别。60年代，苏联的Matin等提出了语音结束点的端点检测，使语音识别水平明显上升；Vintsyuk提出了动态编程，这一提法在以后的识别中不可或缺。60年代末、70年代初的重要成果是提出了信号线性预测编码(LPC)技术和动态时间规整(DTW)技术，有效地解决了语音信号的特征提取和不等长语音匹配问

5、题；同时提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。80年代语音识别研究进一步走向深入：HMM模型和人工神经网络(ANN)在语音识别中成功应用。1988年，FULEE Kai等用VQ/I-IMM方法实现了997个词汇的非特定人连续语音识别系统SPHINX。这是世界上第1个高性能的非特定人、大词汇量、连续语音识别系统。进入90年代后，语音识别技术进一步成熟，并开始向市场提供产品。许多发达国家如美国、日本、韩国以及IBM、Apple、AT&T、Microsoft等公司都为语音识别系统的实用化开发研究投以巨资。同时汉语语音识别也越来越受到重视。IBM开发的 ViaVoice和Microso

6、ft开发的中文识别引擎都具有了相当高的汉语语音识别水平。进入21世纪，随着消费类电子产品的普及，嵌入式语音处理技术发展迅速2。基于语音识别芯片的嵌入式产品也越来越多，如Sensory公司的RSC系列语音识别芯片、Infineon公司的Unispeech和Unilite语音芯片等，这些芯片在嵌入式硬件开发中得到了广泛的应用。在软件上，目前比较成功的语音识别软件有:Nuance、IBM的Viavoice和Microsoft的SAPI以及开源软件HTK，这些软件都是面向非特定人、大词汇量的连续语音识别系统。我国语音识别研究一直紧跟国际水平，国家也很重视。国内中科院的自动化所、声学所以及清华大学等科

7、研机构和高校都在从事语音识别领域的研究和开发。国家863智能计算机专家组为语音识别技术研究专门立项，并取得了高水平的科研成果。我国中科院自动化所研制的非特定人、连续语音听写系统和汉语语音人机对话系统，其准确率和系统响应率均可达90%以上。1.3语音识别技术及其原理语音识别技术的关键在于准确地分辨出不同人的语音特征及其信息内容，并以此控制其他设备来满足人们的各种需要。语音识别根据应用场合、使用对象、语音词汇量、算法模型等同的分类依据，可分为不同的类型。针对办公室、家庭等私人小型场所，门禁系统涉及到的主要是特定人语音识别的特殊要求。本文拟采用对用户的依赖性分类的形式，将相关语音识别分为两类：对用

8、户声音特征的辨识和对用户发出的命令的确认。基于对声音特征辨识的特定人语音识别在对安全要求很高的部门门禁系统中得到了较为广泛的应用。其基原理：当系统接收到外界语音信息后，从事先训练好的语音库中找出惟一匹配的声音特征模型进行辨识，如果匹配成功则执行下一步操作；反之，如果元法匹配将会拒绝执行任何操作。特定人语音识别应用较简单，不需要预先采集过多的样本，对硬件资源要求也较低，因此降低了系统运行中的前期成本；此外，其训练过程可以根据用户习惯，由用户任意定义控制项目的具体命令语句，因而适合大多数中小型以下企业或部门的各类应用。1.4语音识别的分类由于语音识别的目的和作用不同，识别又分为说话人识别和语音识

9、别。其中说话人识别，可分为与文本有关和与文本无关两类。与文本有关的语音识别系统要求用户按照规定的内容发音，每个人的语音模型逐个被精确地建立，而识别时也必须按规定的内容发音，因此可以达到较好的识别效果；而与文本无关的识别系统则不规定说话人的发音内容，模型建立相对困难，但用户使用方便，应用范围较宽。从用途上看，可分为说话人识别和说话人确认。前者判定某一待识别的声音是多个话者中的一个，是多选一的问题，属于闭集识别范围。后者判定一个待识别的声音“是或不是”某一特定说话者的语音，其输出只有两种结果，为肯定或否定的问题。该系统的语音识别芯片是AP7003，并在其上实现与文本有关的说话人的确认，然后执行相应

10、的命令与操作。该系统主要由说话人识别模块、门锁控制电机以及门锁等部分组成。在训练时，说话人的声音通过麦克风进入说话人语音信号采集前端电路，由语音信号处理电路对采集的语音信号进行特征化和语音处理，提取说话人的个性特征参数并进行存储，形成说话人特征参数数据库。在识别时，将待识别语音与说话人特征参数数据库进行匹配，通过输出电路控制门控电机，最终实现对门锁的控制。1.5语音识别技术的前景展望语音作为当前通信系统中最自然的通信媒介，语音识别技术是非常重要的人机交互技术。随着计算机和语音处理技术的发展，语音识别系统的实用性将进一步提高。应用语音的自动理解和翻译，可消除人类相互交往的语言障碍。国外已有多种

11、基于语音识别产品(如声控拨号电话、语音记事本等)的应用，基于特定任务和环境的听写机也已经进入应用阶段。这预示着语音识别技术有着非常广泛的应用领域和市场前景。随着语音技术的进步和通信技术的飞速发展，语音识别技术将为网上会议、商业管理、医药卫生、教育培训等各个领域带来极大的便利5，其应用和经济、社会效益前景非常良好。1.6语音识别芯片AP7003简介AP7003是一款新型、低成本语音识别专用集成电路，内置有麦克风放大器、A/D转换器、语音处理器和I/O控制器，经预处理后可识别12组不同的字词，每组1.5秒时长，可连词或单词识别。AP7003包括AP7003-01(由CPU串行控制)和AP7003-

12、02(由按键直接控制)两种型号，且具有高度的I/O可编程性，使用简单方便，可广泛应用于玩具、识别转控、自动答录等领域。其主要特性如下：内置麦克风放大器内置A/D转换器； DIP40双列直插式封装；识别12组1.5秒时长字词； I/O口具有2个普通输入、4个触发输入、2个输出口(分别有4个和12个输出)、2个LED动；指令优化以方便用户使用； 2.4V4.5V工作电压，且具备低功耗模式。AP7003具有两种工作模式，即录音模式和识别模式。在使用识别模式之前，应先将目标词录入芯片内。AP7003内有12个存储体用于存储12组不同的字句，每个存储体可存储1.5秒时长的字词，可通过键盘或按程

13、序编制的顺序选择存储体录入及存放目标词。语音可通过外部麦克风或其它媒体录入芯片内，经内部处理后以不同的数字特征信号保存于存储体中。目标词录入芯片内后即可将工作模式转换到识别模式，工作时芯片将当前语音与事先已录入存储体的目标词语音相比较，如果有语音特征相匹配，则在芯片的相应输出端口输出高电平或低电平。需要时可以将芯片编程为省电模式以节省电能，当有按键信号时芯片将被唤醒。系统上电后必须先给AP7003-01发清除指令Clear Word以清除12个存储体内的内容，然后发出一个存储指令(Store Word1Store Word12之一)将目标词录入芯片相应的存储体内。当LED1有效时表示芯片准备

14、好录入目标词。通过指令Set R_Model或Set R_Mode2可选择两种识别模式：Set R_Model为单词识别模式，该模式下识别操作完成后芯片进入省电状态以等待新的指令；Set R_Mode2为连词识别模式，该模式下识别操作完成后芯片返回语音录入状态。进入语音识别状态前必须通过指令Set R_LevellSet R_Level4设置识别时要求的匹配度，Set R_Level4要求匹配程度最高，而Set R_Level1最低，可以根据经验设定为中间某一个值。跟在一个Store Word112指令之后的Store Flag指令将前面录入的语音存入指定的存储体以作为目标词。Clear O

15、utputs指令用于清除A端口输出状态(POA1POA12)。Shut Down指令将芯片转入关闭模式以节省电能。当数据格式或时序出现在串行数据(SERIAL DATA)输入口PIT3、PIT2、PIT1时，芯片将发送错误代码到串行数据输出口POB4，同时将数据、时钟发送到串行数据输出口POB2、POB3。指令Store Word112、Store Flag、Clear Word、Set R_Level14和Clear Outputs执行完成后芯片将输出一个Done代码。芯片每次执行完语音识别后，输出一个匹配指示代码(Match Word1Match Word12或NO Match)。当有一个语音匹配时，LED2有效，如果PIM2被拉高(端口A使能)，则A端口相应的引脚变为有效。如果PIM1引脚被拉低，芯片的语音识别功能被禁止。1.7系统总体方案该系统的核心处理器是单片机89s52和ARM芯片S3C2410，并在其上实现与文本有关的说话人的确认，然后执行相应的命令与操作。该系统主要由说话人识别模块、门锁控制电机以及门锁等部分组成。在训练时，说话人的声音通过麦克风进入说话人语音信号采集前端电路，由语音信号处理电路对采集的语音信号进行特征化和语音处理，提取说话人的个性特征参数并进行存储，形成

展开阅读全文

单片机课程设计（论文）基于语音识别技术的门禁系统

最新文档