毕业设计论文 基于模式识别的手写汉字识别

上传人:ss****gk 文档编号:235907481 上传时间:2022-01-06 格式:DOCX 页数:39 大小:264.24KB
返回 下载 相关 举报
毕业设计论文 基于模式识别的手写汉字识别_第1页
第1页 / 共39页
毕业设计论文 基于模式识别的手写汉字识别_第2页
第2页 / 共39页
毕业设计论文 基于模式识别的手写汉字识别_第3页
第3页 / 共39页
毕业设计论文 基于模式识别的手写汉字识别_第4页
第4页 / 共39页
毕业设计论文 基于模式识别的手写汉字识别_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《毕业设计论文 基于模式识别的手写汉字识别》由会员分享,可在线阅读,更多相关《毕业设计论文 基于模式识别的手写汉字识别(39页珍藏版)》请在金锄头文库上搜索。

1、摘要模式识别就是通过计算机用数学技术方法来研究模式的口动处理和识别。 随着计算机技术的发展,人类对模式识别技术提出了更高的要求。在我国如何 将汉字方便、快速地输入到计算机中已成为关系到计算机技术普及的关键问题。 特别是对于大量己有的印刷资料和手稿,计算机口动识别输入己成为必须研究 的课题,所以汉字识别在文献检索、办公自动化、邮政系统、银行票据处理等 方面有着广阔的应用前景。对手写汉字进行识别,首先将汉字图像进行处理,抽取主要表达特征并将 特征与汉字的代码存储在计算机中,这一过程叫做“训练”。识别过程就是将输 入的汉字图像经处理后与计算机中的所有字迸行比较,找出最相近的字就是识 别结果,这一过程

2、叫做“匹配”。本文主要介绍了模式识别的基本原理和手写的10个汉字字符的识别系统 的设计实现过程。第一章介绍了与模式识别有关的概念、描述方法、有关的数 学运算和此学科的发展状况。第二章分析了模式识别的过程、图像文件的格式, 并详细介绍了 BMP格式图像的结构;由于本文设计的识别系统是在VC+环境 下开发的,所以给出了 CDib类的定义和功能介绍。第三章主要讨论了分类器 设计过程中的特征空间优化设计问题、分类器设计准则、基本方法和判别函数 的知识。第四章在前三章知识的基础上,给出了模板匹配法识别图像的原理, 类GetFeature的功能及定义,识别系统设计的开发流程及实现过程,并对实验 结果做岀简

3、单的分析。关键词:模式识别BMP位图 分类器手写汉字识别模板匹配ABSTRACTThe pattern recognition researches how to treat with and recognize pattern automatically through computer with math arithmetic. Along with the development of computer technology, human need more advanced pattern recognition technology. In our country it is a k

4、ey problem for computer technologys popularization that how to input Chinese characters into computer fleetly and conveniently. Especially for large numbers of printed data and manuscript, the automatic recognition and input of Chinese characters becomes a stringent task, therefore the Chinese chara

5、cter recognition will have a broad application prospect on literature retrieval, office automation, postal service system, bank bill processingIn order to recognize Chinese characters, the first task we have to do is feature extraction of a map, after that we have to store the feature in the compute

6、r. This process is called the training11. The second process is called “matcFT, This process compares the hand-written Chinese character feature and the stored features in the computer.This paper mainly introduces the basic principles of pattern recognition and the design realization process of ten

7、hand-written Chinese characters recognition system. The first chapter mainly introduces the concepts related to the pattern recognition, the description method, the mathematics operation and this disciplines development condition. The second chapter introduces the pattern recognition process, the pi

8、cture format, especially the BMP form which is used in this paper. This article designs the recognition system under the VC IDE, therefore we introduce a CDib classs definition and the functions. The third chapter mainly introduces characteristic space optimization design, the classifications design

9、 criterion, the essential method and the knowledge about knowledge function. The fourth chapter produces the principle of template match recognition arithmetic, the class GetFeatures definition and the functions, the recognition systems design flow and the realization process, finally we produce the

10、 experimental result and the simple analysis.Kewords: Pattern Rocognition BMP Classification Template Match Hand-written Chin ese Characters Recog nition第1章绪论41.1模式识别中的一些基本概念41.2模式的描述方法41.3模式识别学科介绍及现状51.4论文的主要研究工作6第2章模式识别系统及位图基础62模式识别系统结构62.2图像识别72.2.1图像识别简介72.2.2图像识别过程82.3位图基础知识92.3.1图像文件格式介绍92.3.2

11、 BMP文件结构102.3.3 CDib类的建立12第3章分类器设计143特征空间优化设计问题143.2分类器设计准则153.3类器设计基本方法163.4判别函数173.5训练与学习18第4章 模板匹配分类器识别汉字系统的实现194系统的功能描述194.2模板匹配法的理论基础194.3特征类的设计204.4系统的设计流程及功能的具体实现214.5实验结果和分析25结束语26致谢词27参考文献28附录29IIT第1章绪论1.1模式识别中的一些基本概念模式识别(Puttem Recognition)就是机器识别、计算机识别或机器自动识 别,FI的在于让机器自动识别事物。如木文所研究的手写汉字识别就

12、是将手写 的汉字分到具体的汉字类别中。模式识别研究的内容是利用计算机对客观物体 进行分类,在错误概率最小的条件下,使识别的结果尽量与客观物体相符合。模式识别中的一个基木概念是相似度(similarity),这和已知的其它一些学 科方法都不相关。一般认为两个对象相似是因为他们具有相似的特征,相似度 经常被描述成更加抽象的概念,它并不是在几个对象之间衡量,而是在一个对 象和一个H标概念(concept)之间进行衡量。让机器辨别事物的最基本的方法 是计算待识别事物与标准模板之间的相似度。在模式识别学科中,就“模式”与“模式类”而言,“模式类”是一类事物 的代表,而“模式”则是某一事物的具体体现。例如

13、每一个汉字及标准符号是 模式类,而用户任意手写的汉字则是“模式”,识别系统要识别的就是这样一个 个“模式”。1.2模式的描述方法在模式识别技术小,被观测的每个对象称为样詁,例如本文中的每个手写 汉字可以作为一个样品,共写了 10个汉字,所以就有10个样品(X|, x2, x3, X4, X5, X6, X7, X8, X9, Xg), -共有10个不同的类别。对于一个样品来 说,必须确定一些与识别有关的因素作为研究的根据,每一个因素称为一个特 征。模式就是样品所具有的特征描述。模式的特征集由处于同一个特征空间的 特征向量表示,特征向量的每个元索称为特征,该向量也因此称为特征向量。 一般用小写字

14、母X, y, z來表示特征。如果一个样品X有n个特征,则可把X 看成一个n维列向量,该向量称为特征向量X,记作:(1.1)也丿抽取图像特征的H的是为了进行分类,识别图像。也就是把图像变成n维空间 的一个向量,实际上就是看成n维空间中的一个点,这样有利于从几何上考虑 问题,计算上比较方便。如果一个对象的特征观察值为xm2,,&,它可构成一个n维的特征向量值X,即X=X,X2,,Xn,式中X1,X2,,X*为特征向量X的各个分量。在模式识别的过程小,要对许多具体对象进行测量,以获得许多观测值,其中有均值、方差、协方差与协方差矩阵。1 均值N个样品的均值可表示为:1 N y卜升其小兀是第i个特征的平

15、均值,一 N 兀=一 V X. N 台 lJ(1.2)(1.3)2 方差s; = X. _ XN7J(1.4)方差用來描述一批数的分散程度,第i个特征的N个数的方差公式是:3 协方差与协方差矩阵:在N个样品中,第i个特征和第j个特征之间的协方差定义为:1 NS:7 N(1.5)对于同一批样品来说,很明显有:S . = S i JJi如果一批样站有n个特征X|,X2,,xno求出没两个特征的协方差,总共得 到I?个值,将这1?个值排列成以下的n维方阵,称为协方差矩阵:5=;,协方差矩阵是对称矩阵,血且主对角2“1ann 线元索SR就是特征Xi的方差Si2, i=l,2,3,-,no1.3模式识别学科介绍及现状分类识别是人类最重要的基本活动之一,在人类的日常生活、社会活动、 科研生产以及学习、工作中无吋无处不在进行着分类识别。模式识别是研究分 类识别理论和方法的科学,是一门综合性、交叉性学科。在理论上它涉及代数 学、矩阵论、概率论、图论、模糊数学、最优化理论等等众多学科的知识,在 应用上又与其他许多领域的工程技术密切相关,其内涵可以概括为信息处理、 分析与决策,它既是人工智能研究领域的重要分支,又是实现机器智能必不可 少的技术手段。该学科的理论任务是运用一切

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号