手写识别模式识别实验论文

资源描述

《手写识别模式识别实验论文》由会员分享，可在线阅读，更多相关《手写识别模式识别实验论文（16页珍藏版）》请在金锄头文库上搜索。

1、手写数字识别系统的设计与实现摘要手写体数字识别是文字识别中的一个研究课题，是多年来的研究热点，也是模式识别领域中最成功的应用之一。主要功能是通过在点击手写数字识别菜单下的绘制数字标签弹出的绘制数字窗口中完成数字的手写，在此窗口中可以进行数字的保存及清屏，然后通过文件菜单中的打开标签打开所绘制的数字，从而进行数字的预处理，其中包括灰度化及二值化处理，然后进行特征提取，最后实现数字的识别。利用 Matlab 程序设计的相关知识，运用模块设计等相关技术，最终完成手写体识别综合设计。实验结果表明，本系统具有较高的识别率。关键词：绘制数字;预处理;特征提取;特征库;数字识别1 前言自上世纪六十年代以来

2、，计算机视觉与图像处理越来越受到人们的关注，并逐渐成为一门重要的学科领域。而作为它们的研究对象的数字图像，也因为它含有研究目标的丰富信息而成为越来越重要的研究对象。图像识别的目标是用计算机自动完成某些信息的处理，用来替代人工去处理图像分类及识别的任务。手写数字识别是图像识别学科下的一个分支，是图像处理和模式识别领域研究的课题之一，由于其具有很强的实用性一直是多年来的研究热点。由于手写体数字的随意性很大，例如，笔画的粗细，字体的大小，倾斜等等都直接影响到字符的正确识别，所以手写体数字识别是一个很有挑战性的课题。在过去的数十年中，研究者们提出了许多的识别方法，取得了较大的成果。手写体数字识别实用性

3、很强，在大规模数据统计(如例行年检，人口普查)，财务，税务，邮件分拣等等应用领域中都有广阔的应用前景。本课题拟研究手写体数字识别的理论和方法，开发一个小型的手写体数字识别系统。在研究手写体数字识别理论和方法的基础上，开发这样一个小型的手写体数字识别系统需要完成以下主要方面的研究与设计工作：手写数字绘制的问题、数字的预处理问题、特征提取问题、特征库的建立问题、数字识别问2 课题的背景2.1 手写数字识别的发展模式识别是六十年代初迅速发展起来的一门学科。由于它研究的是如何用机器来实现人及某些动物对事物的学习、识别和判断能力，因而受到了很多科技领域研究人员的注意，成为人工智能研究的一个重要方面。字

4、符识别是模式识别的一个传统研究领域。从 50 年代开始，许多的研究者就在这一研究领域开展了广泛的探索，并为模式识别的发展产生了积极的影响。手写体数字识别是多年来的研究热点也是字符识别中的一个特别问题。手写体数字识别在特定的环境下，如邮政编码自动识别系统，税表和银行支票自动处理系统等一般情况。当涉及到数字识别时，人们往往要求识别器有很高的识别可靠性，特别是有关金额的数字识别时，如支票中填写的金额部分，更是如此。因此针对这类问题的处理系统设计的关键环节之一就是设计出高可靠性和高识别率的手写体数字识别方法。这个领域取得了飞速的发展，部分是由于更好的学习算法，部分是由于更优良的训练集。美国国家科学学会

5、（NIST）建立了一个包含 60000 个经过标注的数字的数据库，它已经成为对新的学习算法进行比较的性能测试标准。然而可以说还没有哪个手写体数字识别器达到完美的识别效果。2.2 手写数字识别研究的意义手写体数字识别是文字识别中的一个研究课题，是多年来的研究热点，也是模式识别领域中最成功的应用之一。手写数字识别的研究不仅存在很大的应用价值，由于手写数字识别本身的特点，对它的研究也存在着重要的理论价值：1) 阿拉伯数字作为唯一被世界各国通用的符号，所以对手写体数字识别的研究基本上与文化背景无关，各地的研究工作者可以说是基于同一平台开展工作的，有利于研究的比较和探讨。2) 手写数字识别应用广泛，如税

6、表系统，银行支票自动处理和邮政编码自动识别等。在以前，这些工作需要大量的手工录入，投入的人力物力都相对较多，而且劳动强度较大。为了适应无纸化办公的需要，大大提高工作效率，研究实现手写数字识别系统是必须要做的。3) 由于数字类别只有 0-9 共 10 个，比其他字符识别率较高，可将其用于验证新的理论或做深入的分析研究。许多机器学习和模式识别领域的新理论和算法都是先用手写数字识别进行检验，验证其理论的有效性，然后才会将其应用到更为复杂的领域当中。在这方面的典型例子就是人工神经网络和支持向量机。4) 手写数字的识别方法很容易将其推广到其它一些相关的问题上，如对英文之类拼音文字的识别。事实上，有许多学

7、者就是把数字和英文字母的识别放在一起研究的。3 数字识别系统的设计方案在本文中书写数字识别程序用 Matlab 来实现，程序实现了窗口显示，在显示的窗口中实现手写数字的输入、识别、学习过程。在最初的样本中可能没有包括全部的数据，所以程序中的学习功能能增加程序的可用性，更加人性化。在数字识别时主要使用了 Bayes 决策。3.1 数字识别系统功能需求根据对用户需求的分析，系统应包含以下功能：1）数字的获取在绘制数字的窗口中实现数字的手写，并对其坐标值进行保存，利用复位按钮可实现数字的清除工作。2）数字的预处理在手写数字图像识别系统中，图像的预处理跟一般图像系统不同，我们不需要对图像进行灰度化处理

8、、去噪处理等基本操作，我们利用程序保存的坐标值就可以对生成一张二值化图像，相当于图像处理系统的二值化处理。3）特征的提取在第二步中我们得到了手写数字的二值化图像，进行特征提取前需要对此图像的数据区域进行定位，在程序中我们遍历此二值化图像，找到手写数字区域的上、下、左、右边界，重新生成一张数字图片，利用新生成的数字图片分成 5*5 的区域，统计每个区域的目标像素个数和整个小区域像素个数，计算目标像素个数与整个小区域像素的比值，得到 25 个特征值，作为这个手写数字的特征值。4）特征库的训练我们需要训练一个特征库，作为识别的标准。系统中我们手写一个数字提取出它的特征值，再输入此手写数字，将数字与这

9、些特征值相对应存储到特征库里面，特征库我们使用的是 Access 数据库，字段是数字及这个数字所对应所有特征值。特征库越丰富，识别率越高。5）数字识别在手写数字识别中，我们使用的方法是模板匹配法，其实质就是提取出手写数字的特征值，利用这些特征值与特征库的数字的特征值进行比对，找出待识别数字特征值与特征库里存储的特征值最接近的数字，作为识别结果。一般分为左右两部分，左半部分完成未知类别模式的分类；右半部分属于设计分类器的训练过程，利用样品进行训练，确定分类器的具体参数，完成分类器的设计。而分类决策在识别过程中起作用，对待识别的样品进行分类决策。图 1 数字识别系统的基本结构3.2 贝叶斯方法原

10、理Bayes 方法是模式识别中的一种经典方法。用 Bayes 方法进行分类时需要满足两个前提条件。其一是各类别的总体概率分布是已知的,也即类条件概率密度 P(X|Wi)和先验概率 P(Wi)是已知的；其二是决策类别数目已知。类条件概率密度函数 P(X|Wi)是指在已知某类别 Wi 的特征空间中,出现特征值 X 的概率密度,也即在 Wi 条件下出现 X 的概率密度。其中对于待分类样本数字 X ,Bayes 公式可以计算出该数字分属与各个类别的概率,称为后验概率。考察 X 属于那个类的可能性最大,就把 X 归于可能性最大的那个类。在 Bayes 决策中,后验概率作为识别待分类样本的类别依据。其公式

11、可表示如下：其中,P(X|Wi)表示在 X 出现的条件下,待识别对象为 Wi 类的概率。1、基于 Bayes 决策的分类在已知先验概率和类条件概率密度函数的情况下,可以用 Bayes 方法进行分数据获取分类输出分类器设计预处理特征提取分类器确定判别函数特征选择预处理样本输入类。根据分类类别数目的不同,后验概率计算公式可以表示为不同的形式；下面分两种情况进行讨论:(1) 两类情况:待分类样本分别属于 W1 和 W2 类中的一类,在已知这两类的类条件概率密度P(X|W1)和 P(X|W2),先验概率分别为 P(W1)和 P(W2)时,对于任一个待分类样本 X,X分属于两类的后验概

12、率 Bayes 公式可以改写为:其中 i=1 或 2，针对两类情况,可以用后验概率进行判别；后验概率较大的对应的类别为该对象 X 所属的类别。(2) 多类情况:待分类样本可能的类别有 N 类,分别为 W1、W2、Wn,各类的类的条件概率密度 P(X|Wi)和先验概率 P(Wi)已知。我们可以利用式子计算待分类样本对应的各个类的后验概率,后验概率最大的对应的类别为待分类样本的类别。3.3 贝叶斯分类器设计3.3.1 设计要求已知 0-9 十个数字图片文件夹，每个文件夹内有 40 个样本，选定后 30 个为训练样本，设计程序对前 10 个测试样本进行识别，根据输出的测试结果可以得出每个字符被识别的

13、情况以及错误率，也可根据每个字符的识别情况，对识别率低的分析原因、改进处理方法。3.3.2 设计思路为了提取训练样本集测试样本的特征，首先要理解题目所提供的字符图片的基础特征，他们是位图图像，是由 0255 组成的像素点，应用 Matlab 函数可以读出由这些像素点的数据组成的矩阵，再通过面积的阈值比较将所得矩阵转换为只含 0、1 两个元素的矩阵。然后就可以对矩阵分块，统计每个矩阵块中含有数值 1 的个数，按照相同的分块方法，得到每个字符每个对应矩阵块中 1的个数大多是不同的，而同一个字符的样本每个矩阵块中数值 1 的个数是基本相等的。因此，如果按相同方法对被测试的样本进行统计，那么相同的字符

14、所得的个数也是相差不多的，因此取测试样本与训练样本的特征进行差值比较，取得最小值的即为与被测值相同的字符。3.3.3 贝叶斯分类器设计在本系统中将以使用者联机手写的数字作为测试样本。当手写一个数字时,就进行分类识别测试,得出其所属的类别,并可根据需要决定是否要学习该数字。在识别之前须首先知道先验概率和类条件概率密度函数,其中先验概率 P(Wi）可以由训练样本集中的各类数字的个数和样本总数之比近似计算；类条件概率密度函数 P(X|Wi）可以按照模板匹配等方法进行数字的区域划分再进行进一步计算得到。在得到先验概率和类条件概率密度函数以后, 可以运用 Bayes 公式进行后验概率 P(Wi|X）的计

15、算；由于手写数字 09 共有十类,该公式可以表示如下:在这是 i 为总类别数,分别为 0、1、9 等。紧接着就可以进行后验概率的比较, 其中值最大的所对应的类别即为该手写数字的所属的类别, 即:则 xWi。4 手写数字识别系统的设计与基本原理4.1 系统整体功能模块设计整体模块如图 4.1 所示：4.2 手写数字识别系统的基本原理下面分别介绍各部分工作的基本原理：4.2.1 图像的预处理图像的预处理是为了突出手写体数字的特征。在本次设计中主要包括：图像二值化处理。图像的二值化处理就是将图像上的像素点的灰度值设置为 0 或 255，也就是将整个图像呈现出明显的黑白效果。二值图像是指整幅图像画面内

16、仅黑、白二值的图像。进行图像二值变换的关键是要确定合适的阈值，使得字符与背景能够分割开来，二值变换的结果图像必须要具备良好的保形性，不丢掉有用的形状信息，不会产生额外的空缺等等。采用二值图像进行处理，能大大地提高处理效率。二值化的关键在于阈值的选取，阈值的选取方法主要有三类：全局阈值法、局部阈值法、动态阈值法。全局阀值二值化方法是根据图像的直方图或灰度的空间分布确定一个阀值，并根据该阀值实现灰度图像到二值化图像的数字图像的绘制训练特征库二值化处理特征提取数字识别主界面转化。全局阀值方法的优点在于算法简单，对于目标和背景明显分离、直方图分布呈双峰的图像效果良好，但对输入图像量化噪声或不均匀光照等情况抵抗能力差，应用受到极大限制。局部阀值法则是由像素灰度值和像素周围点局部灰度特性来确定像素的阀值的。本文采用全局阈值的方法，实现将图像二值化的功能。如果某个像素的值大于等于阈值，该像素置为白色；否则置为黑色4.2.2 图像的特征提取若直接把预处理后的数据作为输入量，进行分类计

展开阅读全文