基于统计特征的脱机手写文字识别

上传人:cl****1 文档编号:508929212 上传时间:2022-11-22 格式:DOC 页数:68 大小:1.04MB
返回 下载 相关 举报
基于统计特征的脱机手写文字识别_第1页
第1页 / 共68页
基于统计特征的脱机手写文字识别_第2页
第2页 / 共68页
基于统计特征的脱机手写文字识别_第3页
第3页 / 共68页
基于统计特征的脱机手写文字识别_第4页
第4页 / 共68页
基于统计特征的脱机手写文字识别_第5页
第5页 / 共68页
点击查看更多>>
资源描述

《基于统计特征的脱机手写文字识别》由会员分享,可在线阅读,更多相关《基于统计特征的脱机手写文字识别(68页珍藏版)》请在金锄头文库上搜索。

1、 贵州大学毕业设计 第 5 页 摘 要III第一章 绪 论11.1 问题的提出11.2 研究的目的与意义11.2.1 应用方面21.2.2 理论方面21.3 汉字识别的发展概况31.4 汉字识别的问题和困难3第二章 脱机手写文字识别的原理52.1 脱机手写文字识别的原理52.2 系统设计框图:72.3 程序流程框图8第三章 常用特征提取算法及算法的确定93.1 特征提取的意义93.2 常用特征提取算法93.2.1 方法一:统计特征提取算法103.2.2 方法二:结构特征提取算法113.2.3 方法三:人工神经网络法113.3 方法的确定12第四章 手写文字识别的预处理134.1 二值化134.

2、2 文字的切分174.3去噪、归一化204.3.1平滑滤波器去噪处理214.3.2归一化234.4 细化25第五章 特征提取及文字的识别295.1 特征提取295.1.1基于笔划密度特征的提取算法305.1.2基于弹性网格特征的提取算法315.2 文字的匹配33第六章 识别结果分析35第七章 设计取得的成果及方法的改进367.1 设计取得的成果367.2 方法的改进36第八章 结论与展望378.1 结论378.2 展望37参考文献38致谢词39附录一:40附录二:48附录三:53附录四:57基于统计特征提取的脱机手写文字识别 摘 要 手写体识别有着广阔的应用前景和很高的理论价值,从应用角度来看

3、各种文档的高速自动录入,档案管理,早期图书资料的数字化,邮件的自动分拣,证件的自动阅读,票据的自动处理等方面都有广泛的应用。手书体文字识别主要分为两种,即在线识别和离线识别。 脱机手写体汉字识别研究对汉字信息处理自动化,对开拓新一代计算机的智能输入有重要意义。本论文主要讲述的是基于统计特征的脱机手写文字识别。主要介绍的是由不同的人写一个人的名字,识别出本人的签名。本文对整个设计过程进行了详细的分析说明。文中首先对用数码相机照下的分辨率为512x512,灰度级为256的手写文字图片进行预处理,包括直方图、二值化、行切分、字切分、规范化、细化等图像处理;其次,对进行预处理的文字进行特征提取,文中选

4、择了统计特征,因为与结构法相比,统计法具有良好的抗噪声、抗干扰的性能;最后识别判决。整个设计过程都以MATLAB作为编程工具实现具有友好的图形用户界面的统计特征脱机手写文字识别系统。关键词:二值化,字切分,规范化,细化,统计特征Based on Statistical Characteristic Off-line Hand-written writing recognition ABSTRACTThe recognition of the handwritten form has the broad application prospec and the very high theory v

5、alue.Form the application angle looked ,it has the widespread application in the high-speed automatic input,management of the records early digitization of the books and the reference materials,automatial sorts of the mail,automatic reading of the credentials and the the bill aspect and so on.The re

6、cognition of the handwritten mainly divides into two kinds, namely on-line recognition and off-line recognition character.The research about recognition of form and Chinese character is very important to the automation of the Chinese character, and the develops of the new generation of computer abou

7、t intelligent input.The present paper mainly tell us the off-line hand-written writing recognition on the statistical characteristic.The main introduction is to writes a persons name by the different person and disinguish myself signature.First the digital camera illuminates the resolution is 512x51

8、2, the gradation level is 256 hand-written writing picture which we carries on the pretreatment to,including histogram, binaryzation, line of segmentation, character segmentation, standardization, refinement and so on; Next, to pretreats after the picture is to carry on the characteristic extraction

9、.In the article has chosen the statistical characteristic, because compareing with the structure law, the method of average has the good anti-noise and the antijamming performance;Finally,it must decied the distinguishes. The entire design process all has the friendly graphical user interface statis

10、tical characteristic off-line writing by hand-writing recognition system by MATLAB as the programming tool realization.Key words: Binaryzation, Character segmentation, Standardization, Refinement, Statistical characteristic第一章 绪 论1.1 问题的提出文字是人类信息交流的主要载体。随着计算机、信息技术的高速发展,使用计算机处理并识别人们的文字信息也就成为了一个非常重要的研

11、究领域。文字识别技术13是指用计算机自动、高速地辨识写在纸(或介质)上的数字、英文符号或汉字,是模式识别的一个重要分支,它涉及模式识别、图像处理、数字信号处理、人工智能、模糊数学、信息论、计算机等学科,是一门综合性技术。文字识别是模式识别的一个重要分支,也是该领域最为困难的问题,它涉及模式识别亦可译作模式辨认、图象识别、图形识别、型式识别是近30年来得到迅速发展的一门新兴边缘学科。手写字符识别的发展历史可以追溯到本世纪50年代,伴随着手写板硬件的出现,人们开始研究联机手写字符识别技术。随着半导体和计算机技术的发展以及模式识别领域理论和方法研究的不断深入和完善,到80年代后期,联机手写字符识别技

12、术的研究已经朝着实用的方向努力,特别是英文,已经开始研究完全无限制的整句识别技术。然而,尽管联机手写体字符识别和印刷体字符识别技术已经比较成熟,但由于在有些场合,不能采用书写板等专用的输入设备输入文字,或文字信息已经是以手写体的形式存在,如果要利用计算机进行文字识别,就只能进行脱机手写体字符识别。研究手写文字识别对挑战现有的模式识别理论和方法;促进相关学科的发展与完以及各学科的相互融合与借鉴;对解决其他文字具有推动作用和参考价值。1.2 研究的目的与意义当今社会是一个网络四通八达、资源高度共享、信息传播迅速的信息社会。为满足资源共享、信息传播的需要,大量的中文信息都需要在计算机上进行处理。目前

13、,计算机上的中文信息处理系统,可以让人轻松愉快地对输入的中文信息进行处理。然而汉字录入的困难制约着系统的效率,己经成为一个有待解决的“瓶颈”问题。汉字识别的研究与开发,无疑将满足人们对高速自动输入汉字的强烈要求,它在办公自动化、印刷业、信息传播等方面都有着广泛的应用前景。汉字识别是一门多学科综合的研究课题,是模式识别的热点和难点。它不仅与人工智能的研究有关,而且与数字信号处理、图像处理、信息论、计算机科学、几何学、统计学、语言学、生物学、模糊数学、决策论等都有着千丝万缕的联系。一方面各学科的发展给它的研究提供了工具,另一方面,它的研究与开发也必将促进各学科的发展。因而,汉字识别有着重要的理论意

14、义。1.2.1 应用方面当前研究脱机手写文字识别的意义在于:它是中文信息录入的理想手段(计算机技术的发展,使得文字输入成为文字信息处理系统提高速度的“瓶颈”问题)。要解决这个问题,必须采用计算机自动识别文字或语音的方式。而脱机手写文字识别一直被公认为文字信息录入的理想手段;文字识别是智能计算机接口的重要组成部分(智能计算机是在更高的程度上,更完善的模拟和取代人类脑力劳动的全新一代的计算机。智能计算机能识别文字、图形和景物,能听懂语音,能理解文章等。视觉是智能计算机接受外界信息的重要手段。而识别文字是智能计算机必备的功能);文字识别技术是提高办公自动化水平的主要因素(办公自动化就是要求用计算机来

15、代替人日常的办公活动,可以借助计算机来进行文档的处理,进行工程设计等工作。在多媒体时代,图象信息占主要的比重,图象中有着大量的文字信息。文字的自动识别对图象的处理以及存储有着重要的意义);文字识别是重要的信息压缩手段(文字图象经识别后形成代码,信息量压缩了100倍以上,对文字信息压缩、传输有重要的意义);文字识别丰富和完善了模式识别的理论(手写文字识别是模式识别中的一个难题,模式的特征和分类都很复杂。对手写文字识别的研究不仅使模式识别理论与具体的应用相结合,而且推动了模式识别理论的发展)。1.2.2 理论方面 汉字识别不但在实际应用方面十分重要,在理论研究方面也有重大意义。汉字字量大,即模式类别很多,是大类别(或者称为超多类)模式识别问题,涉及到模式识别、图像处理、数字信号处理、自然语言理解、人工智能、模糊数学、信息论、中文信息处理等多个学科,是一门综合性技术,在中文信息、办公自动化、机器翻译、人工智能等高技术领域,都有着重要的价值和意义

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 营销创新

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号