多类小字符集自适应字符识别技术及系统的研究

上传人:li45****605 文档编号:44633123 上传时间:2018-06-14 格式:PDF 页数:132 大小:4.31MB
返回 下载 相关 举报
多类小字符集自适应字符识别技术及系统的研究_第1页
第1页 / 共132页
多类小字符集自适应字符识别技术及系统的研究_第2页
第2页 / 共132页
多类小字符集自适应字符识别技术及系统的研究_第3页
第3页 / 共132页
多类小字符集自适应字符识别技术及系统的研究_第4页
第4页 / 共132页
多类小字符集自适应字符识别技术及系统的研究_第5页
第5页 / 共132页
点击查看更多>>
资源描述

《多类小字符集自适应字符识别技术及系统的研究》由会员分享,可在线阅读,更多相关《多类小字符集自适应字符识别技术及系统的研究(132页珍藏版)》请在金锄头文库上搜索。

1、重庆大学博士学位论文多类小字符集自适应字符识别技术及系统的研究姓名:彭健申请学位级别:博士专业:仪器科学与技术指导教师:黄尚廉2002.4.1巾 文摘 要摘要本文研究了多类小字符集自适应字符识别技术及系统实现。本项睡的背景是基于手写体文字识别技术的铁路轮轴卡片 ( 表格)光电录入系统。在该项目中,需要识别的字符比较多,包括英文大写字母、阿拉伯数字、一些专用符号、部分汉字,这些字符集可能发生变化,要求识别猜度比较高。我们在对字符识别技术进行深入研究的基础上,采取了多种技术措施完成了研究任务。在字符识别技术方面、我 !l 研究了各种神经网络模型在字符识别中的应用原理, 经过比较, 我们选用多层前向

2、网络作为候选的字符分类器。 另 方面,子空间方法R神经网络一样,也是灵活构造字符分类z.实 现自适应字符识别的一个有力的工具,具有训练和识别速度快、识别精 度高的待点。我们研究了 学习子空间方法的原理,对基本学习子空0 5 3 算 法进行了改进,提出了增强的拒识规则,并改进了O j a 的子空间维数选择 算法 。( 自 动 选 择 合 适 的 特 征 和 特 征 提 取 方 法 是 实 现自 适 应 字 符 识 另 。 系 统 的 天键Z. 一。传统的3 - 符识别系统的适应能刀之所 以比较差,就在于人的 先验知识在选择特征的过程中影响太大。我们研究的重点在于如何在没有人的先验知识的情况下自7

3、提取合适的字符特征。我们从两个方面研究了字打特征的白动提取的问题 。一个方面是通过学习发现字符的不变特征a我们研究了几种统计特 征提取方法, 和基于自 适应子空间自 组织映射 ( A S S O M) 神经网络提取字符的特征提取方法。关于字符特征提取的另 一 个方面,从大量的已有特征中选择对该字符集最合适的特征。我们研究了基于粗糙集豹字符特征选择方法,对候 选特征 进行初步选择,去除明显对分类作用不大的特征,并提出了一种快速的粗糙集约简算法。在进行了初步的特征选择后,再利用主分量分析方状对特征进行进一步的降维处理,去除特征间的相关性。除了上述基于学习的字符识别方法外,我们还对可变形模板字符识

4、别技术进行了研究。可变形模板方法可以 解决一些统计和神经网 络识别方法不能解决的一些问题,其突出的优点在于q t, 充分利用人对字符形状的先验知识,不需要用大量的字符样本进行训练,它对解决小字符集识重庆大学博士学位论文别问 题具 有一定的 价值。 我在M i c h a e l R e v o w 和K w o k - W a i C h e u n g 等人的单笔划的数字识别研究的基础上,对他们的方法作了一定改进,将其 应用到多笔划 的英文字母 的识别上 。在实用系统 的研究中,为了提高字符的识别率 ,我们提 出了一种表格描述 和智能分析方法,通过表格描述和定义,将 较大的字符集按表格中不同

5、的填 写位置分解为一系列较小的字符集,从而大大提高了识别精度。这 是一种非常有 效而实用的方法。此 外,在我们提 出的表格 描述和分析方法基础上,我们实现了一套智能表格分割算法,其中包括一种利用表格线的单色表格 的快速分割算法 。如果用 一个方法 固定的字符程序来识 别程 序来识别所有这些字符集显然不能得到好 的识别效果,我 们需要识别系统能根据不同的字符集的特 点自动作相应 的优化和调整。 为 了解 决多个字符集识别器的设计问题 ,我们提出并实现 了一个能 自动根据所要识别的字符集选择最优识别方案的 自适应字 符识别系统。该系统在传统的神经网络和统计学习方法的基础上,通过一个 自适应控制模块

6、 ,使系统能根据要识别 的字符集 自动选择合适 的识别方案。该模型 的主要思想是:将各种字符特征提取 方法 和分类器形成一个函数库 ,我们随时可 以对这个函数库进行扩充。自适应控制模块从函数库中按一定的规则选取合适 的特征提取函数和分类函数,然后对识别器的参数进行训练 ;随后 用测试字符样本作自动作识别率测试并对测试结果作详细记录,自适应控制模块根据测试结果自动对特征提取和分类器方案作调整,这样大大 减轻了设计者的 工作量。 我们实现了 所提出的自 适应字符识别 系统模型, 并 在 实 用 中 取 得 了 较 好 的 效 果 Y、 _ _了岁、 /关 键词 :自 适 应 字 符 识 Ij ,

7、字 符 识 别 r 统, 表 格 饭 别, 可 变 冤 模 板,自动特征提取 ,神经网络英文摘要Ab s t r a c tT h e a d a p t i v e r e c o g n i t i o n t e c h n i q u e s a n d a n a d a p t i v e c h a r a c t e rr e c o g n i t i o n s y s t e m f o r m u l t i p l e s ma l l - c h a r a c t e r - s e t s a r e i n t r o d u c e d i n t h i

8、sp a p e r . T h e b a c k g r o u n d o f t h i s p r o j e c t i s t o d e v e l o p t h e O C R B a s e dA u t o ma t e d E n t r y a n d Ma n a g e me n t S y s t e m o f Ma i n t a i n i n g C a r d s o f T r a i nWh e e l s f o r a c e r t a i n r a i l w a y u n i t . T h e c h a r a c t e r

9、s w h i c h a r e t o b e r e c o g n i z e di n c l u d e t h e u p p e r c a s e E n g l i s h l e t t e r s , d i g i t s , s o m e s p e c i a l s y m b o l s a n ds o me C h i n e s e c h a r a c t e r s , a n d t h e c h a r a c t e r - s e t ma y b e c h a n g e d i n t h e f u t u r e .T h e

10、 r e q u i r e d r e c o g n i t i o n r a t e i s f a i r l y h i g h . O n t h e b a s i s o f t h e d e e p r e s e a r c h o f t h e O C R t e c h n i q u e s , w e a c c o m p l i s h e d t h e r e s e a r c h p r o j e c ts u c c e s s f u l l y .We r e s e a r c h e d t h e p r i n c i p l e

11、o f t h e a p p l i c a t i o n o f v a r i o u s n e u r a l n e t w o r km o d e l s i n t h e c h a r a c t e r r e c o g n i t i o n , a n d b y c o m p a r e , w e t h i n k t h a t t h eML P s a r e s u i t a b l e f o r u s i n g i n o u r s y s t e m. O n t h e o t h e r h a n d , t h e l e

12、a r n i n gs u b - s p a c e me t h o d ( L S M) i s a p o w e r f u l t o o l t o s ma r t l y c o n s t r u c t c h a r a c t e r sc l a s s i fi e r s a s n e u r a l n e t w o r k s . We r e s e a r c h e d t h e p r i n c i p l e o f t h e L S M, p u tf o r w a r d a n e n h a n c e d r e j e c

13、 t i n g r u l e o f L S M c l a s s i f i e r s , a n d i mp r o v e d o n t h eb a s i c L S M a l g o r i t h m a n d t h e O j a s d i me n s i o n s e l e c t i o n a l g o r i t h m o fs u b s p a c e .O n e o f t h e k e y s t o i m p l e me n t t h e a d a p t i v e c h a r a c t e r r e c o

14、 g n i t i o n s y s t e mi s t o e x t r a c t r i g h t f e a t u r e s a d a p t i v e l y . T h e m a i n f a c t o r , w h i c h a f f e c t s t h ea d a p t a b i l i t y o f O C R s y s t e ms , i s t h a t h u ma n d o t o o m u c h w o r k i n t h e f e a t u r e e x t r a c t i o n a n d s

15、 e l e c t i o n . O u r p o i n t i s t o a u t o ma t i c a l l y g e n e r a t e t h e f e a t u r ee x t r a c t i o n s c h e m e s w i t h f e w h u ma n s e x p e r i e n c e s . We d o t h e r e s e a r c h i nt wo d i r e c t i o n s .O n e i s t o f i n d t h e i n v a r i a n t f e a t u

16、r e s t h r o u g h l e a r n i n g . We d i s c u s s e ds o m e s t a t i s t i c a l f e a t u r e e x t r a c t i o n m e t h o d s , a n d t h e a p p l i c a t i o n o f A S S O Mn e u r a l n e t wo r k i n f e a t u r e e x t r a c t i o n .T h e o t h e r d i r e c t i o n o f o u r r e s e a r c h i s t o s e l e c t t h e f e a t u r e s , w h i c h a r et h e m o s t s u i t a b l e f o r c l a s s i f y i n g t h e s p e c i f i c c h a r a c t e r - s e t f r o

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 毕业论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号