视频中文字检测技术研究与实现

资源描述

《视频中文字检测技术研究与实现》由会员分享，可在线阅读，更多相关《视频中文字检测技术研究与实现（50页珍藏版）》请在金锄头文库上搜索。

1、杭州电子科技大学硕士学位论文视频中文字检测技术研究与实现姓名：郑翠翠申请学位级别：硕士专业：计算机应用技术指导教师：王毅刚;王兴起 20100101 杭州电子科技大学硕士学位论文 I 摘要随着网络技术的发展，数字化图像和视频增长非常快。随着移动数码相机以及手机等的普及，各种拍摄来的自然场景的数字图像也是到处可见。为了方便管理海量的视频和图像信息，使用户能够快速得定位自己感兴趣的视频和图像内容。产生了许多视频和图像处理及理解的实际需求，进而推动了人们对视频和图像内容的分析和研究。在视频内容分析方面，研究者主要对视频内容的结构化分析和检索技术比较关注；在图像内容分析方面，研

2、究者对场景中获取内容的分析、监控尤为关注。在上述两个领域中，文字作为一种重要的高层语意信息而显示出其重要的作用。此外，还可将提取出的文字从原图像中去除，同时修复被文字所遮挡的背景区域，进而添加上多语种的文字，这对于不同语种间的视频及图像交流和视频及图像的再次使用也是很有意义的。文字行检测实际上也是一种模式识别。不同于其它的典型模式，例如单个汉字的模式，文字行的大小、形状、颜色等都没有固定的模式。而且在很多情况下，文字所处的背景非常复杂。这些都给文字检测带来非常大的困难。所以传统的直接检测图像模式的方法是不能用来检测文字的。本文在对国内外研究现状和所涉及的基本技术综述的基础上，就

3、视频中文字检测算法做出深入探讨，并提出了两种文字检测的方法，第一种文字检测方法是利用边缘检测和局部直方图来定位文字区域。首先，用边缘检测的方法粗略定位可能的文字区域。然后用局部直方图对提取出来的粗略文字区域进行精确的定位，最后利用文字行的结构信息进行过滤，去除似文本的“假”文字区域。这个算法对于背景不是很复杂的视频有比较好的检测效果。第二种文字检测方法运用了文字的内在结构属性和视频帧的时间冗余信息来检测文字区域。首先，根据文字的内在属性设计几个文字检测器，文字有横笔画、竖笔画、对角笔画，相应的文字检测器也有横笔画文字检测器、竖笔画文字检测器、对角笔画文字检测器等。这些文字检

4、测器能够比较精确得将文字像素提取出来，然后将提取出来的文字像素连接成侯选文字区域。不同于以往的文字检测方法，在本算法中，视频帧的冗余信息被用于文字检测阶段，而非文字增强阶段。最后通过基于密度的去噪处理以及结构信息过滤等形成文字行。实验结果显示，这种文字检测效果较好。此外，本文还就视频中文字提取后的后期应用视频背景修复方法进行初步分析与实现，即：在提取出图像内的文字区域后，本文运用纹理修复技术，将提取出的文字从原图中去除，同时，修复原图中被文字遮挡的背景区域。在一些特定领域中，本文实现的方法取得了较为理想的结果。关键词：文字检测，边缘检测，局部直方图，图像修复杭州电子科技大

5、学硕士学位论文 II ABSTRACT With the network technology and digital development, digital images and video grew very fast. At the same time, with the popularity of mobile digital camera device, users can easily take a variety of natural scenes in the digital image. To facilitate browsing, management and unde

6、rstanding of the images and videos content, a number of actual needs of digital image processing and understanding are generated. Further promoted people to analysis and research the images and video content. In the area of video content analysis, the researchers are particularly concerned about the

7、 video indexing and abstracting techniques. In the areas of image content analysis, researchers are particularly concerned about the automatic acquisition, analysis and monitoring of the scene content. In these two areas, the text showed its important role because it can provide directly high-level

8、semantic information. Besides, the text can also be removed from the original image. When the background of the text area to be repaired. A lot of other lingual texts can be added. This has great significance in the exchange of images in different languages and the reuse of images. Text lines detect

9、ion is actually a kind of pattern recognition. Unlike other typical pattern, the pattern of text lines is not fixed. At the same time the background of text lines tend to be more complex. All these have brought about difficulties to text detection. So the traditional method of detection of the image

10、 model can not be used to detect text lines directly. Based on research at home and abroad , two kinds of detection methods are proposed. The first algorithm is to use edge detection and local histogram to locate the text area. First, edge detection is used to locate the rough text areas. Second, lo

11、cal histogram is used to fixed accurate text lines. Last, structural information is used to remove the factitious text lines. The first algorithm can give quite good detection results if the background of the video is not very complex. The second algorithm is to use the internal structure of the tex

12、t and video frame time redundant information to detect the text area. In the approach temporal information is introduced as the part of detection step to remove false positives. Finally as a post-processing step, density-based distribution method is employed to detect falsely detected features, that

13、 is, noises. The second algorithm also effect good. After the extraction of the text areas in the video sequences, as an application of the text detection, texture repairing technique is used to remove the text from the video. Keywords：Text Detection, Edge Detection, VGH(Variant Gray-scale Histogram

14、), Image inpainting 杭州电子科技大学杭州电子科技大学学位论文原创性声明和使用授权说明学位论文原创性声明和使用授权说明原创性声明原创性声明本人郑重声明：所呈交的学位论文，是本人在导师的指导下，独立进行研究工作所取得的成果。除文中已经注明引用的内容外，本论文不含任何其他个人或集体已经发表或撰写过的作品或成果。对本文的研究做出重要贡献的个人和集体，均已在文中以明确方式标明。申请学位论文与资料若有不实之处，本人承担一切相关责任。论文作者签名：日期：年月日学位论文使用授权说明学位论文使用授权说明本人完全了解杭州电子科技大学关于保留和使用学位论文的规定，

15、即：研究生在校攻读学位期间论文工作的知识产权单位属杭州电子科技大学。本人保证毕业离校后，发表论文或使用论文工作成果时署名单位仍然为杭州电子科技大学。学校有权保留送交论文的复印件，允许查阅和借阅论文；学校可以公布论文的全部或部分内容，可以允许采用影印、缩印或其它复制手段保存论文。（保密论文在解密后遵守此规定）论文作者签名：日期：年月日指导教师签名：日期：年月日杭州电子科技大学硕士学位论文 1 第1章绪论 1.1 研究背景及意义时至今日，数字化视频和图像已经无处不在。特别是数据处理技术的快速进步以及大容量系统的出现，计算机的应用领域对视频和图像信息的需求还会

16、不断增加，而且需要一个有效的算法对这些数据按内容进行检索，而编制索引、检索则需要一套有效的方法能理解数字图像的内容。目前的数字视频/图像主要是来自于视频会议，医学成像，数字电影及用于其他用途的监视视频。对这些数字视频/图像数据库的多媒体资料的基于内容的检索技术正在被广泛的研究，并且有着巨大的商业潜力。文字提取在视频和图像分析方面有重要的意义。比如把网络图片中的文字检测出来并对其内容进行分析，就可以为不良内容图片的监控和过滤提供有效的特征及判断依据。新闻视频中的文字标题通常指明正在播报新闻事件的人物、时间和地点等，如果能对这些文字进行提取和识别则对于高层的新闻视频内容分析和内容检索将有重要作用。在体育视频中，比赛中出现的运动员号码、比分等文字信息对于体育视频内容的分析和检索，以及对于感兴趣的运动员和精彩事件进行定位具有重要作用。可见，对于视频内容分析，特别是视频高层内容提取，文字信息和音频信息，视频信息一样都发挥着重要的作用。在自然场景内容理解方面文字提取也是具有重要的意义的。

展开阅读全文

视频中文字检测技术研究与实现

最新文档