基于灰度像素理论的碎纸片拼接方法数学建模论文

上传人:枫** 文档编号:488309520 上传时间:2024-01-27 格式:DOC 页数:32 大小:1.83MB
返回 下载 相关 举报
基于灰度像素理论的碎纸片拼接方法数学建模论文_第1页
第1页 / 共32页
基于灰度像素理论的碎纸片拼接方法数学建模论文_第2页
第2页 / 共32页
基于灰度像素理论的碎纸片拼接方法数学建模论文_第3页
第3页 / 共32页
基于灰度像素理论的碎纸片拼接方法数学建模论文_第4页
第4页 / 共32页
基于灰度像素理论的碎纸片拼接方法数学建模论文_第5页
第5页 / 共32页
点击查看更多>>
资源描述

《基于灰度像素理论的碎纸片拼接方法数学建模论文》由会员分享,可在线阅读,更多相关《基于灰度像素理论的碎纸片拼接方法数学建模论文(32页珍藏版)》请在金锄头文库上搜索。

1、基于灰度像素理论的碎纸片拼接方法摘要 常规的二维碎片拼接技术一直受到科研领域重视,它在司法鉴定、文物修复、图像处理等领域有着广泛的应用。本文研究的是二维碎片拼接技术中最典型的文档类碎纸片拼接问题。基于文档纸片色彩明确、方向一致、无重叠等特点,利用灰度理论对问题作出解决。通过图形扫描得到图像,然后通过二值化, 梯度算进行预处理,并运用皮尔逊相关性度量及方差分析算法进行匹配,以实现对纸片进行还原。本文通过MATLAB程序模型,以及图片像素灰度理论实现文档碎片的重新拼接。对于问题1,应用图像处理技术中的灰度理论建立了灰度模型I。在对得到灰度模型进行梯度边缘化预处理的方法进行模型改进,建立了边缘灰度模

2、型II。然后借助于皮尔逊相关系数算法和MATLAB软件,对附件中所提供的碎片进行排列拼接。对于问题2,采用化归思想,将二维问题渐变为一维问题。首先归纳碎片特征运用MATLAB软件对碎片进行同行分类,得到11行19列的元素;采用方差分析算法和人工干预对各行中元素进行排列,得到11条横切的图形;采用方差分析算法和人工干预对其进行排列,得以还原。本文的亮点在于对各行中元素采用方差分析算法进行左侧到右侧匹配后,同时增加了右侧到左侧的匹配检验,大大减少了人工干预的工作。关键字: 灰度理论;皮尔逊相关系数算法;梯度边缘化;方差分析算法;人工干预一、问题的重述问题一、对于给定的来自同一页印刷文字文件的碎纸机

3、破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预,请写出干预方式及干预的时间节点。复原结果以图片形式及表格形式表达。问题二、对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预,请写出干预方式及干预的时间节点。问题三、上述所给碎片数据均为单面打印文件,从现实情形出发,还可能有双面打印文件的碎纸片拼接复原问题需要解决。附件5给出的是一页英文印刷文字双面打印文件的碎片数据。请尝试设计相应的碎纸片拼接复原模

4、型与算法,并就附件5的碎片数据给出拼接复原结果。二、模型的假设1.所修复的文章必须是一张完整的文章,碎片一定可以拼接成功,并且文章纸张完整;2.碎纸片的几何尺寸完全相同,边缘清晰,且碎片中字体一致无残缺;3.在检测是否匹配时,不存在实际中不相接的碎片但匹配度相对较高的情况。4.附件中数据真实可靠。三、符号说明四 问题分析问题一的分析:4.1通过对附件1、附件2进行分析,碎片在外观形状上并无差异,所以若对碎片进行重新匹配,可以简化为对碎片边缘进行匹配。考虑先运用MATLAB中的函数将数据以像素灰度模型(gray-scale model)的形式进行读取。通过对结果和附件的观察不难发现,每片碎片列边

5、缘像素特征较为明显,因此,可以通过比较样本碎片左边与其他待测碎片的右边相关性(Correlation coefficient)大小,得到最近拟合碎片,对右边也进行类似处理。这里采用皮尔逊相关系数理论作为相关性检测的基准。选取相关性度量最高值,可以得到正确的排序序列。最后运用MATLAB中的函数将拼接后的图像进行输出。问题二的分析:4.2.1.与一维的区别和联系I.区别:1)需要匹配边数由二到四;2)一边上可用于检测匹配程度的像素点大幅减少;3)段落的首尾会影响检测时的判别。II.联系:1)都可以应用灰度理论转化为数值矩阵后进行分析;2)可以转化为一维问题,可先化成若干横条,然后11个横条进行匹

6、配或先化成若干纵条,然后19个纵条进行匹配。4.2.2.二维碎片的图像分析由图4.2.1可以发现,行间形成的空白区域可视作一条直线,列间形成的空白区域可视作为曲折的直线。并且行间距大于列间距,因此碎片的左右两侧更不容易在碎片中出现白边,白边属于分析匹配程度时的一种特殊情况,会提高分析难度,应尽量避免。另外,由于碎片上下两侧的像素点少于左右两侧,故在单边进行匹配时上下比较更容易出现错误。先成一列的难度较大,先成行较简单,并且成行后横向像素点将增加很多,易于提高成功率,有效减少人工干预。图4.2.14.2.3.归纳可能为一行的所有特征,进行编程监测以得到11行数据。采用方差分析算法对这些数据内部的

7、每列进行排序,得到11条横切的图形。然后采用方差分析算法和人工干预对其进行排列。问题三的分析:采用类似于问题二的方法对正反面分别排序,将不完整的正反面图进行覆盖,得到较完整图,然后进行人工干预,填入少量未识别碎片,得到拼接结果。五、模型的建立与求解问题一 本题考虑到文本图片有别于一般图像,具有色彩稳定,无光照因素扰乱,同时不存在碎片旋转、变形以及遮挡的因素,所以运用基于图像灰度的图像配准方法就能完美得解决文本图片的自动化拼接问题。5.1.基于灰度理论求解模型对碎片进行拼接5.2对图像建立灰度模型灰度(Gray scale)数字图像是每个像素只有一个采样颜色的图像。这类图像通常显示为从最暗黑色到

8、最亮的白色的灰度,尽管理论上这个采样可以任何颜色的不同深浅,甚至可以是不同亮度上的不同颜色。灰度图像与黑白图像不同,在计算机图像领域中黑白图像只有黑白两种颜色,灰度图像在黑色与白色之间还有许多级的颜色深度。但是,在数字图像领域之外,“黑白图像”也表示“灰度图像”,例如灰度的照片通常叫做“黑白照片”。在一些关于数字图像的文章中单色图像等同于灰度图像,在另外一些文章中又等同于黑白图像。其实际颜色越接近白色,灰度值越接近255;越接近黑色,灰度值越接近0。对附件1中19图片进行编号,分别为基于灰度理论得到附件1中19张碎片的0-255像素灰度图矩阵。运用算子提取各碎片样本的左列与右列边缘数列,标记为

9、矩阵。算子的表示:梯度幅值:用卷积模板来实现:1.2相关性度量选取碎片左右列后,需要对碎片进行重新排序,此处,进行各碎片边缘相关性度量。采用皮尔逊相关系数对相关性进行分析。两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的商:以上方程定义了总体相关系数, 一般表示成希腊字母。基于样本对协方差和标准差进行估计,可以得到样本相关系数, 一般表示成: 一种等价表达式的是表示成标准分的均值。基于的样本点,样本皮尔逊系数是:其中 简单的二维皮尔逊相关系数是两项间的差是每个变量值差的平方和再平方根,目的是计算其间的整体距离即不相似性,其中为样本量,分别为两个变量的观测值和均值。描述的是两个变

10、量间线性相关强弱的程度。的取值在-1与+1之间,若表明两个变量是正相关,即一个变量的值越大,另一个变量的值也会越大;若表明两个变量是负相关,即一个变量的值越大另一个变量的值反而会越小。的绝对值越大表明相关性越强。对每一组数据进行相关系数比较可以清楚的得出最有拟合组。例如:通过MATLAB可视化显示与拟合度最高的是即图片与相邻。图5.1.1 由上图可见,相关系数越大,说明指标性质越接近。由于碎片均是正向放置,所以令分别于进行相关性度量分析,对做同样处理,即可得到新序列。附件一结果 08141215031002160104050913181107170006 根据序列排序讲碎片进行重新匹配。考虑到

11、自动化批量处理,下面,通过程序来实现。程序流程图如下:图5.1.2 程序流程图注释:Ci,j代表第i个向量与第j个向量的相似度的值。运用MATLAB软件实现程序。重新匹配后的的图片见附录。图片贴合度满意,基本达到要求。再对附件2中碎片运用此算法进行重新排序并进行拼接。重新匹配后的的图片见附录。由此可见,本算法具有一定的可行性,符合题设要求。程序见附录。拼接结果:附件一结果 08141215031002160104050913181107170006附件二结果 03060207151811000501091310081214171604问题二本题是在问题一的基础上的延伸及复杂化,对一中的纵切结果

12、加以横切。同样,应用灰度理论模型,对各个方块碎片进行重新匹配。1. 碎片灰度化处理,提取边缘数列一、 得到特定行1.流程图2.说明此时,每一行内的各列尚为乱序,运行该程序后通过查找可知这些行内部的碎片序号。如下表所示。07324553566870931261371381531581661741751962081182326304150627686871001201421471681791911952112228495457659195118129141143178186188190192312143139517382107115128134135159160169176199203440891

13、011021081131141171191231401461511541551851942075102937444855596475929810411117117218020120661920365261636769727879969911613116216317789242535384674818810310512213014816116718919313162166106109110125139145150157173181182184187197204151727336071808385132133152156165170198200202205344243475877849094971121211241271361441491641833.程序见附录二、行内排序1.流程图2.说明此时,每一行内各列得到排序,但由于白边和逗号出现,使得单向检测存在很大偏差。故当出现以上两种情况时,记录出现情况的位置,再倒序检测匹配到那个位置,情况会得到好转。3.人工干预得到各行内正确的列序1)部分不需要更改,如第四行

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号