载波片图像分类模型解答

上传人:子 文档编号:41223997 上传时间:2018-05-28 格式:DOC 页数:17 大小:1.04MB
返回 下载 相关 举报
载波片图像分类模型解答_第1页
第1页 / 共17页
载波片图像分类模型解答_第2页
第2页 / 共17页
载波片图像分类模型解答_第3页
第3页 / 共17页
载波片图像分类模型解答_第4页
第4页 / 共17页
载波片图像分类模型解答_第5页
第5页 / 共17页
点击查看更多>>
资源描述

《载波片图像分类模型解答》由会员分享,可在线阅读,更多相关《载波片图像分类模型解答(17页珍藏版)》请在金锄头文库上搜索。

1、 1 / 17载波片图像分类模型解答载波片图像分类模型解答摘要摘要在利用载波片判定有毒物质种类及浓度过程中,如何根据已知类别的图像数据提取 特征,构造分类方法;如何利用已构造的分类方法对未知类别的图像进行有效分类, 并能进一步对分类的物质反应时间进行估计? 本文围绕上述问题进行了科学的分析求解及判定:首先,对大量的图像信息,我们 依次对每张图进行“去边框处理” , “底板变黑” , “反色处理” , “ 搜索方法找特征像 素点” , “聚类分析求中心点” , “中心点排序”等滤波,去噪,采样操作得到目标图像的特征数据:每张图上 36 个圆斑的中心坐标,及该圆斑的平均色度向量。(,)iiiR G

2、 B接着以每张卡片作为一个样本对每个圆斑的平均色度向量降维,使其变成一维向量。 其后利用距离判别法对待测样本进行判定。得到如下分类结果: 属于第一类(“Tea_Orange”)的待判定样本有 10 个: (2、3、6、8、9、14、17、18、20、21)属于第二类(“Tea_orangespice” )的待判定样本有 5 个:(1、7、10、11、15)属于第三类(“Tea_spiced_chai” )的待判定样本有 5 个:(12、22、26、28、29)属于第四类(“Tea_sweet” )的待判定样本有 7 个: (19、23、25、27、31、32、33) 由于兰氏、欧氏距离判别对样

3、本(4、5、13、16、24、30)的判定结果不一致,我 们把此六个样本定为不可判定样本。接着我们采用交叉确认估计法对分类结果的误判 率进行估计,得到两种距离判别法的误判率分别为:9.9%(欧氏距离)和 9.6%(兰氏 距离) ,鉴于本题的复杂性我们认为此结果基本合理。 在问题三的处理过程中,我们根据两种距离运用线性插值的方法对待测样本的反应 时间进行估计并得表 1 所示结果: 表 1:时间估计关键词:聚类分析求中心点、中心点排序、距离判别法、线性插值2 / 17一、一、 问题重述在某种载波片上选取 6 行 6 列 36 个圆形区域分别涂上不同的化学反应物质,让其与 有毒物质(如有毒气体、液体

4、、固体粉沬等)充分接触,根据不同区域反应后的特征可 以用来判别有毒物质的种类和浓度等。我们现在积累有四组实验数据分别表示对不同物质反应的载波片图像文件。文 件名信息记录了实验的序号、反应时间等信息。每次实验根据反应时间不同采集了多 幅图片,且每次实验选取的有毒物质浓度基本相同。但由于图像通过扫描时存在有一 定的角度偏差,所以我们需要对其进行校正! 在本论文中我们需要解决下面三个问题: (1)请根据已知类别的图像数据提取特征,构造分类方法。 (2)用构造的分类方法对另外 33 个未知类别的图像(可能存在不属于上述 4 个类别的数 据)进行分类,并写出结果。 (3)在(2)的基础上,对判定的物质估

5、计反应时间,并写出结果。二、二、 模型假设1假设每张载波片上的每个圆斑的颜色可看作一种颜色 2同组同一次数下不同时间做实验待测物质的浓度基本一样 3待测样本的拍摄时刻不能超出 240 分钟。 4我们确信题目所提供的已经分类的图片确实属于原来的类别。 5假设颜色的三个指标 R、G、B 在两个时刻间均匀变化。 6假设除(R、G、B)指标不考虑颜色的饱和度,亮度等其它因素。三、三、符号说明3 / 17序号符号名说明 1ix第 i 个样本的数据信息2it第 i 个待测样本的反应时间3iu第 i 类物质的中心点4 ijn第 i 类物质判定给第 j 类物质的个数5A组成的交叉确认估计矩阵ijn6 ijd第

6、 i 个待测样本与第 j 类物质中心点的欧氏距离6( )ijLd第 i 个待测样本与第 j 类物质中心点的欧氏距离7 tui第 i 类物质在 t 时刻的中心点8P距离判别法的误判率四、问题分析问题 1:根据题目提供图片,运用图片数据提取,挖掘等技术编程得到每张图片上 36 个圆斑的准确色度向量。问题 2:利用问题 1 中的数据,把数据维数降到一维后,求取每类物质的中心点,并 利用兰式距离和欧式距离判别法分别对待测样本进行判定,最后运用交叉确认估计法 对误判率进行估计,判断判别方法的可靠信。问题 3:通过求解问题 2 的得到了每个待测样本所属类别。在此基础上我们将照时间 尺度标准,找出各组在不同

7、时刻的中心点。利用欧氏距离,求出每个待测样本与同类 物质各时刻中心点的距离,找出与之距离最小的两个中心点。则该样本的反应时间就 应介于此两个中心点所对应的时刻之间。最后我们运用线性差值的方法求解出该样本 具体反应时间。五:模型建立及求解问题问题 1:图片数据的提取:图片数据的提取:为了便于问题的说明,我们随机抽取了一张图片:“JH.1.6.Tea_sweet.varies.110904.KSS311004.P1.120min.jpg”作为例子来讲述图片数据的提取过程。为了校正图像在扫描时的角度偏差,我们首先对原始图片在“CorelDRAW”软件中进行校正旋转(图 2 所示) ,接着在“画图”工

8、具中进行简单切4 / 17割,去掉图像区外的边框,杂色等的干扰(图 3 所示) ,通过对图 3 进行“底版变黑” 处理(图 4 所示)可初步把载波片中的目标图像从背景图像中分离出来。图 1:处理前的图像 图 2:旋转后的图像由于每张图片上都包含 36 个分离的圆斑,所以不能直接对目标图像(各个圆斑)的 色度特征进行提取。必须先对卡片内的每个目标图像进行定位即先求解出每个圆斑的 中心点坐标再去求其色度向量。为此我们接着对图 4 进行反色处理(图 5 所示) ,以排 除各个圆斑颜色各异的干扰,并过滤掉背景图像。图 3:简单切割去外围边框后的图像 图 4:底版变黑处理后的图像 5 / 17图 5:反

9、色处理后的图像 图 6:利用搜索出像素点坐标绘制的特征 图 然后利用搜索方法利用 MATLAB 编程搜索图中各个圆斑内的特征像素点的坐标,据搜 索出的坐标绘制出图形(图 6 所示) ,结果表明从每个圆斑内采集到的特征像素点都聚 集在一定区域,根据聚类分析原则中的最短距离分析法,将所有的点分成 36 类(每个 圆斑即为一类) 。再据分类结果求出每一类的中心点坐标,据坐标绘制出中心点,反映 在各自特征像素点图像上的效果如图 7 所示:图 7:中心点的图像分布(中心红色圆所示) 从图 7 看出:所求中心点位置很好的标识了各个圆斑的中心位置。但由于在聚类 分析过程中把圆斑的顺序打乱,导致数据在降维为一

10、维时,从圆斑提取的数据位置与 真实位置相异。所以,我们必须对每一个中心点,进行定序,以保证提取得每一个数 据在位置上的对应。例如:6 / 17由于程序得到的中心点的序列是不规则的,所以我们有必要将中心点排序 1)将原来的 36 个中心点坐标 b 的两个坐标分别在其方向上分为六类,并计算出每一类的均值 2)将 1)中得到的 x 方向的六个均值和 y 方向的六个均值组合,这样即可得到 36 个标准的中心点坐 标图图 9:中心点定序示例图 3)将原来的 36 个中心点与本程序得到的标准的中心点进行比较,如果中心点与标准的中心点之差 距离相差小于某个值,就把中心点的序号定为与其对应的标准点的序号基于模

11、型假设 1:每张载波片上的每个圆斑的颜色近似看作一种颜色,所以对于每 个中心点我们以之为圆心,取一个相对较小的半径 2 画圆,取这个圆内所有特征像素 点的色度(R,G,B)的平均值,可以有效表征该圆斑的颜色信息。即每张卡片上的每个 圆斑都能通过一个色度向量来代替。如此得到与该图片包含的有效信息基本等量的 36 个色度向量,按照公式 1 的放置格式得到如表 1 所示的色度数据形成 108 1的向量。(公式 1)123612361236( )(,)TX iR RRG GGB BBK KK KK K如此遵循图 8 所示的图像数据提取流程,参照上述样例的具体操作过程完成题目中 所有图像的数据提取过程。

12、为接下来的模型建立及求解准备好数据资源。问题问题 2 2:分类模型的构造及判定:分类模型的构造及判定7 / 175.2.1:四个已知类别的编号 为了便于算法描述,程序执行我们对已知的四个类别分别进行编号如下表 2表 2:四个已知类别编号 类别名Tea_OrangeTea_orangespiceTea_spiced_chaiTea_sweet对应编号12345.2.2:各个类别中心点的求解 为了便于待判定样本分类模型的建立以及后续模型的求解,我们需要知道每个样本 到各个类别的距离。而对于到类别的距离,我们采取待判定样本到每个已知类别的中 心点的距离来计算,所以基于以上情况,我们需定义一个求解各个

13、已知类别中心点的 算法,如公式 2 所示:(公式 2)为第 i 类样本的中心点,为的向量。iu108 1在 matlab 中把此算法编程实现,求解出各个类别的中心点。5.2.3 欧氏距离求解由于我们提取后的数据,是一个降维为一维存放的向量,我们可以采用公式 (3)来计算待判定数据和已知类别的数据之间的距离: 1 221(2)()pijiaja adxu=-(公式3)通过 matlab 编程,即可求出第个待判定样本与第类数据的空间距离。ij最后比较,的大小即可判别第个待判定数据的类别。1 id2id3id4idi5.2.4 兰氏距离求解:1( )4naiaj ij aaiajxudLxu=-=+

14、(公式)同理对于利用兰氏距离,运用同样的方法,编程实现其算法再次对待测样本进行 分类。 5.2.5 分类模型科学性检验 通过分析可以发现,欧氏距离和兰氏距离侧重点各不相同,为了以后分析的正确性, 与科学性,我们用交叉确认估计分析法分别对两种判定方法的误判率进行求解。 5.2.5.1 交叉确认估计分析法的过程(,iixuxiNN类物质为第类的样本总数)8 / 17交叉确认估计分析法的核心是通过对已知类别的再次判定,与已知的类别结果 进行比较,来计算判定方法的的误判率其具体过程如下:1)从已知类别第 1 类(即 Tea_Orange 类)的容量为(在 Tea_Orange 中=99)1n1n的训练

15、样本中,剔除其中一个样品,用剩余的的训练样本和其他类别的所有个训1(1)n 练样本一起建立判别函数; 2)用 1)得到的判别函数判定提出的类别中的样本应该属于那一类 3)将 1)中剔除的样本返回到原类中继续作为训练样本4)重复 1) ,2) ,3) ,对第一类的个样本进行判定,并得出1n1 jn表示对第一类中所有的训练样本通过我们的判定方法得出的将本来属于第1 jn一类的样本判定为其他类别的个数5)按照 1) ,2) ,3) ,4)的处理,依次计算出234,jjjnnn通过上面的分析,我们得到下面的交叉确认估计矩阵:11121314212223243132333441424344nnnn nnnnAnnnn nnnn 分析该矩阵可以得出我们判定方法的误判率求解公式为:(公式 5) 将上面描述的流程转化为 matalab 程序我们得到如下结果 1)使用欧氏距离判定法的误判率()ij ijij ijnij pn 9 / 17交叉确认矩阵: P9.9%91124252 931582 212283A 2)使用兰氏距离判定法的误判率交叉确认矩阵: P9.6%87 431256 711680 322183A=对两种判定方法进行分析,可以发现两种判定方法的误判率并不大,因此,在精度 要求不太高的情况下,我们可以采用这两种判定方法。5.2.6 对欧氏距离和

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号