数学建模基于形态特征叶子识别聚类论文

上传人:小** 文档编号:89193517 上传时间:2019-05-21 格式:DOC 页数:19 大小:706.50KB
返回 下载 相关 举报
数学建模基于形态特征叶子识别聚类论文_第1页
第1页 / 共19页
数学建模基于形态特征叶子识别聚类论文_第2页
第2页 / 共19页
数学建模基于形态特征叶子识别聚类论文_第3页
第3页 / 共19页
数学建模基于形态特征叶子识别聚类论文_第4页
第4页 / 共19页
数学建模基于形态特征叶子识别聚类论文_第5页
第5页 / 共19页
点击查看更多>>
资源描述

《数学建模基于形态特征叶子识别聚类论文》由会员分享,可在线阅读,更多相关《数学建模基于形态特征叶子识别聚类论文(19页珍藏版)》请在金锄头文库上搜索。

1、西北大学研究生数学建模竞赛承 诺 书我们仔细阅读了西北大学数学建模竞赛的竞赛规则与赛场纪律。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们参赛的题目是(从A/B中选择一项填写): C 参赛队编号为: 1069705 所属院系(请填写完整的全名):

2、数学学院、信息科学与技术学院 参赛队员 (打印并签名) : 1. 耿妍 2. 朱锐 3. 卫柄岐 日期: 2015 年 5 月 3 日评阅编号(由校组委会评阅前进行编号):西北大学数学建模竞赛编号专用页评阅编号(由校组委会评阅前进行编号):评阅记录:评阅人评分备注 评奖结果:世界上没有两片相同的叶子摘要本文通过分析叶子图片,建立了形状、边缘、颜色特征的数学模型,使得任意给出测试的叶子图片,我们能判断出它为某种树叶的概率,对于大量的树叶样本图片我们可以根据特征的相似性大小进行分类。在问题一中,我们给形状、边缘、颜色特征分别建立数学模型并将这些特征数字化。对于形状我们又将其细分为表面积、矩形度、伸

3、长度,但是观察所给的数据叶片有可能发生旋转、平移、伸缩,为了克服这些外在因素造成的误差,我们添加不变特征,这样我们的特征描述就比较细致。对于边缘这一特征,由于叶子边缘函数没有规范性,而且在二维上表示,这样对我们的研究带来很大困难,所以我们通过傅里叶描述子将二维图像通过复坐标的形式降到一维,从而简化了问题。对于颜色这一特征,我们将用颜色矩来表示。与颜色直方图相比,该方法的另一个好处在于无需对特征进行向量化。在问题二中,通过分析有关叶子的形状,边缘,颜色的数据可以得出叶子的形态学数据是服从正态分布的,因此我们可以算出叶子的每个形态学数据样本的均值和方差,即可得到样本每一个形态学数据的高斯分布图,但

4、比较两种叶子的同一个形态学数据的时候在一个图像中却显示了两个正态分布的图像。所以综合多种特点,我们选择用贝叶斯分类器对给出的测试叶子计算为某种叶片的概率。在问题三中,我们将叶片的相似性转化为数学语言,即距离。把每个样品看做一个点,将它们对应的特征值为点的值,通过欧几里得距离的大小来判断叶片的相似性。在这一问中我们分别考虑了独立形状、边缘、颜色和综合考虑这些特征,得出了特征越多,分化越细。并且在这一问中我们通过谱系图的建立使得分类结果更清晰。关键词 不变矩阵法,贝叶斯算法,聚类分析一、问题描述1、通过对所给的二百二十组叶子图片的观察,发现形状,边缘,颜色是区分不同种类叶子的最显著特征,所以我们的

5、目的就是将叶子的形状,边缘,颜色特征通过函数数字化,从而定量的分析了不同种类叶子的特征是不同的。2、同一类植物的两片叶子特征经过同一个函数计算,其值不可能完全相同,所以我们需要根据问题一的模型算出给出的测试叶子有可能是那种植物,它的概率有多大。3、对于任意给出的大量叶片,根据叶子特征的相似性,将这些叶子进行归类。二、问题分析问题一:题目中给出的只有叶子的图片,我们只能通过肉眼看出它的形状、颜色、边缘。要求出数学模型,将图片数字化就需要知道图片在计算机中的存储方式。它是被分成像素,用每个像素的灰度值去存储。这样一来我们就可以将图片用离散的点来表示。从而构建了它们的特征模型。问题二:要想知道所给叶

6、子是什么叶子,就要综合考虑它们的特征,但是叶片的三个特征是相互独立的。如何能综合多个特征求概率就是我们要解决的。问题三:叶子的相似性就是由他们的特征所决定,这在问题一将被解决。根据这些特征将叶子进行分类,所以选取那种分类方法就是本问题的关键。三、基本假设1、叶片没有残损卷曲2、不考虑纹理特征四、符号说明符号意义每个像素点的灰度值灰度化后的二值矩阵叶子高度叶子宽度叶子表面积矩形度伸长度不变特征 一阶矩(平均值颜色) 二阶矩(标准方差) 三阶矩(三次根非对称性)图像第个颜色通道分量中灰度级为的像素出现的概率边缘复坐标五、模型的建立与求解5.1问题一:5.1.1形状模型建立与求解:图像在计算机里被分

7、成像素,每个像素的灰度值被整数化。为了防止图片平移,旋转,缩放带来的误差,我们首先将图片归一化,使之变为具有固定标准形式。不考虑图片颜色我们将在形状方面忽略颜色的影响,即将其灰度化,设灰度化后的图像二值矩阵为。我们将形状分为了十个特征来描述:表面积、矩形度、伸长度以及不变矩阵的七个不变特征。对于不变矩阵的七个不变特征,我们选择用二阶和三阶中心距来构造,因为这样能使它们在连续图像变换下可以保持平移、缩放、旋转不变。形状模型如下:,;归一化的中心距离定义为:,其中七个不变矩为 形状模型仿真:首先,我们任意选出一种叶子图片,图(5-1)是附件中135号样品图片的一个代表;图(5-2)是附件中153号

8、样品图片(5-1) (5-2)通过对叶子模型的运行,我们得到了每片叶子的十个特征值,由于空间有限,我们只列出前十个数据。其中行为叶片特征,列为叶片序号。如图,(5-3)是样品135的特征值;(5-4)是样品153的特征值叶片的形状特征图(5-3)(样品135)叶片的形状特征图(5-4)(样品153)5.1.2边缘模型的建立对于这一特征,由于叶子边缘函数没有规范性,并且在二维上,这样对我们的研究带来很大困难,所以我们选择用傅里叶描述子把二维图像轮廓简化成一维问题进行处理。傅立叶描述子的基本思想是对图像边界进行傅立叶变换作为形状描述。首先假定物体的边缘表示为一个坐标序列,其中。用复数来表示每一个坐

9、标,即,对于封闭边界,这一序列是周期的,为N,这样二维坐标下的边界就可以在一维空间上表示。尽管对序列进行了重新解释,但边界本身的性质并未改变。当然,这种表示方法的一个优点就是:把二维问题简化为一维问题。的离散傅立叶变换(DFT)表示为: (1)复系数叫做边界的傅立叶描述符.这些系数的反向傅立叶变换存在于: (2)傅立叶变换的高频分量对应细节而低频分量对应总体形状,在图像检索和图像识别中使用傅立叶描述子时,为了减少使用描述子进行图像相似度判别时的计算量,可以只用一部分对应低频分量的傅立叶系数来近似描述边界形状。边缘模型仿真:同样对样品135和样品153进行分析,表中的横坐标表示边缘的周长、面积、

10、周长面积比、圆形度、方形度、对比度。纵坐标为前十个图片的序号。其中(5-5)是样品135对应的部分边缘特征;(5-6)是样品153对应的部分边缘特征。 叶片的边缘特征图(5-5)(样品135) 叶片的边缘特征图(5-6) (样品153)5.1.3颜色模型建立:对于这一特征,我们将用颜色矩来表示。与颜色直方图相比,该方法的另一个好处在于无需对特征进行向量化。因此,图像的颜色矩一共只需要9个分量(3个颜色分量,每个分量上3个低阶矩),仅采用颜色的一阶矩,二阶矩,和三阶矩就足以表达图像的颜色分布。一阶中心矩,二阶中心矩和三阶中心矩分别表示图像或子区域图像的平均颜色,标准方差和三次根非对称性。三个颜色

11、矩的数学定义:(1)(2)(3)由于每个像素具有颜色空间的三个颜色通道,因此图像的颜色矩由9个分量来描述:颜色模型仿真:对样品135和样品153通过模型求解得到了其对应的部分图(5-7)、(5-8)。图中的横坐标表示图像颜色矩的九个分量。叶片的颜色特征图(5-7)(样品135)叶片的颜色特征图(5-8)(样品153)5.2问题二5.2.1模型建立与求解通过特征提取得到有关叶子的形状,边缘,颜色的数据。以下我们就以样品135的矩形度为例,通过矩形度生成分布图可以发现叶子的形态学数据是服从正态分布的,因此我们可以计算出叶子的每个形态学数据样本的均值和方差,即可得到样本每一个形态学数据的高斯分布图。

12、叶子矩形度数据生成的分布图(5-9)(样品135)通过上面的图可以看出,叶子形态学的数据成正太分布,正好符合贝叶斯分类的先决条件。因此,我们可以利用贝叶斯来进行叶子的分类。贝叶斯原理: 贝叶斯公式: 代表类别,代表特征,我们做出预测肯定是利用当前的特征,来判断输出的类别。 我们可以看到贝叶斯公式先验与后验概率之间的转换,很明显,在我们的定义里面是后验概率,也是我们想要得到的东西。而我们已知先验概率,以及条件概率。对于多类的分类来说,都是一样,所以此项可以略去。那最终的结果就是计算这一项,是可以通过观察来解决的,我们有三类种子可以通过观察知道。上面对于此项的解释是在类中,特征出现的概率,其实简单

13、来讲,就是的概率密度。 这样通过先验概率到后验概率的转换即可进行分类。 5.2.2形态学通过贝叶斯分类这里是针对叶子数据中的一个形态学数据进行的分析,当比较两种叶子的同一个形态学数据的时候通过计算类条件概率曲线,可以分辨出该特征分类是否明显。如下:是颜色矩形成的类条件概率。我们是通过对样品135和样品153进行实验。如图是样品135和样品153的颜色矩特征的分析 颜色特征类条件概率密度曲线(5-10)(样品135和 样品153)从上图可以看出产生的有关颜色矩特征的概率密度曲线的阈值可以很容易的分开两类叶子。因此,颜色特征是对样品135和样品153分类的重要依据。 通过计算形成颜色特征后验概率密度曲线。 颜色特征类后验概率曲线(5-11)(样品135和 样品153)通过后验概率曲线图也很容易看出两类通过颜色分类很容易。实验结果:选取一张类似135类中的叶子,通过计算判定是135类的概率是0.8234。是153类叶子的概率为0.1766。通过比较可以说明利用颜色

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号