基于支持向量机的玉米品种识别

上传人:百*** 文档编号:94126979 上传时间:2019-08-02 格式:DOC 页数:15 大小:761.50KB
返回 下载 相关 举报
基于支持向量机的玉米品种识别_第1页
第1页 / 共15页
基于支持向量机的玉米品种识别_第2页
第2页 / 共15页
基于支持向量机的玉米品种识别_第3页
第3页 / 共15页
基于支持向量机的玉米品种识别_第4页
第4页 / 共15页
基于支持向量机的玉米品种识别_第5页
第5页 / 共15页
亲,该文档总共15页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《基于支持向量机的玉米品种识别》由会员分享,可在线阅读,更多相关《基于支持向量机的玉米品种识别(15页珍藏版)》请在金锄头文库上搜索。

1、*大学毕 业 论 文题目: * 学生姓名: * 指导老师: * 学 院: * 专业班级: * 完成时间: * 基于支持向量机的玉米品种识别摘 要:一个国家想要发展,其必须要农业作为后盾来支持,农业的发展又离不开优质的品种,因而品种的识别有重要意义本文选取农大108、郑单958、辽单565三种玉米品种来作为研究对象,采用支持向量机的算法来进行识别首先,在本文的开篇对支持向量机算法的历史及原理进行的一个简单的介绍其次,要想识别出玉米籽粒,就必须进行籽粒的特征提取,此处从玉米籽粒的数字图像中提取与玉米籽粒的形状、尺寸、颜色等有关的4个形态结构特征及1个与玉米籽粒的重量有关的质量特征最后,运用支持向量

2、机来对玉米品种进行识别对于以上5个玉米籽粒特征,其中质量特征作为本文的一个创新部分,利用支持向量机(SVM)算法进行两次训练识别,第一次的训练识别包含上面的5个特征,第二次的训练识别包含除质量特征以外的4个特征最后将两次训练识别的结果进行比较,结果表明含有质量特征的识别率更高关键词:玉米籽粒;品种识别;支持向量机1 引言农业是一国之本,是社会中唯一生产人类赖以生存的食品的产业部门其意味着农业必须存在并要不断发展我国是一个传统的农业大国,农业的发展对工业的持续快速发展,人民生活水平的快速提高都具有至关紧要的作用俗话说得好“春种一粒粟,秋收万颗子”,形象的表达出种子是最基本的农业生产资料一粒好的种

3、子,它会以高产量和高品质来回报农民一年的辛劳,给农民一年的期盼做一个完美的答复;而一粒坏的种子,却只会让农民一年的艰辛付诸东流,一年的希望变成失望由此可以看出种子的选取在农业生产过程中尤为重要选择什么样的种子,怎样选择是其关键问题,即种子品种的识别问题当今,种子检测方法1主要有种子形态鉴定法2、蛋白质电泳技术检验法、分子标记技术检验法其中,种子形态鉴定法是根据种子形状、大小、色泽、质地、表面的光与毛以及种子外表各部位的特征来加以鉴别,以区分本品种与异品种这种方法简单、经济、快速,但准确性较差,且随着现代育种科学的发展,不同品种间种子外观形态的差异越来越小,因此靠区别种子形态上的差异来鉴定种子纯

4、度也变得越来越困难对于蛋白质电泳技术检验法,它是指利用电泳技术对备检样品的种子或幼苗的蛋白质进行分离、染色,形成蛋白质电泳谱带的差异,并与标准品种相比较,从而鉴定品种的真实性和纯度的一种方法不同作物品种,基因不同,基因的直接表达产物蛋白质在种类、数量、结构等方面亦不同该法即是利用蛋白质的多态性来反映不同品种组成上的差异,从而进行品种鉴定分子标记技术即是通过对品种的多态性即减基序列的差异进行分析,从而鉴别不同品种其检测对象是种子的片段(基因),没有器官的特异性,不受环境的影响,有较高的准确性、稳定性和重复性但是对于蛋白质电泳技术检验法和分子标记技术检验法来说,不仅在技术上程序复杂,而且费用昂贵故

5、在普及上比较困难因此我们的重心必定会是去寻找另一种方法在这条道路上的不断摸索中,终于在后来发现可以使用支持向量机的方法来对种子进行识别支持向量机是Vapnik等于1995年在统计学习理论的基础上提出的一种新的机器学习算法该方法能从有限的训练样本中通过机器识别得到决策规则,且对于独立的测试样本集仍可保证较小的误差其自动、快速、准确,既能减轻专业技术人员的劳动强度,又能防止误识导致的假冒劣质种子流入市场,坑农害农事件的发生3这里就以对玉米品种的识别来进行实验2 支持向量机的概念及其原理支持向量机4(,)是在统计学习理论中维理论和结构风险最小原理的基础上发展而来的一种新的机器学习方法,是当前国际机器

6、学习界的研究热点之一支持向量机基于结构风险最小化原理,将原始数据集合通过某种映射压缩到支持向量集合,从而得到分类决策函数支持向量机的基本思想4是构造一个超平面作为决策平面,这个平面必须能够尽可能多地将2类数据点正确分开,同时也使分开的2 类数据点距离分类面最远,其在二维情况下的示意图如图1所示图1 二维情况下线性支持向量机示意图图1中圆圈和方块分别代表2类样本,其中代表分类线,、分别为过各类中距离分类线最近的一个或多个样本且平行于分类线的一条直线,它们之间的距离叫作分类间隔5(Margin)所谓最优分类线就是要求分类线不但能够使2类样本正确分开,而且能够使它们之间的分类间隔最大前者是为了保证经

7、验风险达到最小,而后者是为了保证其真实风险达到最小在图中到和到的距离是完全相等的,在和上显然有一系列点来“支撑”这两条线,这些“支撑”的点即为支持向量(Support Vector)对于高维空间也可以此类推,只不过此时的最优分类线变成了最优分类面,它将其转化为求解一个二次寻优问题 ,得到的是一个全局最优解,避免了陷入局部极小值对于非线性问题,其把原始问题通过核函数映射到高维空间变换为线性问题,然后在变换空间中求最优分类面,其在后文中将具体说明3玉米籽粒图像的获取3.1 玉米籽粒的收集经过实地调查,发现在众多的玉米品种中,农大108、郑单958、辽单565 三品种在使用上较为广泛,因此决定将它们

8、作为研究对象来进行深入研究在对籽粒的搜集过程中,将生长不正常的籽粒及因储存的原因造成损坏的籽粒排除后,在正常的籽粒中,针对每种玉米品种各随机的取出籽粒200粒3.2 玉米籽粒的分组为了方便进行以后的各种测试及实验等,我们将每种玉米品种的籽粒按照每组50粒的分法随机的分成4组,依次编号为1、2、3、4组,并将三种品种的玉米籽粒按照相同的编号集中在一起组成新的一、二、三、四组3.3 玉米籽粒图像的拍摄及其处理由于考虑到将来玉米品种自动检测设备的应用环境,所以我们在获取种子图像时脱离了固定的照明室为了保证种子在不同光照下的颜色保持恒常性,故需要在拍摄范围之内放置一块标准白板,采用基于标准白板的颜色校

9、正方法5来对获取的图像进行颜色校正,具体的实现过程在文献3中有详细介绍,此处就不多加赘述了在拍摄过程中,需要准备以下物品6首先,要拍摄,肯定离不开拍摄的武器此处准备的图像获取设备是松下型数码相机,对于存储卡而言,为了和相机更好的对应,我们选择的是松下卡;选择的读卡器是金士顿读卡器标准白板制作较为简单,只需要用5页已剪裁好的白色复印纸叠合在一起就可以了,其中使用多层复印纸叠合是为了避免单页纸张过于单薄从而导致透光性太强在拍摄中使用的是细砂布打磨的黑色橡胶板来作为背景,这样的拍摄效果才会更好拍摄条件5:不管在什么光照条件下进行拍摄都要注意使标准白板和使被摄物体受光均匀在图像采集过程中,为了保持相同

10、的对比,必须使用控制变量法,即始终使用同一块标准白板,数码相机也必须控制在同一高度该实验中,采集的每个玉米品种样本数为200,把同一品种的几粒玉米种子人工摆放在黑色橡胶板上,种子均正面朝上,并且使各种子之间相互不重叠图2为获取的两幅样本图像,其他种子均按照该种方法进行操作 (a) 农大108 (b) 郑单958图2 玉米种子图像样本4 玉米籽粒特征的提取要想让玉米种子得到识别,其主要依赖于该玉米种子图像中所包含的特征信息对于玉米籽粒的图像来说,很容易就会注意到在外形和颜色方面它们差距很大,这就是我们要考察的玉米的几何特征和颜色特征但我们也不难发现,有时候同样多的玉米籽粒其重量却相差很大,故本文

11、同时也将其密度视为玉米籽粒的特征来考察4.1 几何特征几何特征即是不同玉米籽粒间的外形特点经过初步观察,发现不同的玉米品种之间的外形主要区别在于面积、圆形度、直径、延伸度等,但是由于它们之间的相关性比较强,若将他们全部纳入特征来考虑,就会显得重复,实验过程中的难度也会增加,所以在此我们直接将面积和圆形度视为玉米籽粒特征的代表其中面积为玉米籽粒轮廓线内包含的所有像素个数,圆形度(为玉米籽粒的面积,为玉米籽粒的周长)测量出的原始数据见附件1.由于玉米籽粒的几何特征分为尺寸特征和形态特征,而在通常情况下,尺寸特征受外部环境影响较大,不同的地方,不同的天气生长出来的玉米其籽粒尺寸往往有一定的差距,故尺

12、寸特征对玉米品种的识别只起一小部分的作用相反,对籽粒形态的影响因素就较少,往往同一品种其形态大致相同,故在玉米品种的识别过程中,形态特征才是关键4.2 颜色特征4.2.1 RGB颜色模型的概念三原色光模式7(RGB color model),又称颜色模型或红绿蓝颜色模型,是一种加色模型,将红(Red)、绿(Green)、蓝(Blue)三原色的色光以不同的比例相加,以产生多种多样的色光4.2.2 HSV 颜色模型的概念HSV8(Hue, Saturation, Value)是根据颜色的直观特性由A R Smith在1978年创建的一种颜色空间,也称六角锥体模型(Hexcone Model)这个模

13、型中颜色的参数分别是:色调(),饱和度(),亮度()4.2.3 玉米籽粒的颜色特征不同玉米品种籽粒的色彩和灰度特点可以通过颜色特征来得到了解6,此处的颜色特征采用了将以上的两种颜色模型相结合的方法,提取了玉米籽粒的蓝、饱和度两大颜色特征值,这两大颜色特征值分别是每粒玉米种子所有像素点的、的各自平均值其中测量出的原始数据见附件1.4.3 质量特征质量特征即是相同数量的不同品种玉米籽粒间的重量特点在这里运用专业的测量质量的仪器电子天平来对玉米籽粒的重量进行测量,质量也是玉米籽粒比较重要的特征之一,它不仅和体积有关,更与玉米籽粒的密度有关为了便于操作,在此仅用质量特征来简单表示其体积和密度的共同特征

14、其中测量出的原始数据见附件15 支持向量机对玉米籽粒品种的识别对于支持向量机的线性问题前面已有清晰的说明,但在生活中我们遇到的问题却大多数属于非线性问题,为了让大家对支持向量机有更加全面透彻的理解,在此对解决非线性问题的原理进行一下简单的分析支持向量机()方法是基于结构风险最小化()原理的一种小样本统计学习方法它是从线性可分情况下最优分类面发展而来的它的基本方法是通过某种非线性映射将输入向量映射到一高维空间,在这个高维空间中构造最优分类超平面9(图3),这一性质保证了机器有较好的泛化能力,而且用这种方式来计算可以不用知道非线性映射的具体形式,只是通过核函数计算高维空间中的内积图 3 原始空间变

15、换为高维空间对支持向量机有了充分的理解之后,用此方法来对玉米品种进行识别就显得简单多了根据玉米品种籽粒特征的提取部分得出的数据,可以运用该种方法来对玉米品种进行识别而在使用此种方法时,其最主要的即是核函数的选取对于支持向量机,其涉及到4个核函数,它们分别是线性核函数、多项式核函数、径向基核函数、Sigmoid核函数,其中径向基核函数10()在应用方面最为广泛,是一个普适的核函数,它通过参数的选择,可以适用于任意分布的样本所以本文采用径向基核函数来作研究所谓径向基函数10(),就是某种沿径向对称的标量函数通常定义为空间中任一点到某一中心之间欧氏距离的单调函数,可记作,其作用往往是局部的,即当远离时函数取值很小对于径向基核函数6,在一般情况下使用时需要确定2个重要的参数:惩罚因子和核参数6其中惩罚因子控制着经验风险和维的平衡,用于实现在经验风险和置信范围的折中,越大则对数据的拟合程度就越高,所以一般都会选取一个较大的数来降

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 毕业论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号