基于非线性重构模型的植物叶片图像集分类方法

上传人:小** 文档编号:34100339 上传时间:2018-02-20 格式:DOC 页数:10 大小:153KB
返回 下载 相关 举报
基于非线性重构模型的植物叶片图像集分类方法_第1页
第1页 / 共10页
基于非线性重构模型的植物叶片图像集分类方法_第2页
第2页 / 共10页
基于非线性重构模型的植物叶片图像集分类方法_第3页
第3页 / 共10页
基于非线性重构模型的植物叶片图像集分类方法_第4页
第4页 / 共10页
基于非线性重构模型的植物叶片图像集分类方法_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《基于非线性重构模型的植物叶片图像集分类方法》由会员分享,可在线阅读,更多相关《基于非线性重构模型的植物叶片图像集分类方法(10页珍藏版)》请在金锄头文库上搜索。

1、基于非线性重构模型的植物叶片图像集分类方法 刘孟南 杜吉祥 华侨大学计算机科学与技术学院 摘 要: 提出一种基于非线性重构模型的植物叶片图像集的分类识别方法。该方法首先使用高斯受限玻尔兹曼机 (GRBMs) 通过非监督预训练来初始化模型的权值;然后针对每一个植物叶片图像集用初始化的模型训练得到一个特定的模型;最后根据测试样本的最小重构误差和测试样本集的最多投票策略来判定测试样本集的类别。该方法通过图像预处理来处理图像, 避免了图像在缩放时发生形变, 并采用基于 k-means 的特征提取方法来提取植物叶片图像特征。实验结果表明, 该方法能够准确地对植物叶片图像集进行分类识别。关键词: 非线性重

2、构模型; 高斯 RBMs; k-means 特征提取; 图像预处理; 作者简介:刘孟南 (1990-) , 男, 硕士生, 主要研究方向为模式识别与图像处理;E-mail::作者简介:杜吉祥 (1977-) ;男, 博士, 教授, 硕士生导师, 主要研究方向为图像处理、神经网络、数据挖掘等, E-mail: (通信作者) 。基金:国家自然科学基金项目 (61175121) Plant Leaf Image Set Classification Approach Based on Non-linear Reconstruction ModelsLIU Meng-nan DU Ji-xiang S

3、chool of Computer Science and Technology, Huaqiao University; Abstract: In this paper, aplant leaf image set identification approach was proposed based on non-linear reconstruction models.This approach initializes the parameters of model by performing unsupervised pre-training using Gaussian restric

4、ted Boltzmann machines (GRBMs) .Then, the pre-initialized model is separately trained for images of each plant set and class-specific models are learnt.At last, based on the minimum reconstruction error from the learnt class-specific models, majority voting strategy is used for classification.Beside

5、s, in order to avoid occurring deformation during the image scaled, this paper normalized plant image by image preprocessing and a method of feature extraction was used based on k-means.The experimental results show that this approach can accurately classify the class of plant image set.Keyword: Non

6、-linear reconstruction models; Gaussian restricted Boltzmann machines; K-means feature extract; Image preprocessing; 1 引言公认自然界存在超过 40 万种植物1-2, 它们形态各异, 结构差异很大, 生存环境也各不相同。为了能更好地认识和利用植物, 必须对植物进行分类识别。我国农业在国民经济中一直占有重要地位, 对植物进行分类能够促进植物学、农业现代化的发展, 对生态环境和生物多样性等方面的保护也起到了积极的作用。传统的植物分类技术的测试集和训练集中每类植物权包含单张或者少量样

7、本图像, 因此识别率很大程度上取决于样本的好坏3-5。随着技术的进步, 我们可以获得大量的植物叶片图像。此外, 基于图像集的植物分类研究更有能力处理研究对象各方面的变化, 包括类内差异、光线改变、多视角、非刚性形变、遮挡物等。成熟有效的植物叶片图像集分类识别算法对园林植物识别、医药植物识别和国民经济有重要意义。从图像集建模的角度, 基于图像集的物体识别方法大致分为两类:基于模型的参数化方法7-10和模型无关的非参数方法11-13。存在的基于图像集的识别方法大多将类内图像的变化信息建模在非线性流形上, 如格拉斯曼流形8,10、黎曼流形12。但是这种建模方法需要假设物体图像分布在某种特定的流。本文

8、提出一种基于非线性的重构模型的植物叶片图像集的分类识别方法。与其他基于图像集的方法相比, 该方法能够自动学习和发现每类植物叶片图像潜在的非线性流形结构, 而无需先验假设。与一些基于深度学习的方法相比, 该方法使用高斯受限玻尔兹曼机 (GRBMs) 通过非监督预训练来初始化模型的权值, 能够有效避免梯度弥散和陷入局部极小值。由于输出层的分类效果不好, 且添加新数据后需要重新训练网络, 该方法为每一个植物叶片图像集用初始化的模型训练得到一个特定的模型, 当需要插入新的训练样本集时, 无需重新训练整个网络, 只需为该训练样本集训练特定的模型;然后根据测试样本的最小重构误差和测试样本集的最多投票策略来

9、判定测试样本集的类别。另外, 本文通过图像的预处理来标准化图像, 避免了图像在缩放时发生形变, 并采用基于 k-means的特征提取方法来提取叶片图像的特征。2 基于非线性重构模型的植物叶片图像集的分类识别方法非线性重构模型能够学习数据潜在的非线性流结构。对于网络, 适当的权值初始化是必要的, 这里采用高斯 RBMs 通过非监督预训练的方法逐层训练得到模型的初始化权值, 每个类用得到的权值初始化模型参数, 并用各自的训练集训练模型, 得到各自的模型参数。最后根据测试样本的最小重构误差和测试集的最多投票策略进行类别的判定。2.1 建立非线性重构模型非线性重构模型结构是一个自动编码器, 由编码器和

10、解码器组成。编码器和解码器分别含有两个隐含层, 其中共享第二个隐含层。非线性重构模型如图 1 所示。编码器:解码器:其中, W eRi-1i 是网络的权值矩阵, 第 i 层有 di个节点, b eRi 是偏差向量, s () 表示非线性激活函数。编码器部分是为了找到输入数据的一种紧凑的低维表示。编码器的参数是结合编码器和解码器并联合训练编码-解码结构通过最小化代价函数来得到的。因此, 可以将解码器定义为结合非线性函数从编码器的输出重构输入数据。模型的参数表示为 = W, b, 其中 W=We, Wd, b=be, bb。图 1 非线性重构模型 下载原图2.2 模型参数的初始化为每一类训练一个特

11、定的模型, 但是不适当的模型初始化权值会使训练的模型陷入局部极小值, 或者出现梯度弥散的问题。因此采用高斯 RBMs 通过非监督的预训练的方法来逐层初始化模型的权值。由于标准的 RBM 的节点只能取 0 或 1, 因此通过修改其能量函数将其扩展到实数域。修改后的能量函数为:其中, i是可视层实值输入数据的标准差。由于对比差异的方法不适合高斯RBM 参数的学习, 修改的高斯 RBM 的概率分布如下:由于编码层学习的权值分别与相对应的解码层的权值关联, 则有:W d=We, Wd=We。至此得到了非线性重构模型的初始化权值。2.3 学习特定的类模型预训练得到模型的初始化权值后, 对于 K 个类,

12、分别为每个类训练微调模型的权值, 得到 K 个特定的模型。通过随机梯度下降法来最小化类 Xc中所有训练样本 x 的重构误差, 得到每一个模型的参数 (c) 。为了避免过拟合和提高可扩展性, 引入正则化的代价函数, 添加权重延迟判罚项 Jwd和稀疏约束项 Jsp的代价函数:其中, wd, sp为正则化参数, J wd确保所有隐含层的权重值较小, 其函数形式为:Jsp确保第 i 个隐含层的第 j 个单元的平均激活度 j尽可能地接近稀疏目标值 (一个很小的值) , 它是根据 KL 散度定义的, 其函数形式为:类特定模型参数 (c) 是通过用训练集 Xc训练正则化的非线性重构模型得到的。2.4 分类给

13、定一个测试样本集 Xtest=x, x, , xtest, 通过所有的类模型参数 (c) (c=1, , k) 来重构每一个测试样本 xX test。如果 x (c) 是 x 通过模型参数 (c) 重构得到的, 则重构误差为:根据最小重构误差来判定测试样本 X 的类标签:测试样本的最小重构误差只有从使用与本测试样本相同的训练集训练的模型中获得, 据此, 测试集 Xtest的标签 ytest由测试样本投票最多的类决定:基于非线性重构模型的植物叶片图像集的分类识别流程如图 2 所示。图 2 基于非线性重构模型的植物叶片图像集的分类识别流程图 下载原图3 图像的预处理和基于 k-means 的特征提

14、取3.1 图像的预处理图像的预处理包含彩色图像灰度化、目标对象的提取, 假设提取后的图像为xR, NM, 需要标准化块大小 LL, 根据 M=L, N=N*L/M 来缩放目标图像, 最后将缩放后的图像放置于标准化块的中心, 从而得到预处理后的图像。预处理过程如图 3 所示。图 3 图像预处理 下载原图3.2 基于 k-means 的植物叶片特征提取从图像集中随机提取 m 个图像块 xR, N=ww 并列向量化构成块矩阵 X=x, , x, xR, 然后进行白化处理, 根据 k-means 聚类方法对白化处理后的块矩阵进行聚类, 得到 k 个聚类中心 c。对于特征映射 f:RR, 采用非线性映射

15、函数:其中, z k=x-c 2, (z) 表示 z 的均值。该激活函数将图像块中的各像素值到对应的 k 个中心的距离大于其相对应均值的值赋值为 0。对于预处理后的大小为 LL 的图像, 根据非线性映射函数 f 和大小为 ww (wL) 的子块, 得到该子块的非线性表示 yR。则当步长 s=1 时, 对于整幅图像可以得到 (L-w+1) (L-w+1) K 的特征矩阵。然后将特征矩阵按 4 个象限分别池化并级联池化的结果, 得到 4 K1 维的特征向量。最后运用 PCA 算法进一步降低特征的维度。特征提取过程如图 4 所示。图 4 特征提取过程 下载原图4 实验实验采用 64 位 window

16、7 系统, 3.30GHz 的 Intel (R) Core (TM) i3 四核处理器, 系统内存为 8GB, matlab 为 2014a 版本。4.1 植物叶片数据库ICL 数据库是由中国科学院智能计算实验室创建, 其包含 220 种 17000 张植物叶片图像。数据库中的植物叶片图像采集自不同时间、不同地点、不同角度的场景下, 叶片图像包含受不同光照、视角、变形等因素影响的叶片, 此外, 还包括部分病叶和残叶。丰富的植物叶片图像资源使得本文实验研究的植物对象具有真实性、普遍性。本文实验中选择 85 种植物叶片图像组成新的植物叶片图像库, 并保证每类图像数目不少于 260 张。植物数据库部分样本示例图如图 5和图 6 所示。由于图像大小不一, 通过预处理将图像灰度化并缩放到 8080。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 管理论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号