基于模糊k-最近邻规则葛根类药材模式识别

上传人:gg****m 文档编号:204991090 上传时间:2021-10-27 格式:DOC 页数:7 大小:55KB
返回 下载 相关 举报
基于模糊k-最近邻规则葛根类药材模式识别_第1页
第1页 / 共7页
基于模糊k-最近邻规则葛根类药材模式识别_第2页
第2页 / 共7页
基于模糊k-最近邻规则葛根类药材模式识别_第3页
第3页 / 共7页
基于模糊k-最近邻规则葛根类药材模式识别_第4页
第4页 / 共7页
基于模糊k-最近邻规则葛根类药材模式识别_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《基于模糊k-最近邻规则葛根类药材模式识别》由会员分享,可在线阅读,更多相关《基于模糊k-最近邻规则葛根类药材模式识别(7页珍藏版)》请在金锄头文库上搜索。

1、基于模糊k?最近邻规则葛根类药材模式识别【摘要】;目的:探讨模糊k?最近邻算法运用于葛根类药材模式识别的可行性。方法:选择6种化学成分的 含量,对不同产地的多种葛根类中药的药理抗内毒素活性建立了模糊k?最近邻规则识别模式。结果:模糊k?最近邻规 则对葛根类中药的药理抗内毒素活性识别正确率达100%,优 于经典k?最近邻法与Bayers判别法。结论:模糊k?最近邻 算法可用于中药模式识别研究。 毕业论文【关键词】;模糊k?最近邻算法;k?最近邻算法;模式识别;葛属毕业论文模式识别技术是一种借助数学方法和计算机技术来 对样品的内部规律及隐含性质进行分析的综合技术,包括判 别分析、聚类分析、机器学习

2、等多种方法。该技术已经广泛 应用于各个领域,随着中药现代化进程,该项技术逐渐在中 药领域深入应用。k?最近邻法已被广泛应用于模式识别的分 类器设计,所谓k?最近邻法(KNN)就是取未知样本的k个 近邻,看这k个近邻多数属于哪一类,就把其归于哪一类, 在分类过程中KNN是采用简单多数投票法来确定未知样本的 分类1。问题是,当学习样本类别分布不均的时候,如果 仅考虑排序后的k个最近邻而忽视样本间的不同距离,势必 会降低KNN的分类精度2。模糊k?最近邻算法 (Fuzzy?KNN,FKNN)就是将模糊理论与k?最近邻法相结合的 一种监督学习技术,它有效解决了上述问题,它将未知样本 与k个最近邻的距离

3、模糊化,并为每个类别都设置了相应的 隶属度,而不象KNN那样简单的将未知样本的归类定为“属 于”或者“不属于” 3FKNN已被成功的应用于多个领域, 在蛋白质结构预测3及文本分类2都有着不错的性能, 本研究将FKNN应用于中药的模式识别,目前国内尚未见报 道。毕业论文1 FKNN算法的原理及实现.本研究的FKNN算法4不同于聂生冬等5将模 糊c?均值聚类与KNN简单结合,而是在KNN的基础上结合模 糊理论进行归类决策实现的,其具体算法安排如下:.(1) 设已知样本集合P=pl, p, pn, n为已知分 类的样本数,c代表分类数,u代表一个cXn的矩阵;. ,(2) 确定未知样本的最近邻数k的

4、值; 选择欧式距离范数d作为距离测度;(4)对每个未知样本X:.%1 计算n个距离d = d (x, pj),并对其进行排序:piep,且 x ?P.d Wd(2) Wd(3) Wd(k) Wd(k+1) WWd(n). ,其中d(l)到d(k)是未知样本x的k个最近邻与x的距离。.%1 在u中找出对应于k个最近邻距离的k个列uj,其中 j = l,2, ko;毕业论文%1 利用上一步从u中获得的k个列uj,计算4:.,ui (x)二?kj二luijld(x,pj)2ml ?kj=lld(x,pj)2m-1. ,其中m为模糊权重调节因子,对于z = l,2,c,如果ui (x)二maxuz(x

5、), zUi,则x属于第i类。取下一个未 知样本转到(4)继续,上述算法不是迭代过程,每个未知 样本都必须按照上述算法处理一遍。毕业论文2;中药葛根类药材的模式识别 .中药模式识别通常是根据中药所含化学成分的整体 进行分类或描述,识别该中药的真伪与优劣。葛根为豆科植 物野葛或甘葛藤的干燥根,全世界已知的葛属植物大约有18 种,我国是葛属植物的原产地之一,分布极其广泛,葛属植 物有9个种和2个变种,其中7种与药用有关,研究结果表 明,不同葛属植物中药用成分异黄酮含量和组分差异显著。 曾明等7对8个来源共17个药材样本的葛属植物的总黄 酮XI、葛根素X2、大豆昔X3、大豆昔元X4、3 ?甲氧基葛

6、根素X5及多糖X6, 6个化学成分进行了测定6,并测定 了相应的抗内毒素活性强度,按照文献8方法对各药材 的抗内毒素活性强度进行分类,强度较弱者记为1,强度较 强者记为2,结果见表1。本研究运用模糊k?最近邻算法以 6个化学成分的含量为输入变量,药理活性强度分类为目标 类别建立模式识别模型。.从表1原始数据随机选取5个作为未知数据进行测 试,剩余12个作为已知数据进行学习,将各数据进行归一 化处理后,运行FKNN算法,算法实现语言为MATLABo对于 FKNN, k值对分类器的性能有显著影响,表2是不同k值下 FKNN的分类精度。由表2结果可见当k值大于等于7时,FKNN 具有最好的分类精度,

7、对未知数据集及整个数据集的识别正 确率都达到了 100%,在本例中k取7进行建模识别,识别结 果见表1。我们也尝试用经典KNN法对数据进行分类,结果 见表3,可见,在相同k值下FKNN都要比KNN表现出更好的 分类性能。就本例数据而言,无论我们怎么调整参数,KNN 法的分类精度都不能令人满意。张汉明等8也对同样的 数据进行了 Bayers判别分析,结果回判的识别正确率也仅 有88%与94%o 毕业论文表1; 17个药材样品的化学与药理模式数据(*为测 试数据)(略)毕业论文表2;不同k值下FKNN的分类精度(略)毕业论文表3;不同k值下KNN的分类精度(略)毕业论文 3结果与讨论.FKNN作为

8、一种监督学习技术,将对每一个未知样本进 行相同的算法处理,且由于其算法不是迭代过程,因此也不 存在不收敛的现象。另外,对于模糊权重调节因子m的取值, 理论上可以是任意的,根据文献4,本研究取值m二2,我 们也对m在1, 3范围内,以0. 1为步长考察了不同m值 对FKNN分类精度的影响,结果发现并无差异。在m=2, k=7 时FKNN对17种葛根类中药的药理抗内毒素活性识别正确率 达100%,识别精度要优于k?最近邻法及文献8的Bayers 判别法,FKNN可以用于中药的模式识别研究。毕业论文【参考文献】;1 Jiawei Han, Micheline Kamber. 著. 范明, 孟晓峰,等

9、译.数据挖掘概念与技术.北京:机械工业出版社, 2001: 209.2 Shang Wenqian, Qu Youli, Huang Houkuan, etal. Fuzzy knn text classifier based on gini index. Journal of Guangxi Normal University: Natural Science Edition, 2006, 24 (4): 87-90.3 Rajkuar Bondugula, Ognen Duzlevski, Xu Dong. Profiles and Fuzzy k?nearest neighbor alg

10、orithm for protein secondary structure prediction. Asia?Pacific Bioinformatics Conference, 2005:8594.4 J. M. Keller, M. R. Gray, J. A. Givens. A fuzzy k?nearest neighbor algorithm. IEEE Trans on SMC, 1985, 15 (4): 580-585.5聂生东,聂斌,章鲁,等.基于模糊k?近邻规则的 多谱磁共振脑图像分割方法的研究.中国生物医学工程学 报,2002, 21 (5): 471 477.6曾明,张汉明,郑水庆,等.葛属植物根的异黄酮 类成分分析.第二军医大学学报,1998, 19 (2): 189-190.7曾明,张汉明,郑水庆,等.葛根及同属植物根的 抗内毒素作用比较.中国中药杂志,1997,增刊:178179 毕业论文8张汉明,曾明,郑水庆,等.中药葛根及同属植物 的模式识别研究(II).中草药,2001, 32 (3): 253254. 毕业论文

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号