利用数据挖掘方法对李佃贵教授辨治慢性萎缩性胃炎医案研究.docx

上传人:cao****hui 文档编号:128677576 上传时间:2020-04-21 格式:DOCX 页数:4 大小:41.46KB
返回 下载 相关 举报
利用数据挖掘方法对李佃贵教授辨治慢性萎缩性胃炎医案研究.docx_第1页
第1页 / 共4页
利用数据挖掘方法对李佃贵教授辨治慢性萎缩性胃炎医案研究.docx_第2页
第2页 / 共4页
利用数据挖掘方法对李佃贵教授辨治慢性萎缩性胃炎医案研究.docx_第3页
第3页 / 共4页
亲,该文档总共4页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《利用数据挖掘方法对李佃贵教授辨治慢性萎缩性胃炎医案研究.docx》由会员分享,可在线阅读,更多相关《利用数据挖掘方法对李佃贵教授辨治慢性萎缩性胃炎医案研究.docx(4页珍藏版)》请在金锄头文库上搜索。

1、利用数据挖掘方法对李佃贵教授辨治慢性萎缩性胃炎医案研究【摘要】介绍了数据挖掘的意义和任务,应用数据挖掘中的关联规则分析技术,挖掘李佃贵教授治疗慢性萎缩性胃炎的临床思想,进而探索李佃贵教授的遣方用药的变化与思路。揭示名老中医遣方用药规律,为慢性萎缩性胃炎的研究提供新思路、新方法,为临床遣方用药提供新的思维模式和决策依据。 /1/view-13012753.htm【关键词】数据挖掘 关联规则 置信度 李佃贵 慢性萎缩性胃炎本文主要是对中医药研究中所涉及到的数据挖掘方法进行分析研究,在中医的科研中,无论是临床、实验和文献的研究中都可能遇到需要进行数据分析的情况,初级的分析方法已很难再适应科学发展的需

2、要,掌握好数据挖掘的思路和方法,对中医科研的进步应该是大有裨益。借助数据挖掘技术继承和发展中医学,数据挖掘技术的发展不但使我们从这些海量数据中发现新的知识,发现数据背后隐藏的关系和规则,还可以对未知的情况进行预测。1.数据挖掘介绍1.1数据挖掘数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘中的原始数据可以是结构化的,如关系数据库中的数据;也可以是半结构化的,如文本、图形和图像数据;甚至是分布在网络上的异构型数据。数据挖掘可以按数据库的类型、挖掘对象、挖掘任务、挖掘方法与技术几个方面进行分类。按

3、数据挖掘任务分类数据挖掘的任务有:关联分析、时序模式、聚类、分类、偏差监测、预测等。按任务分类可将数据挖掘分为:关联规则挖掘、序列模式挖掘、聚类数据挖掘、分类数据挖掘、偏差分析挖掘和预测挖掘等类型。1.2关联规则挖掘李佃贵教授治疗慢性萎缩性胃炎医案的方法是关联分析。关联规则其实就是为了确定数据对象间相关性,从中找到出现条件概率较高的模式。通过搜索事务数据库中的所有事物,寻找所有能将一组数据项和另一组数据项相联系的规则。而这种规则的建立是以一定置信度、支持度作为限制条件的。若两项或多项属性之间存在关联,则其中项的属性值就可以依据其他属性值进行预测,找出数据库中隐藏的关联关系,从而指导制定决策。关

4、联规则挖掘算法:关联规则是描述数据之间存在关系的规则,形式为“A1A2AnB1B2Bn”。一般分为两个步骤:求出大数据项集。用大数据项集产生关联规则。数据挖掘是一个复杂的过程,它的一般步骤是:分析问题-提取、清洗和校验数据-创建和调试模型-查询数据挖掘模型的数据-维护数据挖掘模型。1.3技术路线本课题是研究李佃贵教授辨治慢性萎缩性胃炎医案,结合医案中的症状、用药等信息以及中医药先验知识,运用数据挖掘技术归纳出医案中处方的功效。本文设计了一种新的处方功效分析思路:数据挖掘中的关联规则技术用于药物配伍分析,其有独特的作用。方剂数据挖掘在过程上可分三个阶段:数据准备、数据挖掘、结果表达。2.数据挖掘

5、在中医药中的应用目前运用于方剂研究的数据挖掘方法取得了不少的成果,对中医药理论研究和方剂理论研究起到巨大的推动作用。在数据挖掘技术方面,确定方剂中各种药材之间的关联关系,结合统计学原理以及数据挖掘技术,分析各种病症与各种方剂之间的关系,最终起到医疗辅助决策的作用。本研究把数据挖掘技术应用于李佃贵教授辨治慢性萎缩性胃炎医案的分析中。探讨名中医治疗慢性萎缩性胃炎的处方用药规律,了解其遣方用药的变化与思路,对科学筛选临床有效的方药,为学习提供借鉴,提高临床治疗水平有十分积极的意义。同时加深对医家的了解,验证其学术思想也有不少裨益。3.慢性萎缩性胃炎医案关联规则挖掘分析关联规则挖掘可以发现存在于数据库

6、中的项目或属性间的有趣关系,这些关系是预先未知的或者被隐藏的。一般使用置信度(confidence)来描述关联规则的属性。置信度定义:规则X=Y在事务集中的置信度(confidence)是指同时包含X,Y的事务数与包含X的事务数之比,它用来衡量关联规则的可信程度。记为:confidence(X=Y)support(X)support(XY)。一般情况下,只有关联规则的置信度大于期望可信度,才说明X的出现对Y的出现有促进作用,也说明了它们之间的某种程度的相关性。3.1原始数据来源与预处理原始数据的特点是具备关联性。在临床调研中,发现症状与用药之间都有一定的关联性。而且这些关联性正是临床医生辨证论

7、治的经验,单从一两个病号数据里是不容易发掘这些经验的,必须借助于数据挖掘技术。数据预处理是数据挖掘中的一个重要环节,对实验数据是否妥当处理将直接关系到挖掘结果的质量,采用计算机来处理这些大量复杂的数据,提高了效率。对李佃贵教授治疗慢性萎缩性胃炎医案进行采集、整理,录入数据库中。李佃贵教授2008年10月2011年6月在河北省中医院与河北省中医药研究院医院门诊诊治的慢性萎缩性胃炎患者,其病例内容在李佃贵教授的当场指导下记录。本研究共纳入门诊病例120份。病历都由“病历序号、患者基本信息包括患者的性别以及年龄、患者所有的症状、辨证、处方”几部分组成。首先进行数据规范化,症状、药材都有了统一的名称。

8、其次,进行数据数值化,用文字描述的数据不利于计算机接收和处理,而用数字表达则可以大大的简化工作的复杂度。3.2关联推理慢性萎缩性胃炎临床表现缺乏特异性,而且与病变程度并不完全一致。临床上,有些慢性萎缩性胃炎患者可无明显症状。通过对120份病例统计分析,慢性萎缩性胃炎临床症状主要有:胃脘胀满(66次)、胃脘疼痛(42次)、胃脘不适(6次)、胁肋胀满(10次)、后背疼痛(13次)、嗳气(50次)、呃逆(1次)、烧心(32次)、恶心(9次)、反酸(21次)、乏力(17次)、心烦(6次)、善太息(3次)、咽部不适(12次)、口干(33次)、口苦(20次)、口中粘腻(5次)、口中异味(5次)、怕冷(4次

9、)、舌痛(4次)、纳差(29次)、不寐(19次)、头晕(10次)、小便黄(7次)、大便黏腻不爽(33次)、大便干(17次)等。舌质以黯红舌(84次)为主,舌苔以黄苔(71次)、(厚)腻苔(14次)、白苔(35次)为主。脉象多呈弦象,见脉沉弦(53次)、脉弦滑(28次)、脉沉弦细(10次)、脉细(29次)等。 根据统计结果,按照出现频次从多到少的顺序,排在前十位的临床症状分别是:胃脘胀满(66次)、嗳气(50次)、胃脘疼痛(42次)、大便黏腻不爽(33次)、口干(33次)、烧心(32次)、纳差(29次)、反酸(21次)、口苦(20次)、不寐(19次),这与李佃贵教授总结的慢性萎缩性胃炎“痛、胀、

10、痞、满、呆、嗳、烧、酸、泻、秘”十症基本相符。排在前两位的临床症状分别为:胃脘胀满、嗳气,而胃脘胀满、胃脘不适两个症状共计出现72次,这一主要症状与目前将慢性萎缩性胃炎归为中医“胃痞”的诊断是一致的。在预处理后的病例数据中保留了症状、处方二维信息。在该部分中将挖掘症状与用药之间的关联规则。本程序使用Apriori算法,利用Apirori性质,首先从事务集(120个病例)中,得到药物集和合症状集,之后针对每一个症状,统计与之相关的药物出现频次,通过最小支持度与最小置信度得到强关联规则,挖掘出针对单个病症的用药规则。同理,组合症状,挖掘用药规则,从而得到推荐药方。研究李佃贵教授临证应用药对的关联规

11、则,首先须确定研究对象,即临床常用药范围。研究选定120份病例中出现频次较高且与临床症状关联性较高的药物,即选取最小置信度为50%并且最小药物次数不小于5次时与临床症状相关联的药物作为研究对象,满足上述条件的药物包括砂仁、香附、厚朴、枳实、百合、乌药、当归、川芎、白芍、茯苓、白术、紫蔻、鸡内金、三七粉、白花蛇舌草、半枝莲、茵陈、板蓝根、苦参、黄芩、黄连、绞股蓝、藿香、炒莱菔子、紫苏、石膏等26种药物。统计以上26种药物在120份病例中两两匹配的次数,选择两两匹配次数在50次以上的药对,并从中确定每种药与之匹配次数最高的三对药对作为研究对象,同时分析药对的置信度。分析药对匹配次数、置信度两方面数

12、据,总结李佃贵教授应用药对规律、临证治法及临床经验。3.3实验结果置信度为50%并且最小药物次数大于等于5次时症状与用药关联规则:胃脘疼痛,嗳气,乏力,口干,口苦,纳差,失眠,胃脘疼痛,嗳气,乏力,口干,口苦,纳差,胃脘疼痛,嗳气,乏力,口干,口苦,胃脘疼痛,嗳气,乏力,口干,胃脘疼痛,嗳气,乏力,胃脘疼痛,嗳气此次运算,针对特定病症,药物的最小置信度为50%;出现次数出现大于等于5次的药物在考虑范围内。11:针对病症“呃逆”置信度大于50%的药物有:12:针对病症“烧心”置信度大于50%的药物有:砂仁(出现次数:19,置信度:59%);香附(出现次数:20,置信度:62%);厚朴(出现次数:

13、23,置信度:71%);枳实(出现次数:25,置信度:78%);百合(出现次数:16,置信度:50%);乌药(出现次数:16,置信度:50%);当归(出现次数:17,置信度:53%);川芎(出现次数:16,置信度:50%);白芍(出现次数:17,置信度:53%);茯苓(出现次数:17,置信度:53%);白术(出现次数:16,置信度:50%);紫蔻(出现次数:19,置信度:59%);鸡内金(出现次数:18,置信度:56%);茵陈(出现次数:28,置信度:87%);黄芩(出现次数:26,置信度:81%);黄连(出现次数:30,置信度:93%);炒莱菔子(出现次数:21,置信度:65%);生石膏(出

14、现次数:18,置信度:56%);结论对于挖掘得到的症状与用药之间的关联规则,从中医学角度进行分析,大部分得到了中医专家的认证,符合中医中“症状辨证处方”的规律。从以上统计数据中可以看出,在李教授临证常用药对中,理气药和清热药占了大多数。在统计的药对中,百合乌药为百合汤的组成,黄芩茵陈为茵陈黄芩汤的组成,黄连茵陈为茵陈黄连汤的组成,紫苏黄连可视为苏叶黄连汤的组成。当归、川芎、白芍三药的配对使用临床很常见,枳实厚朴、黄连黄芩、半枝莲白花蛇舌草、枳实莱菔子、枳实香附的配伍,文献也有记载。以上这些药对的匹配次数和置信度都很高,已为广大医家所熟识和认可,虽然在数据挖掘领域认为是“无趣”的,但这些药对的应

15、用无不体现着李佃贵教授扎实的理论功底和丰富的临床经验。通过这些关联规则的挖掘,可以挖掘宝贵的中医临床经验,其中包含了医生个人的诊断习惯。在挖掘的结果中,有的关联规则的置信度很高,但这不能说明所挖掘的关联规则是绝对的可信,因为受我们样本数据本身特点的限制,加上数据预处理阶段不能保证百分之百地正确,就可能导致挖掘结果的误差。但是高的置信度也从另一个方面反映出我们挖掘出的关联规则是客观存在的,还是可以挖掘出中医学隐性知识的。对于挖掘结果进行分析,发现均具有宝贵价值,可以体现出治疗疾病的药对和药组的特性具有重要的意义。参考文献:1“百名名中医治疗慢性萎缩性胃炎临床经验资料的计算机分析研究”,发表于中国中医基础医学杂志,2008,14(1),62-63.2“从数据挖掘角度看中医药治疗健忘与痴呆”,发表于中日友好医院学报2006,20(6),337-340.3“基于数据挖掘的龙胆泻肝汤类方关联分析”,发表于辽宁中医杂志,2009,36(6),877-879.4“中药功效数据集市的多维分析和数据挖掘研究”,发表于中草药,2010,4(12),2106-2108.(作者单位:石家庄市中医院)

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 毕业论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号