第五组肾炎诊断论文(吴英、程志辉、王志霞)

上传人:油条 文档编号:115390445 上传时间:2019-11-13 格式:DOC 页数:21 大小:749KB
返回 下载 相关 举报
第五组肾炎诊断论文(吴英、程志辉、王志霞)_第1页
第1页 / 共21页
第五组肾炎诊断论文(吴英、程志辉、王志霞)_第2页
第2页 / 共21页
第五组肾炎诊断论文(吴英、程志辉、王志霞)_第3页
第3页 / 共21页
第五组肾炎诊断论文(吴英、程志辉、王志霞)_第4页
第4页 / 共21页
第五组肾炎诊断论文(吴英、程志辉、王志霞)_第5页
第5页 / 共21页
点击查看更多>>
资源描述

《第五组肾炎诊断论文(吴英、程志辉、王志霞)》由会员分享,可在线阅读,更多相关《第五组肾炎诊断论文(吴英、程志辉、王志霞)(21页珍藏版)》请在金锄头文库上搜索。

1、肾炎的诊断摘要本题主要讨论肾炎的诊断,是个判断识别问题。通过化验就诊人员体内的各种元素含量来确诊就诊人员是否患肾炎,这就需要我们给出一个指标来协助医生的诊断。人体内有多种微量元素,由于题目的表格中给出Zn、Cu、Fe、Ca、Mg、K 、Na七种元素的化验结果,我们运用判别方法,选择患病人和健康人体内各元素作为分析对象建立判别模型,来协助医生诊断是否健康及其七种元素对总体影响,并尝试确定关键因素来更好诊断。针对问题1:我们通过对表B.1中的数据进行简单Excel分析,发现130号确诊为患肾炎和3160号确诊健康人体内各元素的含量的期望、方差等值相差很大,而且所考虑的元素比较多,很难给出一个标准的

2、指标来衡量一个人的健康情况。同时我们想到距离判别法和费希尔判别法很适合本题的条件,通过MATLAB求解对表B.1是确诊病例的化验结果验证,得到距离判别法的准确率为88.46%,费歇尔判别法的准确率为93.75%。所以我们认为费希尔判别法更具有可行性。针对问题2:我们采用问题1中所得到的最优判别法费歇尔判别法,运用MATLAB处理表B.1中的数据,对30名就诊人员的化验结果进行判别,从而确诊就诊人员的健康情况。结果有15人患病,15人健康。针对问题3:此问是建立在问题1基础上,由于同时分析7种元素还是比较繁琐,需要在不太大影响效果进一步减少元素的个数。根据表格给出的信息,我们可以通过主成分分析,

3、用MATLAB进行计算,最后得到主要因素:Cu、Ca、Mg、Na。并用费歇尔判别法对B.1中化验结果验证,准确率为91.67%。针对问题4:在问题三的简化后,重新建立费歇尔判别函数。再重复二的过程,检验B.2中就诊人员的健康状况。结果有17人患病,13人健康。针对问题5:通过对问题2和问题4的结果的分析,我们可以发现检验的结果相差很小,说明问题3中的关键因素的选择是合理的。这就可以在一定误差范围内,用关键因素来取代全部的因素作为肾病的检测指标,从而减少变量和工作量,很有实际意义。最后我们在考虑判别法的误差,于是通过两类判别法的综合运用来减少,并考虑样本数据可能存在问题时的办法。关键词:距离判别

4、法 费歇尔判别法 主成分分析 元素含量1问题重述人们到医院就诊时,通常要化验一些指标来协助医生的诊断。诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。表B.1(见附录)是确诊病例的化验结果,其中130号病例是已经确诊为肾炎病人的化验结果;3160号病例是已经确诊为健康人的结果。表B.2是就诊人员的化验结果。我们的问题是:1. 根据表B.1中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性。2. 按照1提出的方法,判断表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。3. 能否根据表B.1的数据特征,确定哪些指标是影

5、响人们患肾炎的关键或主要因素,以便减少化验的指标。4. 根据3的结果,重复2的工作。5. 对2和4的结果作进一步的分析。2.模型假设与符号说明2.1模型假设假设1:表格中所给的数据全部正确;假设2:元素对人体的影响是相对独立,而不考虑元素之间的影响;假设3:7种元素足够来检验是否患病,与其他的元素无关。假设4:表中的人如果患病就是肾病,否则健康,没有其他疾病干扰。2.2符号说明:样本指标数;:第个样本,=1、2;:距离判别法的判别函数;:第个样本的均值,=1、2;:患病的指标即元素,=17;:费歇尔判别法的判别函数;:费歇尔判别法的判别函数临界值;:第个样本的协方差矩阵,=1、2;:费歇尔判别

6、法的判别函数的系数,=17.3.模型的问题分析本题主要为医生提供一个指标来协助医生通过对就诊人员化验出的体内各元素的含量来确诊就诊人员是否患肾炎,因此是一个判断识别模型。我们根据表B.1中的数据的130号确诊为患肾炎和3160号确诊为健康的人体内各元素含量的期望和方差的值进行比对,两者的差距还是很大,而且Zn、Cu、Fe、Ca、Mg、K 、Na这七种元素并没有统一的指标,差异各不相同。3.1问题1分析:根据表B.1中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验我们提出方法的正确性。首先我们用Excel表格对B.1中的数据进行了一些处理,发现130号确诊为患肾炎和31

7、60号确诊为健康的人体内各元素的含量的期望、方差、中位数、峰度等都有很大的偏差,并且我们很难用统一的指标对所有元素进行衡量来确定人的健康状况,且每一个人含有的各元素也不近相同。对每个元素分析发现Ca、Mg的含量在患者和健康人中差别很大,而其他元素的差别较小。根据一般的判别问题的方法,首先把患病和健康分为两组,若检验值落在哪一组我们就可以认为它属于这个组,但是还需一个测评指标,如果测评指标为距离,则可以用距离判别法,如果是一个观察临界值,则是费歇尔判别法。同时我们也了解到费希尔判别参与构造函数的判别函数的样品不宜太少,否则用于判别的分类特性的信息太少,影响判别函数的优良性;所以我们在选取样本时也

8、要考虑样本数。由于两类判别函数都要求两样本的平均值之间的差异显著。所以我们还需要对数据进行显著性检验。3.2问题2分析:按照1提出的方法,判断表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。我们在问题1选择的费希尔判别法的基础上,对表B.2中的30名就诊人员的化验结果进行一一判别,将每一个人的七种元素含量以矩阵的形式输入MATLAB中,输出的结果将反映人的健康情况。3.3问题3分析:能否根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。查找资料后发现此问可采用主成分分析方法,其是一种建立在对测量参数相关性分析基础上的统计

9、相关分析技术。由于研究涉及的众多指标之间往往具有一定的相关性,且存在起支配作用的因素,因此可以通过主成分分析对表B.1中的原始数据指标相关矩阵内部结构进行研究,找出影响判别结果的几个互不相关的综合元素指标,使综合元素指标为原来指标的线性组合,且保留原始元素指标的主要信息,用综合指标替代原来的指标,从而使我们问题研究得以简化。3.4问题4分析:这是在问题3找到关键元素后重新建立的判别函数后的检验工作。与问题2相比只是判别函数不同,因此可以使用问题2的方法用MATLAB处理即可得到所需的结果。3.5问题5分析:此问是比较问题2与问题4的结果,实际上是检验关键因素对判别的影响。一般来说,问题2和问题

10、4的结果相差不大,否则就是关键因素判断有误。若是结果相差很小,则可认为关键因素对判断结果有巨大贡献,则可以排除其他因素,而直接用关键因素来模拟整体。这在实际生活中有很多的积极意义,减少工作量和观察指标,使人更好的分析问题。4.模型的建立及求解4.1模型准备 首先对数据进行处理,分别求出患病的化验结果和健康的化验结果各元素的均值和标准差,并对两组进行成对双样本t检验。由,其中、分别为两组样本各元素差值的均值和标准差,显著度=0.05。经过Excel处理后得到如下表格:患病与健康数据显著性处理() 病号元素1303160T值P显著性Zn143.153.68186.629.683.760.0005非

11、常显著Cu12.335.0521.9223.752.140.04显著Fe23.0613.7562.0175.782.270.01非常显著Ca698.17270.192511.131271.67.432.8E-08非常显著Mg113.3946.85295.1451.325.289.4E-06非常显著K201.13259.7890.3751.32-2.1960.036显著Na526.83300.58367.21244.24-2.10.04显著从表可知Ca、Mg的P值几乎为零,极其显著,可认为它们对总体的影响很大,其他元素的影响稍微较小。由于两组元素的各指标之间的差距是显著的,所以我们使用的判别法是

12、有意义的。4.2.1模型1的建立, 根据我们的分析,从样本中选取患病和健康分为、两个样本,其对应均值和方差为:= = =一、距离判别法 X为检测样本,其到、样本的距离记为、,根据距离近就属于谁的原则。可列出如下的关系式:由于、是一个样本,到其距离用常用的距离表示是无法做到,所以需要用到马氏距离:=。根据上述原则,有=-我们令=;则上述距离判别准则可表达为,目标函数为. 二、费歇尔判别法从、两个样体中选取个指标的样品观测数据,借助于方差分析的思想构造一个判别函数:其中,系数确定的原则是使两组间的区别最大,而使每个组内部的离差最小。有了判别函数后,对于一个新的样品,将它的指标值代入判别函数求出值,

13、然后与判别临界值进行比较,就可以判别它应属于哪一个总体。假设从两个总体中分别抽取个样品,每个样品观测个指标,得到观察值。将属于不同总体的样品观测值代入判别函数,则得 对以上两组等式分别左右相加,再除以相应的样品个数,则有 称作第一组样品的“重心” 称作第二组样品的“重心”为了使判别函数能很好地区别来自不同总体的样本,自然希望:(1)来自于不同总体的两个平均值、相差越大越好;(2)对于来自于第一个总体的,它们的离差平方和越小越好,同样越小越好。综合以上两点,就是要求 利用微积分求极值的必要条件,求可使达到最大值的.结果如下:其中,有了判别函数之后,欲建立判别准则还要确定判别临界值,在、先验概率相

14、等的假设下,一般常取为与的加权平均值如果由原始数据求得,满足,则.建立判别准则为:对于新样品代入判别函数中所得值记为。则判别准则为 .如果,则建立判别准则为:模型中我们运用距离判别法和费希尔判别法通过对人体内各元素的含量来确诊就诊人员是否患肾炎。同时也对B.1是确诊病例的化验结果进行验证,从而来检验我们选用的判别方法的可行性。4.2.2问题1模型的求解:一、对距离判别法所建立的模型进行求解,用MATLAB对表B.1确诊病例的化验结果进行验证,验证结果表格如下:病例号距离判别法结果与0比较大小验证结果133.8166大于正确244.7170大于正确32.8707大于正确455.7294大于正确57.4808大于正确6-2.9091小于不正确73.6201大于正确813.5428大于正确94.3357大于正确105.4350大于正确114.3179大于正确1285.7016大于正确13-11.2212小于不正确144.7897大于正确1516.7950大于正确16-1.2244小于不正确1711.2749大于正确18-7.6908小于不正确1916.0102大于正确203.06

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号