肾炎的诊断

上传人:好** 文档编号:107705495 上传时间:2019-10-20 格式:DOCX 页数:20 大小:308.18KB
返回 下载 相关 举报
肾炎的诊断_第1页
第1页 / 共20页
肾炎的诊断_第2页
第2页 / 共20页
肾炎的诊断_第3页
第3页 / 共20页
肾炎的诊断_第4页
第4页 / 共20页
肾炎的诊断_第5页
第5页 / 共20页
点击查看更多>>
资源描述

《肾炎的诊断》由会员分享,可在线阅读,更多相关《肾炎的诊断(20页珍藏版)》请在金锄头文库上搜索。

1、肾炎的诊断摘要本文是一个判别类型的问题,在医学上是一个诊断问题,即从样本个体的若干个量化特征来判断肾炎与否。对于问题一,我们采用了logistic回归模型和Fisher判别法。针对logistic模型,我们引入参量,当=0时表示就诊人员为肾炎患者,当=1时表示就诊人员为健康人。我们引入了概率函数,取=0时=0.25,=1时=0.75,对进行回归,建立了logistic回归模型,然后再从确诊肾炎患者和健康人中分别取出前20组进行回归分析得出回归方程,将所用的40组数据回代检验发现有三组数据与实际不符,这说明所用的概率值0.25和0.75不够合理。通过筛选优化我们得出了最终采用的概率值分别为0.7

2、27和0.227,对应的回归方程为从确诊肾炎患者和健康人中分别取出后10组代入回归方程发现只有第53例与实际不符,正确率为95%。对于Fisher 判别法,我们同样利用已知的40组确诊数据找出了最优判别式当时为肾炎患者,当则是健康的。从已确诊肾炎患者和健康人中分别取出后10组代入检验,发现正确率为95%。对于问题二,利用问题一中的判别方程可得到结果。对于问题三,我们利用独立样本t检验的方法求解得到主要因素为Zn,Fe,Ca,Mg,通过Fisher判别函数系数加权求解得到主要因素为Zn和Ca。对于问题四,利用问题三中的判别方程可得到结果。对于问题五,我们将问题二和问题四得到的结果进行统计分析得到

3、最终结果如下:肾炎患者:61,62,63,64,65,66,67,68,69,71,72,73,76,79,83,85非肾炎患者:70,74,75,77,78,80,81,82,84,86,87,88,89,90最后,我们尝试应用了BP神经网络模型对问题进行了进一步的探讨得到了相当不错的效果除不能确定患病与否的79例和87例外,吻合率达到100%。 关键字:logistic回归模型 Fisher判别法 独立样本t检验 BP神经网络 逐步回归一、 问题重述人们到医院就诊时,通常要化验一些指标来协助医生的诊断。诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。表B.1是确诊病例的化验结果,其中

4、130号病例是已经确诊为肾炎病人的化验结果;3160号病例是已经确诊为健康人的结果。表B.2是就诊人员的化验结果。我们的问题是:1. 根据表B.1中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性。2. 按照1提出的方法,判断表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。3. 能否根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。4. 根据3的结果,重复2的工作。5. 对2和4的结果作进一步的分析。 二、问题的假设假设1:医院提供的确诊病例的化验结果和就诊人员的化验结果都是准确

5、的;假设2:假设是否患肾炎只与题目中所给的元素的含量有关,与其他元素在人体内 的含量没有很大关系;假设 3:假设人体内各种元素含量对是否患肾炎的影响是相互独立的;假设 4:假设题目中所给的数据是在相同的条件下测得的;假设 5:假设题目中所给的样本只患肾炎或只是健康体,没有其他疾病影响;假设 6:费希尔判别的临界值可以视为两总体的重心,即样品的几何重心;三、符号说明代表人体内Zn、Cu、Fe 、Ca、Mg、K、Na这七种元素的含量=1,2,3,4,5,6,7Logistic模型中的概率函数值30个肾炎病人所组成的总体30个健康人组成的总体和两个总体间的离差和两个总体内部的离差组间离差与组内离差的

6、比值费希尔判别函数的系数(=1,2,3,4,5,6,7)第个总体的样品的重心logistic判别式的函数值费希尔判别式的函数值四、问题的分析(1)问题一、问题二的分析:分析题意可知这是一个判别类型的问题,在医学上是一个诊断问题,即从样本个体的若干个量化特征来判断肾炎与否。可以作为统计学中的二值响应问题(即响应变量只有两个值,肾炎时就是1,健康的时就是0),可利用logistic回归模型求解出判别公式;同时我们还采用了Fisher判别法,列出样本观测矩阵,将同一类别的样本在特征空间中聚集在一起,计算出样本的均值向量,找出使两组间的区别最大,而使每组内部的离差最小的判别函数,根据已确定的就诊人员检

7、测的各元素的含量求出阀值,再将待诊病例的各元素的值代到判别函数中并算出函数值与阀值进行比较,比阀值大的为肾炎患者,否则为非肾炎患者。最后将G1和G2的后十组数据代入判别公式并与实际情况比较可判定模型的准确程度。最后在比较两种模型的分析结果,得出相应的结论。(2)问题三、问题四的分析:我们可以直接利用Fisher判别系数得到7种元素的相对重要程度,对其排序即可得到关键因素;同时我们还用了t检验法得到关键影响因素。将两种方法得出的结果对比分析即可最终判定出主要因素。(3)问题五的分析:通过问题二和问题四前后的判断结果的统计分析可得到待确诊的30个人的患病情况,并可由此计算出考虑主因素前后两种模型的

8、准确率。五、模型的建立与求解5.1问题一5.1.1模型一的建立和求解(Logistic回归模型)Logistic回归模型是一种线性回归概率模型,在此模型中我们定义y=0表示就诊人员为肾炎患者,y=1表示就诊人员为健康人。我们不是直接对进行回归,而是先定义一种概率函数,令。此时,如果直接对进行回归,得到的回归方程可能不满足这个条件。在现实生活中,一般有。直接求的表达式,是比较困难的一件事,于是改为考虑我们讨论,概率。设就诊人员为肾炎患者的概率,因我们从题目60个确诊人员中取出的40个样本数据,其中20个是肾炎患者,20个是 健康人,取分界值0.5,令由于我们不知道就诊人员患病的概率也不可能通过题

9、目中给出的数据得出,于是为了可先取区间的中值,y=0时对应=0.25,y=1时对应=0.75即当=0.25表示就诊者患肾炎, =0.75表示就诊者为健康人,利用G1和G2的前20组共40个样本数据得到回归方程为为检测模型的准确率,我们首先将G1和G2各自的后10组确诊数据代入回归方程,发现只有第60例判断错误,正确率为95% ,再将已G1和G2各自的前20组确诊数据代入回归方程,代入却发现共有3组与实际不符。考虑到之前回归用到的概率值0.25和0.75是我们的估计值,与实际情况必然有一定偏差,因此我们考虑从改变这两个值入手来优化模型,编程筛选后将0.75优化为0.727,0.25优化为0.22

10、7。但我们发现G1和G2各自的前20组中仍有两组数据与实际不符(这可能是步差不够小造成的,也可能是Logistic模型本身的缺陷造成的)。虽然用G1和G2的后10组检验正确率仍为95%,但总体正确率提高了1.67%,而且得到的回归方程无疑更加具有说服力。最终得到的回归方程如下:其中:R-square=0.6560(回归性相对好), F=8.7174, P=0.5225 0.05残差图如图从残差图可以看出除第29,30,35三点外,其它点的回归效果均连续的在同一侧,分析出上述条件均满足回归条件,也说明了对函数的优化是有意义的。5.1.2模型二的建立和求解(Fisher判断模型)费希尔(Fishe

11、r)判断模型:费希尔判别法的基本思想: 以两个总体中p个指标的样品数据为观测数据,借助方差分析的思想构建一 个判别函数:其中系数、确定的原则是使两组间的区别最大,而使每组内部的离差最小。有了判别式后,对于一个新的样品,将它的p个指标代入判别式,求出y值,然后与判别式的临界值进行比较,就可以判别它属于哪一个总体。费希尔判别函数的导出:假设新建立的判别式为:现将属于不同的两总体的样品观测值代入判别式中去,则得对上边式子左右两边分别相加,再除以相应的样品个数,则有在求出两个总体的几何中心作为判别式的临界值:为了使判别函数能够很好地区别来自不同总体的样品,自然希望:(1)来自不同总体的两个平均值和,相

12、差越大越好;(2)对于来自第一个总体的(i=1,2,),要求它们的离差平方和越小越好,同样也要求越小越好。综合以上两点,就是要求:越大越好。记Q=Q(, )=为两组间离差,F=F(, )=为两组内的离差,则利用微积分求极值的必要条件求出使I达到最大值的,。为此将上式两边取对数,并分别对取导,当导数值等于0时,I可以得到最大值,经化简整理得:,然后分别用含的表达式将Q和F表示出来。最终得到方程组:其中 即写成矩阵形式为: 所以得到费希尔系数矩阵: 其中 ,根据上面的关系式,在MATLAB中编程,求解出费希尔系数:指标系数其中,如果满足,对于一个新样品代入判别函数中所得到的值记为y,当时,可以判断

13、,当时,可以判断 ;如果满足,对于一个新样品代入判别函数中所得到的值记为y,当时,可以判断,当时,可以判断 。利用matlab软件来求解(1) 建立判别函数由题目给定的数据可得:=(125.8550 12.0445 22.0175 739.7000 108.8950 239.1700 566.5500)= (182 23.1 69 2474.1 299.3 92.8 384.2 )则d=(-56.1 -11.1 -47 -1734.4 -190.4 164.4 182.3 )利用matlab,可求S1,S2,S;最后可以得到:C=d= -0.31 4.22 -0.46 -0.08 -0.22

14、-0.01 0.07所以判别函数为: y=()(2) 计算判别临界值由题目中的数据可得,。则 (3)判别准则 因为 所以判别准则为(4)对判别效果进行检验 对于已知的十个肾炎病患者和十个健康者,其检验结果如下图 其中蓝色*表示实际情况(位于1处表示有肾炎病,位于0表示无肾炎病),红色o表示判断情况。红色o与蓝色*重合表示判断正确。分开表示判断错误。由图可知20个病例号中只有一个判断错误,因此可以得到该判断法的估计准确率为19/20=95%.5.2题二由logistic回归方程和Fisher判别公式分别得到如下结果:病例号616263646566676869707172737475Logistic模型患病健康健康患病患病健康健康患病患病健康患病患病患病健康健康Fisher模型患病患病健康患病患病患病健康健康患病健康

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号