数学建模医学肾炎化验分析报告模型

上传人:ni****g 文档编号:494443336 上传时间:2023-03-25 格式:DOC 页数:19 大小:459KB
返回 下载 相关 举报
数学建模医学肾炎化验分析报告模型_第1页
第1页 / 共19页
数学建模医学肾炎化验分析报告模型_第2页
第2页 / 共19页
数学建模医学肾炎化验分析报告模型_第3页
第3页 / 共19页
数学建模医学肾炎化验分析报告模型_第4页
第4页 / 共19页
数学建模医学肾炎化验分析报告模型_第5页
第5页 / 共19页
点击查看更多>>
资源描述

《数学建模医学肾炎化验分析报告模型》由会员分享,可在线阅读,更多相关《数学建模医学肾炎化验分析报告模型(19页珍藏版)》请在金锄头文库上搜索。

1、word2008年中央民族大学数学建模选拔赛医学肾炎化验分析模型参赛队员 :某某:李 元 学院:信息工程学院 专业:自动化 年级:06级 某某:X 义 学院:理学院 专业:信息与计算科学 年级:06级 某某:许经超 学院:理学院 专业:信息与计算科学 年级:06级 医学肾炎化验分析模型摘 要此数学模型的建立主要是为了解决这样的问题,通过检测人体内相关微量元素的含量来判定一个人是否患肾炎。因而在此数学模型中,自变量为体内假如干种微量元素的含量,因变量作为判定一个人是否患病的主要数据,做如下设定,当被确诊为患病时,设为1,被确诊为健康时,设为0.我们通过对数据的根本分析和判别,试图通过线性回归模型

2、解决这个问题,经过查阅相关资料,了解到logistic模型被广泛应用于病理学研究中作为研究模型,于是利用excel中的回归工具建立logistic回归模型,计算出该线性方程的常量和系数从而完成模型的初步建立。然后利用回归统计表、方差分析表中、回归参数表等中的数据进展分析,来衡量线性回归的拟合度,以与线性方程中各参数的显著性,发现其回归程度较好,又通过将表1和表2中已确诊的数据代入,对60例受检者的数据进展判别,假如大于0.5如此判定为患病,假如小于0.5如此判定为健康。对应的logitp/1-p为正数时候患病,为负数时为健康。发现该模型在此题判断中的正确率高达93.33%,预测能力显著。诊断待

3、测病人,将表3中的数据代入计算其患病概率,判别标准同上所述,得出受检者中有15人健康,15人患病的结论。回归参数表中回归系数的统计量的线性系数显著性t值,表征了该系数的显著性水平,也表征了该项因素对于因变量判定的影响程度。因此以此为衡量的标准来筛选7项相关因素,找到系数显著性最小三种元素,分别为Na,Zn,K;我们又用排列组合的方法分别删除其中的一种、两种和三种元素,分别计算此时代入前60组数据时的准确度,通过比拟从而确定主要影响元素。保存了Ca,Cu,Fe,Mg四种元素,除去非主因素的干扰,用同样的方法重新计算该模型各系数的数值,在保证较高准确率的前提下,最终达到了简化检测过程的目的。利用排

4、除非显著性元素后的Logistic模型,将表3中的数据代入计算其患病概率,判别标准同上所述,得出受检者中有16人健康,14人患病的结论。关键词: logistic回归模型 主因素筛选显著性检验一、问题的提出与分析提出问题:病理检验的一些指标是医生诊断病人病症的主要依据。诊断人员是否患肾炎时通常要化验人体内各种元素含量。表1列出了60个病理检验结果,其中130号病例是已经确诊为肾炎病人的化验结果;3160号病例是已经确定为健康人的结果。表2给出了另外一些就诊人员的化验结果。我们的工作是:1. 根据表1中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验提出方法的正确性。2.

5、 按照1提出的方法,对表2中的30名就诊人员的化验结果进展判别,判定他们是肾炎病人还是健康人。3. 根据表1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,是否可以减少化验的某些指标。4. 根据3的结果,重复2的工作。分析问题根据以上均值分析可知,就诊者是否患肾炎可能取决于其体内各元素含量数值上的增减或各元素含量占元素总含量的比例失衡。而在初步的数据分析下,肾炎产生的主要原因还无法得到确定,这无疑给以后数学模型的建立和求解带来了不便。另外,对于题目给出的化验结果,在一般情况下,都希望能对它们进展数据的规X化处理,以防止含量差异很大的两种元素在改变一个单位含量时对是否患病的结果产生的影

6、响程度相差过大。以下7X图是健康人和病人体内元素含量的坐标图,以与存有相关数据的表格,通过这些图我们可以发现,体内元素的含量与病人的患病诊断具有一定的线性对应关系,因此我们设想,可以用线性回归的方法来构建模型,同时,我们通过查阅资料也得知,在临床上也确实经常使用这种模型去解决问题。我们看到,7种微量元素的数值,可以作为7个自变量,而是否患病的判别概率,作为因变量。此数学模型的建立主要是为了解决这样的问题,通过检测人体内相关微量元素的含量来判定一个人是否患肾炎。因而在此数学模型中,自变量为体内假如干种微量元素的含量,因变量作为判定一个人是否患病的主要数据,做如下设定,当被确诊为患病时,设为1,被

7、确诊为健康时,设为2.这样就建立了一个多元方程,因此我们选择多元统计分析中利用 excel中的回归工具建立logistic回归模型,计算出该线性方程的常量和系数,从而完成模型的初步建立。回归分析工具是通过对一组观察值使用“最小平方法进展直线拟合,以分析一个几个自变量对单个因变量的影响方向与影响程度的方法。它是Excel中数据分析工具的一个内容。然后利用回归统计表、方差分析表中、回归参数表等中的数据进展分析,来衡量线性回归的拟合度,以与线性方程中各参数的显著性。同时,将表1和表2中已确诊的数据代入,检测本模型在进展诊断时的正确率。诊断待测病人,将表3中的数据代入计算其患病概率,假如大于0.5如此

8、判定为患病,假如小于0.5如此判定为健康。同时,我们也看到,在图中的一些点的规律性并不明显,因此我们猜想,可以在构建的方程中忽略一些因素的影响,这就为我们提出简化模型提供了思路。回归参数表中回归系数的t统计量的p值,表征了该系数的显著性水平,也表征了该项因素对于因变量判定的影响程度。因此以此为衡量的标准来筛选7项相关因素,保存其中的主因项,去除非主因素的干扰,重新构建模型,以达到简化模型和提高精度的目的。二、根本假设1假设表中给出化验数据科学可信。确诊病例确诊情况患病、健康准确无误。2假设各位被测患者无其他疾病,不会干扰被测数值。3假设医生不会仅仅依靠化验结果对患病情况作出最终判断,化验仅仅作

9、为医生诊断的一种辅助手段,所以化验结果单方面的现实结果可以跟实际有一定程度的偏差。三、符号说明Logit(p), p 的Logistic 变换 i=1,2,3,4,5,6,7 线性方程中的变量 i=1,2,3,4,5,6,7 y与的复相关系数 i=1,2,3,4,5,6,7 线性方程中的系数F检验统计量回归方程的显著性检验中的显著性水平 根据分子自由度1和分母自由度n-2找出的临界值,由查表得出四模型的建立与求解从上述对数据的分析中,我们可以看到要建立的模型的因变量只有两个值,分别为患病和健康,由此可以考虑应用Binary Logistic模型。我们把Y=0定义为该受检者健康,Y=1定义为该受

10、检者患病,以p作为受检者患病的概率,并把p看做自变量Xi的线性函数,即 , (k=7)在此假设下,由于p的值一定在区间0,1内,而且当p接近于0或1时,自变量即使有很大变化p的值也不可能变化很大,所以对上式直接用最小二乘法进展估计时行不通的。 从数学上看,函数p对Xi的变化在p=0或p=1附近是不敏感的、缓慢的,且非线性程度较高。于是要寻求一个p的函数( p),使得它在p=0 或p=1 附近时变化幅度较大,而函数的形式又不是很复杂。因此,我们引入p 的Logistic 变换或称为p 的Logit 变换,即 , 当P在0,1变化时,logit(p)就在全体实数上变化。我们有下面的变换公式: ,

11、等价于: ,在拟合Logistic回归模型时,我们要建立因变量概率pi关于自变量的关系式,自变量都必须是数值型的。拟合Logistic回归模型采用最大似然估计法。 将数据导入Excel软件中,利用软件的“回归函数,可以方便地得到线性回归模型的相关信息。在进展回归时,选取置信度为95%。于是可以得到该线性回归的回归统计、方差分析与回归参数,具体数值见下表。回归统计Multiple RR SquareAdjusted R Square标准误差观测值59表4.2.1.1 回归统计一个要素或变量同时与几个要素或变量之间的相关关系。复相关系数是度量复相关程度的指标,它可利用单相关系数和偏相关系数求得。设

12、因变量为Y,自变量为X1,X2,Xk,如此Y与X1,X2,Xk的复相关系数记为Ry12k,其计算式为Ry12k=复相关系数越大,明确要素或变量之间的线性相关程度越密切。从表中可以看出,该回归模型复相关系数R的值达到了0.820977,这说明七种元素的含量与人的患病呈高度相关性。dfSSMSFSignificance F回归分析7残差51总计58表4.2.1.2 方差分析从图表中我们看到,F统计量的概率P值达到了0.000000000175794,远小于显著水平0.05,说明方程回归效果显著,方程中至少有一个回归系数显著不为零。Coefficients标准误差t StatP-valueLower

13、 95%Upper 95%下限 95.0%上限 95%Intercept166700112179513表4.2.1.3 回归参数表4.2.1.2 回归方程的显著性检验回归方程的检验假设H0代表线性关系不显著计算检验统计量F通过查F分布表,F1,5=6.61,F=15.06331,FF(1,5),所以该线性模型线性显著,可以应用于对问题的分析。表中可以找到线性回归模型中线性函数的各项系数值,由此可以得到中,b0=0.892219,b1=-0.00036,b2=0.016483,b3=-0.00162,b4=-0.0003,b5=-0.00094,b6=-6.5E-05,b7=0.000301。在

14、以上假设下,假如概率p大于0,如此代表受检者健康未患病,反之,如此受检者极有可能患病。对应每个受检者的各种元素含量,在Excel软件中利用上述公式计算出其患病概率p,可以看到,Logistic模型下计算出来的p的计算公式对前面给出的六十组数据的判断正确率达到了93.33%。具体结果见附录有了上一节中的公式,我们可以将这个模型计算出来的p应用于实际病例的判别。只要给出某一个受检者体内各种元素的含量,就能应用此计算公式算出其患病几率,我们以0为参照,对有无患病的判断标准如上节所述,如此可在Excel中计算出待判定的30组受检者患病的p值。具体数据如下。病例号ZnCuFeCaMgKNapLogit(p)是否患病613231381795131621065421771844271631521332176128646-006450323876316514454771219166790170

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号