Logistic回归分析的判别预测功能及其应用

资源描述

《Logistic回归分析的判别预测功能及其应用》由会员分享，可在线阅读，更多相关《Logistic回归分析的判别预测功能及其应用（4页珍藏版）》请在金锄头文库上搜索。

1、Logistic回归分析的判别预测功能及其应用【摘要】目的：介绍Lgisti回归模型在判别分析中的应用。方法：结合实例介绍Lgisti回归的判别功能的思想、原理、条件和步骤及其在医学领域的应用前景。结果：Lgisti回归应用于判别分析时，显示出了较高的准确性和较好的预测效果。结论：Lgisti回归在定性和半定量资料的判别和预测方面有一定的优势，结合计算机网络技术的开展在医学领域有较好的应用前景。【关键词】Lgisti回归；判别分析；预测；医学应用Lgisti回归分析在医学研究中应用广泛。目前主要是用于流行病学研究中危险因素的挑选，但它同时具有良好的判别和预测功能，尤其是在资料类型不能满足Fis

2、her判别和Bayes判别的条件时，更显示出Lgisti回归判别的优势和效能。本研究对Lgisti回归方程的判别分析进展了讨论，并用一实例介绍其应用。1多元Lgisti回归模型介绍在多元线性回归模型中，因变量y的取值范围是-,+，详细取值取决于自变量的取值范围，而在疾病的危险度分析中，因变量是二分类变量，又称0-1变量，如发病y=1与不发病y=0。用率P作为因变量，那么P的取值范围为0，1，此时要用自变量的线性组合进展变量的筛癣作用大小的比拟和自变量交互作用的研究，就必须通过一个函数关系将因变量P和自变量的线性组合联络起来，这个函数关系便是Lgit变换，详细如下：设P为暴露因素为x时个体发病的

3、概率，那么发病的概率P与未发病的概率1-P之比称为优势比，LgitP定义为优势比的对数：LgitP=ln(p1-p)，此时LgitP的取值范围为-,+,多元Lgisti回归模型定义为：LgitP=+1x1+2x2+x为自变量个数(1)将LgitP看成因变量，Lgisti回归就与多元线性回归的形式是一样的1，2。2Lgisti回归的判别预测功能及用法在Bayes判别分析中，其后验概率的计算公式为:P(D=1|x)=exp(0+1x1+pxp)1+exp(0+1x1+pxp)(2)此公式和Lgisti模型的表达式是完全一样的，其区别在于Bayes判别分析是在各类内指标服从多元正态分布的前提下用判别

4、函数法估计参数，并且需要知道先验概率，而Lgisti回归估计参数却没有这一要求。它是直接根据指标情况通过回归模型求出某一事件发生的估计概率。因此，Lgisti回归不仅具有判别和预测功能，而且限制条件少，资料要求相对低，适用于定性的或半定量的指标，估计各种自变量组合条件下应变量各级别的发生概率，在临床判别诊断和危险人群筛检中，应用前景广阔。在Lgisti回归中，对两类判别问题，记第一类y=0，第二类y=1，那么根据指标可以建立LgitP关于自变量x1,x2x的Lgisti回归方程：LgitP=b0+b1x1+b2x2+bx(3)得概率估计公式：=eb0+b1x1+b2x2+bx1+eb0+b1x

5、1+b2x2+bx(4)根据估计概率进展判别归类，假如估计概率小于0.5，那么判为第一类；假如估计概率大于0.5，那么判为第二类；假如等于0.5，暂不归类。对于多分类类别k2判别问题，需先建立多分类结果的Lgisti回归方程：LgitPk=lnP(y=k|x)P(y=0|x)=bk+bk1x1+bk2x2+bk3x3+bkpxp=gk(x)(5)k=1,2,k-1各类结果的条件概率为：Pk=Py=k|x=egk(x)k-1i=0egk(x),k=1,2,k-1(6)分别计算各样品属于各类之概率，并根据概率大小判别归类，即属于哪一类的概率最大就判别为哪一类2，3，7。3Lgisti回归判别法的应

6、用条件应用Lgisti回归做判别预测时，应当注意资料的分布类型、资料的搜集方法，在正确选择模型和理解模型中参数的意义的根底上做出判别预测。其中n1和n0分别为病例和对照的样本含量，q1和q0为特定人群中发病和不发病的先验概率，可以根据经历作出估计。然后再用调整后的作为Lgisti回归方程的常数项就可以计算预测概率。(2)条件Lgisti回归适用于配比资料的Lgisti分析。在条件Lgisti回归模型中，常数项i是配比组特有的，它的意义是该配比组的各自变量均为0时的基线风险，不同的配比组i可以各不一样。在模型建立的过程中，i因为同一层病例和对照的基线患病率一样被抵消了，因此条件Lgisti回归只

7、估计了表示危险因素作用的值，即LgitP=1x1+2x2+x(8)4应用举例在研究医院抢救急性心肌梗死AI病人能否成功的危险因素的调查中，某医院搜集了5年中该院所有的AI病人的抢救病史，共200例，其中P=0表示抢救成功，P=1表示抢救未能成功而死亡；x1=1表示抢救前已发生休克，x1=0表示抢救前未发生休克；x2=1表示抢救前发生心力衰竭，x2=0表示抢救前未发生心力衰竭；x3=1表示病人从开场AI病症到抢救已超过12小时；x3=0表示病人从开场AI病症到抢救未超过12小时。本例将医院所有AI病人看作是AI总体中的一个随机样本，属于横断面研究，同时考虑3个变量x1,x2,x3的Lgisti回

8、归，资料经统计软件计算，得到相应的Lgisti回归表达式为：Lgit(P)=-2.0858+1.1098x1+0.7028x2+0.9751x3(10)用似然比检验对模型进展拟合优度检验，经检验P=0.09，无统计学意义，说明该模型拟合资料较好，可以用作预测。如某AI病人在有AI病症后5小时送到医院时，未发生休克但已有心衰病症，用上述模型计算得到抢救失败的概率是0.2001，抢救成功的概率为1-0.2001=0.7999，因此预测该病人抢救成功；另一病人在有AI病症后18小时送到医院，已发生休克和心衰病症，用上述模型计算抢救失败的概率为0.669，抢救成功的概率为1-0.669=0.331，因

9、此预测该病人抢救可能失败3。5Lgisti回归的判别效能在判别预测问题上，我们不能说哪一种判别方法最好。无论用哪种判别方法去判断样品的归属问题，均不会永远作出正确的判断。因为任何一种判别方法，所采用的训练样本总是有局限性的，不能完全准确地反映总体信息，所以根据训练样本得出的判别规那么有缺陷是难以防止的。因此，判别效能的进步是一个综合的过程。首先要保证训练样本的代表性，训练样本应最大限度的代表总体情况，才能保证判别的效果；其次是指标的选择，应通过挑选挑出较好的指标来建立方程，增加判别函数的稳定性，从而进步判别效果；最后是根据资料的类型选择适宜的判别方法。假如方法选择不对，那么会大大降低判别的准确

10、率。Lgisti回归在定性和半定量资料的判别和预测方面有一定的优势。在应用Lgisti回归判别时，应注意不同Lgisti回归模型的应用条件，在保证训练样本代表性的根底上，用逐步回归过程对指标进展挑选，挑选出对应变量作用最大的指标建立回归方程，通过组内回代、组外考核和拟和优度检验等方法检验判别效果。由上述讨论可知，判别分析在临床判别诊断和危险人群筛检中，方便快捷、准确性高。随着计算机的普及、动态交互网络技术和数据库技术的飞速开展以及人们获取数据手段的多样化，各种判别方法在计算机辅助诊断和网上咨询中会有广泛的应用前景和开展空间，并发挥不可估量的作用6。【参考文献】1陈景武.卫生管理多因素分析.山东大学出版社，1994.2陈锋.医用多元统计分析方法.中国卫生统计出版社，2001.3方积乾.医学统计学与电脑试验.第2版.上海科学技术出版社，2001.4柳青,等.中国医学统计百科全书多元统计分册.人民卫生出版社，2022.5张文彤.SPSS统计分析教程.北京希望电子出版社，2002.6李丽霞,等.BP神经网络与lgisti回归的比拟研究.中国卫生统计,2022,22(3):138140.7李晓毅.Bayes判别分析及其在疾病诊断中的应用.中国卫生统计,2022,21(6):356357.

展开阅读全文