(毕业论文)-用Logistic回归模型预测糖尿病人病情程度

上传人:zhuma****mei1 文档编号:54245201 上传时间:2018-09-10 格式:DOC 页数:25 大小:1.20MB
返回 下载 相关 举报
(毕业论文)-用Logistic回归模型预测糖尿病人病情程度_第1页
第1页 / 共25页
(毕业论文)-用Logistic回归模型预测糖尿病人病情程度_第2页
第2页 / 共25页
(毕业论文)-用Logistic回归模型预测糖尿病人病情程度_第3页
第3页 / 共25页
(毕业论文)-用Logistic回归模型预测糖尿病人病情程度_第4页
第4页 / 共25页
(毕业论文)-用Logistic回归模型预测糖尿病人病情程度_第5页
第5页 / 共25页
点击查看更多>>
资源描述

《(毕业论文)-用Logistic回归模型预测糖尿病人病情程度》由会员分享,可在线阅读,更多相关《(毕业论文)-用Logistic回归模型预测糖尿病人病情程度(25页珍藏版)》请在金锄头文库上搜索。

1、 楚雄师范学院毕业论文(设计)目目 录录 摘要摘要 关键词关键词AbstractAbstractKeywordsKeywords前言1 1.绪论 1 1.1 研究意义 1 1.2 研究背景 22.Logistic 回归模型简介 2 2.1 二分类 Logistic 回归模型3 2.2 多分类 Logistic 回归模型 42.3 Logistic 回归模型的参数估计方法 5 3.用 Logistic 回归模型预测糖尿病人病情程度7 3.1 问题分析 7 3.2 相关性分析8 3.3 模型建立及检验 10 3.4 结论 12 参考文献参考文献 13 附表附表 1 1 14 附表附表 2 2 15

2、 附表附表 3 3 17 附表附表 4 420 致谢致谢 22楚雄师范学院毕业论文(设计)用用 Logistic 回归模型预测糖尿病人病情程度回归模型预测糖尿病人病情程度摘要:摘要:本文首先总结近年来有关 Logistic 回归模型的研究概况。然后在 Logistic 回归模型的基础上,重点介绍了二分类和多分类变量 Logistic 回归模型。并使用最大似然估计法对模型中的参数进行估计,然后根据拟合优度检验法对模型进行检验。最后利用 SPSS 统计软件对糖尿病人的病情程度建立模型,进行系统的分析并将预测结果与实际结果进行比对。关键词:关键词:Logistic 回归模型 ;拟合优度;最大似然估计

3、;回归系数楚雄师范学院毕业论文(设计)ILogistic regression model was used to predict the severity of diabetic patientsAbstract:This topic summarizes some surveys researched in recent years about Logistic Regression Model. Then on the basis of Logistic Regression Model, introduce two categories and multiple categories

4、variable of Logistic Regression Model, .Firstly, use maximum likelihood to estimste parameters of the model, and secondly, use the goodness of fit test for the model, thirdly, use SPSS statistical software to build model for the severity of patients with diabetes mellitus, carry out the system analy

5、sis and contrast the forecast and real result. Keywords:Logistic regression model; goodness of fit ;maximum likelihood estimate; regression coefficients. 楚雄师范学院毕业论文(设计)0前言Logistic 回归模型作为重要的统计模型,对种群生态学的研究具有核心理论价值。近代以来,它几乎是描述种群 S 型曲线增长的唯一数学模型。可以利用它表征种群的数量动态,如养鱼模型中鱼类种群的增长、收获与时间的关系和国民生产总值的预测等。因此,对其的产生、发

6、展、演变及其类型给以系统的阐述显得非常有必要。1838 年比利时数学家 PFVerhult 推导出 Logistic 基本方程,但被长期湮没,直到上世纪 20年代才被生物学和统计学家 RPearl 和 LJReed 重新发现。实践应用表明,它能有效地描述某些有界增长现象,在信息科学、生物学、预测学、农业学和经济学等领域都有较为广泛的应用,但对于 Logistic 方程中 3 个待估参数的确定方法却一直困扰着使用者。章元明等介绍了 16 种 Logistic方程参数的估计方法,而这些方法既受到运用范围的限制,又牵涉到许多复杂的计算,尽管可以用Excel、Mathematica 等软件辅助分析,但

7、步骤仍然比较繁琐、且工作量大。SPSS 软件以交互性好、无需编程、易学易用等优势,它包含着两种 Logistic 拟合曲线的方法。本文根据 Logistic 回归模型原理,利用糖尿病人胰岛素含量,生长素含量之间的关系,建立Logistic 回归模型,在 SPSS 中实现,得到模型回归系数,建立方程,从而预测出病人病情程度,最后将预测结果和实际结果进行比对。1 1绪论绪论11 研究意义研究意义 在医学研究中,生存与死亡、发病与未发病、阴性与阳性等结果的产生可能与病人的年龄、性别、生活习惯等许多因素有关这时用线性回归模型的方法对实际问题进行研究已经不再适用,而应用 Logistic 回归模型则可同

8、时分析包含离散变量和连续变量的多个自变量,并能有效地分析自变量之间的交互作用,为多个自变量与因变量之间的相互关系提供一个定量描述,从而弥补了线性模型的不足。Logistic 回归模型不仅用于医疗卫生领域的研究,还应用于社会学、经济学等各个领域。例如研究学生龋齿严重程度与刷牙、饮食习惯、年龄等可能的影响因素之间的关系,不同的婚姻状况与收入、心理状态和孩子数量间的关系等等。近年来,随着计算机技术的发展,统计软件的日益成熟使得 Logistic 回归模型作为一种有效的数据处理方法被广泛应用。楚雄师范学院毕业论文(设计)11 12 2 研究背景研究背景Malthus 提出生物总量增长定律后,Verhu

9、lst 最早提出了 Logistic 回归模型进入二十世纪以后,随着人口问题的不断尖锐化,美国统计学家 Pearl 和 Read 重新发现了该模型,并将其应用于研究各国人口的变化情况【1】。近年来,关于 Logistic 回归模型的研究主要集中在参数估计理论研究和假设检验理论研究两个方面。1983 年,Mc Cullagh 和 Nelder 提出了 Logistic 回归模型的极大似然估计【1】。随着半 Logistic分布的出现,Balakrishna N 等人又考虑基于二型截尾数据的半 Logistic 分布的参数估计,2001 年,King 和 Zeng 探讨了如何对稀有事件 Logis

10、tic 回归模型的参数进行校正。为扩大 Logistic 回归模型的应用范围,VEVimi 与 MTenenhaus 提出用偏最小二乘回归法来估计 Logistic 回归模型的参数【2】。随着计算机技术的发展及统计软件的日益成熟,韩俊林、陈励就如何运用 EM 算法对随机效应 Logistic 回归模型进行参数估计进行了讨论,随后 Howard 对 Logistic 回归模型的参数估计进行了更深一步的研究。1980 年,G Hosmer DW 和 Lemeshow S 研究出多元 Logistic 分布的拟合优度检验,随着多分类Logistic 回归模型的提出,Begg 与 Gray 研究出一新

11、的检验方法:将多分类 Logistic 回归模型分解为一系列二分类 Logistic 回归模型,从而将多分类 Logistic 回归模型的显著性检验问题转化为我们所熟悉的二分类 Logistic 回归模型的拟合优度检验。为评价多分类 Logistic 回归模型,Lesaffre 与Albert 提出多分类 Logistic 模型的回归诊断,却由于其涉及过多的计算方法而阻碍其推广。于是,Pigeon 与 Heyse 又对原有的几种检验方法进行了修正;高歌、何露等人阐述了因变量为多分类有序变量时 Logistic 回归应用条件的检验方法;2006 年,张标研究了 Logistic 回归模型的半参数

12、极2大似然估计的渐近性;2007 年,AKGuptaa 等人又探讨了多分类有序 Logistic 回归模型的假设检验问题;在原有的二分类 Logistic 回归模型的拟合优度检验方法上,Jell J.Goeman、Morten W.Fagerland 等人进一步讨论了多分类 Logistic 回归模型的拟合优度检验问题【3】。2 2Logistic 回归模型回归模型简介简介20 世纪 70 年代以来随着对该模型研究的深入, 形成了多值 Logistic 回归模型(多项反应分类logistic 回归模型和有序反应分类 Logistic 回归模型) 、多水平 Logistic 回归模型和模糊 Lo

13、gistic 回归模型等回归模型,本章将对多分类 Logistic 回归模型和二分类 Logistic 回归模型作简单的介绍。2.12.1二分类二分类 Logistic 回归模型回归模型楚雄师范学院毕业论文(设计)22.1.1 二分类 Logistic 回归模型的应用背景当事件A为一般分类变量,将事件A令为Y(Y的取值为0或者1),并且在整个过程中Y服从二项分布,即:,则可以应用二分类Logistic回归模型对事件进行分析。二分类Logistic) 1);(ixPbY回归要求Y有两种取值,即两个分类(0或1) ,预测事件发生或者不发生的概率分别是多少。在此模型中,因变量必须是连续的。二分类Logistic回归模型也被广泛应用于社会生活的预测分析中。例如,品质变量性别有两个类别,可将这两个类别分别以0或1二值变量的形式重新编码。如设置变量Y1表示是否男,取1表示男,取0表示女。一位年轻人可能高中毕业或未能毕业;一位工人可能被雇用或失业;一位处在临床试验中的病人在一个观察期内对治疗可能有反应或没反应。这类数据具有两种可能的结果,被称为二分类数据。习惯上,其结果通常被描述为成功或失败。关注的实质结果一般被看作成功(Y=1),而它的反面则被看作失败(Y=0)。对于二分类因变量,研究者的目标是以一组自变量为条件来估计或预测成功或失败的概率

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 毕业论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号