删失数据分析

上传人:M****1 文档编号:545515924 上传时间:2022-08-18 格式:DOC 页数:37 大小:1.17MB
返回 下载 相关 举报
删失数据分析_第1页
第1页 / 共37页
删失数据分析_第2页
第2页 / 共37页
删失数据分析_第3页
第3页 / 共37页
删失数据分析_第4页
第4页 / 共37页
删失数据分析_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《删失数据分析》由会员分享,可在线阅读,更多相关《删失数据分析(37页珍藏版)》请在金锄头文库上搜索。

1、本科毕业论文(设计) 论文(设计)题目:有关删失数据的某些估计与模型 学 院:理学院 专 业:数学与应用数学 班 级:081 学 号: 学生姓名:黄玉春 指引教师:戴家佳 6月 2 日贵州大学本科毕业论文(设计)诚信责任书本人郑重声明:本人所呈交的毕业论文(设计),是在导师的指引下独立进行研究所完毕。毕业论文(设计)中凡引用她人已经刊登或未刊登的成果、数据、观点等,均已明确注明出处。特此声明。论文(设计)作者签名: 日 期: 摘要 本文讨论了近几年有关删失数据的某些估计与模型,对删失数据的几种重要分类进行了讨论,并且针对这几种分类进行了论述。本文在第二章着重阐明了删失数据的几种重要估计,其中K

2、aplan-Meier估计、Nelson-Alan估计、Pererson估计、Breslow估计等都是近几年在医学等领域广泛应用的概念,本文具体的论述了这几种估计,详尽的理解了它的构成与它的定义。本文在第三章讨论了有关删失数据的一种重要模型Cox模型,Cox模型是近年来在医学上极为重要的一种模型,在分析删失数据的时候,Cox模型对对的评价医学方面等的治疗效果和进一本改善的治疗方案具有重要的临床意义。本文引用Cox模型分析了乳腺癌因子与生存期之间的数量关系,建立生存模型,最后得到相对危险度来估计每个个体的生存率。最后对Cox模型的某些局限性与应用范畴提出了意见。核心字:删失数据,Cox模型,ka

3、plan-Meier估计,Nelson-Aalen估计The Estimation And Models Of Censored DataAbstract This paper discusses the relevant censored data in recent years and some of its important classifications, and gives an account of the classifications.The second chapter of this paper mainly focuses on several important es

4、timate to censored data, among which Kaplan-Meier estimate, Nelson-Alan estimate, Pererson estimate, Breslow estimate are all widely applied in medical science and other fields in recent years. This paper expatiates these estimates, their structures and definitions.In section 3 of this paper discuss

5、es an important model about the censored data-Cox model, Cox model is an extremely important model in recent years in medical , when analysis the censored data , Cox model has important clinical significances for the evaluation of medicine, the treatment effect of the and into a treatment plan of th

6、is improvement . The paper quotes Cox model to analyze the quantitative relationship between the breast cancer factor and life cycle, and establishing survival model, then get the relative risk ratio to estimate the survival rate of each individual. Finally puts forward opinions about the limitation

7、s and application range of the Cox model.Key word: Censored data,model of Cox,kaplan-Meier estimate,Nelson-Aalen estimate目录摘要1第一章 前言31.1.研究现状41.2删失数据基本概念61.3删失数据的几种衍生数据9小结11第二章 删失数据的几种估计122.1 Kaplan-Meier估计122.2 Nelson-Aalen估计22142.3 Pererson估计142.4 Breslow估计23142.5 Buckley-James估计142.6 Lynden-Bell估

8、计24162.7 Turnbull估计17小结17第三章 Cox模型173.1 Cox模型173.2 Cox模型的几种常用类型25183.3 Cox模型分析的环节27203.4 Cox模型的记录描述213.5实例应用28223.6 Cox模型的应用范畴及注意事项253.7 Cox模型的局限性27小结28第四章 总结28参照文献29道谢31第一章 前言 由于失访、变化防治方案、研究时间结束时事件尚未发生等状况, 所采集的数据中许多应当采集而未能采集, 应提交而未在某些时点上提交导致数据不完全, 此类数据称为记录学上的删失数据, 也称为截尾数据、终检数据() 。国内某些学者有关删失数据记录分析的研

9、究重要集中在生存分析、线性回归、半参数回归参数估计等领域。但有关 回归、单指标回归参数估计的研究波及较少。至于在信息随机缺失机制下的研究也重要波及线性回归及半参数回归参数估计, 其她领域波及较少。 作为数理记录学的一种重要分支,生存分析始终是一种非常活跃的研究领域,近年来也得到迅速的发展,并在医学、工业、保险以及经济等领域有着广泛的应用。 老式的独立删失状况下的生存分析的工具、从最初期的生存表措施,到截断数据的似然措施,时间序贯筹划以及技术过程与鞍措施。此外尚有生存函数的估计,截断数据线性回归的参数估计,极端数据的秩检查等重要的研究内容,产生了一系列良好的理论成果。随着考虑的问题越来越复杂,人

10、们提出了一系列新的模型,譬如Cox模型、Aalen相加模型等等。其中模型是应用最为广泛的模型之一。 自从于1972年提出Cox比例风险模型之后,引起了诸多学者的关注。等许多学者做出了一系列卓有成效的分析和对某些己有成果的扩展工作。目前Cox模型己经在工业,医疗领域得到了广泛的应用。模型中,有两个未知的部分,一是参数口,另一种是基准生存函数.因而模型是一种半参数模型。这两个未知的部分都需要运用观测数据来加以估计,固然这里个数参数的估计措施,在后人的整顿中运用偏似然函数己经得到了完整的求参措施。1.1.研究现状国内某些学者有关删失数据记录分析的研究重要集中在生存分析、线性回归、半参数回归参数估计等

11、领域。但有关回归、单指标回归参数估计的研究波及较少。至于在信息随机缺失机制下的研究也重要波及线性回归及半参数回归参数估计, 其她领域波及较少1。线性回归模型领域文献有:秦更生等2证明了具有删失数据下近邻回归函数估计量的强相合性 。非线性回归模型领域文献有:周秀轻等3 研究了随机删失数据非线性回归模型的最小一乘估计问题。半参数回归领域文献有: 秦更生4 研究了当为一维待估参数和删失分布未知时, 基于核光滑和综合数据法, 导出了和 的估计量。非参数回归领域文献有:许冰等5 研究了删失数据非参数回归函数近来邻估计强收敛速度。单指标回归领域文献有:国外自20 世纪80 年代末以来, 某些记录文献从不同

12、角度根据不同假设条件, 对该模型作了一定的研究, 并提出了一系列措施. 而在国内, 有关该模型的有关文献还很少。有关该模型删失数据的记录分析的文献更少。生存分析领域文献有:郑祖康6证明了在具有删失数据的生存分析中整体估计量在 空间的强收敛性以及弱收敛性。时间序列分析领域文献有:何书元等7研究了当平稳时间序列被此外的平稳序列删失后的协方差、有关系数的估计问题。密度估计领域文献有:王启华等8研究观测数据被随机右删失时参数分布族的局部渐近正态与渐近极小极大有效性。 国外文献尚未发现应用模型时对删失比例有何限制的报道。有关删失比例对模型影响的研究,的研究觉得族线性回归模型在忽视删失数据状况下与模型和模

13、型的效能相称,却优于简朴线性回归模型,还觉得族线性回归模型对删失比例的大小具有稳健性但并未考虑删失数据时其效能与模型的比较。有关不同删失数据类型状况下的参数估计有较多研究;如等10提出的混合加成模型合用于左右删失和区间删失,并对忽视区间删失对模型的影响进行了模拟研究,觉得会减少模型的效能;用半过程对左右删失进行参数估计;用半参数及核估计法进行参数估计;应用模拟措施对缺失数据进行了诊断;则对协变量随时间变化的生存分析用核加权偏似然措施进行了参数估计;等对于混合删失用基于贝叶斯的非参数模型进行参数估计;将删失数据分为故意义和无意义删失数据两种,并改善模型对具有这两种删失数据进行参数估计,同步进行了

14、模拟研究等。但是,上述研究均未讨论不同的删失比例对模型的影响,也未见应用措施模拟分析不同删失比例对比例风险模型回归成果的影响。只有和在研究模型特性时,比较了模型和模型的应用条件,提出要根据数据的删失比例、拟合效果、删失分布和生存分布形式等因素选择合适的措施,并建议当删失比例超过60%时使用回归模型,但并未讨论删失比例对回归成果的影响趋势,也未拟定在应用Cox比例风险模型进行生存分析时删失比例的限度。1.2删失数据基本概念 在临床实验研究中,常对各个观测对象进行随访观测,记录各个时点上事件的发生状况,以评价临床疗效。在比较多种疗效之间的效果时,不仅要考虑与否有效,还要考虑从实验开始时发生疗效的时间。假定用甲、乙两药治疗某病,其疗效均为80%,我们也不能笼统地说两种药物的疗效一般,由于还要一种时间效应问题。如果甲药平均三天治愈80%的病人,而乙药平均7天治愈80%的病人,则可以觉得甲药比乙药的疗效好。事实上每一种药物在治疗疾病时,均有一条时间生存曲线,全面科学的评价药物的疗效应是对时间生存曲线的全面评价,而不仅仅是对某个时点治愈率(或生存率)的评价。此外,在临床实验及其随访中,一部分研究对象可观测到死亡,从而得到精确的生存时间,所提供的信息是完全的。但往往另有一部分病人,或半途释放,或到观测结束时仍存活,对这些人无法懂得精确的生存时间,只懂得其生存时间比观测到的

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号