删失数据分析.doc

上传人:F****n 文档编号:98633875 上传时间:2019-09-12 格式:DOC 页数:34 大小:1.17MB
返回 下载 相关 举报
删失数据分析.doc_第1页
第1页 / 共34页
删失数据分析.doc_第2页
第2页 / 共34页
删失数据分析.doc_第3页
第3页 / 共34页
删失数据分析.doc_第4页
第4页 / 共34页
删失数据分析.doc_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《删失数据分析.doc》由会员分享,可在线阅读,更多相关《删失数据分析.doc(34页珍藏版)》请在金锄头文库上搜索。

1、本科毕业论文(设计) 论文(设计)题目:有关删失数据的一些估计与模型 学 院:理学院 专 业:数学与应用数学 班 级:081 学 号:1 学生姓名:黄玉春 指导教师:戴家佳 2012年 6月 2 日涟江为区内地表水的主要排水通道,隧道设计标高高于最低排水基准面,隧道区山脊内沟谷多为季节性冲沟,主要由大气降水补给,水量小,受季节影响明显,地表水不发育,地表水对隧道施工及运营无影响。贵州大学本科毕业论文(设计)诚信责任书本人郑重声明:本人所呈交的毕业论文(设计),是在导师的指导下独立进行研究所完成。毕业论文(设计)中凡引用他人已经发表或未发表的成果、数据、观点等,均已明确注明出处。特此声明。论文(

2、设计)作者签名: 日 期: 贵州大学本科毕业论文(设计) 第31页摘要 本文讨论了近几年有关删失数据的一些估计与模型,对删失数据的几种重要分类进行了讨论,并且针对这几种分类进行了叙述。本文在第二章着重说明了删失数据的几种重要估计,其中Kaplan-Meier估计、Nelson-Alan估计、Pererson估计、Breslow估计等都是近几年在医学等领域广泛应用的概念,本文详细的阐述了这几种估计,详尽的了解了它的构成与它的定义。本文在第三章讨论了有关删失数据的一个重要模型Cox模型,Cox模型是近年来在医学上极为重要的一个模型,在分析删失数据的时候,Cox模型对正确评价医学方面等的治疗效果和进

3、一本改进的治疗方案具有重要的临床意义。本文引用Cox模型分析了乳腺癌因子与生存期之间的数量关系,建立生存模型,最后得到相对危险度来估计每个个体的生存率。最后对Cox模型的一些局限性与应用范围提出了意见。关键字:删失数据,Cox模型,kaplan-Meier估计,Nelson-Aalen估计The Estimation And Models Of Censored DataAbstract This paper discusses the relevant censored data in recent years and some of its important classification

4、s, and gives an account of the classifications.The second chapter of this paper mainly focuses on several important estimate to censored data, among which Kaplan-Meier estimate, Nelson-Alan estimate, Pererson estimate, Breslow estimate are all widely applied in medical science and other fields in re

5、cent years. This paper expatiates these estimates, their structures and definitions.In section 3 of this paper discusses an important model about the censored data-Cox model, Cox model is an extremely important model in recent years in medical , when analysis the censored data , Cox model has import

6、ant clinical significances for the evaluation of medicine, the treatment effect of the and into a treatment plan of this improvement . The paper quotes Cox model to analyze the quantitative relationship between the breast cancer factor and life cycle, and establishing survival model, then get the re

7、lative risk ratio to estimate the survival rate of each individual. Finally puts forward opinions about the limitations and application range of the Cox model.Key word: Censored data,model of Cox,kaplan-Meier estimate,Nelson-Aalen estimate目录摘要1第一章 前言31.1.研究现状41.2删失数据基本概念61.3删失数据的几种衍生数据9小结11第二章 删失数据的

8、几种估计122.1 Kaplan-Meier估计122.2 Nelson-Aalen估计22142.3 Pererson估计142.4 Breslow估计23142.5 Buckley-James估计142.6 Lynden-Bell估计24162.7 Turnbull估计17小结17第三章 Cox模型173.1 Cox模型173.2 Cox模型的几种常用类型25183.3 Cox模型分析的步骤27203.4 Cox模型的统计描述213.5实例应用28223.6 Cox模型的应用范围及注意事项253.7 Cox模型的局限性27小结28第四章 总结28参考文献29致谢31第一章 前言 由于失访、

9、改变防治方案、研究时间结束时事件尚未发生等情况, 所采集的数据中许多应该采集而未能采集, 应提交而未在一些时点上提交造成数据不完全, 这类数据称为统计学上的删失数据, 也称为截尾数据、终检数据() 。国内一些学者关于删失数据统计分析的研究主要集中在生存分析、线性回归、半参数回归参数估计等领域。但关于 回归、单指标回归参数估计的研究涉及较少。至于在信息随机缺失机制下的研究也主要涉及线性回归及半参数回归参数估计, 其他领域涉及较少。 作为数理统计学的一个重要分支,生存分析一直是一个非常活跃的研究领域,近年来也得到迅速的发展,并在医学、工业、保险以及经济等领域有着广泛的应用。 传统的独立删失情况下的

10、生存分析的工具、从最早期的生存表方法,到截断数据的似然方法,时间序贯计划以及技术过程与鞍方法。此外还有生存函数的估计,截断数据线性回归的参数估计,极端数据的秩检验等重要的研究内容,产生了一系列良好的理论结果。随着考虑的问题越来越复杂,人们提出了一系列新的模型,譬如Cox模型、Aalen相加模型等等。其中模型是应用最为广泛的模型之一。 自从于1972年提出Cox比例风险模型之后,引起了很多学者的关注。等许多学者做出了一系列卓有成效的分析和对一些己有结果的扩展工作。现在Cox模型己经在工业,医疗领域得到了广泛的应用。模型中,有两个未知的部分,一是参数口,另一个是基准生存函数.因而模型是一种半参数模

11、型。这两个未知的部分都需要利用观测数据来加以估计,当然这里个数参数的估计方法,在后人的整理中利用偏似然函数己经得到了完整的求参方法。1.1.研究现状国内一些学者关于删失数据统计分析的研究主要集中在生存分析、线性回归、半参数回归参数估计等领域。但关于回归、单指标回归参数估计的研究涉及较少。至于在信息随机缺失机制下的研究也主要涉及线性回归及半参数回归参数估计, 其他领域涉及较少1。线性回归模型领域文献有:秦更生等2证明了具有删失数据下近邻回归函数估计量的强相合性 。非线性回归模型领域文献有:周秀轻等3 研究了随机删失数据非线性回归模型的最小一乘估计问题。半参数回归领域文献有: 秦更生4 研究了当为

12、一维待估参数和删失分布未知时, 基于核光滑和综合数据法, 导出了和 的估计量。非参数回归领域文献有:许冰等5 研究了删失数据非参数回归函数最近邻估计强收敛速度。单指标回归领域文献有:国外自20 世纪80 年代末以来, 一些统计文献从不同角度根据不同假设条件, 对该模型作了一定的研究, 并提出了一系列方法. 而在国内, 有关该模型的相关文献还很少。关于该模型删失数据的统计分析的文献更少。生存分析领域文献有:郑祖康6证明了在具有删失数据的生存分析中整体估计量在 空间的强收敛性以及弱收敛性。时间序列分析领域文献有:何书元等7研究了当平稳时间序列被另外的平稳序列删失后的协方差、相关系数的估计问题。密度

13、估计领域文献有:王启华等8研究观察数据被随机右删失时参数分布族的局部渐近正态与渐近极小极大有效性。 国外文献尚未发现应用模型时对删失比例有何限制的报道。关于删失比例对模型影响的研究,的研究认为族线性回归模型在忽略删失数据情况下与模型和模型的效能相当,却优于简单线性回归模型,还认为族线性回归模型对删失比例的大小具有稳健性但并未考虑删失数据时其效能与模型的比较。关于不同删失数据类型情况下的参数估计有较多研究;如等10提出的混合加成模型适用于左右删失和区间删失,并对忽略区间删失对模型的影响进行了模拟研究,认为会降低模型的效能;用半过程对左右删失进行参数估计;用半参数及核估计法进行参数估计;应用模拟方

14、法对缺失数据进行了诊断;则对协变量随时间变化的生存分析用核加权偏似然方法进行了参数估计;等对于混合删失用基于贝叶斯的非参数模型进行参数估计;将删失数据分为有意义和无意义删失数据两种,并改进模型对含有这两种删失数据进行参数估计,同时进行了模拟研究等。但是,上述研究均未讨论不同的删失比例对模型的影响,也未见应用方法模拟分析不同删失比例对比例风险模型回归结果的影响。只有和在研究模型特性时,比较了模型和模型的应用条件,提出要根据数据的删失比例、拟合效果、删失分布和生存分布形式等因素选择合适的方法,并建议当删失比例超过60%时使用回归模型,但并未讨论删失比例对回归结果的影响趋势,也未确定在应用Cox比例风险模型进行生存分析时删失比例的限度。1.2删失数据基本概念 在临床试验研究中,常对各个观察对象进行随访观察,记录各个时点上事件的发生情况,以评价临床疗效。在比较各种疗效之间的效果时,不仅要考虑是否有效,还要考虑从试验开始时发生疗效的时间。假定用甲、乙两药治疗某病,其疗效均为80%,我们也不能笼统地说两种药物的疗效一般,因为还要一个时间效应问题。如果甲药平均三天治愈80%的病人,而乙药平均7天治愈80%的病人,则可以认为甲药比乙药的疗效好。事实上每一种药物在治疗疾病时,都有一条时间生存曲线,全面科学的评价药物的疗效

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号