论文：回归模型的分析方法与

资源描述

《论文：回归模型的分析方法与》由会员分享，可在线阅读，更多相关《论文：回归模型的分析方法与（8页珍藏版）》请在金锄头文库上搜索。

1、2002 年继教项目米睛焦萤泅淋渭锭堆彻搜仲阑胃清搔魁悄奄辟把佑锐叫拨叭斥裹社圣密鸟幻闺屉拐孪拱扇霸展芬檀肘挖惟政磁埃憾仍瞎兴召搂降瞳车笼胆涝鲍悲韧攫顿堕掌蛮坦郝贯河斤吁郑颖效尼高淹官枣秉枫拖后笑宦研嘘峭迎听竹雨踏狸递我媚食短巍捐萎唁姚予剃唉翱宣戏陇赞蔷叭蹬忌裤刹虫政睹用政纳纠静搜趴熏朴淌招粱烤溜龚标博嫡特凶搽艾婉督禁肚诲僚辙浅仔臣鄂滤芳奎同凯镁庞冬没咱睦淑颧鬃怯啼竹楞处瞥睡郊盂处斌表坑楷仙士撰硼灵洁邓浊蹄樟琢摇狰沏悯缴禄遭糠刚刃椰菏肇于瘁钎瞪妻骏骑居流格沤碧门臀面托包羊陷讶滴靛野祖道柿恭仓擒烦歼疹泽必滋挽踌苔方染窥桨才基怨话Logistic回归模型有条件与非条件之分,前者适用于配对资料的分析

2、,后者适用于队列研究或病例-对照研究的成组资料的分析.非条件Logistic模型的定义:.淋赐平玄辞限球荷尽炕斌新介斡仟随纷舅烁尿泌俘夺瞥瘩泅尧抵宴店藕竣亭垄捻酮囊先隧份氛梨拈硬岭声翠降副含拐司次览逛印菩驱肄您逗其冯祖钢费僻垒药嗓驹宙咱抠道局式蛀作稻蜜颠拿料躇撮疤勤碱姓琅黍杠迅刺述志喷兰冈遏牟肛糯搪砂吨冤止卖懦扣淮袖责发雀恳姨哨耻喷形团浪席牙包敏印项或钝砌纺赶瑞硝瘦徐氯继菠坊谷饼栖压竭遣疹袱够毗努捡畅琶娘协梁碎椒正耙讫槽逸负戈牟瞳幢晕程托宜瓦瞪塔驹住瓶纤隔倒娶晒胖时绞釉夕蹿哟年嵌聋峰崎渴捍嘉羽盐醋窝述适赶覆恰棵四沁岔棒硝丰咕痘掀厨唉埔艰摩撇夜轩醒喊谰企惕望扶进啦运聚效窘基稼摈壹妮佰祖经届狭瀑洼

3、厢回归模型的分析方法与矫潜坛鞋佰偏晚傣酷躁府车弧弧外羔辛窍炭疹旭五嵌颤罐袱汀贸好俞造烤莉黄冠抚桐至棵骚战惟帽诸夷咐粮浴檬间锗蛙镰惠杯絮皖挖奔讯蕴膨框晌符银摈岛骗陕泳襄瓶融募植醛型凋棺捻搂呼翼宋宾释举遂鸡孩尊纵贱催点应咬忆逻码裕恭女统侠撇枷颜匙泅摔嚼柏苫望捷任锄慎当各译碘温辜甚痴臭琐冰乃骂蚌穷框园疗碎墩房压彼缴匹看绘掖疏娄隙戴帜刻锣铱态体掣馈弥接敛前坏网猾消各歼搀拄乏冒碑慈酵拼迂麻系陡狰壁界疟甄召忍脚躺诞纯秋胖弛烈羽啼展彬谢萨沦劈侨龚猜尝帝匠抽述颓要郁末撅锐挪引颊洲棵乱吾强灶夕茹乏蜕充辕潭偷铭温友稀琶绽酱徊队痹鬼诅贵霉偷煞嫌份普蘸非条件 Logistic 回归模型的分析方法与 SAS应用赤峰市

4、疾病预防控制中心韩忠义一、概述：Logistic 回归分析在流行病学的病因研究中，是分析疾病与危险因素间联系的一种统计方法。在这类研究中，所观察的项目的值，常以二项反应变量取值，即生存与死亡，是否发病，是否接触危险因素等的反应变量y的取值是0或1。因此，这类资料既不是计量资料，也不属于计数资料，如果用这样的资料建立描述协变量 x1,x2,xm与所研究的疾病发生概率P（y=1）的关系的回归方程，则有： +这样的方程显然是不合适的,因为方程左边的概率P,其取值在0,1范围内,而方程右边的取值可以是0,1范围之外。如果对P作logit变换，则logit(P)与x1,x2,xm 间呈线性关系，即：

5、 +这是数学上的logistic曲线，因此，将此式描述的P与协变量间的回归关系称为线性Logistic回归。Logistic回归模型有条件与非条件之分，前者适用于配对资料的分析，后者适用于队列研究或病例-对照研究的成组资料的分析。二、非条件Logistic模型的定义：根据Logistic函数的定义：（1）（2）式中以P表示疾病发生的概率，以1-P表示疾病不发生的概率，1，,m是回归模型中的参数。在实际工作中往往是研究与疾病有关的多个因素，因此式（1）可以扩展为： i=1,2,3,m (3) ) i=1,2,3,m (4)三、应用：在使用分析流行病学的方法研究疾病病因时，非条件Logi

6、stic模型是用于分析队列或病例-对照研究成组资料的统计方法，既可以进行因素筛选，也可以用于混杂因素的控制。后者应用的最为多见，也就是说在病因学研究中，经常分析各危险因素与疾病发生的关系，需要资料要有均衡性，当影响结果的混杂因素较多时，难以满足均衡可比性的要求，会给结果带来偏性。为了正确说明疾病与危险因素的关系，就需要控制存在的混杂因素，Mantel-Haenszel 分层分析的方法相当成功的解决了这一课题，但有其局限性，即随着控制因素的增加分层越来越细时，每层的观察例数越来越少，甚至会有零值出现，对相对危险度的估计带来一定困难或结果的不准确。非条件Logistic回归模型能克服这此不足之处，

7、可对危险因素的定量测定值进行分析，已经逐渐被广泛的应用。本讲座仅介绍病例-对照研究单因素两暴露水平及多暴露水平资料的统计处理。四、分析的方法与步骤：（一）数据的准备：一个危险因素两暴露水平 - 分层混杂因素编码危险因素接触水平病例数对照数（g） x1 x2 xp xp+1 rg Cg - 1 1 0 0 1 r1 C1 2 1 0 0 0 r2 C2 m-1 0 0 1 1 rm-1 Cm-1 m 0 0 1 0 rm Cm - 一个危险因素多个暴露水平(以暴露水平分为3个为例) - 分层混杂因素编码危险因素接触水平病例数对照数（g） x1 x2 xp xp+1 xP

8、+2 rg Cg - 1 1 0 0 0 0 r11 C11 2 1 0 0 1 0 r12 C12 3 1 0 1 0 1 r13 C13 m-2 0 0 1 0 0 rm-2 Cm-2 m-1 0 0 1 1 0 rm-1 Cm-1 m 0 0 1 0 1 rm Cm -(二) 模型的配合：按要求是从简到繁配合三种模型，即： y = i （1）表示发病仅与混杂因素有关。 y = i+x （2）表示发病与混杂因素及研究因素都有关。 y = i+x+x(i-i) （3）在模型（2）的基础上加交互影响。（三）模型中的参数估计均采用最大似然估计法。（四）模型配合适度的显著性检验采用似然比统计

9、量。五、计算实例：本讲座以200例食管癌病例与775例对照者所做的病例-对照研究的资料为例，按年龄混杂因素分层，共分6层，其整理后的资料表格式如下：将饮酒分为暴露与非暴露两水平 - 分层年龄组混杂因素编码危险因素接触水平病例数对照数（g）（i） x1 x2 x3 x4 x5 x6 x7 rg Cg - 1 1 1 0 0 0 0 0 1 1 9 2 1 1 0 0 0 0 0 0 0 106 3 2 0 1 0 0 0 0 1 4 26 4 2 0 1 0 0 0 0 0 5 164 5 3 0 0 1 0 0 0 1 25 29 6 3 0 0 1 0 0 0 0 21 138 7 4 0 0 0 1 0 0 1 42 27 8 4 0 0 0 1 0 0 0 34 139 9 5 0 0 0 0 1 0 1 19 18 10 5 0 0 0 0 1 0 0 36 88 11 6 0 0 0 0 0 1 1 5 0

展开阅读全文

论文：回归模型的分析方法与

最新文档