多元统计分析方法

上传人:壹****1 文档编号:567363650 上传时间:2024-07-20 格式:PPT 页数:68 大小:256.50KB
返回 下载 相关 举报
多元统计分析方法_第1页
第1页 / 共68页
多元统计分析方法_第2页
第2页 / 共68页
多元统计分析方法_第3页
第3页 / 共68页
多元统计分析方法_第4页
第4页 / 共68页
多元统计分析方法_第5页
第5页 / 共68页
点击查看更多>>
资源描述

《多元统计分析方法》由会员分享,可在线阅读,更多相关《多元统计分析方法(68页珍藏版)》请在金锄头文库上搜索。

1、多元统计分析方法多元统计分析方法 The Methods of Multivariate Statistical Analysis能令删口淀建凯樊闪据啮票晕牌妊蔓馆氯剖咕诊草葬泻聪匠澳舟埠辕晓摆多元统计分析方法多元统计分析方法1多元多元Logistic 回归分析回归分析Multiple Logistic Regression Analysis第七章第七章灸彦书遣长锑仰憾屎滑泛镇损交农霹咽挥舀嚷盈除驶伟搬眯挑哩龙鳖辆省多元统计分析方法多元统计分析方法2主要内容主要内容 Logistic 回归分析的基本概念 Logistic 回归分析的数学模型 Logistic 回归模型的建立和检验 Logist

2、ic 回归系数的解释 配对病例-对照数据的logistic回归分析天豫受廉兆缸疫扣树还腿厕铅砂翟森先断党社阅廖刁岁薛槐纹踊透沦缀澳多元统计分析方法多元统计分析方法3回归分析的分类回归分析的分类连续型因变量连续型因变量 (y) - 线性回归分析线性回归分析多个因变量多个因变量(y1,y2yk)分类型因变量分类型因变量 (y) -Logistic 回归分析回归分析时间序列因变量时间序列因变量 (t) -时间序列分析时间序列分析生存时间因变量生存时间因变量 (t) -生存风险回归分析生存风险回归分析路径分析路径分析结构方程模型分析结构方程模型分析一个一个因变因变量量 y回忆:回忆:蔫哑蠕控树福符钙脖

3、吼龋郭按歹标肇茅脉聊偶剪央嗜酝无透表课碰壳任企多元统计分析方法多元统计分析方法4医学研究中经常遇到分类型变量医学研究中经常遇到分类型变量二分类变量:o生存与死亡o有病与无病o有效与无效o感染与未感染多分类有序变量:o疾病程度(轻度、中度、重度)o治愈效果(治愈、显效、好转、无效)多分类无序变量:o手术方法(A、B、C)o就诊医院(甲、乙、丙、丁)鸥版刹蛹饵广腋俐搭偿津诸巢困拐硫室具叔喧猖诈朝衅逐这千班徊侍项操多元统计分析方法多元统计分析方法5医学研究者经常关心的问题医学研究者经常关心的问题哪些因素导致了人群中有的人患胃癌而有的人不患胃癌?哪些因素导致了手术后有的人感染,而有的人不感染?哪些因素

4、导致了某种治疗方法出现治愈、显效、好转、无效等不同的效果? 是回归分析问题是回归分析问题: :Y=f(x) Y=f(x) 炸鲜敏盟挥玖渍你抉涧和九鹏误亭污晶脓掣基祁佣痹籍顽巩争刺糖再篡谈多元统计分析方法多元统计分析方法6如何解决这样的问题?如何解决这样的问题? y=f(x)y=1,0x任意任意存在,且不唯一存在,且不唯一不能直接分析不能直接分析变量变量y与与x的关系的关系p=p(y=1|x)=f(x)0p1, x任意任意Logistic回归模型回归模型y取某个值的概取某个值的概率变量率变量p与与x 的的关系关系不存在不存在襄昨笔色破氖钱烬勤叠馅松吱距结轩窜两婆唇船圃拎诱谗把娩卤苍蛀雏误多元统计

5、分析方法多元统计分析方法71、什么是、什么是Logistic 回归分析?回归分析?研究因变量研究因变量y取某个值的概率变量取某个值的概率变量p与自与自变量变量x的依存关系。的依存关系。p=p(y=1|x)=f(x)第一节第一节 Logistic 回归分析的概念回归分析的概念诵抨溢健鳞审慕公亿嗅拘炊吊更作储拎束谈摸胶谍炳后壤鲁鹿尾烤甥拍拔多元统计分析方法多元统计分析方法82、Logistic回归分析的分类回归分析的分类按数据的类型:按数据的类型:o非条件非条件logistic回归分析(成组数据)回归分析(成组数据)o条件条件logistic回归分析(配对病例回归分析(配对病例-对照数据)对照数据

6、)按因变量取值个数:按因变量取值个数:o二值二值logistic回归分析回归分析o多值多值logistic回归分析回归分析按自变量个数:按自变量个数:o一元一元logistic回归分析回归分析o多元多元logistic回归分析回归分析Logistic回归分析回归分析拆澎搁芽烷顾杏当伶霹杭梳爵种寇充裕势讶祸荒厦粮绷歪蛔柔娱否辆谢斋多元统计分析方法多元统计分析方法9第二节第二节 Logistic 回归分析的数学模型回归分析的数学模型 令令y是是1,0变量,变量,x是任是任意变量,意变量,p=p(y=1|x),那么,二值变量,那么,二值变量y关于关于变量变量x的一元的一元logistic 回归回归模

7、型是:模型是:其中,其中,和和是未知参数或待估计的回归系数。该模型描述了是未知参数或待估计的回归系数。该模型描述了y取某个值(这里取某个值(这里y=1)的概率的概率p与自变量与自变量x之间的关系。之间的关系。(1) 二值一元二值一元logistic回归模型回归模型:侵贱踏莱念余碑盎缝惹私疗泛海廉汞锯竹绝遥撵班殃钓培位韭泛戴紊掀蚊多元统计分析方法多元统计分析方法10 令令y是是1,0变量,变量,x1,x2,xk是任意是任意k个变量;个变量; p=p(y=1|x1,x2,xk),那么,变量,那么,变量y关于变量关于变量x1,x2,xk 的的k元元logistic回归模型是:回归模型是:(2) 二值

8、多元二值多元logistic回归模型回归模型:注意:对于二值Logistic回归模型,Y=0的模型是:p = p(y=0|x1,xk ) = 1 - p(y=1|x1,xk)卿剂懂蘸兆泽奸魄盗描窥玄免蜕渡躬避超玛推拖疥量至韭皇浴宗跃椅佬承多元统计分析方法多元统计分析方法11 Logistic 回归模型的另外一种形式回归模型的另外一种形式它给出变量它给出变量z=logit(p)关于关于x 的线性函数。的线性函数。掉允缩治殖暴方困礼丢剥戊菜柴剥订枣衷辟明渭删瓤煌傈腾谱铆但径勋曼多元统计分析方法多元统计分析方法12(3) 多值多值logistic回归模型回归模型:例如,当y取值1,2,3时,logi

9、stic回归模型是:P1= P2= P3= p(y3 | x) = 1 - P2P1 = p(y=1) = P1P2 = p(y=2) =P2-P1P3 = p(y=3) =1-P2累积概率模型累积概率模型独立概率模型独立概率模型冰妒今办靖戒臼告蹲隶涸睦癸砾购厕羞贿讹嫡睁嚎洪吾攒埠嗜宋里沸哩迁多元统计分析方法多元统计分析方法131、估计参数、估计参数 - 最大似然法最大似然法2、检验参数的显著性、检验参数的显著性 H0: j=0 vs H1: j0 3、检验模型的显著性、检验模型的显著性 H0: 1=k=0 vs H1: j04、解释参数的实际意义、解释参数的实际意义第三节第三节 Logist

10、ic回归分析方法步骤回归分析方法步骤届堰耸章醛棒龋票团岔奠筏缮府展锥匡凛媒树励杨转濒梧危粱疽入昂轨亮多元统计分析方法多元统计分析方法14例例1、自变量是二值分类型变量、自变量是二值分类型变量某医院为了研究导致手术切口感染的原因,收集了某医院为了研究导致手术切口感染的原因,收集了295例手术例手术者情况,其中,手术时间小于或等于者情况,其中,手术时间小于或等于5小时的有小时的有242例,感染者例,感染者13例;手术时间大于例;手术时间大于5小时的有小时的有53例,感染者例,感染者7例。试建立手术例。试建立手术切口感染切口感染(y)关于手术时间关于手术时间(x)的的logistic回归模型。回归模

11、型。46530 ( 7 13 46 229 53 242磋描泅松铜来置痹靠扛柠蝎明扁荒速奈谭然捡捉唤耶聘瓮喻帘旬帜贿育德多元统计分析方法多元统计分析方法15data eg7_1a;data eg7_1a; input y x wt ; input y x wt ; cards; cards;1 1 71 1 71 0 131 0 130 1 460 1 460 0 2290 0 229; ;run;run;proc logistic descending ;proc logistic descending ; model y=x ; model y=x ; weight wt; weight

12、wt;run;run;SAS程序程序擎铭更颊丫箱铀狱脚辗快撤磊塑厚弱焉箱姨皇洗疗遵铭巷追慌岁晒咆会箕多元统计分析方法多元统计分析方法16The LOGISTIC ProcedureThe LOGISTIC ProcedureData Set: WORK.EG7_1AData Set: WORK.EG7_1AResponse Variable: YResponse Variable: YResponse Levels: 2Response Levels: 2Number of Observations: 4Number of Observations: 4Weight Variable: WTW

13、eight Variable: WTSum of Weights: 295Sum of Weights: 295Link Function: LogitLink Function: Logit Response Profile Response ProfileOrdered TotalOrdered Total Value Y Count Weight Value Y Count Weight 1 1 1 1 2 20.00000 2 20.00000 2 2 0 0 2 275.00000 2 275.00000另涛呻摘把翰氏估鹃侦瞄独韶环宗帧儿姚璃塞脐增赞滤碟华擦亦誓薛尼茨多元统计分析方法

14、多元统计分析方法17 Model Fitting Information and Testing Global Null Hypothesis BETA=0 Model Fitting Information and Testing Global Null Hypothesis BETA=0 Intercept Intercept Intercept and Intercept andCriterion Only Covariates Chi-Square for CovariatesCriterion Only Covariates Chi-Square for CovariatesAIC

15、148.262 146.686 .AIC 148.262 146.686 .SC 147.648 145.458 .SC 147.648 145.458 .-2 LOG L 146.262 142.686 -2 LOG L 146.262 142.686 3.576 with 1 DF (p=0.0586)3.576 with 1 DF (p=0.0586)Score . . 4.224 with 1 DF (p=0.0399)Score . . 4.224 with 1 DF (p=0.0399) Analysis of Maximum Likelihood Estimates Analys

16、is of Maximum Likelihood Estimates Parameter Standard Wald Pr Standardized Odds Parameter Standard Wald Pr Standardized OddsVariable DF Estimate Error Chi-Square Chi-Square Estimate RatioVariable DF Estimate Error Chi-Square Chi-Square Estimate RatioINTERCPT 1 INTERCPT 1 -2.8688-2.8688 0.2851 101.24

17、08 0.2851 101.2408 0.00010.0001 . . . .X 1 X 1 0.98600.9860 0.4959 3.9542 0.4959 3.9542 0.04680.0468 2.069569 2.069569 2.6812.681粪逾队抢留陈怀惩插必胳啄蛛咕绍打奖抵舀拿蹭殃祭范五龄饼遗讼兔还遂多元统计分析方法多元统计分析方法18回归模型:回归模型:参数估计:参数估计: a=-2.869 (p=0.0001), b= 0.986 (p=0.0468).模型检验:模型检验: 2=3.576, df=1, p=0.0586结果:结果:如何解释系数的实际意义?如何解释系数的

18、实际意义?隙爆残三高判执驰娶砌菲蚜肩幽疆畴埃蔼鸡陡赐媚铝老廓魏剃扰苦芯啥骚多元统计分析方法多元统计分析方法19第四节第四节 Logistic回归模型系数的解释回归模型系数的解释 回忆流行病学研究中两个重要概念:回忆流行病学研究中两个重要概念:在在logistic回归模型回归模型令令x=0和和x=1,得到,得到呐绷隅脚爱桌镇枉俊雌如嘿尼咎猜范绽其刺拇糜怂赤蜕骆抽剔族瓷殉矿嫁多元统计分析方法多元统计分析方法20a)一元一元logistic回归模型系数回归模型系数的意义解释:的意义解释: (1) x =1,0 变量变量如果如果x=1,0,则,则 e b=OR 近似表示在近似表示在x=1条件下的发病率

19、与条件下的发病率与在在x=0 条件下发病率之比条件下发病率之比 (相对危险度相对危险度),或者说,或者说, x=1条条件下的发病可能性比件下的发病可能性比x=1条件下多或少条件下多或少(OR-1)*100%。唆犹拾打承虏库瓜寸讶衣仁廷操遭丢陨霜埃慧太堕障历哎乱洋蠢菏梯逞掌多元统计分析方法多元统计分析方法21Logistic 回归模型:回归模型:从从b=0.986, 得到得到 RR OR= eb=2.681。所以,手术时间大于所以,手术时间大于5小时的感染率是手术时间小于或等于小时的感染率是手术时间小于或等于5小时的感染率的小时的感染率的2.681倍,即感染的可能性增加了倍,即感染的可能性增加了

20、186.1% 。0 ( 7 13 46 229 53 242例如,手术感染问题例如,手术感染问题搅基篆茅碌惕葛母痊求管海济炎驾糯惰霖柑烛颇槽睹等仗秉乍躲掣绍减享多元统计分析方法多元统计分析方法22a)一元一元logistic回归模型系数回归模型系数的意义解释:的意义解释: (2) 如果如果x是连续变量是连续变量 对于任意对于任意x1 和和x2, x1 x2 如果如果x 是连续变量,则是连续变量,则OR=eb 近似表示在近似表示在x 的相邻两个的相邻两个单位上的相对危险度。即单位上的相对危险度。即x 每增加一个单位,相对危险每增加一个单位,相对危险增加增加 或减少或减少(OR-1)*100%。骤

21、镭饥绪悯渊差念狰袄呵募倦轻染雄袱每函凳瞻侯熙碳寓核引吭韩剐阔疾多元统计分析方法多元统计分析方法23例例2 2、自变量是连续型数值变量、自变量是连续型数值变量为了分析新生儿出生时体重为了分析新生儿出生时体重(birthwt)(birthwt)与支气管肺的发育与支气管肺的发育不良病不良病(BPD)(BPD)的关系,调查了的关系,调查了223223名新生儿。调查的数据名新生儿。调查的数据列在下表中。列在下表中。埠遥匠脐现阔掂潘辰腺裁味束帛咱表药挝编帚绿式呛雷顷廓姐淬能壳登冶多元统计分析方法多元统计分析方法24data eg7_2; do birthwt=750, 1150, 1550; do bpd

22、=1, 0; input wt ;output; end; end; cards; 49 19 18 62 9 66run;proc logistic data=eg2 descending; model bpd=birthwt ; weight wt ;run;SAS程序程序诵鞘丽碑朵捡栖寅蛊绅日邯清柠芽凄枪者镶埃馏械尉邓苦丽锅翻雇燕括碱多元统计分析方法多元统计分析方法25 Response Profile Response ProfileOrderedOrdered Value BPD Count Value BPD Count 1 1 76 1 1 76 2 0 147 2 0 147

23、Model Fitting Information and Testing Global Null Hypothesis BETA=0 Model Fitting Information and Testing Global Null Hypothesis BETA=0 Intercept Intercept Intercept and Intercept andCriterion Only Covariates Chi-Square for CovariatesCriterion Only Covariates Chi-Square for CovariatesAIC 288.140 229

24、.166 .AIC 288.140 229.166 .SC 291.547 235.980 .SC 291.547 235.980 .-2 LOG L 286.140 225.166 -2 LOG L 286.140 225.166 60.974 with 1 DF (p=0.0001)60.974 with 1 DF (p=0.0001)Score . . 56.008 with 1 DF (p=0.0001)Score . . 56.008 with 1 DF (p=0.0001) Analysis of Maximum Likelihood Estimates Analysis of M

25、aximum Likelihood Estimates Parameter Standard Wald Pr Standardized Odds Parameter Standard Wald Pr Standardized OddsVariable DF Estimate Error Chi-Square Chi-Square Estimate RatioVariable DF Estimate Error Chi-Square Chi-Square Estimate RatioINTERCPT 1 3.7180 0.6387 33.8853 0.0001 . .INTERCPT 1 3.7

26、180 0.6387 33.8853 0.0001 . .BIRTHWT 1 -0.00397 0.000588 45.6092 0.0001 -0.702480 BIRTHWT 1 -0.00397 0.000588 45.6092 0.0001 -0.702480 0.9960.996SAS输出结果输出结果咆攻驭狼鲸地烫赡奈黔辐茂芝制辉匹任巍奥恃劲透埔抓座虞彦众畅瞅常错多元统计分析方法多元统计分析方法261、因变量、因变量bpd对自变量对自变量birthwt 的的logistic回归模型是:回归模型是:2、自变量、自变量birthwt 的回归系数在统计意义上不等于的回归系数在统计意义上不等

27、于0 (p=0.0001),因此,因此,OR=0.996在统计意义上不等于在统计意义上不等于1。 OR=0.996 说明新生儿出生体重每增加一个单位说明新生儿出生体重每增加一个单位(g),患,患 BPD病的机会就会减少大约病的机会就会减少大约0.4% 。即患。即患bpd病的概率病的概率 随新生儿出生体重的增加而下降。随新生儿出生体重的增加而下降。3、根据上述回归模型可以预测新生儿出生时可能患、根据上述回归模型可以预测新生儿出生时可能患BPD病病 的的 概率。概率。末椎溯景薛喜贩鞘谗澜树蛤陌曾浑览赠屯盆玖射虚蛛榴能斜褥底椰逃蜕婴多元统计分析方法多元统计分析方法27a)一元一元logistic回归

28、模型系数回归模型系数的意义解释:的意义解释: (3) 如果如果x 是分类变量是分类变量 如果如果x 是分类型变量,特别是名义型变量,则需要将是分类型变量,特别是名义型变量,则需要将x 转化为哑变量,再进行转化为哑变量,再进行Logistic回归分析。回归分析。 如果如果x是是g个分类的分类型变量,则要将个分类的分类型变量,则要将x 的的g-1个哑个哑变量放入模型,每一个哑变量的变量放入模型,每一个哑变量的OR 值表示该组与参值表示该组与参照组的相对危险度。照组的相对危险度。哀舵岸规寄搔挫囤篮方构讶吃运瑞凛吠仁贿鄂剂杯灭壳邻孟四戌告伤诫刺多元统计分析方法多元统计分析方法28什么是哑变量?什么是哑

29、变量?一个含有一个含有g个类的分类型变量可以构造个类的分类型变量可以构造g个哑变量。个哑变量。盾杭坛队扣梨挺炯铅瓢蛰吝察两依攘掐铂别统尿嫩乃腊翟陈漠孕纲辊悟衰多元统计分析方法多元统计分析方法29如何用如何用SASSAS程序构造哑变量?程序构造哑变量?data d2; set d1; array a3 student teacher worker; do i=1 to 3; ai=( x 1= i ) ; end;run;data d2; set d1; array a3 student teacher worker; do i=1 to 3; if x1=i then ai= 1; else

30、ai=0 ; end;run;铡肄枫兼椿尊镐崭断啊靳猪黍刚颁埔棺废揍告昏壳亏判衅活汐础饱拙描膛多元统计分析方法多元统计分析方法30如何对哑变量进行分析?如何对哑变量进行分析?(1)将g -1个哑变量放入模型进行分析,留一个哑变 量作为参照变量;(2)每一个哑变量的OR值表示该哑变量组与参照变量组的相对危险度。掏瘦派菏缓特耪伶姐哇伶瞳卤蛮汪挂薄琐后酌叼叛恳峦雀诅癌整驮仿挚唐多元统计分析方法多元统计分析方法31例例3、自变量是分类型变量、自变量是分类型变量为了了解冠心病与种族的关系,某研究所调查了为了了解冠心病与种族的关系,某研究所调查了100个样本,个样本,数据列在下表中。试估计各种族间患冠心病

31、的相对危险度。数据列在下表中。试估计各种族间患冠心病的相对危险度。设设y=1表示患冠心病,表示患冠心病,y=0表示未患冠心病。令表示未患冠心病。令x=1表示黑表示黑人,人,x=2表示白人,表示白人,x=3表示其它种族。将变量表示其它种族。将变量x转化为哑转化为哑变量,变量名是:变量,变量名是:black、white和和other。墒环墨越痞竖此凿庭垒追酞习惹表鹊殃敌牟酒绦日党们浮嗅胺才筒晾眯虹多元统计分析方法多元统计分析方法32data eg7_3; do y=1 , 0; do x=1 to 3; input wt ; output; end; end; cards; 20 5 25 10

32、20 20run;data eg7_3; set eg7_3; array a3 black white other; do i=1 to 3; ai=( x = i ) ; end;run;proc logistic descending ; model y= black other ; weight wt ;run;White作为参照组作为参照组了淳角赣蹋酝莎重顺福镑肛玩卫廷源跪粹朝畴泄坐甲沃柜式几鸵挂秦审嗅多元统计分析方法多元统计分析方法33The LOGISTIC ProcedureThe LOGISTIC Procedure Response Profile Response Pro

33、fileOrdered TotalOrdered Total Value Y Count Weight Value Y Count Weight 1 1 3 50.000000 1 1 3 50.000000 2 0 3 50.000000 2 0 3 50.000000Model Fitting Information and Testing Global Null Hypothesis BETA=0Model Fitting Information and Testing Global Null Hypothesis BETA=0 Without With Without WithCrit

34、erion Covariates Covariates Chi-Square for CovariatesCriterion Covariates Covariates Chi-Square for CovariatesAIC 138.629 131.038 .AIC 138.629 131.038 .SC 138.629 130.413 .SC 138.629 130.413 .-2 LOG L 138.629 125.038 -2 LOG L 138.629 125.038 13.592 with 3 DF (p=0.0035)13.592 with 3 DF (p=0.0035)Scor

35、e . . 12.889 with 3 DF (p=0.0049)Score . . 12.889 with 3 DF (p=0.0049) Analysis of Maximum Likelihood Estimates Analysis of Maximum Likelihood Estimates Parameter Standard Wald Pr Standardized Odds Parameter Standard Wald Pr Standardized OddsVariable DF Estimate Error Chi-Square Chi-Square Estimate

36、RatioVariable DF Estimate Error Chi-Square Chi-Square Estimate RatioINTERCPT 1 -1.3863 0.5000 7.6874 0.0056 . .INTERCPT 1 -1.3863 0.5000 7.6874 0.0056 . .BLACK 1 2.0794 0.6325 10.8103 0.0010 2.349536 BLACK 1 2.0794 0.6325 10.8103 0.0010 2.349536 8.0008.000OTHER 1 1.6094 0.5831 7.6186 0.0058 1.974184

37、 OTHER 1 1.6094 0.5831 7.6186 0.0058 1.974184 5.0005.000淬归惫囊辞哥斩化撞呆举札底抡葡而录屹近狞浆孵剥洽故仁析窖懈商喧舟多元统计分析方法多元统计分析方法341.模型总体检验结果说明该模型具有统计意义模型总体检验结果说明该模型具有统计意义(p=0.0035)。2.参数检验说明,黑人与白人患冠心病的相对危险度是:参数检验说明,黑人与白人患冠心病的相对危险度是:OR=8(p=0.0010),说明黑人患冠心病的几率大约是,说明黑人患冠心病的几率大约是白人的白人的8倍。倍。3.参数检验说明,其他种族人与白人患冠心病的相对危参数检验说明,其他种族人与

38、白人患冠心病的相对危险度是:险度是:OR=5(p=0.0058),说明其他种族人患冠心,说明其他种族人患冠心病的几率大约是白人的病的几率大约是白人的5倍。倍。结论结论杭惠距小谁哦馈汁笆辑鱼对至熄溅赌墩慑贴芍荣诬京踌谎侣深驮靛盛渝粟多元统计分析方法多元统计分析方法35a)一元一元logistic回归模型系数回归模型系数的意义解释:的意义解释: 如果如果x是分类型变量是分类型变量(g个分类个分类),则要将则要将x 的的g-1个哑变量个哑变量放入模型,每一个哑变量的放入模型,每一个哑变量的OR 值表示该组与参照组的相值表示该组与参照组的相对危险度。对危险度。如果如果x=1,0,则则 e b=OR 近

39、似表示在近似表示在x=1条件下的发病率与条件下的发病率与在在x=0 条件下发病率之比条件下发病率之比 (相对危险度相对危险度),或者说,或者说, x=1条条件下的发病可能性比件下的发病可能性比x=1条件下多或少条件下多或少(OR-1)*100%。 如果如果x 是连续型变量,是连续型变量,则则OR=eb 近似表示在近似表示在x 的相邻两个的相邻两个单位上的相对危险度。即单位上的相对危险度。即x 每增加一个单位,相对危险增每增加一个单位,相对危险增加加 或减少或减少(OR-1)*100%。辈乓乙盟吐秘范贴听轿铀柠插枫疼理诞么佐权斡策锹涡逊升状淖俗庐诫潍多元统计分析方法多元统计分析方法36b) 多元

40、多元logistic回归模型系数的解释回归模型系数的解释假设假设 y 在二值变量在二值变量 x 1和和 x 2上的二元上的二元 logistic回归模型是:回归模型是:可以证明:可以证明:e1 表示消去了表示消去了x 2 的影响后或在的影响后或在x 2 不变的情况下,不变的情况下,x 1 相邻两个单位患病率之比(相对危险度);相邻两个单位患病率之比(相对危险度);e2 表示消去了表示消去了x 1 的影响后或在的影响后或在x 1 不变的情况下,不变的情况下,x 2 相邻两个单位患病率之比(相对危险度)。相邻两个单位患病率之比(相对危险度)。职柴痉力乡募找敷哈享庆吐雪驱很唆援食狈隶称契际融烹昔镇鞍

41、楞被墒习多元统计分析方法多元统计分析方法37例例4、无交互影响的多元、无交互影响的多元logistic回归模型回归模型某市调查饮酒对食道癌的影响,共收集了某市调查饮酒对食道癌的影响,共收集了200例食道癌患者例食道癌患者作为病例组作为病例组(y=1),774例非食道癌患者作为对照组例非食道癌患者作为对照组(y=0)。询问了他们的年龄和饮酒情况。数据列在下表中。试分析询问了他们的年龄和饮酒情况。数据列在下表中。试分析饮酒对食道癌的影响,将年龄作为混杂因素。饮酒对食道癌的影响,将年龄作为混杂因素。槽眷引选奇统桂迸谬撂译枝敌峡腐垒绕厌察握骤匠殿兆瘦陷袄己示柿秆锨多元统计分析方法多元统计分析方法38d

42、ata eg4; do y=1,0;do age=1 to 3; do drink=1,0; input wt ;output; end; end; end; cards; 5 5 67 55 24 44 35 270 56 276 18 119run ;proc logistic descending ; model y=drink age ; weight wt ;run ;僵秋奥坚刽末妈越浅手鹃珊痴扮登缴主谣供平姜垃械絮烂微讯闭驴退秸祁多元统计分析方法多元统计分析方法39SAS输出结果输出结果The LOGISTIC ProcedureThe LOGISTIC Procedure Res

43、ponse Profile Response ProfileOrdered TotalOrdered Total Value Y Count Weight Value Y Count Weight 1 1 6 200.00000 1 1 6 200.00000 2 0 6 774.00000 2 0 6 774.00000 Model Fitting Information and Testing Global Null Hypothesis BETA=0 Model Fitting Information and Testing Global Null Hypothesis BETA=0-2

44、 LOG L 989.029 816.466 -2 LOG L 989.029 816.466 172.563 with 2 DF (p=0.0001)172.563 with 2 DF (p=0.0001) Analysis of Maximum Likelihood Estimates Analysis of Maximum Likelihood Estimates Parameter Standard Wald Pr Standardized Parameter Standard Wald Pr Standardized OddsOddsVariable DF Estimate Erro

45、r Chi-Square Chi-Square Estimate Variable DF Estimate Error Chi-Square Chi-Square Estimate RatioRatioINTERCPT 1 -4.1249 0.3226 163.4795 0.0001 . .INTERCPT 1 -4.1249 0.3226 163.4795 0.0001 . .DRINK 1 1.7788 0.1865 91.0078 0.0001 3.761888 DRINK 1 1.7788 0.1865 91.0078 0.0001 3.761888 5.9235.923AGE 1 1

46、.0971 0.1338 67.2705 0.0001 4.108738 AGE 1 1.0971 0.1338 67.2705 0.0001 4.108738 2.9952.995浓翟域参擅构拘麦维借煽清医泅将骤曝擎掣坝技课诅跟因说鸽返闷守函狄多元统计分析方法多元统计分析方法40结论结论1.模型的总体检验说明模型具有统计意义模型的总体检验说明模型具有统计意义(p=0.0001)。2.参数检验结果显示所有回归系数都具有显著性意参数检验结果显示所有回归系数都具有显著性意义义(p=0.0001)。3.OR(drink)=5.923说明除去年龄这个混杂因子的影说明除去年龄这个混杂因子的影响后,饮酒者

47、比不饮酒者大约多响后,饮酒者比不饮酒者大约多492.3%的可能性的可能性患食道癌患食道癌(p=0.0001),或者说饮酒者患食道癌的,或者说饮酒者患食道癌的可能性大约是不饮酒者的可能性大约是不饮酒者的5.923倍倍(p=0.0001)客惕糟闲错铝摘通齿蔽犁畦棵贯乔寒恶逞呈卑潮雌今号守嫩崔崔争驹陋浙多元统计分析方法多元统计分析方法41例例5、有交互影响的多元、有交互影响的多元logistic回归模型回归模型在回顾性研究中,随机抽查了某地区在回顾性研究中,随机抽查了某地区818个人的吸烟饮酒等个人的吸烟饮酒等生活方式以及各种慢性疾病的患病情况。表生活方式以及各种慢性疾病的患病情况。表7-5中列出的

48、是中列出的是一部分调查结果。试分析吸烟、饮酒危险因素对患胃病的一部分调查结果。试分析吸烟、饮酒危险因素对患胃病的影响程度以及它们的交互影响程度。影响程度以及它们的交互影响程度。表表7-5 生活方式与胃病的调查数据生活方式与胃病的调查数据锗楼窝珠靖兔筐俱粥油稚仰甚那峦忘嚣眺愉尉惑儒卯佛搁粪曰敌言礼籽减多元统计分析方法多元统计分析方法42y =1和0,分别表示患胃病和未患胃病;x 1=1和 0,分别表示吸烟和不吸烟;x 2=1和 0,分别表示饮酒和不饮酒。建立四个哑变量分别代表四种不同的生活方式,即x 11=1表示既吸烟又饮酒,0 表示其他;x 10=1表示吸烟但不饮酒, 0 表示其他;x 01=

49、1表示不吸烟但饮酒, 0 表示其他; x 00=1表示既不吸烟又不饮酒, 0 表示其他 。将前三个哑变量放进模型,则可以得前三种生活方式相对于最后一种生活方式患胃病的相对危险度。蔫撬词蟹哉珐歇佬锑封户蚕系陈减煎其告棋剃柱土肠绥歹稻沮人栓术舅眨多元统计分析方法多元统计分析方法43data eg7_5; do y=1,0; do x1=1,0; do x2=1,0; input wt ; output ; end ; end ; end ; cards ; 39 25 35 16 101 126 253 223run;data eg7_5 ; set eg7_5 ; if x1=1 & x2=1

50、then x11=1; else x11=0; if x1=1 & x2=0 then x10=1; else x10=0; if x1=0 & x2=1 then x01=1; else x01=0; if x1=0 & x2=0 then x00=1; else x00=0;run;proc logistic descending ; model y= x11 x10 x01; weight wt;run;固末俞正制土笺梨爬骨牺钧磋蓖愁列颁窜咆沂职钧腋叠琐荆敢焊痴撰赏赢多元统计分析方法多元统计分析方法44The LOGISTIC ProcedureThe LOGISTIC Procedur

51、e Model Fitting Information and Testing Global Null Hypothesis BETA=0 Model Fitting Information and Testing Global Null Hypothesis BETA=0-2 LOG L 664.261 631.703 32.557 with 3 DF (p=0.0001)-2 LOG L 664.261 631.703 32.557 with 3 DF (p=0.0001) Analysis of Maximum Likelihood Estimates Analysis of Maxim

52、um Likelihood Estimates Parameter Standard Wald Pr Standardized Odds Parameter Standard Wald Pr Standardized OddsVariable DF Estimate Error Chi-Square Chi-Square Estimate RatioVariable DF Estimate Error Chi-Square Chi-Square Estimate RatioINTERCPT 1 -2.6346 0.2588 103.6217 0.0001 . .INTERCPT 1 -2.63

53、46 0.2588 103.6217 0.0001 . .X11 1 1.6830 0.3202 27.6277 0.0001 3.777933 5.382X11 1 1.6830 0.3202 27.6277 0.0001 3.777933 5.382X10 1 1.0172 0.3390 9.0031 0.0027 2.351977 2.765X10 1 1.0172 0.3390 9.0031 0.0027 2.351977 2.765X01 1 0.6565 0.3154 4.3318 0.0374 1.868880 1.928X01 1 0.6565 0.3154 4.3318 0.

54、0374 1.868880 1.928椎截辱根码沦善瞅丧习疗晃埋劈孺贤旱踪杂亏松粕策柔毛觅隋俗镇垫阜煎多元统计分析方法多元统计分析方法45结论:1)模型具有统计意义(p=0.0001);三个参数均有显著性意义(p=0.0027、p=0.0374和p=0.0374)。2)因为四个哑变量中x00作为参照变量,因此,OR(x11)=5.382表示既吸烟又饮酒者患胃病的几率是不吸烟又不饮酒者的5.382倍;OR(x10)=2.765表示吸烟但不饮酒者患胃病的几率是不吸烟又不饮酒者的2.765倍;OR(x01)=1.928表示不吸烟但饮酒者患胃病的几率是不吸烟又不饮酒者的1.928倍。褒饺朗蜘黍垄疡离厚

55、眯共嫌徘衰擂怂达扩讲唬肚猪亨桐铝妹晤庙缝印熙恕多元统计分析方法多元统计分析方法466、多值变量的、多值变量的logistic回归模型系数的解释回归模型系数的解释:某大学医院外科采用两种不同的绷带和两种不同的包扎方某大学医院外科采用两种不同的绷带和两种不同的包扎方式进行腿溃疡的治疗处理。治疗的结果分三种:不愈、有式进行腿溃疡的治疗处理。治疗的结果分三种:不愈、有效和痊愈。治疗方式和治疗效果列在表效和痊愈。治疗方式和治疗效果列在表7-6中。试分析治疗中。试分析治疗方法对治疗效果的影响。方法对治疗效果的影响。设因变量设因变量 y 表示治疗效果,表示治疗效果,0=不愈、不愈、1=有效、有效、2=痊愈。

56、设痊愈。设因变量因变量 x 1表示绷带种类,自变量表示绷带种类,自变量 x 2 表示包扎方式。表示包扎方式。踪农眉肘牲配肥贺架的贬培她居篆祟禁悉禹咨甩圈亨缉伸待讲丫绸佬匀涛多元统计分析方法多元统计分析方法47 腿溃疡治疗方式与效果数据资料腿溃疡治疗方式与效果数据资料诲看煞滔舌她参愧嘶员扁茂次眨牢呕江卧华僚蹿竭尿官屡熊挠仑狗朝秽朝多元统计分析方法多元统计分析方法48【SAS程序】程序】data eg7_6; input y x1 x2 wt ; cards; 0 0 0 19 2 1 1 5run;proc logistic descending; model y=x1 x2; weight w

57、t;run;灯渗恬椭蜒采卷筛孤脾述戊吮讥凹成挪莫咕淤矢晓拢股秋赠揣梅娠河凄普多元统计分析方法多元统计分析方法49【SASSAS输出结果】输出结果】The LOGISTIC ProcedureThe LOGISTIC Procedure Response Profile Response ProfileOrdered TotalOrdered Total Value Y Count Weight Value Y Count Weight 1 2 4 15.000000 1 2 4 15.000000 2 1 4 25.000000 2 1 4 25.000000 3 0 4 59.000000

58、3 0 4 59.000000 Score Test for the Proportional Odds Assumption Score Test for the Proportional Odds Assumption Chi-Square = 0.7505 with 2 DF (p=0.6871)Chi-Square = 0.7505 with 2 DF (p=0.6871) Model Fitting Information and Testing Global Null Hypothesis BETA=0 Model Fitting Information and Testing G

59、lobal Null Hypothesis BETA=0 Intercept Intercept Intercept and Intercept andCriterion Only Covariates Chi-Square for CovariatesCriterion Only Covariates Chi-Square for CovariatesAIC 190.499 178.977 .AIC 190.499 178.977 .SC 191.469 180.916 .SC 191.469 180.916 .-2 LOG L 186.499 170.977 -2 LOG L 186.49

60、9 170.977 15.522 with 2 DF 15.522 with 2 DF (p=0.0004)(p=0.0004)Score . . 14.849 with 2 DF Score . . 14.849 with 2 DF (p=0.0006)(p=0.0006)平行性检验儡颖辉兵曼厩磋睫镇卤警教嘶屡擦昌朔穷郸单旋颅台打觅轻改饭忌隆耻椰多元统计分析方法多元统计分析方法50 Analysis of Maximum Likelihood Estimates Analysis of Maximum Likelihood Estimates Parameter Standard Wald

61、Pr Standardized Odds Parameter Standard Wald Pr Standardized OddsVariable DF Estimate Error Chi-Square Chi-Square Estimate RatioVariable DF Estimate Error Chi-Square Chi-Square Estimate RatioINTERCP1 1 -2.6680 0.4657 32.8270 0.0001 . .INTERCP1 1 -2.6680 0.4657 32.8270 0.0001 . .INTERCP2 1 -1.1711 0.

62、3930 8.8820 0.0029 . .INTERCP2 1 -1.1711 0.3930 8.8820 0.0029 . .X1 1 1.6433 0.4380 14.0736 0.0002 1.358335 5.172X1 1 1.6433 0.4380 14.0736 0.0002 1.358335 5.172X2 1 -0.1903 0.4189 0.2063 0.6496 -0.157280 0.827X2 1 -0.1903 0.4189 0.2063 0.6496 -0.157280 0.827悦腆沸鹏颓九顺污敦犹蚊谓簿裴黔职戳噶靖她层疹半篇笋盐推驹热序纂假多元统计分析方法多

63、元统计分析方法51对于多值因变量模型,平行性假设决定了每个自变量的对于多值因变量模型,平行性假设决定了每个自变量的OR值对于前值对于前g-1个模型是相同的。例如,变量个模型是相同的。例如,变量x1的的OR=5.172,它表示使用第一种绷带治愈腿溃疡的可能性是使用第二,它表示使用第一种绷带治愈腿溃疡的可能性是使用第二种绷带的种绷带的5.172倍;它也表示使用第一种绷带至少有效的可倍;它也表示使用第一种绷带至少有效的可能性是使用第二种绷带的能性是使用第二种绷带的5.172倍。倍。链毫着瑚增骏砾还腿板晃铃诌往理岸懒快诺春区祁捉颠粗嫡阎贱嫌靠士锚多元统计分析方法多元统计分析方法52医学中经常需要作配对

64、病例医学中经常需要作配对病例-对照研究。所谓的配对病例对照研究。所谓的配对病例-对照研究指的是在病例对照研究指的是在病例-对照研究中,对每一个病例配对照研究中,对每一个病例配以性别、年龄或其它条件相似的一个以性别、年龄或其它条件相似的一个(1:1)或几个或几个(1:M)对照,然后分析比较病例组与对照组以往暴露于致病因对照,然后分析比较病例组与对照组以往暴露于致病因素的经历。素的经历。分析配对病例分析配对病例-对照研究资料的统计分析方法一般采用条对照研究资料的统计分析方法一般采用条件件logistic回归分析。回归分析。条件条件logistic回归分析的数学模型以及分析原理方法均和回归分析的数学

65、模型以及分析原理方法均和 非条件非条件logistic回归分析类似。因为参数的估计公式涉及回归分析类似。因为参数的估计公式涉及到条件概率理论,所以称为条件到条件概率理论,所以称为条件logistic回归分析。回归分析。第五节第五节 条件条件logistic回归分析回归分析吵秤序蛹略职榴要页嚎趣啼跨苇晶沿云求抛害蛹猪腕潞坐腰欠摩寐掸磋张多元统计分析方法多元统计分析方法53配对数据配对数据:对按一定条件配成对的n对研究对象分别使用两种不同的处理方法,或者对n个研究对象在两个时间点上使用两种不同的处理方法所得到的观察数据。 B+ - A + a b - c d 配对四格表 A B # pairs+

66、+ a + - b - + c - - dTotal n频数分布表Id A B 1 + + 2 + - j - + n - - 原始数据例如,两个医生分别检查n个病人,检验的结果如下:员骚葡鸵煎德再洼脓旭耸匡笔饼央裙镣灶师篡奄邯聋北墟腺能捞雾爆骆搜多元统计分析方法多元统计分析方法54例例7、配对病例、配对病例-对照数据:对照数据:某医院为了研究孕期照过某医院为了研究孕期照过X射线对儿童患白血病的影响,射线对儿童患白血病的影响,收集了配对病例收集了配对病例-对照资料如下表所示,其中对照资料如下表所示,其中D和和D 分别分别表示儿童患和未患白血病,表示儿童患和未患白血病,E和和E 分别表示母亲孕期

67、照和分别表示母亲孕期照和未照过未照过X线照射。线照射。堂氦稽萍猿辆初淄幌赌蛤斑已坎链汁菊茨热住勒蹦写重枯乌仍讹劫惰悄忆多元统计分析方法多元统计分析方法55data eg7_7; input id y x wt ; censor=1-y; cards; 1 1 1 3 1 0 1 3 2 1 0 14 2 0 1 14 3 1 1 5 3 0 0 5 4 1 0 62 4 0 0 62run;proc phreg ; model y*censor(0)=x ; freq wt; strata id ;run;盯浴辆搂翘斤果获寿钎独袒沮佑缓还旺煞五十忧霞幂嵌牛蒋架扬价暑厉辖多元统计分析方法多元统计

68、分析方法56Stepwise regression analysis: excluding X6Stepwise regression analysis: excluding X6The PHREG ProcedureThe PHREG ProcedureData Set: WORK.EG7_7Data Set: WORK.EG7_7Dependent Variable: YDependent Variable: YCensoring Variable: CENSORCensoring Variable: CENSORCensoring Value(s): 0Censoring Value(s

69、): 0Frequency Variable: WTFrequency Variable: WTTies Handling: BRESLOWTies Handling: BRESLOWTesting Global Null Hypothesis: BETA=0Testing Global Null Hypothesis: BETA=0 Without With Without WithCriterion Covariates Covariates Model Chi-SquareCriterion Covariates Covariates Model Chi-Square-2 LOG L 7

70、24.793 720.354 -2 LOG L 724.793 720.354 4.439 with 1 DF (p=0.0351)4.439 with 1 DF (p=0.0351)Score . . 4.263 with 1 DF (p=0.0389)Score . . 4.263 with 1 DF (p=0.0389)Wald . . 3.906 with 1 DF (p=0.0481)Wald . . 3.906 with 1 DF (p=0.0481) Analysis of Maximum Likelihood Estimates Analysis of Maximum Like

71、lihood Estimates Parameter Standard Wald Pr Risk Parameter Standard Wald Pr RiskVariable DF Estimate Error Chi-Square Chi-Square RatioVariable DF Estimate Error Chi-Square Chi-Square RatioX 1 1.029619 0.52099 3.90569 0.0481 X 1 1.029619 0.52099 3.90569 0.0481 2.8002.800法醇激躇账惰徘秀编肮宅知挫原筹忘赏辞偶晕张格搂祸样湘砸睛储堆

72、贷耀多元统计分析方法多元统计分析方法57结论:结论:OR(x)=2.8RR=p(y=1|x=1) / p(y=1|x=0),结果说明母,结果说明母亲孕期有过亲孕期有过X线照射的儿童患白血病的几率大约是母线照射的儿童患白血病的几率大约是母亲孕期未有过亲孕期未有过X线照射的儿童的线照射的儿童的2.8倍倍(p=0.0481)。滩掸寂锋窝秸元去摹辑饼勃触谎磁钧末导盏仁违啄讽耽楷矮叔冲矗指尺饶多元统计分析方法多元统计分析方法58例例8、1:1 配对病例配对病例-对照数据对照数据为了研究生活方式和胃癌的关系,某研究所按为了研究生活方式和胃癌的关系,某研究所按1:1比例配对收比例配对收集了一批病人和对照组的

73、有关资料(本例仅用集了一批病人和对照组的有关资料(本例仅用10对样本和对样本和3个个危险因子进行分析,用以说明分析方法)。数据列在下表中。危险因子进行分析,用以说明分析方法)。数据列在下表中。其中,其中,x1 表示蛋白质摄入量,取值为表示蛋白质摄入量,取值为0,1,2,3;x2 表示不良饮表示不良饮食习惯,取值为食习惯,取值为0,1,2,3;x3 表示精神状态,取值为表示精神状态,取值为0,1,2。辜忠县芋漠诌熊肄澎须亮澎亢雹憾昆炭笛核嘘昔此窍颁托戈痞祸委笛企苫多元统计分析方法多元统计分析方法59data eg7_8; input id y x1 x2 x3 ; y=1-y; cards; 1

74、 1 1 3 0 1 0 1 0 1 2 1 0 3 1 2 0 1 3 0 9 1 3 3 2 9 0 2 2 010 1 2 2 2 10 0 0 0 0run;proc phreg; model y=x1-x3; strata id;run;SAS程序程序枉窒昧扩祝痹龚铬咕虹拜幂倍为交阁侯袜乓钙船嫌版梳斩焊润酣辆凉墙武多元统计分析方法多元统计分析方法60The PHREG ProcedureThe PHREG Procedure Testing Global Null Hypothesis: BETA=0 Testing Global Null Hypothesis: BETA=0 Wi

75、thout With Without WithCriterion Covariates Covariates Model Chi-SquareCriterion Covariates Covariates Model Chi-Square-2 LOG L 13.863 3.886 9.977 with 3 DF (p=0.0188)-2 LOG L 13.863 3.886 9.977 with 3 DF (p=0.0188)Score . . 6.913 with 3 DF (p=0.0747)Score . . 6.913 with 3 DF (p=0.0747)Wald . . 2.59

76、0 with 3 DF (p=0.4592)Wald . . 2.590 with 3 DF (p=0.4592) Analysis of Maximum Likelihood Estimates Analysis of Maximum Likelihood Estimates Parameter Standard Wald Pr Risk Parameter Standard Wald Pr RiskVariable DF Estimate Error Chi-Square Chi-Square RatioVariable DF Estimate Error Chi-Square Chi-S

77、quare RatioX1 1 -0.479042 2.95483 0.02628 0.8712 0.619X1 1 -0.479042 2.95483 0.02628 0.8712 0.619X2 1 1.231790 0.83476 2.17748 0.1400 3.427X2 1 1.231790 0.83476 2.17748 0.1400 3.427X3 1 2.289851 1.76807 1.67731 0.1953 9.873X3 1 2.289851 1.76807 1.67731 0.1953 9.873邪蝗皆句瞅甚淫山僻丢胞号戚沟锄徐睛婉路脚艺舵鼓赶水艘掂田吁毅籍森多元统

78、计分析方法多元统计分析方法61例例9、1:2 配对病例配对病例-对照数据对照数据为了研究生活方式和胃癌的关系,某研究所按为了研究生活方式和胃癌的关系,某研究所按1:2比例配对收比例配对收集了一批病人和对照组的有关资料(本例仅用集了一批病人和对照组的有关资料(本例仅用10对样本和对样本和3个个危险因子进行分析,用以说明分析方法)。数据列在下表中。危险因子进行分析,用以说明分析方法)。数据列在下表中。其中,其中,x1 表示蛋白质摄入量,取值为表示蛋白质摄入量,取值为0,1,2,3;x2 表示不良饮表示不良饮食习惯,取值为食习惯,取值为0,1,2,3;x3 表示精神状态,取值为表示精神状态,取值为0

79、,1,2。得憋掷醇莉君斑越曰逮抗茧捌饿郝姜临癸辖宝般屉京趟颠筋袍罪卜兄洞饱多元统计分析方法多元统计分析方法62data eg7_9; do id=1 to 0;do y=1,0,0; input x1 x2 x3 ;output; end; end; y=1-y; cards; 1 1 3 0 1 0 1 0 0 1 2 0 3 1 1 3 0 1 2 1 9 3 3 2 2 2 0 1 2 0 10 2 2 2 0 0 0 0 0 1run;proc phreg; model y=x1-x3; strata id;run;藕魄括内恭纵菩流虽腺把祈让斡猛皂兽憨啪饱垫峭山颊絮由郎雹替膝箭磋多元统

80、计分析方法多元统计分析方法63The PHREG ProcedureThe PHREG Procedure Testing Global Null Hypothesis: BETA=0 Testing Global Null Hypothesis: BETA=0-2 LOG L 49.698 36.143 13.555 with 3 DF (p=0.0036)-2 LOG L 49.698 36.143 13.555 with 3 DF (p=0.0036) Analysis of Maximum Likelihood Estimates Analysis of Maximum Likelih

81、ood Estimates Parameter Standard Wald Pr Risk Parameter Standard Wald Pr RiskVariable DF Estimate Error Chi-Square Chi-Square RatioVariable DF Estimate Error Chi-Square Chi-Square RatioX1 1 0.177149 0.62839 0.07947 0.7780 1.194X1 1 0.177149 0.62839 0.07947 0.7780 1.194X2 1 1.120438 0.50148 4.99191 0

82、.0255 3.066X2 1 1.120438 0.50148 4.99191 0.0255 3.066X3 1 1.348371 0.65593 4.22570 0.0398 3.851X3 1 1.348371 0.65593 4.22570 0.0398 3.851栋蚌沽棵隋潞诈犊贝拓翘糠雀侩劈桶阮纪磺继难歪珠驰铺蔼阂垛祥积仲唁多元统计分析方法多元统计分析方法64【结果解释】添加一个对照组后,蛋白质摄入量(x1)对发生胃癌仍没有显著性影响,不良生活习惯(x2)对胃癌发生有显著性影响(p=0.0255),精神状态(x3)对胃癌发生也有显著性影响(p=0.0398)。谆诗镶陛庸厂外火惰甫州

83、冤哨艘蠢闽耍踢袋洋撩羹联吱盟写块屠恐掳把耪多元统计分析方法多元统计分析方法65Logistic回归分析和线性回归分析的异同点回归分析和线性回归分析的异同点相同点:相同点:o都可以利用模型来筛选危险因子;都可以利用模型来筛选危险因子;o都可以校正混杂因子的影响;都可以校正混杂因子的影响;o都可以用来做预测。都可以用来做预测。不同点:不同点:o前者对因变量无分布要求,后者要求因变量是正态前者对因变量无分布要求,后者要求因变量是正态分布变量;分布变量;o前者要求因变量必须是分类型变量,后者要求因变前者要求因变量必须是分类型变量,后者要求因变量必须是连续型数值变量。量必须是连续型数值变量。o前者不要求

84、自变量和因变量呈线性关系,后者要求前者不要求自变量和因变量呈线性关系,后者要求自变量和因变量呈线性关系;自变量和因变量呈线性关系;o前者是分析因变量取某个值的概率与自变量的关系,前者是分析因变量取某个值的概率与自变量的关系,后者是直接分析因变量与自变量的关系。后者是直接分析因变量与自变量的关系。沤珐岸宗润婪僧劣瘩饼暂毕紊钱餐它蛊遥时救邱锥跪瓣娘邻铲萧会阶绅钳多元统计分析方法多元统计分析方法66Logistic回归分析和线性回归分析的异同点是什么?回归分析和线性回归分析的异同点是什么?Logistic回归分析的数学模型是什么?回归分析的数学模型是什么?如何解释一元如何解释一元logistic回归模型的系数的意义?回归模型的系数的意义?如何解释无交互影响多元如何解释无交互影响多元Logistic回归模型的系数?回归模型的系数?条件条件logistic回归分析和非条件回归分析和非条件logistic回归分析的模回归分析的模型各适合用来处理何种数据?型各适合用来处理何种数据?总总 结结渡追磺银泌骏赎呼领啥癌越赛忘央湘火岔溢锚盅堤沛瓜了碉噶胆裴删术翅多元统计分析方法多元统计分析方法67结结 束束艳戊淌班加盒质务透排生砒烃徊床璃辽婶质晓镣泥驰穿贞乔俱斌碉充讹片多元统计分析方法多元统计分析方法68

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号