最新医用sas统计分析四幻灯片

上传人:m**** 文档编号:567251541 上传时间:2024-07-19 格式:PPT 页数:75 大小:1.09MB
返回 下载 相关 举报
最新医用sas统计分析四幻灯片_第1页
第1页 / 共75页
最新医用sas统计分析四幻灯片_第2页
第2页 / 共75页
最新医用sas统计分析四幻灯片_第3页
第3页 / 共75页
最新医用sas统计分析四幻灯片_第4页
第4页 / 共75页
最新医用sas统计分析四幻灯片_第5页
第5页 / 共75页
点击查看更多>>
资源描述

《最新医用sas统计分析四幻灯片》由会员分享,可在线阅读,更多相关《最新医用sas统计分析四幻灯片(75页珍藏版)》请在金锄头文库上搜索。

1、医用医用SASSAS统计分析(四)统计分析(四) 一、 多元线性回归q 基本概念 多元线性回归简称多元回归,是研究一个应变量与多个自变量间线性依存关系数量变化规律的一种方法。q 多元线性回归方程式中:b0为回归方程常数项,bj (j=1,2,,m )为偏回归系数,即在其他自变量固定的条件下,Xj改变一个单位时应变量的改变量。 7/19/20247/19/20242 2 Parameter Estimates Parameter Standard T for H0: Variable DF Estimate Error Parameter=0 Prob |T| INTERCEP 1 -3035.

2、536354 2168.6738473 -1.400 0.2111 X1 1 60.931823 36.29713798 1.679 0.1442 X2 1 37.808334 22.98080891 1.645 0.1510 X3 1 101.379460 121.97470310 0.831 0.4377 StandardizedVariable EstimateINTERCEP 0.00000000X1 0.46445689X2 0.39174762X3 0.253994507/19/20247/19/20249 9q 逐步回归 v 简介 逐步回归是筛选自变量的常用的方法之一。筛选自变量

3、的方法还有前进法,后退法和最优回归子集法。逐步回归法是依据事先给定的两个显著性水平SLE和SLS,将自变量逐个引入方程,同时每引入一个新变量后,对已选入的变量要进行逐个检验,将不显著的变量剔除,这样保证最后所得的变量都有显著性。v自变量间的多重共线性(multicollinearity) 整个回归方程的统计检验P 的矛盾现象。 偏回归系数的估计值明显与实际情况不符,或者是偏回归系数的符号与专业知识的情况相反。7/19/20247/19/20241010据专业知识,该自变量与应变量间关系密切,而偏回归系数检验结果P 。 增加(或删除)一个变量,或者改变(或去除)一个观察值,引起回归系数估计值发生

4、大的变化。多重共线性是引起上述问题的重要原因。v解决多重共线性的办法 用主成分估计等有偏估计替代最小二乘估计。 用逐步回归等方法筛选自变量。 如上例7-7,整个回归模型P=0.0355,而b0,b1,b2,b3P值均大于0.05。估计变量之间存在共线性问题。7/19/20247/19/20241111程序7-13data stepreg1;input x1 x2 x3 y ;cards;35 69 0.7 160040 74 2.5 260040 64 2.0 210042 74 3.0 265037 72 1.1 240045 68 1.5 220043 78 4.3 275037 66 2

5、.0 160044 70 3.2 275042 65 3.0 2500;proc reg;model y=x1-x3/stb tol vif collin collinoint R;model y=x1-x3/selection=stepwise sle=0.25 sls=0.25 stb;run;7/19/20247/19/20241212 例(医学统计学王洁贞主编,例15.1) 某科研协作组调查某煤矿期高血压病患者40例,X1为工作面污染程度等级,X2为井下工龄(年),X3为体重(kg),X4为吸烟年限(年),X5为饮酒年限(年),Y为收缩压(kPa),试作多元线性回归分析。data st

6、epreg2;infile d:sassas5wang15_1.txt;input id x1 x2 x3 x4 x5 y ;proc reg;model y=x1-x5/stb tol vif collin collinoint r;model y=x1-x5/selection=stepwise sle=0.05 sls=0.05 stb;run;7/19/20247/19/20241313 二、多元线性相关 研究多个变量间线性关系的一种统计分析方法。变量间相关系数有以下三类:v 简单相关系数 它是说明两个变量相关程度和方向(不考虑其他变量的影响)的统计指标(ri,j)。v 偏相关系数 它

7、是当其他变量固定时,说明某两个变量间相关程度和方向的统计指标(如r12,3)。v 复相关系数R 亦称为全相关系数。说明应变量与各自变量的线性关系的密切程度。v 决定系数 R2 复相关系数的平方。它说明应变量的变异中由各自变量的改变而引起的占多少。如R2=0.8,则说明应变量的变异中有80%由自变量的改变而引起的。7/19/20247/19/20241414 程序7-12data mcorr1;infile d:sassas5mcorr1.txt;input x1 x2 x3 y ;proc corr nosimple; /* 禁止一些简单统计量的输出*/var x1 x2 x3 y; /* 包

8、括了所有变量,实际可以省略*/proc corr nosimple;var x1 x2;partial x3 ; /* partial语句的作用是固定x3 */proc corr nosimple;var x1 x2;partial x3 y; /* partial语句的作用是固定x3和y */run;7/19/20247/19/20241515 三、Logistic回归分析q 简介 Logistic回归模型是适用于应变量(因变量)为分类变量的回归分析。当应变量为分类变量时,如应变量结果为二分类变量的发病、不发病,生存、死亡等,是不能用多元线性回归模型(Y=0+i xi)来分析各种危险因素与应

9、变量之间的关系的。因为应变量Y只能取值为1和0。不符合线性回归模型中应变量Y应具有正态分布和方差齐性的要求,同时线性回归模型得到的Y值会出现大于1或小于0的不合理结果,显然不能用线性回归建立预测模型。 以发病为例,发病的概率为P,不发病的概率为1-P,0P1。公式等号左边简称为logit(P),即logit(P)= 0+i xi可证明,无论Y得何值,均0P1。上式可推导为:7/19/20247/19/20241616q Logistic回归的应用 logistic回归在流行病学和临床流行病学等方面应用广泛,既可用于前瞻性的队列研究,又可用于回顾性的病例对照研究。 常用于:病因学分析; 预后分析

10、; 鉴别诊断; 评价治疗措施; 毒物的半数效量和联合作用 7/19/20247/19/20241717qLogistic回归的分类 按应变量的类型分类为:v 两分类的Logistic回归 非条件logistic回归 即研究对象未经过配对。(在SAS中调用logistic模块进行统计)。 条件logistic回归 即在配对病例对照研究中的1:1和1:M及N:M配对。(在SAS中调用Phreg模块进行统计)。v 多分类有序反应变量的Logistic回归 (在SAS中调用logistic模块进行统计)。v 多分类无序反应变量的Logistic回归 (在SAS中调用Catmod模块进行统计)。本讲主要

11、介绍两分类Logistic回归 7/19/20247/19/20241818q 两分类非条件Logistic回归 语法格式 Proc logistic data=数据集 选项 ; model 应变量名=自变量名列 / 选项 ; freq ;可选项,指明频数变量。 output ; output语句创建一个新的SAS数据集,其含有每个个体的原始数据, pred|p=变量名为在out=数据集中含有每个个体预测概率。【Procroc语句的语句的 选项选项 】 order=data 规定按照数据集中反应变量水平出现的先后顺序进行运算。 descending(或des) 规定按照反应变量降序水平进行运算

12、。7/19/20247/19/20241919 注意:以上两个选项非常重要,如死亡为1,存活为0,为了得到死亡对存活的概率(或者说是死亡的危险),应选择此两个选项之一,否则得到的是存活对死亡的概率,因为logistic回归模型是自动按反应变量值为小的来拟合方程的。反之,如果死亡为0,存活为1,可不选此两项之一, 【 model语句的语句的 选项选项 】 selection=forward(或f)| backward(或b) | stepwise(或s) | score 规定变量的筛选方法,分别为向前、向后、逐步和最优子集法。缺省时为none,拟合全回归模型。 sle=概率值 指定变量进人模型的

13、显著水平,缺省为0.05。 sls=概率值 指定变量剔除模型的显著水平,缺省为0.05。 CL 计算输出所有回归参数的可信区间。7/19/20247/19/20242020 clodds=pl 计算输出OR的可信区间。 scale=none aggregate 要求对模型进行拟合优度检验。 例9-4 40例病人的治愈情况Y(Y=0表示未愈,Y=1表示治愈,病情严重程度X1(X1=0 表示不严重,X1=1表示严重),年龄X2为连续变量,治疗方法X3(X3=0表示新方法,X3=1表示一般疗法),数据如表9.6,试作logistic回归分析。程序9-4data c;infile d:sassas5c

14、x9_4.txt;input y x1-x3;proc logistic des; /*按降序水平进行运算*/model y=x1-x3/scale=none aggregate;/*对模型进行拟合优度检验*/Output out=b p=pr; /*在数据集b中含有每个个体的预测概率值*/ run;7/19/20247/19/20242121 The LOGISTIC Procedure Data Set: WORK.C 数据集名 Response Variable: Y 反应变量Y Response Levels: 2 反应变量水平数2 Number of Observations: 40

15、 观察值40 Link Function: Logit 联系函数logit Response Profile 反应变量的描述 Ordered 顺序值 Value Y Count 计数值 1 1 17 2 0 23 7/19/20247/19/20242222 Deviance and Pearson Goodness-of-Fit Statistics 模型的拟合优度检验 Pr Criterion DF Value Value/DF Chi-SquareDeviance 31 36.3231 1.1717 0.2344Pearson 31 29.5583 0.9535 0.5402 Model

16、 Fitting Information and Testing Global Null Hypothesis BETA=0 模型拟合信息和整体偏回归系数为0 的假设检验 Intercept Intercept andCriterion Only Covariates Chi-Square for Covariates判断的准则 仅有截距 所有变量 协变量的卡方AIC 56.548 55.413 .SC 58.237 62.169 .-2 LOG L 54.548 47.413 7.135 with 3 DF (p=0.0677)Score . . 6.630 with 3 DF (p=0.0

17、847)7/19/20247/19/20242323 Analysis of Maximum Likelihood Estimates 最大似然法估计值分析 Parameter Standard Wald Pr Standardized OddsVariable DF Estimate Error Chi-Square Chi-Square Estimate RatioINTERCPT 1 3.7025 2.1442 2.9817 0.0842 . .X1 1 -0.6157 0.7135 0.7446 0.3882 -0.171877 0.540X2 1 -0.0939 0.0636 2.1

18、812 0.1397 -0.309336 0.910X3 1 -1.5236 0.7396 4.2430 0.0394 -0.424813 0.218 Association of Predicted Probabilities and Observed Responses 模型回代判别分析 Concordant = 71.9% (一致率) Somers D = 0.448 Discordant = 27.1% (非一致率) Gamma = 0.452 Tied = 1.0% (结点率) Tau-a = 0.224 (391 pairs) c = 0.7247/19/20247/19/2024

19、2424治愈的概率模型为: 例2为了探讨冠心病发生的有关危险因素,对26例冠心病病人和28例对照者进行病例对照研究,各因素的说明见下表。试用logistic逐步回归分析方法筛选危险因素。7/19/20247/19/20242525表冠心病8个可能的危险因素与赋值因素变量名赋值说明年龄(岁)X145=1,4554=2,5564=3,65=4高血压史X2无=0,有=1高血压家族史X3无=0,有=1吸烟X4不吸=0,吸=1高血脂史X5无=0,有=1动物脂肪摄入X6低=0,高=1体重指数(BMI)X724=1,2426=2,26=3A型性格X8否=0,是=1冠心病Y 对照=0,病例=17/19/202

20、47/19/20242626程序data ex16_2; infile d:sassas5log2.txt; input x1-x8 y;proc logistic des; model y=x1-x8/selection=stepwise sle=0.1 sls=0.1clodds=pl ;run;7/19/20247/19/20242727q条件Logistic 回归 条件Logistic回归分析是用phreg(proportional hazard regression ,比例风险回归)模块完成的。 Phreg模块主要用于Cox回归的计算) 语法格式 在data步先建立一个时间哑变量,一

21、般为time=1-case;(如病例case=1,对照case=0,则病例哑变量time=0,对照哑变量time=1,要求病例的time要小,对照的time要大)。如果病例case=0,对照case=1,时间哑变量为time=case。 Proc phreg 选项 ; model =/选项;7/19/20247/19/20242828Strata ;Freq ;【Proc phreg 选项 】;nosummary 不打印输出事件和截尾数值。 simple 输出模型中变量的简单统计描述【 model 过程过程 选项选项 】 ties=discrete 用离散的logistic模型替代比例风险模型

22、。此句必选!selection=forward(或f)| backward(或b) | stepwise(或s) | score 规定变量的筛选方法,分别为向前、向后、逐步和最优子集法。缺省时为none,拟合全回归模型。7/19/20247/19/20242929 sle=概率值 指定变量进人模型的显著水平,缺省为0.05。 sls=概率值 指定变量剔除模型的显著水平,缺省为0.05。 risklimits 计算输出RR的可信区间。 alpha=概率值 指定RR的(1-)可信区间,缺省时为0.05。q 1:1配对条件Logistic回归 例9-8 为研究胃癌的危险因素,某医学院用103对1:1

23、配对资料,这里选用其中10对三个因素,即X1(蛋白质摄入量0,1,2,3),X2(不良饮食习惯0,1,2,3)及X3(精神因素0,1,2)。数据如表9.11。试作条件Logistic回归分析。7/19/20247/19/20243030表9.11 10对胃癌的1:1配对数据对号病例对照X1X2X3X1X2X3123456789101001101132331212113201201212221101120020032020002010001000007/19/20247/19/20243131程序data log1_2;do id=1 to 10;do case=0 to 1;input x1-

24、x3 ;time=case;output;end;end;cards; 1 3 0 1 0 1 0 3 2 1 3 0 0 1 2 0 2 0 1 2 0 1 0 0 1 1 1 1 2 1 0 2 2 2 0 01 1 1 0 0 01 1 2 0 0 03 3 2 2 2 02 2 2 0 0 0;proc phreg;model time*case(1)=x1-x3/ties=discrete selection=stepwise sle=0.25 sls=0.25;strata id;run;7/19/20247/19/20243232 The PHREG Procedure Data

25、 Set: WORK.LOG1_2 Dependent Variable: TIME 反应变量time Censoring Variable: CASE 截尾变量case Censoring Value(s): 1 截尾值为1 Ties Handling: DISCRETE 结点处理方法为 discrete Summary of the Number of Event and Censored Values PercentStratum ID Total Event Censored Censored 1 1 2 1 1 50.00 2 2 2 1 1 50.0010 10 2 1 1 50.

26、00- Total 20 10 10 50.007/19/20247/19/20243333 Step 1: Variable X3 is entered. The model contains the following explanatory variables. X3 Testing Global Null Hypothesis: BETA=0 Without With Criterion Covariates Covariates Model Chi-Square -2 LOG L 13.863 7.158 6.705 with 1 DF (p=0.0096) Score . . 5.

27、538 with 1 DF (p=0.0186) Wald . . 3.139 with 1 DF (p=0.0764)7/19/20247/19/20243434Step 2: Variable X2 is entered. The model contains the following explanatory variables. X2 X3 Testing Global Null Hypothesis: BETA=0 Without With Criterion Covariates Covariates Model Chi-Square -2 LOG L 13.863 3.724 1

28、0.139 with 2 DF (p=0.0063) Score . . 7.229 with 2 DF (p=0.0269) Walt . . 2.467 with 2 DF (p=0.2913)NOTE: No (additional) variables met the 0.25 level for entry into the model.7/19/20247/19/20243535 Analysis of Maximum Likelihood Estimates Parameter Standard Wald Pr RiskVariable DF Estimate Error Chi

29、-Square Chi-Square Ratio 变量 自由度 参数估计值 标准误 wald卡方值 P值 RR值X2 1 1.165351 0.81080 2.06579 0.1506 3.207X3 1 2.067157 1.63944 1.58985 0.2073 7.902 Summary of Stepwise Procedure Variable Number Score Wald Pr Step Entered Removed In Chi-Square Chi-Square Chi-Square 1 X3 1 5.5385 . 0.0186 2 X2 2 3.4594 . 0.0

30、629胃癌患病的概率模型为:7/19/20247/19/20243636q 1:M或N:M的条件Logistic回归 1:M配比是一个病例配M个对照,N:M配比是N个病例配M个对照。使用的SAS语句和1:1配对基本是一致的。 例题 某北方城市研究喉癌发病的危险因素,用1:2配对的病例-对照研究方法进行了调查。先选取了6个可能的危险因素并节录25对数据,各因素的赋值说明见下表1,资料列于表2。试作条件Logistic逐步回归。 7/19/20247/19/20243737表1 喉癌的危险因素与赋值说明 因素 变量名 赋值说明咽炎 X1 无=1,偶尔=2,经常=3吸烟量(支/日) X2 0=1,1

31、4=2,59=3,1020=4,20=5声嘶史 X3 无=1,偶尔=2,经常=3摄食新鲜蔬菜 X4 少=1,经常=2,每天=3摄食水果 X5 很少=1,少量=2,经常=3癌症家族史 X6 无=0,有=1是否患喉癌 Y 病例=1,对照=0 7/19/20247/19/20243838表2 喉癌1:2配对病例-对照调查资料整理表配比组号 i Y X1 X2 X3 X4 X5 X6 j 1 1 3 5 1 1 1 0 0 1 1 1 3 3 0 0 1 1 1 3 3 0 2 1 1 3 1 1 3 0 0 1 1 1 3 2 0 0 1 2 1 3 2 0 i 25 1 1 4 1 1 1 1 0

32、 1 1 1 3 2 0 0 1 1 1 3 3 0 7/19/20247/19/20243939 程序data log1_4;infile d:sassas5log1_4.txt;do i=1 to 25; do j=1 to 3;input y x1-x6;time=1-y;output;end;end;proc phreg nosummary;model time*y(0)=x1-x6/ties=discrete selection=stepwise sle=0.1 sls=0.1 risklimits;strata i;run;7/19/20247/19/20244040四、 生存分析

33、q 简介v 概念 生存分析是将事件的结果和出现此结果所经历的时间结合起来分析的统计分析方法。v 生存分析的数据 完全数据 即掌握研究事件的起点,又掌握终点的生存时间资料为完全数据,一般用t来表示。 不完全数据 因迁移原因失去联系;死于其他原因;在总结分析时仍然生存。生存分析中称这种不完全数据为截尾数据、删失数据、终检数据(censoreddata)。v 生存率(survivalrate)又称累积生存概率,即个体活过时点t的概率,用S(t)表示。7/19/20247/19/20244141v 生存分析的三种变量1.目标变量 即生存时间,常记为t。2.协变量 可以是研究因素,也可以是排除其影响的因

34、素,常记为x1,x2,xp。3.截尾变量 常记为censor或d等。 v 生存分析的任务 估计生存率;比较生存率;寻找影响因素。v 生存分析的方法 参数法 已知生存时间T 服从某特定的分布类型,对分布的参数作统计描述与推断。常见的有:Weibull分布,指数分布,正态分布等。相应的SAS过程为lifereg。非参数法 不知生存时间T的分布类型或不符合特定的分布类型,对整个分布或某个特征作统计描述与推断。常用乘积极限7/19/20247/19/20244242法(product limit method)和寿命表法(life table method)估计生存率和中位生存时间等;用时序检验(lo

35、g-rank test),Wilcoxon检验和似然比检验等作分组比较。相应的SAS过程为:lifetest 半参数法 不知生存时间分布确切类型,用模型的方法对模型的部分参数作统计描述与推断。常用的是Cox模型。相应的SAS过程为:phreg。 注:半参数法与参数法可用来研究多个因素对生存时间的影响,非参数法难以实施多因素生存分析。q 非参数法的lifetest过程v 语法格式: PROC LIFETEST 选项; TIME ;7/19/20247/19/20244343STRATA;(指定比较的分组变量,按分组变量名列 分别进行分析和比较。)TEST; (指定协变量名列,检验生存时间与该变量

36、是 否有关)Freq ; (指定频数变量名)v PROC过程选项 1.method=方法 指定估计生存率所用的方法: PL 要求用乘积极限法(即Kaplan-Meier 法)估计生存率并计算中位生存时间等,为缺省方法。 LT 要求用寿命表法估计生存率等。2.intervals=(初值 to 终值 by 步长) 或 width=数值只能在指定方法为寿命表法时使用。用寿命表法分析时,程序会自动7/19/20247/19/20244444 给定生存时间的区间。如果人为规定生存时间的分组区间,则需用该选项指定。3. Plots=绘图类型 要求输出生存分析图。可供输出的图形有: S 对生存函数S(t)作

37、图。横、纵坐标分别为t,S(t)。 H 对风险函数作图。横、纵坐标分别为t,H(t)。v 小样本资料的乘积极限法 (Kaplan-Meier法 )例15-1 25例某种癌症的患者在不同的日期随机分配至两治疗组,分别以A、B两种治疗方法进行治疗。治疗后继续对这些病人进行随访至到2003年5月31日结束。资料如表15.1所示,数字后又+号者为删失值。试进行生存率分析。7/19/20247/19/20244545data life1;do group=1 to 2;input n;do i=1 to n;input t ;if t Test Chi-Square DF Chi-Square Log-

38、Rank 时序检验 0.6640 1 0.4152 Wilcoxon 秩和检验 0.3272 1 0.5673 -2Log(LR) 似然比检验 1.0362 1 0.30877/19/20247/19/20245252例 王洁贞主编医学统计学例14.1 P202手术疗法组: 52 78 92 96 105 123 145 136* 157* 182* 209* 224*手术+化疗组:79 95 117 175 203 102* 157* 199* 216* 246* 269 7/19/20247/19/20245353data life2;do group=1 to 2;input n;do

39、i=1 to n;input t ;if t Test Chi-Square DF Chi-Square Log-Rank 28.6179 1 0.0001 Wilcoxon 24.6082 1 0.0001 -2Log(LR) 24.7436 1 0.0001 寿命表资料程序编制的循环语句如下:7/19/20247/19/20246060data life4;do g=1 to 2; /* g=1为甲疗法,g=2为乙疗法*/ input n; /* 输入两疗法的组段数*/ do censor=0 to 1; /* censor=0为死亡数,censor=1为截尾数据*/ do i=1 to

40、n; input t f ; /* 输入每个组段的下限时间和人数 */ output; end; end;end;cards; 4 0 8 7 5 13 4 19 2 0 0 7 1 13 0 19 0 6 7 4 13 2 19 2 25 3 31 1 37 0 7 4 13 2 19 3 25 2 31 4 37 1 ;proc lifetest method=lt width=6 plots=(s) formchar(1,2,7)=|-+;time t*censor(1);strata g;freq f;run;7/19/20247/19/20246161五、Cox回归分析q 简介 Co

41、x回归亦称Cox比例风险回归(Coxs proportional hazard regression),Cox回归是生存分析中最重要的分析方法之一,其优点是使用条件很宽和便于作多因素分析。 Cox回归是将生存时间和各种影响因素(协变量)关系用回归方程式来表示,主要解决多因素(如年龄、职业、吸烟、病情、治疗等)对生存期的影响。由于生存数据不仅包含生存时间T,同时还有截尾数据,这就造成了用回归方法来研究生存时间的困难,因此Cox将协变量对生存期的影响表现为它对危险函数的关系上,以危险度h(t,x)作为反应变量(时间变量),解决了截尾数据的困难,是多因素生存分析成为可能。7/19/20247/19/

42、20246262q Cox模型的基本公式 h(t ,x)=h0(t)exp(1X1+2X2+pXp)式中h(t ,x)为风险率函数,即在协变量(X)影响下的生存时间已达到t的观察对象在时刻t的瞬时死亡率;h0(t)是所有危险因素为0时的基础风险率,它是未知的; 是Cox模型的回归系数,是需要估计的参数。j0,则Xj取值越大时,h(t ,x)的值越大,表示病人死亡的风险越大;j=0,则Xj取值对h(t ,x)没有影响;j0,则Xj取值越大时,h(t ,x)的值越小,表示病人死亡的风险越小;RR(或OR)= h(t ,x)/h0(t)=exp(1X1+2X2+pXp)7/19/20247/19/2

43、0246363qCox回归模型的应用Cox模型属半参数模型,对资料没有特殊的要求,主要用于肿瘤和其他慢性病的预后分析,还用于慢性病复发期、治愈期及药物的生效时间等资料。q语法格式 Proc phreg 选项 ; model =/选项; Strata ; Freq ;7/19/20247/19/20246464 output ; output语句创建一个新的SAS数据集,其含有每个个体的原始数据,包括自变量Xj,生存时间,截尾指示变量。Xbeta=PI为在out=数据集中含有每个个体的预后指数(PI=jXj),PI指数越大,病人死亡的危险性越大,PI指数越小,病人死亡的危险性越小。【 proc过

44、程过程 选项选项 】 nosummary 不打印输出事件和截尾数值。 simple 输出模型中变量的简单统计描述。 【 model 过程过程 选项选项 】7/19/20247/19/20246565 ties=breslow 是用近似似然估计,为默认的选项。 ties=discrete 用离散的logistic 模型替代比例风险模型。selection=forward(或f)| backward(或b) | stepwise(或s) | score 规定变量的筛选方法,分别为向前、向后、逐步和最优子集法。缺省时为none,拟合全回归模型。 sle=概率值 指定变量进人模型的显著水平,缺省为0.

45、05。 sls=概率值 指定变量剔除模型的显著水平,缺省为0.05。 risklimits 计算输出RR的可信区间。 alpha=概率值 指定RR的(1-)可信区间,缺省时为0.05。7/19/20247/19/20246666例 王洁贞主编医学统计学 P263 表18-2 某恶性肿瘤的影响因素及量化值变量 含 义 量化值 X1 X2 X3 X4 X5 X6 T Y病人的年龄性别组织学类型治疗方式淋巴结是否转移肿瘤的浸润程度病人的生存时间病人的结局岁女 0 , 男1 低分化 0 ,高分化 1 新治疗方式 0 ,传统治疗方式 1否 0 ,是 1 未突破浆膜层 0 ,突破浆膜层 1月死亡 0 ,

46、截尾 17/19/20247/19/20246767程序data cox;infile d:sassas5cox.txt;input id x1-x6 t y;proc phreg data=cox;model t*y(1)=x1-x6/selection=stepwise risklimits;output out=cox1 xbeta=PI;run;7/19/20247/19/20246868 The PHREG Procedure Data Set: WORK.COX 分析的数据集名 Dependent Variable: T 时间变量 Censoring Variable: Y 截尾变

47、量 Censoring Value(s): 1 截尾值 Ties Handling: BRESLOW 似然函数形式 Summary of the Number of Event and Censored Values 时间和结尾数据的摘要 Percent Total Event Censored Censored 63 26 37 58.737/19/20247/19/20246969Step 1: Variable X4 is entered. The model contains the following explanatory variables. X4 Testing Global

48、Null Hypothesis: BETA=0 偏回归系数为0 的假设检验 Without WithCriterion Covariates Covariates Model Chi-Square 准则 无协变量 有协变量 模型卡方-2 LOG L 201.994 187.690 14.304 with 1 DF (p=0.0002)Score . . 13.040 with 1 DF (p=0.0003)Wald . . 10.265 with 1 DF (p=0.0014)7/19/20247/19/20247070Step 2: Variable X5 is entered. The m

49、odel contains the following explanatory variables. X4 X5 Without WithCriterion Covariates Covariates Model Chi-Square-2 LOG L 201.994 182.777 19.217 with 2 DF (p=0.0001)Score . . 17.594 with 2 DF (p=0.0002)Wald . . 14.579 with 2 DF (p=0.0007)NOTE: No (additional) variables met the 0.05 level for ent

50、ry into the model.7/19/20247/19/20247171 Analysis of Maximum Likelihood Estimates 最大似然估计的分析 Parameter Standard Wald Pr Variable DF Estimate Error Chi-Square Chi-Square 变量 自由度 参数估计值 标准误 wald卡方 P值X4 1 1.761621 0.54791 10.33726 0.0013X5 1 0.931330 0.44455 4.38899 0.0362 Conditional Risk Ratio and 95% C

51、onfidence Limits 相对危险度和其95%可信区间 Risk Variable Ratio Lower Upper RR 下限 上限 X4 5.822 1.989 17.039 X5 2.538 1.062 6.066 7/19/20247/19/20247272 Summary of Stepwise Procedure 逐步回归摘要 Variable Number Score Wald Pr Step Entered Removed In Chi-Square Chi-Square Chi-Square步数 进入 剔出 变量数 score卡方 P值 1 X4 1 13.0399

52、 . 0.0003 2 X5 2 4.7039 . 0.0301 h(t ,x)=h0(t)exp(1.761621X4+0.931330X5) 或 RR(OR )=exp(1.761621X4+0.931330X5)7/19/20247/19/20247373例题 本书练习13第2题data lx13_2;do g=1 to 2;do i=1 to 21;input t b ;if t0 then censor=1;else censor=0;t=abs(t);output;end;end;cards;-6 1.6 6 0.205 6 11.5 6 1.9 7 2.7 -9 0.63 -10

53、 0.50 10 0.90 -11 0.40 13 0.76 16 3.99 -17 0.145 -19 0.114 -20 0.103 22 0.21 23 0.37 -25 0.06 -32 0.16 -32 0.34 -34 0.03 -35 0.0281 0.63 1 100 2 81.3 2 30.2 3 10.24 4 22.91 4 0.265 5 3.09 5 9.33 8 3.31 8 1.122 8 0.21 8 1.82 11 3.09 11 0.132 12 0.031 12 1.15 15 0.20 17 0.89 22 0.54 23 0.093;proc lifetest plots=(s) formchar(1,2,7)=|-+;time t*censor(1);strata g;test b;proc phreg;model t*censor(1)=b g/risklimits;run;7/19/20247/19/20247474

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号