第八章 回归分析

举报
资源描述
第八章 回归分析第一节 Linear 过程8.1.1 主要功能8.1.2 实例操作第二节 Curve Estimation 过程8.2.1 主要功能8.2.2 实例操作第三节 Logistic 过程8.3.1 主要功能8.3.2 实例操作第四节 Probit 过程8.4.1 主要功能8.4.2 实例操作第五节 Nonlinear 过程8.5.1 主要功能8.5.2 实例操作回归分析是处理两个及两个以上变量间线性依存关系的统计方法。在医学领域中,此类问题很普遍,如人头发中某种金属元素的含量与血液中该元素的含量有关系,人的体表面积与身高、体重有关系;等等。回归分析就是用于说明这种依存变化的数学关系。第一节 Linear 过程8.1.1 主要功能调用此过程可完成二元或多元的线性回归分析。在厄尔多元线性回归分析中,用户还可根据需要,选用不同筛选自变量的方法(如:逐步法、向前法、向后法,等) 。返回目录 返回全书目录8.1.2 实例操作[例 8.1]某医师测得 10 名 3 岁儿童的身高(cm) 、体重(kg)和体表面积(cm 2)资料如下。试用多元回归方法确定以身高、体重为自变量,体表面积为应变量的回归方程。儿童编号 体表面积(Y) 身高(X 1) 体重(X 2)123456789105.3825.2995.3585.2925.6026.0145.8306.1026.0756.41188.087.688.589.087.789.588.890.490.691.211.011.812.012.313.113.714.414.915.216.08.1.2.1 数据准备激活数据管理窗口,定义变量名:体表面积为 Y,保留 3 位小数;身高、体重分别为X1、X2,1 位小数。输入原始数据,结果如图 8.1所示。图 8.1 原始数据的输入8.1.2.2 统计分析激活 Statistics 菜单选 Regression 中的 Linear...项,弹出 Linear Regression 对话框(如图8.2 示) 。从对话框左侧的变量列表中选 y,点击  钮使之进入 Dependent 框,选 x1、x2,点击  钮使之进入 Indepentdent(s)框;在 Method 处下拉菜单,共有 5 个选项:Enter (全部入选法) 、Stepwise(逐步法) 、Remove(强制剔除法) 、Backward(向后法) 、Forward(向前法) 。本例选用 Enter 法。点击 OK 钮即完成分析。图 8.2 线性回归分析对话框用户还可点击 Statistics...钮选择是否作变量的描述性统计、回归方程应变量的可信区间估计等分析;点击 Plots...钮选择是否作变量分布图(本例要求对标准化 Y 预测值作变量分布图) ;点击 Save...钮选择对回归分析的有关结果是否作保存(本例要求对根据所确定的回归方程求得的未校正 Y 预测值和标准化 Y 预测值作保存) ;点击 Options...钮选择变量入选与剔除的 α、β 值和缺失值的处理方法。8.1.2.3 结果解释在结果输出窗口中将看到如下统计数据:* * * * M U L T I P L E R E G R E S S I O N * * * *Listwise Deletion of Missing DataEquation Number 1 Dependent Variable.. YBlock Number 1. Method: Enter X1 X2Variable(s) Entered on Step Number1.. X22.. X1Multiple R .94964R Square .90181Adjusted R Square .87376Standard Error .14335Analysis of VarianceDF Sum of Squares Mean SquareRegression 2 1.32104 .66052Residual 7 .14384 .02055F = 32.14499 Signif F = .0003------------------ Variables in the Equation ------------------Variable B SE B Beta T Sig TX1 .068701 .074768 .215256 .919 .3887X2 .183756 .056816 .757660 3.234 .0144(Constant) -2.856476 6.017776 -.475 .6495End Block Number 1 All requested variables entered.结果显示,本例以 X1、 X2 为自变量,Y 为应变量,采用全部入选法建立回归方程。回归方程的复相关系数为 0.94964,决定系数(即 r2)为 0.90181,经方差分析,F=34.14499,P=0.0003,回归方程有效。回归方程为 Y=0.0687101X1+0.183756X2-2.856476。本例要求按所建立的回归方程计算 Y 预测值和标准化 Y 预测值(所谓标准化 Y 预测值是指将根据回归方程求得的 Y 预测值转化成按均数为 0、标准差为 1 的标准正态分布的Y 值)并将计算结果保存入原数据库。系统将原始的 X1、X2 值代入方程求 Y 值预测值(即库中 pre_1 栏)和标准化 Y 预测值(即库中 zpr_1 栏) ,详见图 8.3。图 8.3 计算结果的保存本例还要求对标准化 Y 预测值作变量分布图,系统将绘制的统计图送向 Chart Carousel窗口,双击该窗口可见下图显示结果。图 8.4 对标准化 Y 预测值所作的正态分布图返回目录 返回全书目录第二节 Curve Estimation 过程8.2.1 主要功能调用此过程可完成下列有关曲线拟合的功能:1、Linear:拟合直线方程(实际上与 Linear过程的二元直线回归相同,即 Y = b0+ b1X) ;2、Quadratic:拟合二次方程(Y = b 0+ b1X+b2X2) ;3、Compound:拟合复合曲线模型(Y = b 0×b1X) ;4、Growth:拟合等比级数曲线模型(Y = e (b0+b1X)) ;5、Logarithmic:拟合对数方程(Y = b 0+b1lnX)6、Cubic:拟合三次方程(Y = b 0+ b1X+b2X2+b3X3) ;7、S:拟合 S形曲线(Y = e (b0+b1/X)) ;8、Exponential:拟合指数方程(Y = b 0 eb1X) ; 9、Inverse:数据按 Y = b0+b1/X进行变换;10、Power:拟合乘幂曲线模型(Y = b 0X b1) ;11、Logistic:拟合 Logistic曲线模型(Y = 1/(1/u + b 0×b1X) 。返回目录 返回全书目录8.2.2 实例操作[例 8.2]某地 1963 年调查得儿童年龄(岁)X 与锡克试验阴性率(%)Y 的资料如下,试拟合对数曲线。年龄(岁)X锡克试验阴性率(% )Y123456757.176.090.993.096.795.696.28.2.2.1 数据准备激活数据管理窗口,定义变量名:锡克试验阴性率为 Y,年龄为 X,输入原始数据。8.2.2.2 统计分析激活 Statistics 菜单选 Regression 中的 Curve Estimation...项,弹出 Curve Estimation 对话框(如图 8.5 示) 。从对话框左侧的变量列表中选 y,点击  钮使之进入 Dependent 框,选 x,点击  钮使之进入 Indepentdent(s)框;在 Model 框内选择所需的曲线模型,本例选择 Logarithmic 模型(即对数曲线) ;选 Plot models 项要求绘制曲线拟合图;点击 Save...钮,弹出 Curve Estimation:Save 对话框,选择 Predicted value 项,要求在原始数据库中保存根据对数方程求出的 Y 预测值,点击 Continue 钮返回 Curve Estimation 对话框,再点击 OK 钮即可。图 8.5 曲线拟合对话框8.2.2.3 结果解释在结果输出窗口中将看到如下统计数据:ndependent: XDependent Mth Rsq d.f. F Sigf b0 b1Y LOG .913 5 52.32 .001 61.3259 20.6704在以 X 为自变量、Y 为应变量,采用对数曲线拟合方法建立的方程,决定系数R2=0.913(接近于 1) ,作拟合优度检验,方差分析表明:F=52.32 ,P=0.001 ,拟合度很好,对数方程为:Y=61.3259+20.6704lnX。本例要求绘制曲线拟合图,结果如图 8.6 所示。图 8.6 对数曲线拟合情形根据方程 Y=61.3259+20.6704lnX,将原始数据 X 值代入,求得 Y 预测值(变量名为fit_1)存入数据库中,参见图 8.7。图 8.7 计算结果的保存返回目录 返回全书目录第三节 Logistic 过程8.3.1 主要功能调用此过程可完成 Logistic回归的运算。所谓 Logistic回归,是指应变量为二级计分或二类评定的回归分析,这在医学研究中经常遇到,如:死亡与否(即生、死二类评定)的概率跟病人自身生理状况和所患疾病的严重程度有关;对某种疾病的易感性的概率(患病、不患病二类评定)与个体性别、年龄、免疫水平等有关。此类问题的解决均可借助逻辑回归来完成。特别指出,本节介绍的 Logistic过程,应与日常所说的 Logistic曲线模型(即 S或倒 S形曲线)相区别。用户如果要拟合 Logistic曲线模型,可调用本章第二节 Curve Estimation过程,系统提供 11种曲线模型,其中含有 Logistic曲线模型(参见上节) 。在一般的多元回归中,若以 P(概率)为应变量,则方程为P=b0+b1X1+b2X2+…+bkXk,但用该方程计算时,常会出现 P>1 或 P<0 的不合理情形。为此,对 P 作对数单位转换,即logitP=ln(P/1-P),于是,可得到 Logistic回归方程为:eb0+b1X1+b2X2+…+bkXkP = ———————————1+ eb0+b1X1+b2X2+…+bkXk返回目录 返回全书目录8.3.2 实例操作[例 8.3]某医师研究男性胃癌患者发生术后院内感染的影响因素,资料如下表,请通过Logistic回归统计方法对主要影响因素进行分析。术后感染(有无)Y年龄(岁)X1手术创伤程度(5 等级)X2营养状态(3 等级)X3术前预防性抗菌(有无)X4白细胞数(×10 9/L)X5癌肿病理分度(TNM 得分总和)X6有有无无无有无有有无无无无无无697257413265585455596436424850453113
展开阅读全文
温馨提示:
金锄头文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档


电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号