实验四 回归分析SAS过程(1)讲解

上传人:我** 文档编号:114383555 上传时间:2019-11-11 格式:DOC 页数:29 大小:664.50KB
返回 下载 相关 举报
实验四 回归分析SAS过程(1)讲解_第1页
第1页 / 共29页
实验四 回归分析SAS过程(1)讲解_第2页
第2页 / 共29页
实验四 回归分析SAS过程(1)讲解_第3页
第3页 / 共29页
实验四 回归分析SAS过程(1)讲解_第4页
第4页 / 共29页
实验四 回归分析SAS过程(1)讲解_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《实验四 回归分析SAS过程(1)讲解》由会员分享,可在线阅读,更多相关《实验四 回归分析SAS过程(1)讲解(29页珍藏版)》请在金锄头文库上搜索。

1、课时授课计划课次序号: 10 一、课题:实验四 回归分析SAS过程(1)统计推断与预测二、课型:上机实验三、目的要求:1. 掌握利用SAS建立多元回归方程的方法;2. 能检验所建立回归方程的显著性与方程系数的显著性,能根据实际问题作预测与控制.四、教学重点:会对实际数据建立有效的多元回归模型;能对回归模型进行运用,对实际问题进行预测或控制.教学难点:多元回归模型的建立.五、教学方法及手段:传统教学与上机实验相结合六、参考资料:应用多元统计分析,高惠璇编,北京大学出版社,2005;使用统计方法与SAS系统,高惠璇编,北京大学出版社,2001;多元统计分析(二版),何晓群编,中国人民大学出版社,2

2、008;应用回归分析(二版),何晓群编,中国人民大学出版社,2007;统计建模与R软件,薛毅编著,清华大学出版社,2007.七、作业:2.3(单) 2.4 八、授课记录:授课日期班次九、授课效果分析:实验四 回归分析SAS过程(1)2学时一、实验目的和要求掌握利用SAS建立多元回归方程的方法,掌握PROC REG过程,并能检验所建立回归方程的显著性与方程系数的显著性,能根据实际问题作预测与控制二、实验内容1. PROC REG过程一般格式:PROC REG ;MODEL 因变量=回归变量/ ;其它选择语句 ;OUTPUT OUT=SAS数据集名 关键字名=输出数据集中的变量名;RUN;(1)P

3、ROC REG语句此语句是PROC REG过程的必需语句,指出要进行分析的数据集省略此项,SAS系统对最新建立的数据集进行分析(2)MODEL语句中的选项部分该语句定义建模用的因变量、回归变量(自变量)、模型的选择及拟合结果输出的选择在关键词“Model”之后,应指明因变量,等号后依次列出回归变量,每个变量间用空格分开此语句的选项部分提供了最优模型的选择方法和其他拟合结果的输出选项,其中包括:1) 选择合适的建立模型方法:SELECTION=name其中“name”可以是FORWARD(或F)、BACKWARD(或B)、STEPWISE、RSQUARE、ADJRSQ、CP等之一l SELECT

4、ION=FORWARD SLENTRY=显著性水平向前选择最优模型法(FORWARD):从仅含常数项的回归模型开始,逐个加入自变量,对每一个尚不在方程内的自变量按一定显著性水平,根据其一旦进入模型后对模型的贡献大小逐步引入方程,直至再没有对模型有显著贡献的自变量“SLENTRY=显著性水平”为自变量进入模型的控制水平,写在选择方法语句之后若省去此句,则SAS系统默认的水平为SLENTRY=0.05l SELECTION=BACKWARD SLSTAY=显著性水平向后删除法(BACKWARD):先建立包含全部自变量的线性回归模型,然后按一定的显著性水平从模型中逐步剔除变量缺省SLSTAY =0.

5、1l SELECTION=STEPWISE SLENTRY =入选水平 SLSTAY=剔除水平逐步回归法(STEPWISE):按向前选择法(前进法)进入变量,再对模型内所有变量检验,看是否有因新变量引入而对模型的贡献变得不显著,若有就剔除,若无则保留,直至方程内所有变量均显著逐步法有两个控制水平,即选入水平(SLENTRY=入选水平)和剔除水平(SLSTAY=剔除水平),而且剔除水平应低于选入水平缺省SLENTRY =0.15 SLSTAY =0.15l SELECTION=RSQUARE在所有可能的回归方程中用 准则选择最优模型的方法在每一个给定的自变量个数的水平上,打印出使达到最大的那个回

6、归模型的拟合结果l SELECTION=ADJRSQ:修订的准则选择最优模型法l SELECTION=CP:准则选择最优模型法注意:以上方法只可在选项部分写出其中一种,不可并用2)对模型选取细节的选项l DETAILS:对模型选取方法FORWARD、BACKWARD、STEPWISE,若打印出每一步引入和删除自变量及相关信息选用此项如一个自变量选入模型时的偏F值、模型的值和一个自变量被剔除时模型值及有关参数估计的信息l NOINT:取消回归模型的常数项,即拟合过原点的回归方程3)对估计细节内容的选择:在选项部分,还可以选择一个或多个(中间用空格分开)参数估计和拟合残差等相关内容,常用的有:l

7、CORRB:输出参数估计的相关系数矩阵,第行第列为与相关系数估计l COVB:输出估计参数的协方差矩阵,即MSE(XTX)-1l P:输出因变量拟合值、观测值、拟合残差若已选CLI、CLM、R,无需该选项l R:输出有关残差及用于影响性分析的各量,包括拟合值的标准差、残差、学生化残差(残差除以标准差)及Cook距离(度量了当删除某观测值后,参数估计的总变化量)l I:输出矩阵输出形式为注意:以上选择内容可以和最优模型选择方法并用于Model语句的“选项部分”对BACKWARD、FORWARD、STEPWISE的模型选择方法,以上估计细节内容只是最终选择模型的相应结果;对RSQUARE准则,只给

8、出全模型的相应结果;对于ADJRSQ和CP方法,给出具有最大和值的模型的相应结果(3)OUTPUT语句建立SAS的输出结果数据集此语句建立一个与估计内容有关的SAS数据集语句格式为:OUTPUT OUT=SAS数据集名 关键字名=输出数据集中的变量名;l 关键字名为需要的统计量名,它们有PREDICTED(或P)=name:因变量拟合值,指定名称为name;RESIDUAL(或R)=name:残差及指定的名称;STUDENT=name:标准化(或学生化)残差;L95M=name:因变量期望值的95%的置信区间的置信下限;U95M=name:因变量期望值的95%的置信上限;L95=name:因变

9、量值的95%置信区间的置信下限;U95=name:因变量值的95%的置信区间的置信上限;COOKD (COOK氏D值)=name:Cooki距离,用于影响性分析的统计量;H=name:杠杆量,即,,是设计矩阵的第行;PRESS=name:值,用以估计第组观测值对拟合值的影响;DFFITS=name:用以估计第组观测值对参数估计的影响;STDP=name:期望值的标准误差STDR=name:残差的标准误差;STDI=name:预测值的标准误差;其中等号前的部分为输出语句的关键词,后面的name飞等号前的变量指定一名称 以上介绍了一些常用的选项无论选项如何,PROC REG过程总是自动输出相应模型

10、的参数估计值及其标准差,检验参数是否为零的统计量值及相应的值方差分析表、检验回归关系显著性的统计量和值,复相关系数及其平方值等2示例例1(书上例2.3)某科学基金会的管理人员欲了解从事研究工作的中、高水平的数学家的年工资额Y与他们研究成果(论文、著作等)的质量指标、从事研究工作时间、能获得资助的指标为此按一定设计方案调查了24位此类型的数学家,得数据如书上表2.3所示(1)假设误差服从分布,建立与之间的线性回归方程并研究相应的统计推断问题;(2)假设某位数学家的关于的值为,试预测他的年工资额并给出置信度为95%的置信区间解:(1)建立回归模型进行统计推断 设与回归模型,观测值满足,其中()相互

11、独立,且即 1)SAS系统回归分析的proc reg 过程进行统计推断程序:data examp2_3;input y x1-x3;cards;33.2 3.5 9 6.140.3 5.3 20 6.438.7 5.1 18 7.446.8 5.8 33 6.741.4 4.2 31 7.537.5 6.0 13 5.939.0 6.8 25 6.040.7 5.5 30 4.030.1 3.1 5 5.852.9 7.2 47 8.338.2 4.5 25 5.031.8 4.9 11 6.443.3 8.0 23 7.644.1 6.5 35 7.042.8 6.6 39 5.033.6

12、3.7 21 4.434.2 6.2 7 5.548.0 7.0 40 7.038.0 4.0 35 6.035.9 4.5 23 3.540.4 5.9 33 4.936.8 5.6 27 4.345.2 4.8 34 8.035.1 3.9 15 5.0;run;proc reg data=examp2_3; /* 调用回归分析的reg过程 */model y=x1-x3/i; /* 模型因变量y,自变量x1、x2、x3,输出Hessian矩阵*/ run; 2)由方差分析表进行统计推断Analysis of Variance 方差分析表 Sum of MeanSource DF Squares Square F Value Pr F方差来源 自由度 平方和(SS) 均方(MS) F0=MSR/MSE 检验p值Model p-1=3 SSR=627.81700 MSR=SSR/3=209.27233 F0=68.12 |t| 参数 参数估计值 标准差估计值 t值 Intercept 1 17.84693 2.00188 8.92

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号