【精选】实验四 回归分析SAS过程(1)

上传人:姜** 文档编号:856510 上传时间:2017-05-19 格式:DOC 页数:29 大小:664.50KB
返回 下载 相关 举报
【精选】实验四 回归分析SAS过程(1)_第1页
第1页 / 共29页
【精选】实验四 回归分析SAS过程(1)_第2页
第2页 / 共29页
【精选】实验四 回归分析SAS过程(1)_第3页
第3页 / 共29页
【精选】实验四 回归分析SAS过程(1)_第4页
第4页 / 共29页
【精选】实验四 回归分析SAS过程(1)_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《【精选】实验四 回归分析SAS过程(1)》由会员分享,可在线阅读,更多相关《【精选】实验四 回归分析SAS过程(1)(29页珍藏版)》请在金锄头文库上搜索。

1、课时授课计划课次序号: 10 一、课题:实验四 回归分析 SAS 过程(1)统计推断与预测二、课型:上机实验三、目的要求:1. 掌握利用 SAS 建立多元回归方程的方法;2. 能检验所建立回归方程的显著性与方程系数的显著性,能根据实际问题作预测与控制.四、教学重点:会对实际数据建立有效的多元回归模型;能对回归模型进行运用,对实际问题进行预测或控制.教学难点:多元回归模型的建立.五、教学方法及手段:传统教学与上机实验相结合六、参考资料:应用多元统计分析 ,高惠璇编,北京大学出版社,2005;使用统计方法与 SAS 系统 ,高惠璇编,北京大学出版社,2001;多元统计分析(二版),何晓群编,中国人

2、民大学出版社,2008;应用回归分析(二版),何晓群编,中国人民大学出版社,2007;统计建模与 R 软件 ,薛毅编著,清华大学出版社,2007.七、作业:2.3(单) 2.4 八、授课记录:九、授课效果分析:授课日期班次实验四 回归分析 SAS 过程(1)2 学时一、实验目的和要求掌握利用 SAS 建立多元回归方程的方法,掌握 PROC REG 过程,并能检验所建立回归方程的显著性与方程系数的显著性,能根据实际问题作预测与控制二、实验内容1. PROC REG 过程一般格式:PROC REG ;MODEL 因变量=回归变量/ ;其它选择语句 ;OUTPUT OUT=SAS 数据集名 关键字名

3、=输出数据集中的变量名;RUN;(1)PROC REG 语句此语句是 PROC REG 过程的必需语句,指出要进行分析的数据集省略此项,SAS 系统对最新建立的数据集进行分析(2)MODEL 语句中的选项部分该语句定义建模用的因变量、回归变量(自变量) 、模型的选择及拟合结果输出的选择在关键词“Model”之后,应指明因变量,等号后依次列出回归变量,每个变量间用空格分开此语句的选项部分提供了最优模型的选择方法和其他拟合结果的输出选项,其中包括:1)选择合适的建立模型方法:SELECTION=name其中“name”可以是 FORWARD(或 F) 、BACKWARD(或 B) 、STEPWIS

4、E、RSQUARE、ADJRSQ、CP 等之一 SELECTION=FORWARD SLENTRY=显著性水平向前选择最优模型法(FORWARD):从仅含常数项的回归模型开始,逐个加入自变量,对每一个尚不在方程内的自变量按一定显著性水平,根据其一旦进入模型后对模型的贡献大小逐步引入方程,直至再没有对模型有显著贡献的自变量 “SLENTRY=显著性水平”为自变量进入模型的控制水平,写在选择方法语句之后若省去此句,则 SAS 系统默认的水平为 SLENTRY=0.05 SELECTION=BACKWARD SLSTAY=显著性水平向后删除法(BACKWARD):先建立包含全部自变量的线性回归模型,

5、然后按一定的显著性水平从模型中逐步剔除变量缺省 SLSTAY =0.1 SELECTION=STEPWISE SLENTRY =入选水平 SLSTAY=剔除水平逐步回归法(STEPWISE ):按向前选择法(前进法)进入变量,再对模型内所有变量检验,看是否有因新变量引入而对模型的贡献变得不显著,若有就剔除,若无则保留,直至方程内所有变量均显著逐步法有两个控制水平,即选入水平(SLENTRY=入选水平)和剔除水平(SLSTAY=剔除水平) ,而且剔除水平应低于选入水平缺省 SLENTRY =0.15 SLSTAY =0.15 SELECTION=RSQUARE在所有可能的回归方程中用 准则选择最

6、优模型的方法在每一个给定的自变量2pR个数的水平上,打印出使 达到最大的那个回归模型的拟合结果 SELECTION=ADJRSQ:修订的 准则选择最优模型法 2p SELECTION=CP: 准则选择最优模型法pC注意:以上方法只可在选项部分写出其中一种,不可并用2)对模型选取细节的选项 DETAILS:对模型选取方法 FORWARD、BACKWARD 、STEPWISE,若打印出每一步引入和删除自变量及相关信息选用此项如一个自变量选入模型时的偏 F 值、模型的 值和一个自变量被剔除时模型 值及有关参数估计的信息2R2R NOINT:取消回归模型的常数项,即拟合过原点的回归方程3)对估计细节内

7、容的选择:在选项部分,还可以选择一个或多个(中间用空格分开)参数估计和拟合残差等相关内容,常用的有: CORRB:输出参数估计的相关系数矩阵,第 行第 列为 与 相关系数估ijij计 COVB:输出估计参数的协方差矩阵,即 MSE(XTX)-1 P:输出因变量拟合值、观测值、拟合残差若已选 CLI、CLM 、R,无需该选项 R:输出有关残差及用于影响性分析的各量,包括拟合值的标准差、残差、学生化残差(残差除以标准差)及 Cook 距离(度量了当删除某观测值后,参数估计的总变化量) I:输出矩阵 输出形式为1)(XT SETX1)(注意:以上选择内容可以和最优模型选择方法并用于 Model 语句

8、的“选项部分” 对BACKWARD、FORWARD、STEPWISE 的模型选择方法,以上估计细节内容只是最终选择模型的相应结果;对 RSQUARE 准则,只给出全模型的相应结果;对于 ADJRSQ 和 CP方法,给出具有最大 和 值的模型的相应结果2aRpC(3)OUTPUT 语句建立 SAS 的输出结果数据集此语句建立一个与估计内容有关的 SAS 数据集语句格式为:OUTPUT OUT=SAS 数据集名 关键字名=输出数据集中的变量名; 关键字名为需要的统计量名,它们有PREDICTED(或 P)=name:因变量拟合值,指定名称为 name;RESIDUAL(或 R)=name :残差及

9、指定的名称;STUDENT=name:标准化(或学生化)残差;L95M=name:因变量期望值的 95%的置信区间的置信下限;U95M=name:因变量期望值的 95%的置信上限;L95=name:因变量值的 95%置信区间的置信下限;U95=name:因变量值的 95%的置信区间的置信上限;COOKD (COOK 氏 D 值)=name:Cooki 距离,用于影响性分析的统计量;H=name:杠杆量,即 , , 是设计矩阵 的第 行;Tiix1)(Xn2,ixXiPRESS=name: 值,用以估计第 组观测值对拟合值的影响;)(pdi iDFFITS=name:用以估计第 组观测值对参数估

10、计的影响;iSTDP=name:期望值的标准误差STDR=name:残差的标准误差;STDI=name:预测值的标准误差;其中等号前的部分为输出语句的关键词,后面的 name 飞等号前的变量指定一名称以上介绍了一些常用的选项无论选项如何,PROC REG 过程总是自动输出相应模型的参数估计值及其标准差,检验参数是否为零的 统计量值及相应的 值方差分析表、tp检验回归关系显著性的 统计量和 值,复相关系数及其平方值等Fp2示例例 1(书上例 2.3)某科学基金会的管理人员欲了解从事研究工作的中、高水平的数学家的年工资额 Y 与他们研究成果(论文、著作等)的质量指标 、从事研究工作时间 、1X2X

11、能获得资助的指标 为此按一定设计方案调查了 24 位此类型的数学家,得数据如书上3X表 2.3 所示(1)假设误差服从 分布,建立 与 之间的线性回归方程并研究相),0(2NY321,应的统计推断问题;(2)假设某位数学家的关于 的值为 ,试预测他321,X对对2.7,01.5),(0321x的年工资额并给出置信度为 95%的置信区间解:(1)建立回归模型进行统计推断 设 与 回归模型 ,Y321,X3210XY观测值满足 , 4,iiiii xxy3210其中 ( 4,i)相互独立,且 ),(2Ni即 对XY),(2IN1)SAS系统回归分析的proc reg 过程进行统计推断程序:data

12、 examp2_3;input y x1-x3;cards;33.2 3.5 9 6.140.3 5.3 20 6.438.7 5.1 18 7.446.8 5.8 33 6.741.4 4.2 31 7.537.5 6.0 13 5.939.0 6.8 25 6.040.7 5.5 30 4.030.1 3.1 5 5.852.9 7.2 47 8.338.2 4.5 25 5.031.8 4.9 11 6.443.3 8.0 23 7.644.1 6.5 35 7.042.8 6.6 39 5.033.6 3.7 21 4.434.2 6.2 7 5.548.0 7.0 40 7.038.

13、0 4.0 35 6.035.9 4.5 23 3.540.4 5.9 33 4.936.8 5.6 27 4.345.2 4.8 34 8.035.1 3.9 15 5.0;run;proc reg data=examp2_3; /* 调用回归分析的reg 过程 */model y=x1-x3/i; /* 模型因变量y, 自变量x1、x2 、x3,输出Hessian矩阵*/ run; 2)由方差分析表进行统计推断Analysis of Variance 方差分析表Sum of MeanSource DF Squares Square F Value Pr F方差来源 自由度 平方和(SS)

14、均方(MS) F 0=MSR/MSE 检验p值 0Model p-1=3 SSR=627.81700 MSR=SSR/3=209.27233 F0=68.12 |t|参数 参数估计值 标准差估计值 t值 k)(ksk0|)(|00kHtPpIntercept 1 17.84693 2.00188 8.92 X1=3.5 5.3 5.1 5.8 4.2 6 6.8 5.5 3.1 7.2 4.5 4.9 8 6.5 6.6 3.7 6.2 7 4 4.5 5.9 5.6 4.8 3.9; X2=9 20 18 33 31 13 25 30 5 47 25 11 23 35 39 21 7 40

15、35 23 33 27 34 15; X3=6.1 6.4 7.4 6.7 7.5 5.9 6 4 5.8 8.3 5 6.4 7.6 7 5 4.4 5.5 7 6 3.5 4.9 4.3 8 5; Y=33.2 40.3 38.7 46.8 41.4 37.5 39 40.7 30.1 52.9 38.2 31.8 43.3 44.1 42.8 33.6 34.2 48 38 35.9 40.4 36.8 45.2 35.1; X=ones(24,1),X1,X2,X3; b,bint,r,rint,stats=regress(Y,X); b,bint,stats ,rcoplot(r,rint);b =17.84691.10310.32151.2889bint =13.6711 22.02280.4157 1.79060.2441 0.39890.6663 1.9116置信区间均不包含 0,回归参数检验显著。stats =2R0Fp2s0.9109 68.1192 0.0000

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 实验/测试

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号