回归分析实验课 实验8

上传人:re****.1 文档编号:504302704 上传时间:2022-10-30 格式:DOCX 页数:15 大小:51.21KB
返回 下载 相关 举报
回归分析实验课 实验8_第1页
第1页 / 共15页
回归分析实验课 实验8_第2页
第2页 / 共15页
回归分析实验课 实验8_第3页
第3页 / 共15页
回归分析实验课 实验8_第4页
第4页 / 共15页
回归分析实验课 实验8_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《回归分析实验课 实验8》由会员分享,可在线阅读,更多相关《回归分析实验课 实验8(15页珍藏版)》请在金锄头文库上搜索。

1、实验报告八实验课程:回归分析实验课专业:统计学年级:姓名:学号:指导教师完成时间得分:教师评语:学生收获与思考:实验八含定性变量的回归模型(4学时)一、实验目的1掌握含定性变量的回归模型的建模步骤3运用 SAS 计算含定性变量的各种回归模型的各参数估计及相关检验统计量二、实验理论与方法在实际问题的研究中,经常会遇到一些非数量型的变量。如品质变量;性别;战争与和平。我们 把这些品质变量也称为定性变量,在建立回归模型的时候我们需要考虑到这些定性变量。定性 变量的回归模型分为自变量含定性变量的回归模型和因变量是定性变量的回归模型。自变量含有定性变量的时候,我们一般引进虚拟变量,将这些定性变量数量化。

2、例如研究粮食产量问题,y为粮食产量,x为施肥量,另外考虑气候问题,分为正常年份和干旱年份两种情况, 这个问题数量化方法就是引入一个0-1型变量D,令Dj=l表示正常年份,D.=0表示干旱年份, 粮食产量的回归模型为:y二B +B x + B D+1i 0 1i 2 i i。因变量是定性变量时,一般用logis tic回归模型(分组数据的logis tic回归模型,未分组数据 的logistic回归模型,多类别的logistic回归模型),probit回归模型等。三. 实验内容1.用DATA步建立一个永久SAS数据集,数据集名为xt 103,数据见表21;对数据集xt 103,建立y对 公司规模

3、和公司类型的回归,并对所得到的模型进行解释。2研制一种新型玻璃,对其做耐冲实验。用一个小球从不同的髙度h对玻璃做自由落体撞击, 玻璃破碎记为y=1,玻璃未破碎记y=0.数据见表22.是对表中数据建立玻璃耐冲性对髙度h的 logis tic回归,并解释回归方程的含义。3.某学校对本科毕业生的去向做了一个调查,分析影响毕业去向的相关因素,结果见表23.其 中毕业去向“1”=工作,“2”=读研,“3”=出国留学。性别“1”=男生,“0”=女生。用多类别 的Logisi tic回归分析影响毕业去向的因素。四. 实验仪器计算机和 SAS 软件五. 实验步骤和结果分析1.用DATA步建立一个永久SAS数据

4、集,数据集名为xt 103,数据见表21;对数据集xt 103,建立y对 公司规模和公司类型的回归,并对所得到的模型进行解释。方差分新返自由庚均亦F荫Pr F模型215Q4. 41333752. 2066772.50误差rl176.386671Q 37569校正合计1680. ewoo均方根误差3. 22113R方0. 8951丙变量均値19. 400(X3调整R方0. 3827变异系数16.60377R检验中R方为0.8951,可以认为回归拟合效果较好。回归方程通过F检验,说明模型是显著成立 的。参数倍计値自由度参数怙计值蠶七値Pr |t|I ntercept133.874071.B13S6

5、18. 68 0001x11-0.101740.0088911.44.0001x216.055471.45V115.52.0001由参数估计表,可以看出,全部变量都是显著的,回归方程为:人y = 33.87 - 0.102x + 8.06x1 2其中,x2是虚拟变量,当公司类型为“互助”时,x2为0,为“股份”时,x2为1。由方程可知,x2为1,即股份制公司的保险革新措施速度y会更大。股份制公司采取保险革新措施的积极性比互助型公司高,股份制公司建立在共同承担风险上,更愿意革新。公司规模越大,采取保险革新措施的倾向越大:大规模公司保险制度的更新对公司的影响程度比小规模公司大。SAS程序:data

6、 xt103;input y x1 x2 ; /*引入虚拟变量,将公司类型的互助设为0,股份设为1*/cards;17151 02692021 175 030 31022 104 00277 012 210 019 120 04290 016238 028164 115272 111295 13868131 85121224 120 166 113 305 130124 114 246 1 run;proc reg data=xt103;model y=x1 x2;run;2研制一种新型玻璃,对其做耐冲实验。用一个小球从不同的髙度h对玻璃做自由落体撞击,玻璃 破碎记为y=l,玻璃未破碎记y=0

7、.数据见表22.是对表中数据建立玻璃耐冲性对髙度h的logistic回 归,并解释回归方程的含义。模型信息:模型信息数据集WORK. WJZ响应变量y响应水平数2模型二元Lo百it优化方法Fi sher评分法响应概况有序値总 頻数10162110膜型拟合统计星准则仅截距截距和协变量AIC36.64631.97BSC37. 90534. 494-1 L34” 64627. 97B模型解出的是y=0的概率。检验全局零假设:BETA=0检验卡方自由度Pr 卡方似然比6. 668610.0098评分6. 112910. 0134Wald5. 062810.0244由三个检验中,统计量的P值都小于0.0

8、5,可以认为模型是显著的。忧比怙计值效应点估计値95% Walid置信限h0.0010.001 0. 357预测概率和观测响应的关联一致部分所占百分比7.6Somers D0.575不一致部分所占百分比21.3Gamma0. 575貉値百分比0.01 au-a0.283对160c0.78fi由Wald检验的显著性概率及其P值,可以看出,h变量对方程的影响是显著的。最大似然怙计値分析参数自由度估计值霹Wald卡方Pr 卡方1 ntercept114.59186. 35265.27610.0216h1-7.96143. 54725.06280.0244由极大似然估计,各个参数系数也通过检验。因此模

9、型有效。 c、exp(14.59 - 7.98h)p (y = 0)=二元 logit 模型为1 + exp(1459 - 798h)模型意义为,小球掉落高度为h,则玻璃未破碎的概率为p,而y=0表示玻璃未破碎。也就是说,该种新型的玻璃,用小球对其撞击,当小球的掉落高度为h时,玻璃未破碎的概率就是exp(14.59-7.98h)p (y = 0)=1 + exp(14.59-7.98h),那么,玻璃会破碎的概率就为1-p(y=0),这也可以看成是一种比例,就是大量实验中,同个高度h,玻璃会被击破的比例。SAS 程序:data wjz;input h y ;/*引入虚拟变量,将公司类型的互助设为

10、0,股份设为1*/cards;1.5001.5201.5401.5601.5811.60 01.62 01.6401.66 01.68 11.7001.7201.7401.7611.7801.80 11.82 01.8401.86 11.88 11.9001.9211.9401.9611.9812.00 1;run;proc logistic data=wjz;model y=h;run;proc logistic data=wjz;class h;model y=h/link=glogit aggregate scale=none;run;3.某学校对本科毕业生的去向做了一个调查,分析影响毕

11、业去向的相关因素,结果见表23.其中毕 业去向“1”=工作,“2” =读研,“3”=出国留学。性别“1”=男生,“0” =女生。用多类别的Logisitic 回归分析影响毕业去向的因素。专业课X,英语x2性别兀 月生活费工4毕业去向y模型信愿数据集WORK. WJZ响应变量y响应水平数3模型广义Logiit忧化方法Newtorr-Raphson响应槪况有序值y頻数11172216331偏菱和Pearson拟合优度统计量准则值自由度值/自由度Pr 古方偏差56. 5380700.80770.8775Pearson80.1123701.14450.1915两个统计量的P值均大于0.05,说明模型拟

12、合的较好。检验全局零假设:BETA=0检验卡方自由度Pr 卡方似然比26.277680.0009评分19.994380.0W4Wald14.242?80.0756检验全局零假设:BETA=O无效假设检验结果(似然比,评分)的结果P值均小于0.01,具有显著统计 学意义。3型效应分析效应自由度Wald卡方Pr 卡方xl29.66050. 0080x22斗.36350.1126x320. 31740.8533x426. 49660.0388三个变量中,有两个是不显著的变量,x3,x2,剔除x3:偏差和Pearson拟合优度统计量准则值自由度值/自由度Pr 卡片偏差56. 8596720. 7897

13、0. 9043Pearson77. 9296721.0B240. 2958两个统计量的P值均大于0.05,说明模型拟合的较好。检验全局零假设:BETA二0检验卡方自由度Pr 卡方似然比25.955960. 0002评分19.872160. 0029Wald14. 196160. 0275检验全局零假设:BETA=O无效假设检验结果(似然比,评分,wald)的结果P值均小于0.01,具有显著 统计学意义。3型效应分析效应自由度Wald卡肓Pr 卡育x129.91330.0070x224.0. 1137x426 46140.0395三个变量都是显著的。以x4=“1”,即参加工作,为参照。最大似然估计値分析参数y自由度估计値aWald卡方Pr 卡芳1ntercep

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号