多元统计分析作业一(第三题).doc

上传人:F****n 文档编号:98884712 上传时间:2019-09-15 格式:DOC 页数:7 大小:122.50KB
返回 下载 相关 举报
多元统计分析作业一(第三题).doc_第1页
第1页 / 共7页
多元统计分析作业一(第三题).doc_第2页
第2页 / 共7页
多元统计分析作业一(第三题).doc_第3页
第3页 / 共7页
多元统计分析作业一(第三题).doc_第4页
第4页 / 共7页
多元统计分析作业一(第三题).doc_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《多元统计分析作业一(第三题).doc》由会员分享,可在线阅读,更多相关《多元统计分析作业一(第三题).doc(7页珍藏版)》请在金锄头文库上搜索。

1、课 程 名 称: 多元统计回归分析 实 验 项 目:边远及少数民族聚居区和会经济发展水平实 验 类 型: 验证性 学 生 学 号: 学 生 姓 名: 学 生 班 级: 课 程 教 师: 实 验 日 期: 2016-03-28 1.实验目的: 利用spss软件验证一下边远及少数民族聚居区的社会经济发展水平与全国平均水平有无显著差异。2.实验内容: 现选取内蒙古、广西、贵州、云南、西藏、宁夏、新疆、甘肃和青海等9个内陆边远省区。选取人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口等五项能够较好的说明各地区社会经济发展水平的指标,验证一下边远及少数民族聚居区的社

2、会经济发展水平与全国平均水平有无显著差异。边远及少数民族聚居区社会经济发展水平的指标数据地区人均GDP(元)三产比重(%)人均消费(元)人口增长(%)文盲半文盲(%)内蒙古506831.121418.2315.83广西407634.220409.0113.32贵州234229.8155114.2628.98云南435531.3205912.125.48西藏371643.5155115.957.97宁夏427037.3194713.0825.56新疆622935.4274512.8111.44甘肃345632.8161210.0428.65青海436740.9204714.4842.92资料来源

3、:中国统计年鉴(1998),北京,中国统计出版社,1998。五项指标的全国平均水平为: 3.实验步骤及结果:解:(1)先利用SPSS软件检验各变量是否遵从多元正态分布(见输出结果1-1)输出结果1-1正态性检验Kolmogorov-SmirnovaShapiro-Wilk统计量DfSig.统计量dfSig.人均GDP.2199.200*.9589.781三产比重.1459.200*.9259.437人均消费.2099.200*.8739.131人口增长.1509.200*.9499.682文盲半文盲.2469.124.8989.242*. 这是真实显著水平的下限。a. Lilliefors 显

4、著水平修正上表给出了对每一个变量进行正态性检验的结果,因为该例中样本数n=9,所以此处选用Shapiro-Wilk统计量。则Sig.值分别为0.781、0.437、0.131、0.682、0.242均大于显著性水平,由此可以知道,人均GDP、三产比重、人均消费、人口增长、文盲半文盲这五个变量组成的向量均服从正态分布,即我们认为这五个指标可以较好对各地区社会经济发展水平做出近似的度量。(2)提出原假设及备选假设(3)做出统计判断,最后对统计判断作出具体的解释SPSS的GLM模块可以完成多元正态分布有关均值与方差的检验。依次点选AnalyzeGeneral Linear ModelMultivar

5、iate进入Multivariate对话框,将人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口等这五项指标选入Dependent列表框,将分类指标选入Fixed Factor(s)框,点击OK运行,则可以得到如下结果(见输出结果1-2)。输出结果1-2主体间因子值标签N分类1.00边远及少数民族聚居区社会经济发展水平92.00全国经济平均发展水平1多变量检验a效应值F假设 df误差 dfSig.截距Pillai 的跟踪.99081.986b5.0004.000.000Wilks 的 Lambda.01081.986b5.0004.000.000Hotell

6、ing 的跟踪102.48281.986b5.0004.000.000Roy 的最大根102.48281.986b5.0004.000.000分类Pillai 的跟踪.8344.029b5.0004.000.101Wilks 的 Lambda.1664.029b5.0004.000.101Hotelling 的跟踪5.0374.029b5.0004.000.101Roy 的最大根5.0374.029b5.0004.000.101a. 设计 : 截距 + 分类b. 精确统计量上面第一张表是样本数据分别来自边远及少数民族聚居区社会经济发展水平、全国的个数。第二张表是多变量检验表,该表给出了几个统计

7、量。由Sig.值可以看到,无论从哪个统计量来看,两个分类的经济发展水平是无显著差别的。实际上,GLM模型是拟合了下面的模型: 式中(人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲)分类上面多变量检验表实际上是对该线性模型显著性的检验,此处有常数项是因为不能肯定模型过原点。而模型没有通过显著性检验,意味着分类中的不同取值对Y的取值无显著影响,也就是说,不同分类的经济发展水平是相同的。但是,在实际中,我们往往更希望知道差别主要来自哪些分类,或者不同分类经济发展水平的比较。对此,对GLM模块的选项作如下设置:在GLM主对话框中点击Contrasts按钮进入Contrasts对话框

8、,在Change Contrasts框架中打开Contrasts右侧的下拉框并选择Simple,此时下侧的Reference Category被激活,默认是Last被选中,表明边远及少数民族聚居区社会经济发展水平与全国平均发展水平作比较,点击Change按钮,Continue继续,OK进行,得到如下结果(见输出结果1-3)输出结果1-3对比结果(K 矩阵)分类 简单对比a因变量人均GDP三产比重人均消费人口增长文盲半文盲级别 1 和级别 2对比估算值-2003.2322.274-1006.1112.71212.014假设值00000差分(估计 - 假设)-2003.2322.274-1006.

9、1112.71212.014标准 误差1129.2654.912395.8602.76115.688Sig.114.656.035.355.466差分的 95% 置信区间下限-4607.321-9.053-1918.967-3.655-24.162上限600.85713.602-93.2569.07948.190a. 参考类别 = 2见输出结果1-3表示(1)在显著性水平的水平下,可以看到Sig.值分别为0.114、0.656、0.035、0.355、0.466,由此我们可以知道边远及少数民族聚居区社会经济发展水平与全国平均发展水平中的人均消费存在显著差别,即全国的平均人均消费大于边远及少数民

10、族聚居区人均消费,相差值为1006.111元。人均GDP、三产比重、人口增长率、文盲半文盲等指标无明显差别。(2)在显著性水平的水平下,可以看到Sig.值分别为0.114、0.656、0.035、0.355、0.466均大于显著性水平,我们可以看出边远及少数民族聚居区社会经济发展水平与全国平均发展水平中的人均GDP、三产比重、人均消费、人口增长率、文盲半文盲等指标无明显差别。输出结果1-4多变量检验结果值F假设 df误差 dfSig.Pillai 的跟踪.8344.029a5.0004.000.101Wilks 的 lambda.1664.029a5.0004.000.101Hotelling

11、 的跟踪5.0374.029a5.0004.000.101Roy 的最大根5.0374.029a5.0004.000.101a. 精确统计量4.实验结果(或心得体会):通过实验,得出输出结果1-4是上面多重比较可信性的度量,并且由Sig.值可以让我们看到,比较检验是可信的。利用spss可将多指标数据进行良好的分析。5.指导教师点评(总分100分,所列分值仅供参考,以下部分打印时不可以断页)实验内容出色完成30分良好完成25分基本完成20分部分完成15分初步完成5分实验步骤精益求精30分比较完善25分合乎要求20分缺少步骤15分少重要步骤5分实验结论(心得体会)分析透彻20分分析合理17分合乎要求14分结论单薄8分难圆其说4分工作态度勇于探索20分能够务实17分中规中矩14分华而不实8分态度不端正0分总 分有抄袭剽窃行为则实验成绩记为零分,并且严重警告!教师签字: 日期: 年 月 日注:验证性实验仅上交电子文档,设计性试验需要同时上交电子与纸质文档进行备份存档。村民建房委员会应建立村级农房建设质量安全监督制度和巡查制度,选聘有责任心和具有一定施工技术常识的村民作为义务巡查监督员,开展经常性的巡查和督查。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号