假设检验与方差分析

上传人:wt****50 文档编号:33965936 上传时间:2018-02-19 格式:DOC 页数:19 大小:1.95MB
返回 下载 相关 举报
假设检验与方差分析_第1页
第1页 / 共19页
假设检验与方差分析_第2页
第2页 / 共19页
假设检验与方差分析_第3页
第3页 / 共19页
假设检验与方差分析_第4页
第4页 / 共19页
假设检验与方差分析_第5页
第5页 / 共19页
点击查看更多>>
资源描述

《假设检验与方差分析》由会员分享,可在线阅读,更多相关《假设检验与方差分析(19页珍藏版)》请在金锄头文库上搜索。

1、统计学实验指导书1实验四 假设检验实验目的:通过此实验熟练掌握如何利用假设检验工具根据不同条件选择相应检验工具进行检验,有助于学习者理解假设检验的过程及结果实验要求:能够运用 Excel 对总体均值进行假设检验,学会针对实际背景提出原假设和备择假设来检验实际问题,并根据检验结果作出符合统计学原理和实际情况的判断和结论,加深对统计学方法的广泛应用背景的理解假设检验与区间估计两者之间存在密切的关系,二者用的是同一个样本、同一个统计量、同一种分布,所以也可以用区间估计进行假设检验,两者结论是一致的。在 Excel 中进行假设检验,除可按区间估计过程用公式和逆函数计算外,还备有专用的假设检验工具,包括

2、 Z检验工具、T检验工具和 F检验工具。使用这些工具,可以直接根据样本数据进行计算,一次给出检验统计量、单尾和双尾临界值以及小于或等于临界值的概率等所需要的数值。实验四主要介绍假设检验工具的使用。一、假设检验的一般过程假设检验主要是根据计算出的检验统计量与相应临界值比较,作出拒绝或接受原假设的决定。根据全国汽车经销商协会报道,旧车的平均销售价格是 10192 美元。堪萨斯城某旧车经销处的一名经理检查了近期在该经销处销售的 100 辆旧车。结果样本平均价格是 9300 美元,样本标准差是 4500 美元。在 0.05 的显著性水平下,检验 H0: H1: 。问:假设检验的结论是92092什么?这

3、名经理接下来可能会采取什么行动?本例由于样本容量比较大,其均值近似服从正态分布,总体方差未知,需要用样本标准差来代替,选择 T 统计量进行检验。T 统计量的计算公式统计学实验指导书2如下: )1(10ntsxtn单击任一空单元格,输入“=(9300-10192)/(4500/SQRT(100) ”,回车确认,得出 t 统计量为-1.982。单击另一空单元格,输入“=TINV(0.025,99)” ,回车确认,得出 t 分布的右临界值为 2.276。因为 ,所以不拒276.98.1绝原假设,认为此旧车经销处旧汽车平均销售价格不小于 10192 美元。那么接下来这名经理会采取什么相应行动?(请读者

4、思考) 。本例主要介绍了假设检验的一般过程,利用 Excel 的公式和函数求出相应的统计量值和临界值,最后作出结论。二、假设检验工具的使用接下来介绍如何使用 Excel 的假设检验工具。使用这一工具应该注意二点:第一,由于现实世界和生活中大量的数据服从正态分布,Excel 的假设检验工具是按正态总体设计的(以下各例未特殊说明,认为其服从或近似服从正态分布) ;第二,Excel 的假设检验工具主要用于检验两总体之间有无显著差异。具体来讲,Z检验工具是对方差或标准差已知的两总体均值进行差异性检验;T检验工具是对方差和标准差未知的两总体均值进行差异性检验,其中包括等方差假设检验、异方差假设检验和成对

5、双样本检验;F检验工具是对总体的标准差进行检验。(一)Z 检验工具的使用国际航空运输协会对商务旅行者进行调查以确定大西洋两岸过关机场的等级分数。假定:要求 50 名商务旅行者组成的随机样本给迈阿密机场打分,另 50 名商务旅行者组成的随机样本给洛杉机机场打分,最高等级为 10分。两个样本数据如下:迈阿密机场得分数据:6 4 6 8 7 7 6 3 3 8 10 4 87 8 7 5 9 5 8 4 3 8 5 5 44 4 8 4 5 6 2 5 9 9 8 4 89 9 5 9 7 8 3 10 8 9 6洛杉机机场得分数据:10 9 6 7 8 7 9 8 10 7 6 5 73 5 6

6、8 7 10 8 4 7 8 6 9 95 3 1 8 9 6 8 5 4 6 10 9 83 2 7 9 5 3 10 3 5 10 8统计学实验指导书3假定两总体的等级标准差已知(这里用样本标准差代替总体标准差) ,分别为 2.16 和 2.37。问:在 5%的显著性水平下,迈阿密机场和洛杉机机场的平均等级有无差异?将数据分别输入到 Excel 表中( A2:A51;B2:B51) ,在“工具”菜单中选择“数据分析”选项,从其“分析工具”列表中选择“Z检验:双样本平均差检验” ,回车进入该工具对话框,如图 4-1 所示。图 4-1 Z检验工具对话框 在“变量 1 和变量 2”的区域框中,分

7、别输入“A1:A51”和“B1:B51”(数据区域) 。 “假设平均差(P)框”中,输入 “0”。 “变量 1 的方差和变量 2 的方差”框中,分别输入“4.68”和“5.63”(总体方差) 。 单击“标志(L)”复选框(因为数据区域有列标题) ; “ (A)”框中要求输入显著性水,本例按默认设置 0.05 即可。 本例选择“输出区域”设置框,在其中输入“C1” 。完成以上操作后,回车确认,在指定的区域给出计算结果,见表 4-1。表 4-1 Z检验计算结果统计学实验指导书4结果解释与分析:1、 “平均”为样本均值;“已知协方差”指总体方差;“观察值”为样本个数。2、表中给出的 Z 统计量为:

8、21)()(nxz3、将 Z 统计量与临界值相比,本例采用双尾比较 ,所以只96.184.0能不拒绝原假设,认为两机场等级评分没有差异。当然,也可以将显著性水平与 P 值比较,如果 P 值大于显著性水平则不拒绝原假设。(二)T 检验工具的使用1、假定两总体的方差相同大学人员安排委员会公布了大学毕业生首次任职薪水数据下表列出了会计专业和财政专业样本每年薪水数据:(单位:千美元)会计 财政28.8 26.325.3 23.626.2 25.027.9 23.027.0 27.926.2 24.528.1 29.024.7 27.425.2 23.529.2 26.929.7 26.2统计学实验指导

9、书529.3 24.0采用 0.05 的显著性水平,检验会计专业和财政专业毕业生首次任职平均年薪是否存在差异?将数据分别输入到 Excel 表中( A2:A13;B1:B13) ,在“工具”菜单中选择“数据分析”选项,从其“分析工具”列表中选择“t 检验:双样本等方差假设” ,回车进入该工具对话框,如图 4-2 所示。图 4-2 “t检验:双样本等方差假设 ”对话框将各子对话框进行相应设置后(具体可参照 Z检验) ,回车确认,在指定的区域给出计算结果,见表 4-2。表 4-2 “t检验:双样本等方差假设”结果结果解释与分析:(1)合并方差是两样本方差的加权平均数,其计算公式为:统计学实验指导书

10、62)1()1(2nssSp(2)df 为“自由度” 。本例 t 检验统计量的自由度为 12+12-2=22。(3)t Stat 是 t 检验统计量,其计算公式为: 2121)()(nsxp(4)将 t 统计量与临界值比较,本例采用双尾检验,2.232.07(0.041.72(0.021.76(0.020.35,所以拒绝原假设,认为新软件包开发指定系统所需时间的方差不小于旧软件包。统计学实验指导书12实验五 方差分析实验目的:熟练使用“方差分析 ”工具在假设检验的基础上,对影响均值的各个因素进行分析。实验要求:对房产分析的结果能够作出正确合理的解释,包括对“SUMMAY”部分,方差分析部分从而

11、判断该因素各水平是否对观测变量有显著影响,并作出相应的决策。实验四介绍了假设检验,其中用了较多的篇幅介绍了两个总体之间均值的显著性检验,实际中还会遇到多个总体均值的检验问题。如果按实验四的方法两两进行检验,将十分麻烦,并且部分总体有差别能否表明有总的差别,仍有待解决。方差分析(Analysis of variance,简称 ANOVA)能够解决多个均值是否相等的检验问题,其由于在分析时将所有的样本资料结合在一起,从而使检验的稳定性增强,并且可以节省大量的时间。方差分析作为一种实用、有效的分析方法在实践中被广泛的应用。本部分主要介绍如何使用 Excel 中的数据分析工具进行方差分析。一、单因素方

12、差分析单因素方差分析是在事物变化的若干因素中,只就某一特定因素分析,其它因素尽可能不变。对从事营销的人员进行一项调查,以研究他们的职业道德标准观念。假定下表是从研究中所获得的数据(高分表示道德标准高) ,如表 5-1 所示。在 0.05 的显著性水平下,检验三组人员的观念是否存在显著差异。表 5-1 研究数据统计学实验指导书13将数据输入表单后,在“工具”菜单中选择“数据分析”选项,从其“分析工具”列表中选择“方差分析:单因素方差分析” ,回车进入该工具对话框,如图 5-1 所示。图 5-1 “方差分析:单因素方差分析”对话框 在“输入区域(I)”框中,输入数据所在的区域,本例为 A1:C7。

13、 “分组方式”按默认的列;因有列标题,所以选择“标志位于第一行(L)” 的复选框。 要求输入显著性水平,本例按默认设置即可。)(A 输出选项本例选择“新工作表(P) ”(因输出内容比较多) 。完成以上设置后,回车确认,结果见表 5-2。表 5-2 “方差分析:单因素方差分析”输出结果统计学实验指导书14结果解释与分析:1、SS 表示平方和。组间 SS(用 SSA 表示) ,计算公式为:;组kiikinji xnxSA1212 kkiikinj nnxL2111,内 SS(用 SSE 表示) ,计算公式为: kinjixSE12、df 为自由度。SSA 的自由度为 k-1,其中 k 为因素水平的

14、个数,SSE 的自由度为 n-k。3、MS 为平均平方。组间 MS(用 MSA 表示) ,计算公式为:;组内 MS(用 MSE 表示) ,计算公式为: 。1kSAM knSEM4、F 统计量为: ),1(knFMSEA5、将 F 统计量的值与给定显著性水平的临界值相比,本例 73.68,所以拒绝原假设,认为三种营销人员观念有差异。也可以将给出的 P 检验值与显著性水平比较,结论相同。二、无重复(无交互作用)双因素的方差分析双因素方差分析的内容是在影响事物变化的各种因素中选定两个因素,就其不同水平进行交叉的全面检测,分析究竟是一个因素在起作用,还是两个因素都起作用,或是两个因素的影响都不起作用。

15、进行双因素分析时,其各因素的不同水平可以重复测试(有交互作用) ,也可以不重复测试(无交互作用) 。本部分介绍无重复(交互作用)双因素分析。统计学实验指导书15有四个品牌的彩电在五个地区销售,为分析彩电的品牌(因素 A)和销售地区(因素 B)对销售量是否有影响,对每个品牌在各地区的销售量取得以下数据,见表 5-3。表 5-3 不同品牌的彩电在各地区的销售量数据试分析品牌和销售地区对彩电的销售量是否有显著影响(显著性水平为 0.05)?从“分析工具”列表中选择“ 方差分析:无重复双因素分析 ”,回车进入该工具对话框,如图 5-2 所示。图 5-2 “方差分析:无重复双因素分析”对话框在“输入区域(I)” 框中输入数据所在的区域,本例为 A2:F6,并选定“标志(L)” 复选框。 取默认值 0.05。)(A在输出选项中,选择“新工作表”。完成以上设置后,回车确认,结果见表 5-4。结果解释与分析: 1、行为因素 A,列为因素 B。各因素和误差项的(离差)平方和计算公式分别为:; ;kirjixS12. kirjxS12. kirjjixxSE12.2、三个平方和的自由度(df)分别是:因素 A 的离差平方和 SSA 的自由度为 k-1统计学实验指导书16因素 B 的离差平方和 SSB 的自由度为 r-1随机误差平方和 SSE 的自由度为 (k-1)(r-1) 3、因素

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号