第三章 假设检验与T检验-上课材料.doc

上传人:pu****.1 文档编号:559583027 上传时间:2022-10-12 格式:DOC 页数:13 大小:1,008.41KB
返回 下载 相关 举报
第三章 假设检验与T检验-上课材料.doc_第1页
第1页 / 共13页
第三章 假设检验与T检验-上课材料.doc_第2页
第2页 / 共13页
第三章 假设检验与T检验-上课材料.doc_第3页
第3页 / 共13页
第三章 假设检验与T检验-上课材料.doc_第4页
第4页 / 共13页
第三章 假设检验与T检验-上课材料.doc_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《第三章 假设检验与T检验-上课材料.doc》由会员分享,可在线阅读,更多相关《第三章 假设检验与T检验-上课材料.doc(13页珍藏版)》请在金锄头文库上搜索。

1、第三章 假设检验与T检验、方差分析(Compare Means菜单)n 周岁儿童的平均身高是否为75厘米?n 男生和女生的计算机平均成绩有显著差异吗?n 同一样本使用某种减肥茶前后效果是否有显著性差异?n 不同学历是否对工资收入产生显著影响?n 在不同城市采用不同广告形式对广告效果会产生显著影响吗?F 本章学习内容3.1 假设检验概述3.2 SPSS单样本T检验3.3 SPSS两独立样本T检验3.4 SPSS两配对样本T检验3.5 方差分析概述3.6 单因素方差分析3.7 多因素方差分析F 具体内容3.1 假设检验概述假设检验是一种根据样本数据来推断总体的分布或均值、方差等总体统计参数的方法。

2、那么,为何要根据样本来推断总体呢?其原因有二: 总体数据不可能全部收集到。如:质量检测问题; 收集到总体全部数据要耗费大量的人力和财力。假设检验在两种假设条件下进行: 假设总体的分布已知参数检验 假设总体的分布未知非参数检验基本步骤:(1)根据检验的目标,对待推断的总体参数或分布作一个基本假设H0;(2)利用收集到的样本数据和基本假设计算某检验统计量(t),且该统计量一定服从某种已知分布;(3)根据该统计量的值得到对应的相伴概率(P值),即:检验统计量在某个特定的极端区域取值在H0成立时的概率;(4)如果相伴概率P值小于用户给定的显著性水平a,则拒绝H0。否则,不拒绝H0。原理:假设检验依据的

3、是小概率原理(小概率事件在一次试验中几乎不会发生),会发生这一事件的临界概率为a(一般设定为0.05或0.01),如果最后得出的p值大于a,则不能排除H0,显著性差异没有发生,而Pa,则拒绝H0,显著性差异发生。SPSS中的参数检验方法 SPSS单样本T检验 SPSS两独立样本T检验 SPSS两配对样本T检验3.2 SPSS单样本T检验就是检验某变量的总体均值与指定的检验值之间是否存在显著差异。例如:周岁儿童的平均身高是否为75厘米?居民平均存(取)款金额是否为2000元?要求:样本来自的总体服从正态分布。实例分析:某种生产浴皂机器的设计规则为每批平均生产120块肥皂,超过或低于这个标准都是不

4、合理的。如下有10批产品组成的样本,且假定总体服从正态分布。见“例 5-1”。108 118 120 122 119 113 124 122 120 123 显著性水平a为0.05,通过该样本检验,分析是否该生产过程运作正常。这个问题,实际上就是问样本检验结果与120的均值有无差异。采用单样本的T检验过程。具体操作如下:AnalyzeCompare Means One-Sample T Test,打开T检验对话框,如下图。1432t即t值,df为自由度,sig.(2 tailed)为双尾P值。样本均值与检验值的差为-1.100。95%的样本差值落在(-4.63,2.43)这个置信区间内。可以看

5、出,t统计量的值为-0.705,相伴概率值(sig.significance)为0.4980.05,因此不能拒绝H0的原假设(120的检验值),显著性差异不大,结果表示该生产过程较正常。习题:1. 分析“初一男生身高样本”文件中样本平均身高是否与160大致相当。3.3 SPSS两独立样本T检验(一)含义根据两独立样本的数据,对两总体均值是否有显著差异进行推断。例如:男生和女生的计算机平均成绩有显著差异吗?城镇和农村的平均存款金额有显著差异吗?(二)要求两样本必须相互独立,即:抽取其中一批样本对抽取另一批样本没有任何影响。(如:北京周岁儿童与上海儿童的平均身高);两总体服从正态分布。(三)检验过

6、程实例分析:某研究机构分别对20款中型及小型汽车进行安全性测试,较低的分数意味着安全性更高。数据见文档“例 5-2”,要求使用两独立样本T检验来比较中型和小型汽车的安全性有无差异。具体操作如下:AnalyzeCompare Means Independent-Samples T Test,打开独立样本T检验对话框,如下图。5432识别变量:对应两个不同总体12.大于的话,看第一行t检验概率(sig.值)。,则认为两总体均值有显著差异,则认为两总体均值没有显著差异1.判断F检验中sig.值与a值(0.05)大小2.小于或等于,看第二行t检验概率(sig.值)。判断同上。(四)检验结果分析首先,如

7、果F检验的P,则不能拒绝F检验的H0,认为方差齐性;其次看equal行(第一行)的t检验概率。如果,则拒绝t检验的H0,认为两总体均值有显著差异;如果,则不拒绝t检验的H0,认为两总体均值不具有显著差异。那么,如果F检验的P,则拒绝F检验的H0,认为方差不齐性;其次看Unequal行(第二行)的t检验概率。其余同上。针对本例,由于F检验中sig.值大于0.05,因此根据第一行t检验显著性概率为0.000,即认为中型汽车和小型汽车的安全性得分有显著性差异。习题:3.4 SPSS两配对样本T检验(一) 含义:根据配对样本对两总体均值是否有显著差异进行推断。例如:同一样本使用某种减肥茶前后效果是否有

8、显著性差异?(二)要求:两样本数据必须两两配对,即:样本个数相同,个案顺序相同。如:减肥茶的效果、不同广告形式对销售额的影响;两总体服从正态分布。(三)检验过程实例分析:一种新型减肥食品正在作投入市场前的检验。一个随机样本由8个人组成试验前后样本体重数据见文档“例 5-3”,我们可以使用两配对样本T检验来比较服用减肥食品前后效果有无差异。具体操作如下:AnalyzeCompare Means paired-Samples T Test,打开配对T检验对话框,如下图。将左框两变量移入配对变量框中,采用按住shift键的方式。习题:为检验一种新的训练方法是否有助于提高跳远运动员的成绩,收集到了10

9、名运动员在使用新方法前后跳远的最好成绩,如下表,采用t检验分析之间的显著性差异。运动员号码使用新方法之前成绩(米)使用新方法之前成绩(米)015.742.79026.286.12035.465.44046.035.57055.775.81066.416.48076.196.32085.555.64095.395.57105.875.933.5 方差分析概述(一)问题的提出通过参数检验可以解决两两总体均值的比较,那么多个总体均值的检验如何作?(如:北京、上海、广州周岁儿童平均身高的比较)。这可以利用方差分析的方法来实现(二)分析目的方差分析是从数据间的差异入手,分析哪些因素是影响数据差异的众多因

10、素中的主要因素。例如:影响某农作物亩产量的因素(品种、施肥量、气候等)影响推销某种商品的推销额(不同的推销策略、价格、包装方式、推销人员的形象等)(三)涉及的概念(1)观察因素: 观测变量(2)影响因素:控制因素(控制变量)将控制因素的不同情况称为控制因素的不同水平.随机因素.(四)方差分析的类型单因素方差分析多因素方差分析协方差分析3.6 单因素方差分析(一)目的检验某一个控制因素的改变是否会给观察变量带来显著影响。例如:考察不同肥料对某农作物亩产量是否有显著差异。考察妇女生育率在不同地区是否有显著差异。考察不同学历是否对工资收入产生显著影响。考察不同的推销策略是否对推销额产生显著影响。(二

11、)基本思路(1)入手点:检验控制变量的不同水平下,各总体的分布是否存在显著差异,进而判断控制变量是否对观测变量产生了显著影响。(2)前提:不同水平下各总体服从方差相等的正态分布。(3) H0:不同水平下,各总体均值无显著差异。即不同水平下控制因素的影响不显著。(三)实例分析某城市五个地区每天发生交通事故的次数,见文件“例 6-1”,检验个地区平均每天交通事故的次数是否有显著性差异。由于涉及到的控制变量只有一个:方位变化,但有5个总体样本,所以采用的是单因素方差分析。东部北部中部南部西部1512101413171014912141313791117151014141281079操作过程:依次选取

12、AnalyzeCompare MeansOne-way ANOVA(analysis of variance),弹出对话框,如下图。Options选项中所勾选的三个分别表示输出描述统计量、方差齐性检验表和均值点图。检验结果分析:由于方差分析F检验中sig.值小于0.05,因此拒绝原假设H0,表明所检验因素即地区不同对平均每天交通事故的次数观测量有显著影响。(四)单因素方差分析中的多重比较目的:如果总体均值存在差异,F检验不能说明哪个水平造成了观察变量的显著差异。多重比较将对每个水平的均值逐对(两两)进行比较检验。SPSS提供了各种不同的多重比较方法,具体选项在post hoc 中选取。如下图。

13、可以看出,只有南部地区的平均每天交通事故次数分别与东部、北部、中部的平均每天交通事故次数有显著性差异(sig.值0.05)。方法选择策略一般可参照如下标准: 如果存在明确的对照组,要进行的是验证性研究,即计划好的某两个或几个组间(和对照组)的比较,宜用LSD法; 若需要进行的是多个均数间的两两比较(探索性研究),且各组个案数相等,适宜用Tukey法; 其它情况宜用Scheffe法。习题:见习题13.7 多因素方差分析如下两图,第一个图只涉及一个控制因素:施肥量。而第二张图“不同城市中不同类型广告对于广告效果的影响”就涉及到了两个方面的控制变量:城市类型和广告类型。此处就需要采用多因素方差分析了

14、。(一)目的:测试若干个控制因素的改变是否造成观察变量的显著变动。如果有两个及以上的因素影响某一因变量试验结果,则成为多因素方差分析,此时需要对这多个因素(以两个为例)进行检验,分析是一个因素在起作用,还是两个因素都起作用,还是两个因素都起作用,还是两个因素搭配起来同时起作用(及交互作用)。(二)实例分析调查不同职业及不同性别对收入的显著性影响,见文件“例 6-2”,用多因素方差分析法分析职业、性别及其交互作用对收入的影响。操作过程:依次选取AnalyzeGeneral Linear ModelUnivariate,弹出对话框,如下图。可以看出,职业、性别及其交互作用职业*性别的sig.值都小于0.05,因此在0.05显著性水平下拒绝原假设,认为职业、性别及其交互作用都显著,即对月薪都有显著影响。习题:根据文件“三类机器和四组工人对产量有无影响.sav”,分析三类机器和四组工人对产量有无影响。雌鼠高蛋白和低蛋白增重差异性检验结果:1

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号