04_参数检验-spss剖析

上传人:今*** 文档编号:106934489 上传时间:2019-10-17 格式:PPT 页数:44 大小:633.50KB
返回 下载 相关 举报
04_参数检验-spss剖析_第1页
第1页 / 共44页
04_参数检验-spss剖析_第2页
第2页 / 共44页
04_参数检验-spss剖析_第3页
第3页 / 共44页
04_参数检验-spss剖析_第4页
第4页 / 共44页
04_参数检验-spss剖析_第5页
第5页 / 共44页
点击查看更多>>
资源描述

《04_参数检验-spss剖析》由会员分享,可在线阅读,更多相关《04_参数检验-spss剖析(44页珍藏版)》请在金锄头文库上搜索。

1、现代统计理论与方法,第4章 假设检验,本章主要内容,在正态或近似正态分布的计量资料中,经常在使用前一章统计描述过程分析后,还要进行组与组之间平均水平的比较。本章介绍的T检验方法,主要应用在两个样本间比较。 如果需要比较两组以上样本均数的差别,这时就不能使用上述的T检验方法作两两间的比较。对于两组以上的均数比较,可使用方差分析方法。,假设检验概述,假设检验的基本思想 根据样本的信息检验关于总体的某个假设是否正确,这类问题称作假设检验 通过一个实例说明假设检验的思想和方法,罐装可乐的容量按标准应为355毫升,生产流水线上罐装可乐不断地封装,然后装箱外运.怎么知道这批罐装可乐的容量是否合格呢?,把每

2、一罐都打开倒入量杯, 看看容量是否合于标准.,通常的办法是进行抽样检查,每隔一定时间,抽查若干罐.如每隔1小时,抽查5罐,得5个容量的值X1,X5,根据这些值来判断生产是否正常. 如发现不正常,就应停产,找出原因,排除故障,然后再生产;如没有问题,就继续按规定时间再抽样,以此监督生产,保证质量.,讨论罐装可乐的容量问题,在正常生产条件下,由于种种随机因素的影响,每罐可乐的容量应在355毫升上下波动. 这些因素中没有哪一个占有特殊重要的地位. 因此,假定每罐容量服从正态分布是合理的. 这样,我们可以认为X1,X5是取自正态总体N(,2)的样本,当生产比较稳定时,2是一个常数. 要检验的假设是:H

3、0:=0 (0=355) 它的对立假设是:H1:0 称H0为原假设(或零假设),称H1为备选假设(或对立假设),如何判断原假设H0 是否成立,由于是正态分布的期望值,它的估计量是样本均值,因此可以根据样本均值与0的差距来判断H0 是否成立 当上述差距较小时,可认为H0是成立的;差距较大时,应认为H0不成立,即生产已不正常 较大、较小是一个相对的概念,合理的界限在何处?应由什么原则来确定?,随机误差与系统误差,问题归结为对差异作定量的分析,以确定其性质. 差异可能是由抽样的随机性引起的,称为“抽样误差”或 随机误差.这种误差反映偶然、非本质的因素所引起的随机波动.然而,随机性波动是有一定限度的,

4、如果差异超过了这个限度,则我们就不能用抽样的随机性来解释了.必须认为这个差异反映了事物的本质差别,即反映了生产已不正常.这种差异称作“系统误差” 根据所观察到的差异,如何判断它究竟是由于偶然性在起作用,还是生产确实不正常?这里需要给出一个量的界限 .,如何给出这个量的界限?,这里用到人们在实践中普遍采用的一个原则:,小概率事件在一次试验中基本上不会发生,在假设检验中,我们称这个小概率为显著性水平,用表示.常取=0.1 0.05 0.01,罐装可乐的容量按标准应为355毫升. 一批可乐出厂前应进行抽样检查,现抽查了n 罐,测得容量为 X1,X2,Xn,问这一批可乐的容量是否合格? H0:=355

5、) H1:355 由于已知,选检验统计量, N(0,1),它能衡量差异大小且分布已知,对给定的显著水平,有标准正态分布的双侧分位数u/2 ,且下式成立,,故我们可以取拒绝域为:,W:,如果由样本值算得该统计量的实测值落入区域W,则拒绝H0;否则,不能拒绝H0 .,这里所依据的逻辑是,如果H0是对的,那么衡量差异大小的某个统计量落入区域 W(拒绝域) 是个小概率事件.如果该统计量的实测值落入W,也就是说,H0 成立下的小概率事件发生了,那么就认为H0不可信而否定它.否则我们就不能否定H0 (只好接受它).,不否定H0并不是肯定H0一定对,而只是说差异还不够显著,还没有达到足以否定H0的程度 所以

6、假设检验又叫“显著性检验” 如果显著性水平取得很小,则拒绝域也会比较小.其后果是:H0难于被拒绝. 如果在很小的情况下H0仍被拒绝了,则说明实际情况很可能与之有显著差异.基于这个理由,人们常把为0.05时拒绝H0称为是显著的,而把为0.01时拒绝H0称为是高度显著的.,假设检验的一般步骤,(1)分析问题建立统计假设; (2)构造检验统计量,在原假设成立条件下确定检验统计量的分布; (3)由给定的小概率确定原假设的否定域; (4)由样本实现计算检验统计量实现,根据其是否落入原假设的否定域进行判断。,假设检验的两类错误,由于作出结论的依据是下述,小概率原理,小概率事件在一次试验中基本上不会发生 .

7、,假设检验的两类错误,如果H0成立,但统计量的实测值落入否定域,从而作出否定H0的结论,那就犯了以真为假的错误.,如果H0不成立,但统计量的实测值未落入否定域,从而没有作出否定H0的结论,即接受了错误的H0,那就犯了以假为真的错误 .,假设检验的两类错误,犯两类错误的概率:,P拒绝H0|H0为真= ,P接受H0|H0不真= .,显著性水平 为犯第一类错误的概率.,4.2 单一样本T检验,定义:SPSS单样本T检验是检验某个变量的总体均值和某指定值之间是否存在显著差异。统计的前提样本总体服从正态分布。也就是说单样本本身无法比较,进行的是其均数与已知总体均数间的比较。,单样本T检验的零假设为H0总

8、体均值和指定检验值之间不存在显著差异。 采用T检验方法,按照下面公式计算T统计量:,4.2 单一样本T检验,操作练习,菜单选项: Analyze - Compare Means - One-Sample T Test 研究问题 打开数据文件“公司职工”,检验该公司职工的平均当前薪金是否达到36000元(年),4.3 两独立样本T检验,定义:所谓独立样本是指两个样本之间彼此独立没有任何关联,两个独立样本各自接受相同的测量,研究者的主要目的是了解两个样本之间是否有显著差异存在。这个检验的前提如下。 两个样本应是互相独立的,即从一总体中抽取一批样本对从另一总体中抽取一批样本没有任何影响,两组样本个案

9、数目可以不同,个案顺序可以随意调整。 样本来自的两个总体应该服从正态分布。,4.3 两独立样本T检验,两独立样本T检验的零假设H0为两总体均值之间不存在显著差异。 在具体的计算中需要通过两步来完成:第一,利用F检验判断两总体的方差是否相同;第二,根据第一步的结果,决定T统计量和自由度计算公式,进而对T检验的结论作出判断。,1判断两个总体的方差是否相同,SPSS采用Levene F方法检验两总体方差是否相同 原假设H0:12=22(两总体方差齐性) 备择假设H1:1222(两总体方差不齐),2根据结果决定T统计量和自由度计算公式,(1)两总体方差未知且相同情况下,T统计量,4.3 两独立样本T检

10、验,(2)两总体方差未知且不同情况下,T统计量,T统计仍然服从T分布,但自由度采用修正的自由度,公式为,4.3 两独立样本T检验,原假设H0:1= 2(两总体均值无显著性差异) 备择假设H1:12(两总体均值存在显著性差异) 从两种情况下的T统计量计算公式可以看出,如果待检验的两样本均值差异较小,t值较小,则说明两个样本的均值不存在显著差异;相反,t值越大,说明两样本的均值存在显著差异。,4.3 两独立样本T检验,菜单选项: Analyze - Compare Means - Independent-Samples T Test 研究问题 打开数据文件“公司职工”,分析下列问题 男职工平均薪金

11、与女职工平均薪金是否存在显著性差异。 青年职工与中年职工平均薪金是否存在显著差异。 40岁(含)以上职工与40岁以下职工平均薪金是否存在显著差异。,4.4 配对样本T检验,配对样本T检验是根据样本数据对样本来自的两配对总体的均值是否有显著性差异进行推断。一般用于同一研究对象(或两配对对象)分别给予两种不同处理的效果比较,以及同一研究对象(或两配对对象)处理前后的效果比较。前者推断两种效果有无差别,后者推断某种处理是否有效。,4.4 配对样本T检验,配对样本T检验的前提要求如下: 两个样本应是配对的。在应用领域中,主要的配对资料包括:具有年龄、性别、体重、病况等非处理因素相同或相似者。首先两个样

12、本的观察数目相同,其次两样本的观察值顺序不能随意改变。 样本来自的两个总体应服从正态分布。,4.4 配对样本T检验,两配对样本T检验的零假设H0为两总体均值之间不存在显著差异。 首先求出每对观察值的差值,得到差值序列;然后对差值求均值;最后检验差值序列的均值,即平均差是否与零有显著差异。如果平均差和零有显著差异,则认为两总体均值间存在显著差异;否则,认为两总体均值间不存在显著差异。,4.4 配对样本T检验,4.4 配对样本T检验,菜单选项: Analyze - Compare Means - Paired-Samples T Test 研究问题 打开数据文件“公司职工”,分析该公司职工平均当前

13、薪金与平均起始薪金之间是否存在显著性差异。,4.5 单因素方差分析,方差分析用于两个及两个以上样本均数差别的显著性检验。 受不同因素的影响,研究的数据会不同。造成结果差异的原因可分成两类 一类是不可控的随机因素的影响,这是人为很难控制的一类影响因素,称为随机变量; 另一类是研究中人为施加的可控因素对结果的影响,称为控制变量。,方差分析的基本思想,通过分析研究不同变量的变异对总变异的贡献大小,确定控制变量对研究结果影响力的大小。 通过方差分析,分析不同水平的控制变量是否对结果产生了显著影响。如果控制变量的不同水平对结果产生了显著影响,那么它和随机变量共同作用,必然使结果有显著的变化;如果控制变量

14、的不同水平对结果没有显著的影响,那么结果的变化主要由随机变量起作用,和控制变量关系不大。,根据控制变量的个数,可以将方差分析分成单因素方差分析和多因素方差分析。 单因素方差分析的控制变量只有一个(但一个控制变量可以有多个观察水平),多因素方差分析的控制变量有多个。,单因素方差分析,定义:单因素方差分析测试某一个控制变量的不同水平是否给观察变量造成了显著差异和变动。例如,培训是否给学生成绩造成了显著影响;不同地区的考生成绩是否有显著的差异等。 单因素方差分析实质上采用了统计推断的方法,由于方差分析有一个比较严格的前提条件,即不同水平下,各总体均值服从方差相同的正态分布,因此方差分析问题就转换成研

15、究不同水平下各个总体的均值是否有显著差异的问题。,采用的统计推断方法是计算F统计量,进行F检验。总的变异平方和记为SST,分解为两个部分 一部分是由控制变量引起的离差,记为SSB(组间Between Groups离差平方和); 另一部分随机变量引起的SSW(组内Within Groups离差平方和)。于是有 SST=SSB+SSW,k为水平数;ni为第i个水平下的样本容量。 SSW是各水平组均值和总体均值离差的平方和,反映了控制变量的影响。 SSB是每个数据与本水平组平均值离差的平方和,反映了数据抽样误差的大小程度。,F统计量是平均组间平方和与平均组内平方和的比,计算公式为,从F值计算公式可以看出,如果控制变量的不同水平对观察变量有显著影响,则观察变量的组间离差平方和必然大,F值也就比较大;相反,如果控制变量的不同水平没有对观察变量造成显著影响,那么,组内离差平方和影响就会比较大,F值就比较小。,操作练习,菜单选项: Analyze - Compare Means - One-Way ANOVA 研究问题:打开文件“公司职工” 分析不同职务人员的年龄有无显著性区别 分析不同年龄段职工的起始薪金有无显著性区别,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号