《第5章SPSS20.0均值检验》由会员分享,可在线阅读,更多相关《第5章SPSS20.0均值检验(38页珍藏版)》请在金锄头文库上搜索。
1、5.1推断统计与参数检验推断统计与参数检验5.2单一样本单一样本t检验检验5.3两独立样本两独立样本t检验检验5.4两两配对样本配对样本t检验检验n参数检验是推断统计的重要组成部分。推断统计方法是根据样本数据推断总体特征的方法,它在对样本数据描述的基础上,以概率的形式对统计总体的未知数量特征(如均值、方差等)进行表述。n通过对样本数据的研究来推断总体特征主要出于以下两大原因:第一,总体数据无法全部收集到;第二,在某些情况下虽然总体数据能够收集到,但实施时会耗费大量的人力、物力和财力n 对总体特征的推断一般采用参数估计(点估计和区间估计)和假设检验两类方法实现。SPSS兼顾了这两类方式,由于其核
2、心原理基本类似,这里仅以对假设检验的基本思想做重点讨论。n 假设检验的基本思想是首先对总体参数提出假设,然后利用样本告之的信息去验证提出的假设是否成立。如果样本数据不能充分证明和支持假设,则在一定的概率条件下,应拒绝该假设;相反,如果样本数据不能够充分证明或者支持假设是不成立的,则不能推翻假设。上述假设检验推断过程所依据的基本信息是小概率原理,即发生概率很小的随机事件,在某一次特定的实验中是几乎不可能发生的。n第一、提出零假设(记为H0) 即根据推断检验的目标,对待推断的总体参数或分布提出一个基本假设。n第二、选择检验统计量 在假设检验中,样本值(或更极端值)发生的概率并不是直接由样本数据得到
3、的,而是通过计算检验统计量观测值发生的概率而间接得到的。这些检验统计量服从或者近似服从某种已知的理论分布。对于不同的假设检验问题以及不同的总体条件,会有不同的选择检验统计量的理论、方法和策略,这是统计学家研究的课题。应用汇总只需要依据实际,明确问题,遵循理论套用即可。n第三、计算检验统计量观测值发生的概率 选定检验统计量之后,在认为零假设成立的条件下,利用样本数据便可计算出检验统计量观测值发生的概率,即概率p值或者称为相伴概率(即指该检验统计量在某个特定的极端区域取值在H0成立时的概率),该概率值间接地给出了样本值(或更极端值)在零假设成立条件下发生的概率。对此可以依据一定的标准来判定其发生的
4、概率是否为小概率,是否是一个小概率事件。n第四、给定显著性水平 ,并做出统计决策 显著性水平 是指零假设正确但却被错误地拒绝了的概率或风险,一般人为确定为0.05或者0.1等,意味着零假设正确同时也正确地接受了的可能性(概率)为95%或99%。n5.2.1单样本单样本t检验的目的检验的目的n单样本t检验的目的是利用来自某总体的样本数据,推断该总体的均值与指定的检验值之间的差异在统计上是否是显著的。它是对总体均值的假设检验。n5.2.2单样本单样本t检验的基本步骤检验的基本步骤n1、提出零假设 其中 为总体均值, 为 检验值n2、选择检验统计量当方差已知时当方差未知时n3、计算检验统计量观测值和
5、概率p值 该步目的是计算检验统计量的观测值和相应的概率p值。SPSS将自动将自动将计算t统计量的观测值和对应的概率p值。4、给出显著性水平 ,并做出决策给出显著性水平 ,与检验统计量的概率p值做比较。如果概率p值小于显著性水平,则应拒绝零假设,认为总体均值与检验值之间存在显著差异;反之,如果概率p值大于显著性水平,则不应拒绝零假设,认为总体均值与检验值之间无显著差异。n(1)选择选项分析比较均值单样本T检验,出现如图5-1所示的窗口n(2)在【检验变量】框中输入检验值。n(3)单击【选项】按钮定义其他选项,出现如图5-2所示的窗口。“选项”用来指定缺失值的处理方法。其中,“按分析顺序排除个案”
6、表示当计算时涉及的变量上有缺失值,则剔除在该变量上为缺失值得个案;按列表排除个案表示剔除所有在任意变量上含有缺失值的个案后再进行分析。可见,较第二种方式,第一种处理方式较充分地利用了样本数据。n至此,SPSS将自动计算t统计量和对应的概率p值。n例5.1 从一批钢管抽取10根,测得其内径(单位:mm)为:100.36 100.31 99.99 100.11 100.64 100.85 99.42 99.91 99.35 100.10 ,检验其平均值是否为100mmn提出假设:nSPSS计算步骤:n1、按照顺序:分析比较均值单样本T检验,进入单一样本T检验对话框,将左侧“钢管内径”变量选入【检验
7、变量(T)】中,右下角的【检验值(V)】框中输入已知的总体均值,默认为0,本题中为100.如图5-1所示n2、单击【选项】按钮,弹出【单一样本T检验:选项】对话框,如图5-2所示,置信区间百分比,SPSS默认值为95%(即显著性水平0.05)。对于独立样本和配对样本的均值检验,对置信区间操作都相同。n3、单击【继续】,回到【单一样本T检验】对话框,单击【确定】。输出结果见表5-1,5-2 表5-1给出了单一样本均值检验的描述性统计量、标准差和均值标准误差。钢管内径均值为100.1040,接近总体100表表5-1 5-1 单个样本统计量单个样本统计量N均值标准差均值的标准误钢管内径10100.1
8、040.47596.15051n表5-2是单一样本均值检验的结果列表,给出了t统计量、自由度、双尾概率以及显著性水平及置信区间。双尾概率P=0.507显著性水平0.05,接受原假设,说明钢管内径与平均值100无显著差异。5.3 两独立样本t检验n5.3.1 两独立样本t检验的目的 两独立样本t检验的目的是:利用来自两个总体的独立样本,推断两个总体的均值是否存在显著差异。这里,方法设计的两个总体,并采用t检验的方法。同时要求两组样本相互独立,即从一总体中抽取一组样本对从另一总体中抽取一组样本没有任何影响,两组样本的个案数目可以不等。因此称为独立样本t检验。 两独立样本t检验的前提是,两样本相互独
9、立。两独立样本t检验的基本步骤n1、提出零假设 分别为第一个和第二个总体的均值。n2、选择检验统计量第一种情况:当两总体方差未知且相等时n第二种情况:当两总体方差位置且不相等时3、计算检验统计量的观测值和概率p值 该步目的是计算F统计量和t统计量的观测值以及相应的概率p值。SPSS将自动一句单因素方差分析的方法计算F统计量和概率p值,并自动将两组样本的均值、样本数、抽样分布方差带入式(5.7),计算出t统计量的观测值和对应的概率p值。4、给出显著性水平,并做出决策两独立样本t检验的基本操作nSPSS两独立样本t检验的基本操作步骤:n选择菜单分析比较均值独立样本T检验,于是出现如图5-5所示的窗
10、口。n选择检验变量到【检验变量】框。n选择总体标识变量到【分组变量】框中。n单击【定义组】按钮定义两总体的标识值,显示如图5-6所示的窗口。其中,【使用指定值】表示分别输入两个对应两个不同总体的变量值;【割点】框中应输入一个数字,小于该值的对应一个总体,大于该值的对应另一个总体。n两独立样本t检验的【选项】含义与单样本t检验的相同。n例5.3下面给出两种型号的计算器充电后所能使用的时间的观测值n型号1: 5.5 5.6 6.3 4.6 5.3 5.0 6.2 5.8 5.1 5.2 5.9n型号2: 3.8 4.3 4.2 4.0 4.9 4.5 5.2 4.8 4.5 3.9 3.7 4.6
11、n设两样本独立且数据所属的两总体的密度函数至多差一个平移量。能否认为两种型号的电池使用时间相同。n输出结果如表5-5,5-6所示n表5-5给出了独立样本均值检验的描述性统计量,包括两个样本的均值,标准差和均值的标准误。从表中可以看出,型号1的使用平均时间为5.5,型号2的使用平均时间为4.3667,两者之间存在一定的差异。n表5-6是独立样本均值检验的结果列表,给出了F值,t统计量,自由度,双尾概率,以及显著性水平及置信区间。检验结果分为两行,第一行表示方差相等时的检验结果,第二行表示方差不等时的检验结果。表中P分别为0.000,0.000,都小于显著性水平0.05,故拒绝原假设,说明型号1和
12、型号2的电池使用平均时间有显著性的差异。5.4 两配对样本t检验n 两配对样本t检验的目的n两配对样本t检验的目的是:利用来自两个总体的配对样本,推断两个总体的均值是否存在显著差异。n配对样本t检验与独立样本t检验的差别之一是要求样本是配对的。所谓配对样本可以是个案在“前”“后”两种状态下某属性的两种不同特征,也可以是对某事务两个不同侧面或方面的描述。其差别在于抽样不是相互对立,而是互相关联的。 n因此,配对样本通常具有两个特征:第一,两组样本的样本数相同;第二,两组样本观测值的先后顺序是一一对应,不能随意更改。两配对样本t检验正是利用两组配对样本的数据,对其总体均值有无显著差异做出推断n步骤
13、与前面类似,不在累赘。两配对样本t检验的基本操作n1、选择菜单分析比较均值配对样本T检验,于是出现如图5-9所示的窗口。n2、选择一对或若干对检测变量到【成对变量】框。n3、两配对样本t检验的【选项】含义与单样本t检验的相同。n至此,SPSS将自动计算t统计量和对应的概率p值n例5.5为研究某种减肥茶是否具有明显的减肥效果,某减肥茶厂商对35名肥胖志愿者进行了减肥跟踪调研。首先将其喝减肥茶以前的体重记录下来,三个月后再依次将这35名志愿者喝茶后的体重记录下来。通过这两组样本数据的对比分析,推断减肥茶是否具有明显的减肥作用。具体数据如下:n具体操作n(1)选择菜单分析比较均值配对样本T检验,于是
14、出现如图5-9所示的窗口。n(2)选择左侧“喝茶前体重”“喝茶后体重”到【成对变量】框。n(3)两配对样本t检验的选项含义与单样本t检验的相同n分析结果如下:n表5-10给出了喝茶前与喝茶后体重的基本描述统计量,表明喝茶前与喝茶后样本的平均值有较大差异。喝茶后的平均体重低于喝茶前的平均体重。n表5-11给出了喝茶前与喝茶后体重的简单相关关系及检验n表5-12喝茶前与喝茶后体重的两配对样本t检验结果,第一列是喝茶前与喝茶后体重的平均差异,相差了19.2公斤;第二列是差值样本的标准差;第三列是差值样本抽样分布的标准差;第四列、第五列是差值95%的置信区间的下限和上限;第六列是t检验统计量的观测值;
15、第八列为t检验统计量观测值对应的双尾概率P值,接近0。如果显著性水平 为0.05,由于概率p值小于显著性水平 ,应拒绝零假设,即认为总体上体重差的平均值与0有显著不同,意味着喝茶前与喝茶后的体重平均值存在显著差异,可以认为该减肥茶具有显著的减肥效果。小结:n均值的比较与检验是检验差异显著性的非常重要的统计工具,这种差异显著性的检验是样本均值间的比较。进行检验的一般步骤为:提出假设、确定检验统计量、确定显著性水平、计算检验统计量、做出判断。n均值检验主要包括以下三类:n1、单一样本的均值检验,即只对单一变量的均值加以检验,用于检验样本所在总体的均值是否与给定的检验值之间存在显著性差异。n2、独立样本的均值检验,即检验的不同均值来自独立没有关联的正态总体。n3、配对样本的均值检验,即根据两个配对样本,推断两个总体的均值是否存在显著性差异n以上三类在SPSS中,都是通过【分析】工具下的【比较均值】完成的。 谢 谢