《社会统计学张彦第十一章节非参数检验检验》由会员分享,可在线阅读,更多相关《社会统计学张彦第十一章节非参数检验检验(42页珍藏版)》请在金锄头文库上搜索。
1、第十一章 非参数检验,在社会研究中我们经常要采用定序尺度,但直到现 在,我们都还没有机会讨论涉及到定序尺度的显著性检 验。本章要讲述某些用于定序尺度的双样本检验。与以 前所讲的检验不同,使用这类方法不需要对总体分布作 任何事先的假定(例如正态总体)。同时从检验的内容来 说,也不是检验总体分布的某些参数(例如均值、成 数、方差等),而是检验总体某些有关的性质,所以称 为非参数检验。非参数检验,泛指“对分布类型已知的 总体进行参数检验”之外的所有检验方法。,与均值差等检验比较,非参数检验有什么优点呢? 在对均值差进行t 检验时,不仅要有定距尺度的假定, 还要有正态总体的假定。当然,对于大样本,正态
2、总体 的假定可以放松。但正是对于小样本,这种假定最容易 出问题。因此,在满足下面两条件之一时,我们期望用 非参数检验代替均值差检验:没有根据采用定距尺 度,但可以安排数据的顺序(即秩);样本小且不能假 定具有正态分布。由于非参数检验不能充分利用全部现 有的资料信息。因此,如果有根据采用定距尺度,并且 如果对于小样本能够假定其具有正态性,或对大样本能 够放松对正态性假定的要求,一般宁愿使用均值差检 验,而不用非参数检验。,非参数检验,无需做出经典统计所必要的 关于分布的任何假设。唯一需要的假设是:全 部数据或数据对都出自相同的基本总体,且取 样是随机的、相互独立的。基于这种原因,非 参数检验又称
3、为分布自由(或无分布)检验。“无 分布”不是指总体真的无分布,而是指虽有时对 总体分布一无所知,但仍可以进行分析。不仅 如此,这些很容易理解的方法还可以用于处理 等级的资料和定性的信息。,很显然,如果把从一个正态总体中抽取的数据用分布 自由来处理,其效果肯定不如相应的参数检验有力。我们 一般用下述指标来确定非参数检验的“效率” 。 式中的n 0和n分别是两种检验 保证实现给定的检验力所需的样本 容量。如果说某种非参数检验的检 验效率为95,就意味着这种非参 数检验在使用100个数据时的效力等 于t检验(在正确模型条件下)使用95 个数据的效力。,检验力又称检验势,它是用1或1(犯第二类错误的概
4、率)来定义的。也就是说,对于固定的样本容量,检验能够否定错误假设的能力越大,其相对检验力越大。,“符号检验”是针对观察结果之差的符号来作估价的。在 单一实验组的实验中,对于样本中每个个体的前测与后测, 如果我们并不关心(X1X0)的具体数值,而只关心是增大 了还是减小了。具体来说,就是只研究差值 d 的符号,即 若X1X0,记作“+”; 若X1X0,记作“”; 若X1X0,删去。 那么我们面对的就将是配对样本的“符号检验”问题 了。“符号检验”并不要求配对样本出自同一个总体,重要 的是各个对的结果要相互独立。,第一节 符号检验,符号检验的零假设就是配对观察结果的差平均起来等于零:人们期望这些差
5、中有一半小于零(负号),而另一半大于零(正号),因此符号检验就是对差分布之中位数为零的零假设检验。现将符号检验的零假设和备择假设表达如下 H0:p (+)p ()0.5 H1:单侧检验 p (+)p ()或 p (+)p () 双侧检验 p (+)p () 很显然,符号检验就是先假设 p0.5,按二项分布计算正号“+”出现次数之抽样分布,然后以样本中正号“+”出现的次数 x 作为检验统计量。如果它是B(x;n,0.5)下的小概率事件,便否定对差分布之中位数为零的零假设,即认为两总体存在平均水平上的差别。由此可见,符号检验是二项检验的一种实际应用。,例 假设我们观测15个相配的对,获得两个差为零
6、和13个差不为 零,其中有11个正号,2个负号,试在2.5的显著性水平上进行单 侧检验。 解 H0:p0.5 H1:p (+)p () 由0.025确定否定域,查二项分布表(附表2) P (13;13,0.5)0.000 P (12; 13,0.5)0.002 P (11; 13,0.5) 0.010 P (10; 13,0.5)0.035 P (13) + P(12)+ P (11)0.000 + 0.002 + 0.010 0.0120.025 P (13) + P (12) + P (11) +P(10) 0.012 + 0.0350.0470.025 所以否定域由x等于11,12,13
7、组成。现检验统计量 x11, 所以零假设 p0.5在2.5显著性水平上被拒绝。,例 随机地选择13个单位,放映一部描述吸烟有害于身体健康 的影片,下表中的数字是各单位认为吸烟有害身体健康的职工的百分 比,现试在0.05显著性水平上,用符号检验检验实验无效的零假设。,解 H0:p05 H1:p (+)p () 由上例知,B(x;13,0.5)在0.025显著性 水平上,单侧检验(p0.5)否定域由 x 由11, 12,13组成。 观察前表知,在13个相配的对中,10个差为 正号,3个差为负号,即检验统计量 x10。所 以零假设 p0.5在2.5显著性水平上不能被拒 绝。,对比例10.3.1和例1
8、1.1.2可见,由于符号检验只计 及差值d 的符号,而没有计及差值d的大小,所以有时用t 检验可以作出拒绝零假设的判定,如改用符号检验却往往 不能作出这样的判定。因此说,符号检验效力较低。根据 计算,就满足正态分布而言,符号检验法的效率是配对样 本 t 检验的63。即如果符号检验法需要样本容量为100 的话,那么t 检验法只需n63就可作出相同的检验。但符 号检验运用于定类尺度,对总体分布又无需加以限制,所 以就配对样本的显著性检验而言,其适应面是相当广的。 像符号检验这样的非参数值验,在分布自由检验中称为 简便检验(或快速检验)。,对于配对样本,至此我们已经接触了两种 检验,即符号检验和t检
9、验。在符号检验中, 只考虑差值d的符号而不管其大小,并且应用 二项分布检验零假设。另一方面,最有力的检 验 t 检验,则不仅需要定距尺度,而且还 要求假定差值d服从正态分布。配对符号秩检 验兼备了上述两种检验的某些特征,其效力也 介乎两者之间。,第二节 配对符号秩检验,配对符号秩检验对于非正态分布的d 值,是最佳检验,其检验效力大大高于符号检验。如果 t 检验的假定成立,配对符号秩检验的检验效力对于大、小样本都近乎为95。因此,在定距尺度测量的水平上,若由于样本容量太小而不能假定正态分布的时候,配对符号秩检验特别有用。,配对符号秩检验的零假设基本上和符号检验以及用于 配对样本的 t 检验的零假
10、设相同。配对符号秩检验的步骤 如下: (1) 首先求出每对数据的差值d 。 (2) 不计正负,按绝对值大小把差值d按顺序排列起来。 (3)绝对值最小者赋秩为l,第二小者赋秩为2,绝对 值最大者赋秩为n (其中绝对值相等者,将它们应得的秩均分 之),再在差值前补填上符号。 (4)求得正差值的秩和T+ 及负差值的秩和T- 。我们期望 两个秩和应该近似相等。如果T+和T-相差太大,就应该否定 零假设。,(5)取两个秩和中较小的一个,即Tmin(T+ ,|T-|), 作为检验统计量。 (6)给定显著性水平。如果n小,从配对符号秩检验 表(附表9)中直接查出临界值T(n)。如果n大(n25),就 要应用
11、正态近似法,查出Z(单侧检验)或Z/2(双侧检验), 同时检验统计量Z按下式计算 (7)若T T(n) ,就拒绝零假设,同时认为总体间有 显著性差异。,例 随机地选择13个单位,放映一部描述吸烟有害于身体健康 的影片,下表中的数字是各单位认为吸烟有害身体健康的职工的百分 比,现试在0.05显著性水平上,用配对符号秩检验检验检验实验无效 的零假设。,解 H0:T+ |T-|,即在总体中,正秩和等于负秩和。 H1:T+ |T-|。 前表给出了有关资料,由此又列出了配对符号 秩检验所需要的数据。根据表中数据,可以看出负 秩和小于正秩和。因此检验统计量T 取负秩和。 T |T-|1.5 + 4 + 8
12、13.5 由0.025,n13,查表得单侧检验的 T0.025(13)l713.5,所以否定T+ |T-|的零假设, 即说明该实验刺激有效。,将例11.2.1与例l0.3.1和例11.1.2对比,可见配对符号秩检验 的效力比符号检验的效力高得多,而很接近于t 检验的效力。理论研 究表明,对于配对样本非正态分布的差值d,配对符号秩检验是最佳 检验。 虽然本例中n 很小,但是为了说明用法,我们仍然使用正态近似 法计算一下检验统计量 在单侧检验中,ZZ0.0251.962.24,我们可以否定零假 设。但必须指出,正态近似计算法没有把同数值(或同分对)的情 况考虑在内而作出修正。因此,它在同数值的数目
13、很大时不能使用。,前面我们刚刚讨论过的符号检验和配对符号秩检 验,都只适用于配对样本。当样本为独立样本时,可采 用本节所讨论的秩和检验法。其具体步骤为: (1)设从两个未知的总体1和总体2中分别独立、随机地各抽取一 个样本,样本1的容量为n1,样本2的容量为 n2,两样本的数据分别列示如下: 样本1:X1,X2,, X n1 样本2:Y1,Y2,, Y n2 (2)把样本1和样本2混合起来,并按数值从小到大顺序编号,每 个数据的编号即为它的秩。如果混合样本中有相同数值的数据,则 将它们应得的秩均分。,第三节 秩和检验,(3)分别计算两样本的秩和:样本l中所有X1,X2,, X n1的秩和记作R
14、1;样本2中所有Y1,Y2,,Y n2的秩和记作R2。 (4)秩和检验是针对两个总体具有完全相同的形式的零假设而进行检验的。在均值差检验中,研究的重点放在中心趋势的差异上,而不是离差的差异或形式的差异。秩和检验的零假设则可以用任何差异形式表示出来。 (5)计算检验统计量U 。检验统计量U是对混合样本中n1+ n2个元素根据它们的秩和和它们所属的总体标出的双重指标,检验统计量U是U1和U2中较小的一个,即U min(U1,U2),然后用下式核对计算 U1 + U2 n1 n2 (6)给出显著性水平,从秩和检验表(附表10)中 查出临界值U,如果计算出的U值小于或等于从附表10 中查出的临界值U(
15、n1 ,n2),则零假设被拒绝。,例 设评审专家对19所大专院校按校园环境质量排 名次,环境质量最好的学校记分数为1,环境质量最差的 学技记分数为19。其中10所学校是本科院校,其他9所学 校是专科院校。假定这19所学校是分别从全部大专院校 中随机地抽取的,试问:专科类院校和本科类院校的环 境质量是否有显著性差异(0.05)? 本科院校环境质量的名次(秩)为: 1,2,4,5,6,7,9,11,14,17 (n110) 专科院校环境质量的名次(秩)为: 3,8,10,12,131516,18,19 (n29),解 H0:专科类院校和本科类院校的环境质量无差异 H1:专科类院校和本科类院校的环境质量有差异 根据题意 R1l+2+4+5+6+7+9+11+14+1776 R23+8+10+12+13+15+16+18+19114 代入下两式得 所以检验统计量Umin(U1,U2)U22l 由0.05查附表10得 U(n1 ,n2)U 0.05(10 ,9)202l 所以不否定零假设,说明在0.05的水平上,不能认为专科类院 校和本科类院校的环境质量有显著性差异。,秩和检验本来可直接用R1和R2,不必求U 。但由于对于n小 的U ,其值可以准确地从数表中查出,所以在秩和检验中一般使 用统计量U比较方便。秩和检验因而也有了U检验之称。如果n较 大,U的抽样分布