《心理与教育统计学第11章非参数检验ppt课件》由会员分享,可在线阅读,更多相关《心理与教育统计学第11章非参数检验ppt课件(51页珍藏版)》请在金锄头文库上搜索。
1、 第十一章第十一章 非参数检验非参数检验假设检验的方法有两种:参数检验(parametric test)和非参数检验(non parametric test)。各种参数检验的共同特点:是对总体参数的推论,要求样本所属的总体呈正态分布、总体方差齐性等等。参数检验主要适用于等距变量和比率变量的资料。非参数检验不要求样本所属的总体呈正态分布,一般也不是对总体参数进行检验。非参数检验不仅适用于非正态总体名义变量和次序变量的资料,而且也适用于正态总体等距变量和比率变量的资料。 一一、两独立、两独立样本的本的检验检验 1秩和检验小样本情况 n1 和n2都小于10,且n1n2 时,将两个样本的数据合在一起编
2、秩次(从小到大赋予等级),计算容量小的样本的秩次和T(等级和)。 检验步骤检验步骤 提出假设 编秩次(将两样本数据混合在一起) 求秩和(求容量较小的样本的秩次和,并表示为) 查秩和检验表,做出统计决断表表17179 9 秩和检验统计决断规则秩和检验统计决断规则T T与两与两侧临界界值比比较 显著性显著性 T T1 1 2 2 不不显著显著 1 1或或 2 2显显 著著例5:从某班随机抽取5名走读生和6名住校生,测 得英语口语成绩见表17-10。问走读生与住校生英语口语成绩是否有显著差异?表1710 走读生与住校生英语口语测验成绩走走读生生4238354132住校生住校生561960433855
3、表表171711 11 学生英学生英口口测验成绩秩和检验计算表测验成绩秩和检验计算表原始分数走读生4238354132住校生561960433855等级分数走读生63.5251住校生1081173.5917.5 17.5 根据根据n n1 15 5,n n2 26 6查表查表当显著性水平为当显著性水平为0.050.05时,时,1 119 19 ,T T2 24141差异差异显著显著。 (双(双侧概率概率,单侧为为0.0250.025)大样本情况大样本情况 当n1和n2都大于10,二项分布接近于正态分布,其平均数和标准差分别为: 检验统计量计算为:(174)2 2中位数检验中位数检验顺序变量的数
4、据常以中位数作为集中量。对两个或几个独立样本的比较,可以采用非参数检验法中的中位数检验法(median test )。中位数的检验方法是将各组样本数据合在一起找出共同的中位数,然后分别计算每个样本在共同中位数上、下的频数(恰好等于中位数的不计),再进行RC表的2检验。 检验步骤检验步骤 提出假设(H0:两独立样本中高于中位数和低于中位数的数据个数相同 ) 将两样本数据混合,并找出共同的中位数。 分别统计两样本中大于中位数的数据个数和小于中位数的数据个数。 用独立样本四格表的2检验方法进行检验。 秩和检验法和中位数检验法,针对的是两独立样本。如果样本的数据不能满足参数检验中独立样本t检验的要求,
5、可以用这两种方法进行差异检验,但检验精度比参数检验要差。二二、两相关、两相关样本的本的检验检验两相关样本的数据是一一对应的成对数据,因此相关样本又称为配对样本。对两相关样本的数据进行非参数检验的方法主要有符号检验法和符号等级检验法。 1 1、符号检验法符号检验法符号检验法(sign test)以每一对数据之差的正负符号的数目进行检验。检验思想是:如果两样本没有显著性差异,则两样本中每一对数据之差所得的正号与负号的数目应大致相当。实际应用中,遇到无法用数字描述的问题,符号检验法是一种简单而有效的检验方法。 小样本情况(n25) 检验步骤提出假设:H0:P(X1X2)P(X1X2) H1:P(X1
6、X2)P(X1X2)观察每一对数据的差数并记符号分别将正号和负号的个数记为n+和n-,0不计。将n+和n-较小的一个记为r,并计算Nn+n-确定检验形式,查表并做出统计决断符号检验表中是单侧检验表,进行双侧检验时,其显著性水平应乘以2。符号检验是以二项分布为基础的。符号检验表也是以二项分布为基础编制的。 表表17171 1 单侧符号检验统计决断规则单侧符号检验统计决断规则r r与与临界界值比比较 P P值 显著性显著性 检验检验结果果 r r r r 0.050.05 P P0.050.05不不显著显著在在0.050.05显著性水平显著性水平保留保留H H0 0,拒拒绝H H1 1r r 0.
7、010.01 r r r r 0.050.050.050.05P P0.010.01显著显著在在0.050.05显著性水平显著性水平拒拒绝H H0 0,接受接受H H1 1r r r r 0.010.01P P0.010.01极其极其显著显著在在0.010.01显著性水平显著性水平拒拒绝H H0 0,接受接受H H1 1例1:将三岁幼儿经过配对而成的实验组施以五种颜色命名的教学,而对照组不施以教学,后期测验得分见表11-2。问进行教学与不进行教学,幼儿对颜色命名的成绩是否有显著差异? 表11-2 关于五种颜色命名得分的测验结果序序号号1 12 23 34 45 56 67 78 89 9101
8、011111212实验验组组X X1 1181820202626141425252525212112121414171720201919对对照照组组X X2 213132020242410102727171721218 8151511116 62222表11-3 关于五种颜色命名得分的符号检验计算表序序号号1 12 23 34 45 56 67 78 89 9101011111212实验验组组X X1 1181820202626141425252525212112121414171720201919对对照照组组X X2 213132020242410102727171721218 815151
9、1116 62222差数符号差数符号+ +0 0+ + +- -+ +0 0+ +- -+ + +- -计算计算:n+=7,n-=3,因此 n=n+n-=10,r=3查表:表: n n=10=10时,时,r r0.050.05= =1 1,本本题r r=3=3,差差异异不不显著显著问题:本例本例题是是双双侧检验,检验,若若单单侧检验检验呢呢?、大样本情况、大样本情况(n(n25)25)大样本时,由于二项分布接近于正态分布,可用作为检验统计量,采用正态近似法。(附表中的数据虽然可满足n从1到90的情况,但在实际应用中,当n25时常常使用正态近似法)。在零假设条件下,二项分布的平均数和标准差分别为
10、:n为了使计算结果更接近正态分布,可用校正公式计算: (171)(172)统计量的计算公式为: 例2:32人的射击小组经过三天集中训练, 训练后与训练前测验成绩见表174。问三天的集中训练有无显著效果? 表114 集训前后成绩序序号号前测前测后测后测序序号号前测前测后测后测序序号号前测前测后测后测序序号号前测前测后测后测 1 1424240409 9606064641717505044442525202036362 2383835351010474739391818252526262626606042423 3535356561111121215151919636359592727515144
11、444 4494941411212323230302020454537372828282823235 5242421211313656561612121393932322929343430306 6545460601414484858582222484853533030626268687 7434334341515545452522323666656563131606060608 851514040161662625858242457575454323249494545计算计算nn+22,nn-9,nnn+n-31,nr92 2符号等级检验(符号秩和检验符号等级检验(符号秩和检验) ) 又称为
12、Wilcoxon SignedRank test,也简称为Wilcoxon test,是比符号检验法精确度高一些的另一种非参数检验方法 小样本情况小样本情况(n25) (n25) 当样本容量n25时,用查表法进行符号等级检验:提出假设: H0:P(X1X2)P(X1X2) 求差数的绝对值编秩次(赋予每一对数据差数的绝对值等级数)添符号(给每一对数据差数的等级分数添符号)求等级和(分正、负求等级和,将小的记为)查符号等级检验表,做出统计决断。 表表11115 5 符号等级检验统计决断规则符号等级检验统计决断规则T T与与临界界值比比较 P P值 显著性显著性 检验检验结果果 0.050.05 P
13、 P0.050.05不不显著显著在在0.050.05显著性水显著性水平平保留保留H H0 0,拒拒绝H H1 10.010.01 0.050.050.050.05P P0.010.01显著显著在在0.050.05显著性水显著性水平平拒拒绝H H0 0,接受接受H H1 1 0.010.01P P0.010.01极其极其显著显著在在0.010.01显著性水显著性水平平拒拒绝H H0 0,接受接受H H1 1例3:将三岁幼儿经过配对而成的实验组施以五种颜色命名的教学,而对照组不施以教学,后期测验得分见表17-6。问进行教学与不进行教学,幼儿对颜色命名的成绩是否有显著差异? 表17-6 关于五种颜色
14、命名得分的测验结果序序号号1 12 23 34 45 56 67 78 89 9101011111212实验验组组X X1 1181820202626141425252525212112121414171720201919对对照照组组X X2 213132020242410102727171721218 8151511116 62222表表17-7 17-7 关于关于五五种种色命名得色命名得分的符号检验计算表分的符号检验计算表序序号号1 12 23 34 45 56 67 78 89 9101011111212实验验组组X X1 11818202026261414252525252121121
15、21414171720201919对对照照组组X X2 213132020242410102727171721218 8151511116 62222计算计算:T T=47.5=47.5,T T=7.5=7.5,因此因此 T T=7.5=7.5查表:表: n n=10=10时时( (差差数为数为0 0不不计) ),T T0.050.05= =8 8,差差异异显著显著差数差数5 50 02 24 42 28 80 04 41 16 614143 3等级等级7 72.52.5 5.55.5 2.52.59 95.55.51 18 810104 4添添符号符号+ + + + + + + +大样本情况
16、大样本情况(n(n25)25)当样本容量n25时,二项分布接近于正态分布,因此有:n检验统计量检验统计量可可计算计算为为:(17.3)例例4 4:3232人的射击小组经过三天集中训练,人的射击小组经过三天集中训练,训训 练后与训练前测验成绩见表练后与训练前测验成绩见表17178 8。问三天。问三天的集中训练有无显著效果?的集中训练有无显著效果?表178 集训前后成绩计算表序序号号前测前测后测后测序序号号前测前测后测后测序序号号前测前测后测后测序序号号前测前测后测后测 1 1424240409 9606064641717505044442525202036362 2383835351010474
17、739391818252526262626606042423 3535356561111121215151919636359592727515144444 4494941411212323230302020454537372828282823235 5242421211313656561612121393932322929343430306 6545460601414484858582222484853533030626268687 7434334341515545452522323666656563131606060608 8515140401616626258582424575754543
18、23249494545计计 算算+ +356.5356.5 - -139.5139.5 因此因此, ,139.5139.5,n n3131符号检验法和符号等级检验法,针对的是相关样本。如果样本的数据不能满足参数检验中相关样本t检验的要求,可以用这两种方法进行差异检验,但检验精度比参数检验要差。 三、等级方差分析三、等级方差分析 方差分析要求满足“总体正态”、“方差齐性”等条件,而且只能针对连续型测量数据。当这些条件不能满足时,就需要采用非参数检验的方法。等级方差分析就是方差分析的非参数检验方法。1 1、克、克- -瓦氏单向等级方差分析瓦氏单向等级方差分析克-瓦氏单向等级方差分析是一种非参数方差
19、分析方法,又称为克-瓦氏检验法(Kruskal Wallis H)。用于对多组独立样本进行分析,对应于参数检验法中的完全随机设计方差分析。 基本分析过程:基本分析过程: 将多组样本数据合在一起编秩次(从小到大赋予等级)计算各样本的等级和代入统计量公式计算查统计表做出统计结论 统计量计算公式统计量计算公式公式中,N 为各组频数总和, n 为各样本容量, R 为各组数据秩次和 。 (175) 统计决断方法统计决断方法 1、样本容量较小或组数较少情况当各组的容量n5,或者样本组数k3,可查检验表,根据相应的样本容量找出概率值。(0.05时差异显著)2 2、样本容量较大或组数较多情况、样本容量较大或组
20、数较多情况 当各组容量n5,或者样本组数k3时,由(175)式计算的值,其抽样分布接近于自由度dfk1的2分布,因此可查2值表进行统计决断。 例例6 6:三个小组图画成绩见表:三个小组图画成绩见表17-1217-12,问三组成绩,问三组成绩是否有显著差异?是否有显著差异?表17-12 三个小组图画成绩计算表等等级级分分数数甲甲乙乙丙丙5.55.51 1141410104 412127 7111113132 23 39 98 85.55.5序号序号原始分原始分数数甲甲乙乙丙丙1 16262454585852 27777606079793 36868787882824 45454565676765
21、 570706262合合计5 55 54 41414R R1 1=32.5=32.5R R2 2=24.5=24.5R R3 3=48=48计计 算算n根据根据k k3 3,n n1 15 5,n n2 25 5,n n3 34 4 查查表表判判断断2 2、弗里德曼双弗里德曼双向等级方差分析向等级方差分析 n弗里德曼双向等级方差分析(Friedman test)用于多组相关样本,是随机区组设计的非参数检验。n双向等级方差分析是对同一个对象(或匹配的对象)接受k 次实验处理所获得的原始数据之间编秩次(即赋予等级),然后以这些等级数为基础,计算 值作为检验统计量。 统计量计算公式为:(17) 统计
22、决断方法统计决断方法1样本容量较小或组数较少情况当样本容量n9,k3;或者n4,k4时,可查检验表,根据相应的样本容量找出概率值。 2.2.样本容量较大或组数较多情况样本容量较大或组数较多情况 当k3,n9;k4,n4或者k4时,由(176)式计算的值,其抽样分布接近于自由度dfk1的2分布,因此可查2值表进行统计决断。例例7 7:五位教师对甲、乙、丙三篇作文所作的评价见:五位教师对甲、乙、丙三篇作文所作的评价见 表表17-1317-13。问三篇作文被评价的成绩是否相同?。问三篇作文被评价的成绩是否相同?表11-13 五位教师对三篇作文评价计算表原始原始分数分数甲甲乙乙丙丙3 31 12 23
23、 31 12 23 32 21 11 13 32 21 13 32 2R R1 1=11=11R R2 2=10=10R R3 3=9=9教师教师序序号号原始原始分数分数甲甲乙乙丙丙1 13838242430302 23434282832323 34646373730304 42121292926265 5404045454242合合计计计 算算n根据根据n n5 5,k k3 3 查查表表判判断:差异断:差异不不显著显著四四、非参数检验非参数检验的特点的特点1一般不需要严格的前提假设。2非参数检验特别适用于顺序资料或等级变量。3非参数检验很适用于小样本,且方法简单。4非参数检验最大的不足是未能充分利用资料的全部信息。5非参数方法目前还不能处理“交互作用”。 谢谢大家!大家!