非参数假设检验第四次课新

上传人:工**** 文档编号:568910521 上传时间:2024-07-27 格式:PPT 页数:88 大小:2.09MB
返回 下载 相关 举报
非参数假设检验第四次课新_第1页
第1页 / 共88页
非参数假设检验第四次课新_第2页
第2页 / 共88页
非参数假设检验第四次课新_第3页
第3页 / 共88页
非参数假设检验第四次课新_第4页
第4页 / 共88页
非参数假设检验第四次课新_第5页
第5页 / 共88页
点击查看更多>>
资源描述

《非参数假设检验第四次课新》由会员分享,可在线阅读,更多相关《非参数假设检验第四次课新(88页珍藏版)》请在金锄头文库上搜索。

1、非参数假设检验非参数假设检验追求追求1 非参数非参数检验是相对于检验是相对于参数参数检验而言的,这两检验而言的,这两种检验方法在实际中都有广泛的应用,但它们有着种检验方法在实际中都有广泛的应用,但它们有着不同的数理统计原理和应用场合。不同的数理统计原理和应用场合。 在统计学的发展过程中,最先出现的推断统在统计学的发展过程中,最先出现的推断统计方法都对样本所属总体的性质作出若干假设,即计方法都对样本所属总体的性质作出若干假设,即对总体的对总体的分布形状分布形状作某些限定,例如作某些限定,例如Z检验、检验、t检验,检验,假设假设样本的总体分布加以某些限定,把所要推断的样本的总体分布加以某些限定,把

2、所要推断的总体数字特征看作未知的总体数字特征看作未知的“参数参数”进行推断,称之进行推断,称之为为参数参数统计方法(统计方法(Parameter statistical methods)或限定分布统计方法(或限定分布统计方法(distribution-specified statistical methods),基于此所做的假设检验就称),基于此所做的假设检验就称为参数检验(为参数检验(Parametric test)。常用的检验如)。常用的检验如t检检验、验、Z检验、检验、F检验等都是参数检验。检验等都是参数检验。2参数参数检验只有在关于总体分布的检验只有在关于总体分布的假设成立假设成立时,

3、所时,所得出的结论才是正确的,所以它在很多场合不便得出的结论才是正确的,所以它在很多场合不便应用,于是统计学家发展了许多对总体不作太多应用,于是统计学家发展了许多对总体不作太多或严格限定的统计推断方法,这些方法一般不涉或严格限定的统计推断方法,这些方法一般不涉及总体参数的假设,与之相对应的统计方法通常及总体参数的假设,与之相对应的统计方法通常称为称为非参数非参数统计(统计(Nonparametric statistics)或)或自由分布统计方法(自由分布统计方法(Distribution-free statiscal methods),基于此所做的假设检验则称为),基于此所做的假设检验则称为非

4、参非参数检验数检验(Nonparametric test)或自由分布统计)或自由分布统计检验(检验(Distribution-free statistical test)。非参)。非参数检验的前提假设比参数检验方法少很多,也容数检验的前提假设比参数检验方法少很多,也容易满足,易满足,适用于适用于已知信息相对较少的数据资料,已知信息相对较少的数据资料,而且它的计算方法也简便易行。而且它的计算方法也简便易行。 3对于多数参数检验方法,都有一种或几种对于多数参数检验方法,都有一种或几种相对应的非参数检验方法,如下表所示。相对应的非参数检验方法,如下表所示。参数检验与非参数检验方法的对应表参数检验与非

5、参数检验方法的对应表参数参数检验方法方法非参数非参数检验方法方法t检验法法两个独立两个独立样本的本的中位数中位数检验两个独立两个独立样本的本的秩和秩和检验t检验法法(配(配对样本)本)成成对比比较、单样本本正正负号号检验成成对比比较、单样本本符号秩符号秩检验单因素方差分析因素方差分析K个独立个独立样本的本的H检验法法多因素方差分析多因素方差分析Friedman 检验法法相关系数相关系数Spearman 秩相关系数秩相关系数4与参数检验方法对比,非参数检验方法具有以下优点与参数检验方法对比,非参数检验方法具有以下优点: : 检验条件宽松,适应性强。参数检验假定总体分布为检验条件宽松,适应性强。参

6、数检验假定总体分布为正态、近似正态或以正态分布为基础而构造的正态、近似正态或以正态分布为基础而构造的t分布或分布或 分布;非参数检验不受这些条件的限制,弥补了参分布;非参数检验不受这些条件的限制,弥补了参数检验的不足,对于非正态的、方差不等的以及分布数检验的不足,对于非正态的、方差不等的以及分布形状未知的数据都适用。形状未知的数据都适用。检验方法灵活,用途广泛。非参数检验不但可以应用检验方法灵活,用途广泛。非参数检验不但可以应用与定距、定比等连续变量的检验,而且适用于定类、与定距、定比等连续变量的检验,而且适用于定类、定序等分类变量的检验。对于那些不能直接进行四则定序等分类变量的检验。对于那些

7、不能直接进行四则运算的定类数据和定序数据,运用符号检验、符号秩运算的定类数据和定序数据,运用符号检验、符号秩检验都能起到好的效果。检验都能起到好的效果。非参数检验的计算相对简单,易于理解。由于非参数非参数检验的计算相对简单,易于理解。由于非参数检验更多地采用计数的方法,其过程及结果都可以被检验更多地采用计数的方法,其过程及结果都可以被直观地理解,为使用者所接受。直观地理解,为使用者所接受。 非参数检验的优点非参数检验的优点 5非参数检验的缺点非参数检验的缺点 非参数检验也有一些不可避免的缺点非参数检验也有一些不可避免的缺点:非参数检验方法对总体分布的假定不多,适应非参数检验方法对总体分布的假定

8、不多,适应性强,但方法本身也就缺乏针对性,其功效不性强,但方法本身也就缺乏针对性,其功效不如参数检验。如参数检验。非参数检验使用的是非参数检验使用的是等级等级或或符号秩符号秩,而不是实,而不是实际数值,方法虽简单,但会失去许多信息,因际数值,方法虽简单,但会失去许多信息,因而检验的有效性也就比较差。而检验的有效性也就比较差。例如例如对于一批适对于一批适用于用于t检验的配对资料,如果采用检验的配对资料,如果采用符号秩符号秩检验检验处理,其功效将低于处理,其功效将低于t检验,如果用检验,如果用符号符号检验检验处理则效率更低,因为它对信息的利用更不充处理则效率更低,因为它对信息的利用更不充分。当然,

9、如果假定的分布不成立,那么非参分。当然,如果假定的分布不成立,那么非参数检验就是更值得信赖的。数检验就是更值得信赖的。6一个总体分布的非参数假设检验一个总体分布的非参数假设检验 (2)(2)两个总体的分布未知两个总体的分布未知, ,它们是否相同它们是否相同;非参数假设检验非参数假设检验需要处理需要处理的问题:的问题:(1)(1)猜出总体的分布猜出总体的分布( (假设假设),),用另一组样本检验。用另一组样本检验。两个总体分布的非参数假设检验两个总体分布的非参数假设检验 内容内容多个总体分布的非参数假设检验多个总体分布的非参数假设检验 7配对样本非参数检验配对样本非参数检验 SPSS的非参数检验

10、一个一个总体:单样本总体分布的检验总体:单样本总体分布的检验两个两个总体总体多个多个总体总体独立样本非参数检验独立样本非参数检验配对样本非参数检验配对样本非参数检验独立样本非参数检验独立样本非参数检验8一个总体分布的检验一个总体分布的检验检验总体的检验总体的卡方卡方分布分布检验总体的检验总体的二项二项分布分布单样本单样本变量值变量值的的随机性随机性检验检验( (游程游程检验检验) )单样本的单样本的KolmogorovSmirnov检验检验检验总体的检验总体的正态正态分布分布9 P- -P正态正态概率分布图概率分布图(Graphs P- -P) Q Q- -Q Q正态正态概率单位分布图概率单位

11、分布图(Graphs Q Q- -Q Q)检验总体的正态分布的图示法检验总体的正态分布的图示法 是根据变量的累计比例对所指定的理论分布累是根据变量的累计比例对所指定的理论分布累计比例绘制的图形。计比例绘制的图形。 是根据变量分布的分位数对所指定的理论分布是根据变量分布的分位数对所指定的理论分布分位数绘制的图形。分位数绘制的图形。1011半正态分布半正态分布( (Half-normal) )伽玛分布伽玛分布( (Gamma) )指数分布指数分布( (Exponential) )Test Distribution提供提供1313种概率分布:种概率分布:贝塔分布贝塔分布( (Beta) )卡方分布卡

12、方分布( (Chi-square) )拉普拉斯分布拉普拉斯分布( (Laplace) )逻辑斯谛分布逻辑斯谛分布( (Logistic) )对数正态分布对数正态分布( (Lognormal) )正态分布正态分布( (Normal) )帕累托分布帕累托分布( (Pareto) )T分布分布( (Student T) )威布尔分布威布尔分布( (Weibull) )均匀分布均匀分布( (Uniform) )12Bloms方法方法:使用公式:使用公式:Tukey方法方法:使用公式:使用公式:Rankit方法方法:使用公式:使用公式:Van der Waerden方法方法:使用公式:使用公式:n:个案

13、的数目个案的数目r:从从1 1到到n的秩次的秩次式中式中:选择比率估测的公式,每次只能选择一项。13 若与某个概率分布的统计图一致,即被检验的数据符合所指定的分布,则代表个案的点簇在一条直线上。14 总体分布的卡方检验的总体分布的卡方检验的原理原理:如果从一个随如果从一个随机变量机变量X X中随机抽取若干个观察样本中随机抽取若干个观察样本,这些观察这些观察样本落在样本落在X的的K个互不相交的子集中的个互不相交的子集中的观察频数观察频数服从一个多项分布服从一个多项分布,该多项分布当该多项分布当K趋于无穷时趋于无穷时,就近似服从就近似服从X的总体分布。的总体分布。 因此,假设样本来自的总体服从某个

14、期望分因此,假设样本来自的总体服从某个期望分布或理论分布,同时获得样本数据各子集的实际布或理论分布,同时获得样本数据各子集的实际观察频数,则可依据下面统计量作出推断观察频数,则可依据下面统计量作出推断:例题例题检验总体的检验总体的卡方卡方分布分布15 例题例题:某地一周内每日患忧郁症的人数如表某地一周内每日患忧郁症的人数如表所示,请检验一周内每日人们忧郁的数是否满足所示,请检验一周内每日人们忧郁的数是否满足1:1:2:2:1:1:11:1:2:2:1:1:1。周日患者数131238370480529624731SPSS实现实现过程过程1.1.定义变量;定义变量;2.2.变量加权;变量加权;3.

15、3.进入进入Analyze菜单菜单1617 用于选择计算非参数检验统计量对应的P值的方法。SPSS提供了3种计算P值的方法:Asymptotic only:渐进性的显著性检验,适合于样本服从渐进分布或较大样本。Monte Carlo:不依赖渐进性方法估测精确显著性,这种方法在数据不满足渐进性分布,而且样本数据过大以致不能计算精确显著性时特别有效。Exact:精确计算法,即准确计算观测结果的统计概率。计算量较大,适用于小样本。1819 卡方检验卡方检验要求要求样本量是充分大的,使用时样本量是充分大的,使用时建议样本容量应该建议样本容量应该不小于不小于3030,同时同时每个单元每个单元中的期望频数

16、不能太小,如果有类别的频数中的期望频数不能太小,如果有类别的频数小于小于5 5,则建议将它与相邻的类别合并,如果则建议将它与相邻的类别合并,如果有有20%20%的单元期望频数都小于的单元期望频数都小于5 5,就不能再使就不能再使用卡方检验了。用卡方检验了。20 练习练习:赛马比赛时,任一马的起点位置是起跑赛马比赛时,任一马的起点位置是起跑线上所指定的标杆位置。现有线上所指定的标杆位置。现有8 8匹马的比赛,位置匹马的比赛,位置1 1是内侧最靠近栏杆的跑道,位置是内侧最靠近栏杆的跑道,位置8 8是外侧离栏杆是外侧离栏杆最远的跑道,下表是某赛马在一个月内某特定圆最远的跑道,下表是某赛马在一个月内某

17、特定圆形跑道上的纪录,并且按照起点的标杆位置分类。形跑道上的纪录,并且按照起点的标杆位置分类。试检验起点标杆位置对赛马结果的影响试检验起点标杆位置对赛马结果的影响。马在马在8 8个圆形跑道的起点标杆位置上获胜的纪录个圆形跑道的起点标杆位置上获胜的纪录均匀分布检验均匀分布检验21 二项分布检验的二项分布检验的基本思想基本思想:根据搜集到的样根据搜集到的样本数据,推断总体分布是否服从某个指定的二项本数据,推断总体分布是否服从某个指定的二项分布。分布。 SPSS中的二项分布检验,在样本小于等于中的二项分布检验,在样本小于等于3030时,按照计算二项分布概率的公式进行计算;样时,按照计算二项分布概率的

18、公式进行计算;样本数大于本数大于3030时,计算的是时,计算的是Z统计量,认为在零假统计量,认为在零假设下设下,Z统计量服从正态分布统计量服从正态分布。 其其零假设零假设:样本来自的总体与所指定的某个样本来自的总体与所指定的某个二项分布不存在显著的差异。二项分布不存在显著的差异。K:观察变量取值的样本个数,:观察变量取值的样本个数,当当K小于小于n/2/2时,取加号;时,取加号;p为检为检验概率。验概率。练习练习检验总体的检验总体的二项二项分布分布22 练习练习:某地某一时期内出生:某地某一时期内出生3535名婴儿,其中名婴儿,其中女孩儿女孩儿1919名(名(Sex=0=0), ,男孩儿男孩儿

19、1616名(名(Sex=1=1)。)。问,该地区出生婴儿的性别比例与通常的男女性问,该地区出生婴儿的性别比例与通常的男女性别比例(总体概率约为别比例(总体概率约为0.50.5)是否不同?数据如)是否不同?数据如下表所示:下表所示: 续续233535名婴儿的性别名婴儿的性别 242526单样本变量值的随机性检验单样本变量值的随机性检验( (游程检验游程检验) ) 依时间或其他顺序排列的有序数列中,具有依时间或其他顺序排列的有序数列中,具有相同的事件或符号的相同的事件或符号的连续部分连续部分称为一个称为一个游程游程。调。调用用Runs过程过程可进行游程检验,即用于检验序列中可进行游程检验,即用于检

20、验序列中事件发生过程的事件发生过程的随机性随机性分析分析。 单样本变量值的随机性检验是对某变量的取单样本变量值的随机性检验是对某变量的取值出现是否随机进行检验,也称值出现是否随机进行检验,也称游程检验游程检验。例题例题27例题例题:某村发生一种地方病,其住户沿一条河排:某村发生一种地方病,其住户沿一条河排列,调查时对发病的住户标记为列,调查时对发病的住户标记为“1”1”,对非发,对非发病的住户标记为病的住户标记为“0”0”,共,共2020户,其取值如下表户,其取值如下表所示:所示:续续283535家住户的发病情况家住户的发病情况293031单样本的单样本的KolmogorovSmirnov检验

21、检验 单样本单样本KSKS检验检验是一种拟合优度的非参数检是一种拟合优度的非参数检验,是利用样本数据验,是利用样本数据推断推断总体总体是否服从是否服从某一理论某一理论分布的方法,适用于探索连续性随机变量的分布分布的方法,适用于探索连续性随机变量的分布形态。进行形态。进行Kolmogorov-Smirnov Z Z检验,是将一检验,是将一个变量的实际频数分布与正态分布个变量的实际频数分布与正态分布( (Normal) )、均均匀分布匀分布( (Uniform) )、泊松分布泊松分布( (Poisson) )进行比较进行比较。 SPSS实现实现KS检验的过程如下检验的过程如下:32(1 1)根据样

22、本数据和用户的指定构造出理论分根据样本数据和用户的指定构造出理论分布,查分布表得到相应的布,查分布表得到相应的理论理论累计概率分布函数累计概率分布函数 。(2 2)利用样本数据计算各样本数据点的累积概利用样本数据计算各样本数据点的累积概率,得到检验率,得到检验累计概率分布函数累计概率分布函数 。(3 3)计算计算 和和 在相应的变量值点在相应的变量值点X X上的差,上的差,得到得到差值差值序列。单样本序列。单样本K KS S检验主要对检验主要对差值差值序列序列进行研究进行研究。例题例题33 例题例题:某地某地144144个周岁儿童身的高数据如下表,问个周岁儿童身的高数据如下表,问该地区周岁儿童

23、身高频数是否成正态分布该地区周岁儿童身高频数是否成正态分布?身高区间人数642684697701671207225732474227616782796831343536 练习练习:某报刊亭为研究每天报刊的销售量某报刊亭为研究每天报刊的销售量,为以后每天报刊进量提供依据为以后每天报刊进量提供依据,统计其在统计其在140140天的天的销售中销售中,某日报的日销售量的频数资料如下表某日报的日销售量的频数资料如下表,问该资料的频数是否服从正态分布问该资料的频数是否服从正态分布?日销售量(份)天数日销售量(份)天数159221021924160169422022922170179723023916180

24、18916240249219019920250259620020925260137两个总体独立样本的非参数检验两个总体独立样本的非参数检验检验两个总体的分布是否相同:检验两个总体的分布是否相同:方差相同方差相同分布分布函数函数形式形式相同相同两个总体的分布若相同两个总体的分布若相同参数相同参数相同均值相同均值相同(2)(2)两个总体的分布未知两个总体的分布未知, ,它们是否相同它们是否相同;38Wald-wolfowitz Runs 游程检验游程检验Mann-Whitney U秩和检验秩和检验KolmogorovSmirnov检验检验Moses Extreme Reactions极端反应检验极

25、端反应检验两个总体两个总体独立样本独立样本的非参数检验方法的非参数检验方法两个总体两个总体独立样本独立样本非参数检验方法的非参数检验方法的SPSS操作操作39零假设零假设:样本来自的两独立总体分布样本来自的两独立总体分布无显著差异无显著差异 K- -S检验实现的方法检验实现的方法:将两组样本数据混合并将两组样本数据混合并升序排列升序排列,分别计算两组样本分别计算两组样本秩秩的累计频率和每的累计频率和每个点上的累积频率,然后将两个累计频率个点上的累积频率,然后将两个累计频率相减相减,得到得到差值差值序列数据序列数据。 K- -S检验将关注差值序列,并计算将关注差值序列,并计算K- -S的的Z统统

26、计量,依据正态分布表给出相应的相伴概率值计量,依据正态分布表给出相应的相伴概率值。(1 1)KolmogorovSmirnov检验检验40两组样本是可以各自独立颠倒顺序的两组样本是可以各自独立颠倒顺序的(2 2)Mann-Whitney U秩和检验法秩和检验法检验这两组样本是否来自同一个总体检验这两组样本是否来自同一个总体( (或两组样本或两组样本的总体分布是否相同的总体分布是否相同) )。 问题问题: 有两个总体的样本为有两个总体的样本为:与与可能可能。 Mann-Whitney U检验的统计量是:检验的统计量是: 式中式中对给定对给定 , ,查查 值表值表, ,得得若若, ,则总体分布相同

27、。则总体分布相同。41 两样本两样本Wald-wolfowitz 游程检验游程检验中,中,计算游计算游程的方法与观察值的程的方法与观察值的秩秩有关。有关。首先首先,将两组样本将两组样本混合并混合并升序升序排列。在数据排序时排列。在数据排序时,两组样本的每两组样本的每个观察值对应的样本组标志值序列也随之重新排个观察值对应的样本组标志值序列也随之重新排列列,然后然后对标志值序列对标志值序列求游程求游程。 如果计算出的游程数相对如果计算出的游程数相对比较小比较小,则说明样本则说明样本来自的两总体分布形态存在来自的两总体分布形态存在较大较大差距。差距。 SPSS将自动计算游程数得到将自动计算游程数得到

28、Z统计量统计量,并依据正并依据正态分布表给出对应的相伴概率值态分布表给出对应的相伴概率值。(3)Wald-wolfowitz 游程检验游程检验42 如果跨度或截头跨度很小如果跨度或截头跨度很小,说明两个样本数据说明两个样本数据无法无法充分混合充分混合,认为实验样本存在极端反应认为实验样本存在极端反应。 两独立样本的极端反应检验两独立样本的极端反应检验,将一个样本作为控将一个样本作为控制样本制样本,另一个样本作为实验样本。以控制样本做对另一个样本作为实验样本。以控制样本做对照照,检验实验样本是否存在极端反应。检验实验样本是否存在极端反应。 首先首先,将两组样本将两组样本混合并升序混合并升序排列排

29、列;然后然后计算控计算控制样本最低秩和最高秩之间的观察值个数制样本最低秩和最高秩之间的观察值个数,即即:Span( (跨度跨度) )。 为控制极端值对分析结果的影响为控制极端值对分析结果的影响,可先去掉样本可先去掉样本两个最极端的观察值后两个最极端的观察值后,再求跨度再求跨度,这个跨度称为这个跨度称为截截头跨度头跨度。零假设零假设:样本来自的两独立总体分布:样本来自的两独立总体分布没有显著差异。没有显著差异。(4)Moses 极端反应检验极端反应检验43两组独立样本的总体分布是否相同的检验两组独立样本的总体分布是否相同的检验例如:例如:用两种激励方法对同样工种的两个班组用两种激励方法对同样工种

30、的两个班组进行激励,每个班组都有进行激励,每个班组都有7 7个人,测得激励后个人,测得激励后的业绩增长率如下表所示,问:两种激励方的业绩增长率如下表所示,问:两种激励方法的激励效果的分布有无显著差异法的激励效果的分布有无显著差异?两种激励方法分别用于两个班组的效果(两种激励方法分别用于两个班组的效果(%)激励法激励法A 16.10 17.00 16.80 16.50 17.50 18.00 17.20激励法激励法B 17.00 16.40 15.80 16.40 16.00 17.10 16.90SPSS的实现过程的实现过程: 点击点击进入进入Analyze菜单的菜单的Nonparametri

31、c Tests子菜单子菜单,选择,选择2 Independent Sample命令。命令。4445 Moses Extreme Reactions(极端检验):(极端检验):检验两检验两个独立样本观察值的散布范围是否有差异存在,以个独立样本观察值的散布范围是否有差异存在,以检验两个样本是否来自具有同一分布的总体检验两个样本是否来自具有同一分布的总体。 Mann-Whitney U:检验两个独立样本所属的总检验两个独立样本所属的总体均值是否相同体均值是否相同。 Kolmogorov-Smirnov Z(KS):推测两个样推测两个样本是否来自具有相同分布的总体本是否来自具有相同分布的总体。 Wal

32、d-Wolfowitz runs(游程检验):(游程检验):考察两个独考察两个独立样本是否来自具有相同分布的总体立样本是否来自具有相同分布的总体。4647 练习练习:研究两个不同厂家生产的灯泡使用寿命是研究两个不同厂家生产的灯泡使用寿命是否存在显著性差异否存在显著性差异,随机抽取两个厂家生产的灯泡随机抽取两个厂家生产的灯泡,试验得到的使用寿命数据如下表试验得到的使用寿命数据如下表:灯泡寿命厂家编号6751682169116701650169316501649268026302650264626512620248两个总体两个总体配对样本配对样本的非参数检验方法的非参数检验方法McNemar检验检

33、验Sign符号检验符号检验法法( (正负号检验法正负号检验法) )Wilcoxon 秩和检验秩和检验49(1)(1)Wilcoxon秩和检验法秩和检验法 设有两个总体的样本为设有两个总体的样本为:把两组样本放在一起把两组样本放在一起, ,按样本观察值按样本观察值较多地集中在左段。较多地集中在左段。w w太大太大, ,说明样本说明样本较多地集中在右段。较多地集中在右段。两组样本是两组样本是可以可以各自独立颠倒顺序的各自独立颠倒顺序的。可能与w w太小太小, ,说明样说明样本本( (秩秩) )加总起来加总起来, ,记为记为w w。如果两个总体的分布相同如果两个总体的分布相同, ,则则样本应当是均匀

34、混合的样本应当是均匀混合的, ,即即w w不能太小不能太小, ,也不能太大。也不能太大。的序号的序号为秩。把样本个数少的这组样本为秩。把样本个数少的这组样本那么每个观察值就有一个序号那么每个观察值就有一个序号, ,称称的大小重新排序的大小重新排序, ,不妨设不妨设续续50显著性水平显著性水平,则接受 由于 ,w应在某两个数字之间应在某两个数字之间:, ,可以由威尔可可逊表可以由威尔可可逊表, ,依据依据是由是由所决定的。对于给定的所决定的。对于给定的查查出出。若,或,则拒绝反之,若。51 McNemar变化显著性检验,以研究对象变化显著性检验,以研究对象自身自身为对照,检验其两组样本为对照,检

35、验其两组样本“前后前后”变化变化是否显著。该检验要求待检验的两组样本的是否显著。该检验要求待检验的两组样本的观察值是观察值是二值二值数据数据。即即该法该法适用于适用于相关的二相关的二分变量数据。分变量数据。零假设零假设:样本来自的两配对:样本来自的两配对总体分布总体分布无无显著差异显著差异 McNemar变化显著性检验变化显著性检验基本方法基本方法:二二项分布检验项分布检验。例题例题(2)McNemar检验检验52 例题例题:分析学生接受某种方法进行训练的效果分析学生接受某种方法进行训练的效果,收集到收集到1010个学生在训练前、训练后的成绩如下表所个学生在训练前、训练后的成绩如下表所示示,问

36、训练前后学生的成绩是否存在显著性差异问训练前后学生的成绩是否存在显著性差异?训练前训练后训练前成绩训练后成绩0158.0070.001170.0071.000145.0065.000156.0068.000045.0050.000050.0055.001161.0075.001170.0070.000155.0065.001160.0070.00535455不能各自不能各自独立独立地颠倒顺序。地颠倒顺序。要求样本要求样本发生的概率为发生的概率为(3)(3)符号检验法符号检验法( (正负号检验法正负号检验法) )复习二项分布:复习二项分布:或或在在次重复努力试验中,次重复努力试验中, 事件事件,

37、在在次试验中出现的次数为次试验中出现的次数为, 则如果随机变量则如果随机变量的分布如下:的分布如下:则称则称服从参数为服从参数为的二项分布,的二项分布, 记为记为且二项分布的均值为且二项分布的均值为, 方差为方差为。56若随机变量X 分布,则统计量且,定理一:定理二:函数的均值定理三: 当 充分大时, 近似地服从均值 、的正态分布,即标准差为 按照经验,只要 ,同时,就可以认为足够大了,用正态分布来近似它。57符号检验法的符号检验法的思路思路:若两个总体的分布相同若两个总体的分布相同, ,即即,则则令:令:的个数的个数的个数的个数:的个数的个数:的个数的个数:则则设设式中式中用容量相同的两个用

38、容量相同的两个配对样本配对样本来检验,即来检验,即所以问题转化为:所以问题转化为:58求从小到大的累积概率:求从小到大的累积概率:正负号个数检验法的正负号个数检验法的处理处理小样本情况下:小样本情况下:对对对对求从大到小的累积概率:求从大到小的累积概率:即即若若则接受则接受是拒绝是拒绝 的最的最高高界限。界限。是拒绝是拒绝 的最的最低低界限。界限。小小样本情况下样本情况下大大样本情况下样本情况下S统计量统计量59对于显著性水平对于显著性水平假设:假设: (即即式中用式中用(即即)绝还是接受绝还是接受。所谓所谓“大样本大样本”, ,就是要就是要检验统计量为:检验统计量为:代替代替, 得出拒得出拒

39、是否大于是否大于判断判断,同时同时 大样本大样本情况下情况下, ,正负号个数检验法的处理正负号个数检验法的处理60例例 一一个个卖卖衬衬衣衣的的邮邮购购店店从从过过去去的的经经验验中中得得知知有有15%15%的的购购买买者者说说衬衬衣衣的的大大小小不不合合身身, ,要要求求退退货货。现现这这家家邮邮购购店店改改进进了了邮邮购购定定单单的的设设计计, ,结结果果在在以以后后售售出出的的500500件件衬衬衣衣中中, ,有有6060件件要要求求退退货货。问问:在在5%5%的的a a水水平平上上, ,改改进进后后的的退退货货比比例例( (母母体体比比例例) )与与原原来来的的退退货货比例有无显著差异

40、比例有无显著差异? ? 由于 =5000.15=7525,已经足够大,故由中心极限定理, 近似地服从均值为 、的正态分布。 于是取显著性水平 ,方差为解:61与与 可从可从“符号检符号检在显著性水平在显著性水平 之下之下, ,依据依据S= =min( , )( , ) 处理正负号个数检验法的处理正负号个数检验法的S统计量方法统计量方法 , ,选统计量:选统计量:记记, ,若若则拒绝假设则拒绝假设认为认为则接受假设则接受假设若若, ,认为认为。这一检验法的重要的前提与前两个方法相同这一检验法的重要的前提与前两个方法相同, ,验表验表”中查出中查出 :与与 就越接近。就越接近。S越小越小, ,的差

41、别就越大的差别就越大与与即按照问题本来的属性即按照问题本来的属性, ,天然地配对。天然地配对。不能不能各自独立地颠倒顺序。各自独立地颠倒顺序。或或样本样本注意注意:S越大越大, ,62多独立样本的多独立样本的KW检验检验多独立样本的多独立样本的Median检验检验多个总体多个总体独立样本独立样本的非参数检验的非参数检验多独立样本的多独立样本的KT检验检验63 SPSS实现的过程中实现的过程中,将多组样本数据混合并将多组样本数据混合并升序排列,求出混合样本数据的中位数升序排列,求出混合样本数据的中位数, ,并假设并假设是共同的中位数是共同的中位数。 如果多组独立样本的中位数如果多组独立样本的中位

42、数无显著差异无显著差异,则说,则说明多组独立样本有共同的中位数。如果每组中大明多组独立样本有共同的中位数。如果每组中大于该中位数的中位数于该中位数的中位数大致等于大致等于每组中小于该中位每组中小于该中位数的样本数,则可以认为该多个独立总体的中位数的样本数,则可以认为该多个独立总体的中位数没有显著差异。数没有显著差异。多独立样本的中位数检验多独立样本的中位数检验 通过对多组数据的分析,推断多个独立总体通过对多组数据的分析,推断多个独立总体分布是否存在显著差异分布是否存在显著差异。 零假设零假设:样本来自的多个独立总体的中位数无样本来自的多个独立总体的中位数无显著差异显著差异。64多独立样本的多独

43、立样本的KW检验检验 零假设零假设:样本来自的多个独立总体的分布无显样本来自的多个独立总体的分布无显著差异著差异。 SPSS SPSS的实现的实现,将多组样本数据将多组样本数据混合并升序混合并升序排列,排列,求出求出每个观察值的秩,然后对多组样本的值求出求出每个观察值的秩,然后对多组样本的值分别求平均值。如果各组样本的平均秩大致相等,分别求平均值。如果各组样本的平均秩大致相等,则认为多个独立总体的分布无显著差异则认为多个独立总体的分布无显著差异。n第第i组样本的观察值个数;组样本的观察值个数;R平均秩。平均秩。例题例题65 例题例题:随机抽取随机抽取3 3个班级学生的个班级学生的2121个成绩

44、样本,个成绩样本,问问3 3个班级学生总体成绩是否存在显著差异个班级学生总体成绩是否存在显著差异?666768多个总体多个总体配对样本配对样本的非参数检验的非参数检验多配对样本的多配对样本的Friendman检验检验多配对样本的多配对样本的Kendall检验检验多配对样本的多配对样本的Cochran Q检验检验69多配对样本的Friendman检验要求要求:数据是数据是定距定距的的。 实现原理实现原理:以样本为单位,将各个样本数据按照升以样本为单位,将各个样本数据按照升序排列,求各个样本数据在各自行中的秩,然后计序排列,求各个样本数据在各自行中的秩,然后计算个样本的秩总和及平均秩算个样本的秩总

45、和及平均秩。 如果多个配对样本的分布存在显著性差异如果多个配对样本的分布存在显著性差异,则数则数值普遍偏大组的值普遍偏大组的秩和秩和必然偏大必然偏大,各组的各组的秩秩之间就会之间就会存在显著差异。如果个样本的存在显著差异。如果个样本的平均秩平均秩大致相当大致相当,则则可以认为个组的总体分布没有显著差异可以认为个组的总体分布没有显著差异。例题例题70 例题例题:为了试验某种减肥药物的性能,测量为了试验某种减肥药物的性能,测量1111个个人在服用该药以前以及服用该药人在服用该药以前以及服用该药1 1个月后、个月后、2 2个月后、个月后、3 3个月后的体重。问个月后的体重。问:在这在这4 4个时期,

46、个时期,1111个人的体重有个人的体重有无发生显著的变化无发生显著的变化?Pre-1Post-1Post-2Post-380.0080.0070.0069.0079.0075.0071.0070.0085.0080.0075.0075.0080.0075.0068.0070.0075.0075.0074.0070.0074.0074.0070.0069.0065.0065.0063.0061.0070.0070.0070.0070.0080.0070.0065.0065.0075.0072.0070.0060.0080.0080.0070.0069.00717273多配对样本的多配对样本的Ke

47、ndall检验检验 主要用于分析评判者的主要用于分析评判者的判别标准判别标准是否一致公平。是否一致公平。它将每个评判对象的分数都看作是来自多个配对它将每个评判对象的分数都看作是来自多个配对总体的样本。一个评判对象对不同评判对象的分总体的样本。一个评判对象对不同评判对象的分数构成一个样本,其数构成一个样本,其零假设零假设:样本来自的多个配样本来自的多个配对总体的分布无显著差异,即评判者的评判标准对总体的分布无显著差异,即评判者的评判标准一致一致。Kendall协同系数协同系数W的公式的公式:例题例题R:第第i个被评判者的秩和个被评判者的秩和;n:被评判者人数被评判者人数;m:评判人数评判人数。7

48、4 例题例题:某文艺晚会有某文艺晚会有5 5个节目,共有个节目,共有5 5个评委参与个评委参与打分。问这打分。问这5 5个评委的判别标准是否一致,数据如下个评委的判别标准是否一致,数据如下表。表。注意注意:不是检验这不是检验这5 5个节目之间实际是否存在显个节目之间实际是否存在显著的差异著的差异。75这这5个评委的判别标准是否一致的个评委的判别标准是否一致的SPSS处理处理7677式中:式中:K为样本数;为样本数;n为样本容量;为样本容量;多配对样本的多配对样本的Cochran Q检验检验 该检验处理的数据是该检验处理的数据是二值二值的的( (0 0和和1 1) )。其零假设。其零假设:样本来

49、自的多配对总体分布无显著差异样本来自的多配对总体分布无显著差异。例题例题为第为第j列取值为列取值为1 1的个数;的个数;为第为第i行取值为行取值为1 1的个数。的个数。78 例题例题:消费者协会调查了顾客对消费者协会调查了顾客对3 3种品牌电视机种品牌电视机的满意程度,共有的满意程度,共有1010个顾客参与了满意度的调查,个顾客参与了满意度的调查,数据如下表所示数据如下表所示:7980812008年的第29届北京奥运会上,女子射箭的前四名选手在决赛中4组共12箭的比赛成绩数据资料如下:分析4名选手的决赛成绩之间是否存在显著性差异?作 业8283首先,给出4名运动员比赛成绩的描述性分析,初步分析

50、他们比赛成绩之间是否存在显著性差异。84其次,给出4名运动员比赛成绩的正态性检验,结果如下:85再次,给出4名运动员比赛成绩的方差齐次性检验,结果如下:根据上述两种检验结果可知,有1名运动员成绩不符合正态性要求,因此,使用方差分析法进行检验可能会产生问题。此外,由于样本量太小,检验的可靠性也值得怀疑。因此,采用非参数法更为合适。86最后,给出4名运动员比赛成绩的Kruskal-Wallis检验,结果如下:检验结果说明不能拒绝原假设,即没有证据表明4名运动员的比赛成绩之间存在显著性差异。87本案例的分析结果表明,虽然运动员根据比赛成绩排出了最终名次,但这并不意味着她们的射箭成绩之间就存在显著性差异,至少从统计角度上看是如此。88

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号