第章两样本的非参数检验课件

上传人:re****.1 文档编号:587350327 上传时间:2024-09-05 格式:PPT 页数:80 大小:719.72KB
返回 下载 相关 举报
第章两样本的非参数检验课件_第1页
第1页 / 共80页
第章两样本的非参数检验课件_第2页
第2页 / 共80页
第章两样本的非参数检验课件_第3页
第3页 / 共80页
第章两样本的非参数检验课件_第4页
第4页 / 共80页
第章两样本的非参数检验课件_第5页
第5页 / 共80页
点击查看更多>>
资源描述

《第章两样本的非参数检验课件》由会员分享,可在线阅读,更多相关《第章两样本的非参数检验课件(80页珍藏版)》请在金锄头文库上搜索。

1、第三章第三章 两样本非参数检验两样本非参数检验在单样本非参数检验中,研究者可以解决诸如一个在单样本非参数检验中,研究者可以解决诸如一个总体的中心是否等于一个已知的值,某个随机变量总体的中心是否等于一个已知的值,某个随机变量是否服从某种特定的分布,某个序列是否具有随机是否服从某种特定的分布,某个序列是否具有随机性等问题。然而在实际中,更受注意的往往是比较性等问题。然而在实际中,更受注意的往往是比较两个总体的位置参数。比如,两种训练方法中哪一两个总体的位置参数。比如,两种训练方法中哪一种更出成绩,两种汽油中哪一种污染更小,两种营种更出成绩,两种汽油中哪一种污染更小,两种营销策略中哪种更有效,两种药

2、物哪一种的治疗效果销策略中哪种更有效,两种药物哪一种的治疗效果更好等等,这就需要使用两样本的非参数方法,第更好等等,这就需要使用两样本的非参数方法,第三章中所介绍的方法大都适用。三章中所介绍的方法大都适用。1编辑版pppt第三章 两样本非参数检验在单样本非参数检验中,研究者可以解决在抽取样本时有两种形式:相关的和独立在抽取样本时有两种形式:相关的和独立的。若第一次抽样的所有样本某一属性的的。若第一次抽样的所有样本某一属性的测量结果,不影响第二次抽样的所有样本测量结果,不影响第二次抽样的所有样本同一属性的测量结果,则这种抽样是独立同一属性的测量结果,则这种抽样是独立的,若第一次抽样的测量结果影响

3、另一次的,若第一次抽样的测量结果影响另一次抽样测量结果,则这种抽样是相关的。为抽样测量结果,则这种抽样是相关的。为了避免或者尽量减少由于其他因素影响引了避免或者尽量减少由于其他因素影响引起的两组之间的附加差异,得到更准确地起的两组之间的附加差异,得到更准确地结论,研究中通常采用两个相关的样本。结论,研究中通常采用两个相关的样本。2编辑版pppt在抽取样本时有两种形式:相关的和独立的。若第一次抽样的所有样相关样本的获取有两种方式:相关样本的获取有两种方式:1.让每一研究对象做自身的对照者让每一研究对象做自身的对照者2.将研究对象两两配对,分别给每一对两将研究对象两两配对,分别给每一对两个成员以不

4、同的处理。在进行配对时,应个成员以不同的处理。在进行配对时,应让每一对在可能影响处理结果的其他因素让每一对在可能影响处理结果的其他因素方面尽量相似,以尽量避免和减少附加差方面尽量相似,以尽量避免和减少附加差异。一般来说,用研究对象自身作为对照异。一般来说,用研究对象自身作为对照者要优于配对方法,因为在配对过程中很者要优于配对方法,因为在配对过程中很难完全控制住其他的影响因素。两个相关难完全控制住其他的影响因素。两个相关样本的非参数检验方法主要有符号检验法样本的非参数检验方法主要有符号检验法和和Wilcoxon符号秩和检验法。符号秩和检验法。3编辑版pppt相关样本的获取有两种方式:3编辑版pp

5、pt利用两个相关样本进行研究,对于某些问题是利用两个相关样本进行研究,对于某些问题是很方便的。但现实中要做到很好配对并不容易。很方便的。但现实中要做到很好配对并不容易。若由于配对不当或无法配对,就要使用两个独若由于配对不当或无法配对,就要使用两个独立样本的非参数检验方法:立样本的非参数检验方法:Brown-Mood检验检验法,法,Mann-Whitney-Wilcoxon检验法,检验法,Wald-Wolfowitz游程检验法,游程检验法, 检验法,检验法,Kolmogorov-Smirnov检验法等。两个独立样检验法等。两个独立样本可以各自从两个总体中随机抽选获得,也可本可以各自从两个总体中随

6、机抽选获得,也可以对随机抽样的一个样本诸元素随机分别实施以对随机抽样的一个样本诸元素随机分别实施两种处理而形成。两种处理而形成。4编辑版pppt利用两个相关样本进行研究,对于某些问题是很方便的。但现实中要本章主要介绍两个相关样本和两个独立样本的非本章主要介绍两个相关样本和两个独立样本的非参数检验方法,包括:参数检验方法,包括:3.1 符号检验法(相关样本)符号检验法(相关样本)3.2 Wilcoxon符号秩和检验法(相关样本)符号秩和检验法(相关样本)3.3 Brown-Mood检验法(独立样本)检验法(独立样本)3.4 Mann-Whitney-Wilcoxon检验法(独立样本)检验法(独立

7、样本)3.5 Wald-Wolfowitz游程检验法(独立样本)游程检验法(独立样本)3.6 检验法(独立样本)检验法(独立样本)3.7 Kolmogorov-Smirnov检验法(独立样本)检验法(独立样本)5编辑版pppt本章主要介绍两个相关样本和两个独立样本的非参数检验方法,包括3.1 符号检验法(符号检验法(Sign Test)3.1.1 基本思路与检验步骤(同第二章)基本思路与检验步骤(同第二章)设有两个连续总体设有两个连续总体x,y,累积的分布函数分别为累积的分布函数分别为F(x),F(y)。随机的分别从两个总体中抽取数目为随机的分别从两个总体中抽取数目为n的样本数据,的样本数据,

8、 和和 将它们将它们 配对得到配对得到 若研究的问题是它们是否具有相同的分布,即若研究的问题是它们是否具有相同的分布,即F(x)=F(y)是否成立,由于是否成立,由于x,y的总体分布未知,而研究者也不关的总体分布未知,而研究者也不关心它们的具体分布形式,只是关心分布是否相同,因而心它们的具体分布形式,只是关心分布是否相同,因而可以采用位置参数进行判断。若两个样本的总体具有相可以采用位置参数进行判断。若两个样本的总体具有相同的分布,则中位数应相同,即在同的分布,则中位数应相同,即在n个数对中,个数对中,Xi大于大于yi的个数与的个数与Xi小于小于yi的个数应相差不大。的个数应相差不大。6编辑版p

9、ppt3.1 符号检验法(Sign Test)3.1.1 基本思检验步骤检验步骤:(1)提出假设)提出假设7编辑版pppt检验步骤:(1)提出假设7编辑版pppt(2)计算检验统计量)计算检验统计量8编辑版pppt(2)计算检验统计量8编辑版pppt(3)确定拒绝域)确定拒绝域9编辑版pppt(3)确定拒绝域9编辑版pppt3.1.2 应用应用例例.为帮助学生通过自学提高对知识的掌握,为帮助学生通过自学提高对知识的掌握,有关专家编辑了符合教学大纲的教学参考有关专家编辑了符合教学大纲的教学参考资料。为了研究资料。为了研究“教学参考资料对于指导教学参考资料对于指导学生自学是否有效学生自学是否有效”

10、这一问题,随机选取这一问题,随机选取了了15名学生进行测试,学生使用参考资料名学生进行测试,学生使用参考资料前的试卷(前的试卷(A)得分与使用参考资料后的试得分与使用参考资料后的试卷卷(B)得分列在下表内(得分列在下表内(A卷与卷与B卷的范围,卷的范围,内容与难度相当)内容与难度相当):10编辑版pppt3.1.2 应用例.为帮助学生通过自学提高对知识的掌握,有3.1.2 应用应用学生编号学生编号123456789101112131415A卷成绩卷成绩707070707575757575787675797275B卷成绩卷成绩758070767175828670808075808383这些资料能

11、否说明参考资料能够促进学生掌握知识这些资料能否说明参考资料能够促进学生掌握知识11编辑版pppt3.1.2 应用学生编号1234567891011121312编辑版pppt12编辑版pppt3.2 Wilcoxon符号秩和检验法( Wilcoxon Signed-Rank Test)13编辑版pppt3.2 Wilcoxon符号秩和检验法( Wilcoxon检验步骤:14编辑版pppt检验步骤:14编辑版pppt(3)确定拒绝域a.根据检验统计量W和a查Wilcoxon符号秩和检验表以得到在零假设下的 值 如果 小于给定的显著性水平,拒绝零假设;反之不能拒绝零假设。b.如果n很大,要用正态近似

12、,得到一个与W有关的正态随机变量z值,再查正态分布表得到 值,最后将 与a作比较。15编辑版pppt(3)确定拒绝域15编辑版pppt例例1根据根据3.1.2中的例题,利用中的例题,利用Wilcoxon检验法检验法检验参考资料能否促进学生掌握知识检验参考资料能否促进学生掌握知识(a=0.05)3.2.2 应用应用16编辑版pppt例1根据3.1.2中的例题,利用Wilcoxon检验法检验参17编辑版pppt17编辑版pppt用用A,B两种材料生产的产品其寿命检测记两种材料生产的产品其寿命检测记录如下:录如下:例例2:18编辑版pppt用A,B两种材料生产的产品其寿命检测记录如下:例2:18编辑

13、产品编号产品编号A材料材料B材料材料产品编号产品编号A材料材料B材料材料11600161011152015052163015501216431650315801560131530150841560157214148614705159015881514741480616201620161480147571610160517162815888165016361814921510915791590191556149010151015202016251568产品使用寿命统计表产品使用寿命统计表 单位:小时单位:小时试分析两种材料对产品的使用寿命由无显著性影响(试分析两种材料对产品的使用寿命由无显著性影

14、响(a=0.05)19编辑版pppt产品编号A材料B材料产品编号A材料B材料116001610120编辑版pppt20编辑版pppt21编辑版pppt21编辑版pppt3.3 Brown-Mood检验法Brown-Mood检验法是一种位置参数检验,主检验法是一种位置参数检验,主要用来检验两个独立样本的中位数是否相同。要用来检验两个独立样本的中位数是否相同。和位置参数相同零假设的表述方法:和位置参数相同零假设的表述方法:1.P(XY)=P(XY)=1/2 2.分布函数分布函数F(X)=F(Y) 3.X+a和和Y同分布,且有:当同分布,且有:当a大于时,大于时,XY4.中位数中位数22编辑版ppp

15、t3.3 Brown-Mood检验法Brown-Mood检验法假设假设 和和 是两个相互独立的随机样本,是两个相互独立的随机样本,来自两个总体来自两个总体X X和和Y Y,其相应的中位数为,其相应的中位数为 和和 。我。我们关注的问题是,两个总体的位置参数们关注的问题是,两个总体的位置参数 = = 是否是否成立。成立。零假设零假设 成立的情况下,由成立的情况下,由m m个个X X、n n个个Y Y可可以组成一个观测值数为以组成一个观测值数为m m十十n nN N的混合样本,其样的混合样本,其样本中位数为本中位数为 , 应该对于两个总体样本数据说都应该对于两个总体样本数据说都处于中间位置。与符号

16、检验思想相似,如果任何一处于中间位置。与符号检验思想相似,如果任何一个样本中大于个样本中大于 或小于或小于 的数目过多或过少,我们的数目过多或过少,我们就有理由怀疑零假设的真实性。就有理由怀疑零假设的真实性。3.3.1 检验思想与检验方法检验思想与检验方法23编辑版pppt假设 和 是两个相互独若若a或者或者b过大或过小,则有理由怀疑原假设。令过大或过小,则有理由怀疑原假设。令A表表示列联表中左上角取值示列联表中左上角取值a的的x样本中大于样本中大于 的变量的变量,则则A为我们的检验统计量。由初等概率可知,在为我们的检验统计量。由初等概率可知,在m, n及及t固定时,固定时,A分布在零假设下为

17、超几何分布(对于不超分布在零假设下为超几何分布(对于不超过过m的的k):): x y 总和总和 27编辑版pppt27编辑版pppt实际运用中p值的计算ExcelExcel中的超几何分布函数:中的超几何分布函数:HYPGEOMDIST(sample_s,number_sample,population_s,number_population)Sample_s样本中成功的次数样本中成功的次数A。Number_sample样本容量样本容量T。Population_s样本总体中成功的次数样本总体中成功的次数m。Number_population 样本总体的容量样本总体的容量N N。Hypgeomdi

18、st(A,t,m,N)=Hypgeomdist(A,t,m,N)=R R程序:程序:P(Aa)=phyper(a,m,n,a+b)P(Aa)=phyper(a,m,n,a+b)28编辑版pppt实际运用中p值的计算Excel中的超几何分布函数:28编辑版3.3.2 3.3.2 检验的大样本近似检验的大样本近似根据超几何分布的性质,可以检验统计根据超几何分布的性质,可以检验统计量的性质:量的性质:29编辑版pppt3.3.2 检验的大样本近似根据超几何分布的性质,可以检验1960年匈牙利学者年匈牙利学者Hajek证明了以下结论:证明了以下结论:1.Z的渐进分布为的渐进分布为N(0,1)分布;)分

19、布;2.Z2为为 分布,其渐进分布为分布,其渐进分布为 分布。分布。30编辑版pppt1960年匈牙利学者Hajek证明了以下结论:30编辑版pp3.3.2 3.3.2 检验的大样本近似31编辑版pppt3.3.2 检验的大样本近似31编辑版pppt3.3.3 3.3.3 假设检验步骤如果如果P值小于给定的显著性水平,拒绝值小于给定的显著性水平,拒绝“两个数列的中位两个数列的中位数相同数相同”的假设。检验步骤可归结为下表:的假设。检验步骤可归结为下表:严格的说,在严格的说,在 时因时因A不对称,双边检验结果不那么不对称,双边检验结果不那么理想。理想。零假设:备择假设:检验统计量 值 A A A

20、32编辑版pppt3.3.3 假设检验步骤如果P值小于给定的显著性水平,拒绝“3.3.3 应用33编辑版pppt3.3.3 应用33编辑版pppt3.3.3 应用34编辑版pppt3.3.3 应用34编辑版pppt3.4 WMW检验Wilcoxon-Mann-Whitney检验译作维尔科克森检验译作维尔科克森曼曼惠特尼检验,简称惠特尼检验,简称WMW检验,这种方法检验,这种方法不考虑总体分布的具体形式,只需假定不考虑总体分布的具体形式,只需假定两个独立两个独立的相比较的总体有相同或相似的的连续分布,分的相比较的总体有相同或相似的的连续分布,分布不需要对称。布不需要对称。WMW检验的精确度较高,

21、在正态总体情况下使检验的精确度较高,在正态总体情况下使用可以达到参数检验方法用可以达到参数检验方法t检验法功效的检验法功效的95%的的精度;如果是偏态总体,它的精度还要高于精度;如果是偏态总体,它的精度还要高于t检验检验法。法。相比相比brown-mood检验,不仅利用了样本的符号检验,不仅利用了样本的符号信息,也利用了相对大小信息。信息,也利用了相对大小信息。35编辑版pppt3.4 WMW检验Wilcoxon-Mann-Whitney3.4.1检验方法的思想W统计量将两个样本混合在一起,并按从小到大的顺序排列起将两个样本混合在一起,并按从小到大的顺序排列起来,得到混合顺序样本:来,得到混合

22、顺序样本:在混合样本中,将各数值排序得到它们在混合样本中,将各数值排序得到它们 的秩。令的秩。令 和和 分别为分别为 和和 在混合样本中的秩,在混合样本中的秩, 和和 分分别为别为 和和 的总和(秩和):的总和(秩和):如果如果 为真,则为真,则 与与 应较均匀地分布在混合顺序样本中,这应较均匀地分布在混合顺序样本中,这 N个观察值能个观察值能够被看作是来自共同总体的一个单一的随机样本。两够被看作是来自共同总体的一个单一的随机样本。两个样本的秩和将相差不大。个样本的秩和将相差不大。36编辑版pppt3.4.1检验方法的思想W统计量将两个样本混合在一起,并显然,如果显然,如果x的秩大部分都小于的

23、秩大部分都小于y的秩(的秩( 很小)很小),则表明,则表明x样本的值偏小,我们就有理由怀疑混样本的值偏小,我们就有理由怀疑混合子样是一个随机的混合样本,合子样是一个随机的混合样本, 不能成立。不能成立。同理,如果同理,如果 很小,很小, 也不能成立。可见,也不能成立。可见, 和和 都可以用作检验统计量,一般取两者中较都可以用作检验统计量,一般取两者中较小的一个作为检验统计量,记作小的一个作为检验统计量,记作 ,W被称为被称为Wilcoxon秩和统秩和统计量(计量(Wilconxon Rank-Sum Statistics),该该统计量是由统计量是由Wilconxon于于1945年提出的。年提出

24、的。37编辑版pppt显然,如果x的秩大部分都小于y的秩( 很小),则表3.4.2 检验方法的思想U统计量Mann-Whitney与1947年提出了U检验量,我们也可以用U来检验零假设。这里定义 为所有X观察值在混合样本中超过Y观察值的个数, 为所有Y观察值在混合样本中大于X观察值的个数,U为 和 中较小者,即 。若 成立, 与 的差别不会很大,U不会太小。如果U很小,我们就有理由怀疑 。实际上,检验统计量W和U等价,二者之间只是一个线性变换关系,一般将其统称为Wilconxon-Mann-Whitney统计量。38编辑版pppt3.4.2 检验方法的思想U统计量Mann-Whitnem=n=

25、2情形下统计量的可能取值39编辑版ppptm=n=2情形下统计量的可能取值39编辑版pppt40编辑版pppt40编辑版pppt41编辑版pppt41编辑版pppt1. 为离散分布。为离散分布。其中其中 的最大值为的最大值为n(n+1)/2+mn,最小值为,最小值为n(n+1)/2。2. 都是中心对称的。都是中心对称的。其中,其中, 的中心为的中心为n(N+1)/2。统计量的性质统计量的性质42编辑版pppt1. 为离散分布。统计量的性质42编辑P值的计算43编辑版ppptP值的计算43编辑版ppptm=n=2情形下统计量的可能取值44编辑版ppptm=n=2情形下统计量的可能取值44编辑版p

26、ppt3.4.2 正态逼近45编辑版pppt3.4.2 正态逼近45编辑版pppt打 结46编辑版pppt打 结46编辑版pppt检验步骤47编辑版pppt检验步骤47编辑版pppt3.4.3 应用例:两种材料制成同一零件,随机抽取19件作疲劳强度测试,得到如下结果: A材料:82 64 53 61 59 83 76 55 70 73 B材料:80 60 65 91 86 84 77 93 75 试问两种材料制造的零件,其疲劳强度有无显著差异(=5%)48编辑版pppt3.4.3 应用例:两种材料制成同一零件,随机抽取19件作疲3.4.3 应用(2)计算检验统计量 秩 和1 2 3 4 5 6

27、 7 8 9 10 11 12 13 14 15 16 17 18 19 数 据A材料B材料53 55 59 61 64 70 73 76 82 83 60 65 75 77 80 84 86 91 9349编辑版pppt3.4.3 应用(2)计算检验统计量 秩 和1 3.4.3 应用R程序:wilcox.test(x,y)50编辑版pppt3.4.3 应用R程序:wilcox.test(x,y)503.4.4 练习今测得甲、乙两矿灰分含量(%)资料如下: 甲:3.75 4.3 3.95 3.8 3.85 乙:3.9 4.05 4.1 4.0 试用Wilcoxon-Mann-Whitney检验

28、法判定甲乙两矿的灰分有无显著差异(=0.05) 51编辑版pppt3.4.4 练习今测得甲、乙两矿灰分含量(%)资料如下:53.5 Wald-Wolfowitz 游程检验游程检验( Wald-Wolfowitz Runs Test)Mann-Whitney-Wilcoxon检验主要应用于检验检验主要应用于检验两个样本是否来自具有相同位置的总体,是对两两个样本是否来自具有相同位置的总体,是对两个总体在集中趋势方面有无差异的一种考察,而个总体在集中趋势方面有无差异的一种考察,而不研究其它类型方面的差异。不研究其它类型方面的差异。 Wald-Wolfowitz 游程检验则可以考察任何一种差异。游程检

29、验则可以考察任何一种差异。 Wald-Wolfowitz Runs Test译为沃尔德译为沃尔德-沃尔福威茨连沃尔福威茨连串检验或游程检验,简称串检验或游程检验,简称W-W串检验。串检验。52编辑版pppt3.5 Wald-Wolfowitz 游程检验( Wald3.5.1 基本方法与检验步骤基本方法与检验步骤设有设有x, y两个总体具有连续分布,其累积分布函数分别为两个总体具有连续分布,其累积分布函数分别为F (x)和和F (y)。如果想知道两个总体是否存在某种差异,。如果想知道两个总体是否存在某种差异,可以用可以用“两个总体分布相同两个总体分布相同”作为零假设。为此,需要作为零假设。为此,

30、需要从从x中随机抽取中随机抽取m个数据个数据 , 从从y中随机抽取中随机抽取n个数据个数据 , 数据的测量层次至少要是定序尺度。将两个独立样本的数据的测量层次至少要是定序尺度。将两个独立样本的m + n=N个数据混合排序,并确定序列的游程(取自同个数据混合排序,并确定序列的游程(取自同一样本的一串相连的数据)。如果零假设为真,则两个一样本的一串相连的数据)。如果零假设为真,则两个样本的数据期望能相互混合地排列,游程数会相对较大。样本的数据期望能相互混合地排列,游程数会相对较大。若若x的游程或的游程或y的游程过长,也就是来自同一总体的数据的游程过长,也就是来自同一总体的数据在有序的序列中过多地相

31、互连接,则游程数将会相当少,在有序的序列中过多地相互连接,则游程数将会相当少,数据不支持数据不支持 。故序列的游程数据可以作为检验统计量。故序列的游程数据可以作为检验统计量。 53编辑版pppt3.5.1 基本方法与检验步骤设有x, y两个总体具有连续3.5.1 基本方法与检验步骤基本方法与检验步骤54编辑版pppt3.5.1 基本方法与检验步骤54编辑版pppt3.5.2 应用应用例例 研究者想知道研究者想知道“问题按难易次序提问是否影问题按难易次序提问是否影响学生正确回答的能力响学生正确回答的能力”。今从全校学生中随机。今从全校学生中随机抽取一个班的学生,随机地将学生分为两组,让抽取一个班

32、的学生,随机地将学生分为两组,让第一组的学生做第一组的学生做A卷(问题从易到难),第二组卷(问题从易到难),第二组学生做学生做B卷(问题从难到易)。考试被控制在完卷(问题从难到易)。考试被控制在完全相同的条件下进行,评分结果如下:全相同的条件下进行,评分结果如下: A卷卷 83 82 84 96 90 64 91 71 75 72 B卷卷 42 61 52 78 69 81 75 78 78 65 试问在试问在0.05显著性水平下显著性水平下“问题按难易次序提问问题按难易次序提问是否影响学生正确回答的能力是否影响学生正确回答的能力”?55编辑版pppt3.5.2 应用例 研究者想知道“问题按难

33、易次序提问是否影3.5.2 应用应用解:(解:(1)提出假设)提出假设 :F(X)=F(Y) (两种提问方式对学生成绩无影响两种提问方式对学生成绩无影响) : F(X)F(Y) (两种提问方式会造成学生成绩的两种提问方式会造成学生成绩的差异差异) (2)计算检验统计量)计算检验统计量 u=642 52 61 64 65 69 71 72 75 75 78 78 78 81 82 83 84 90 91 96 y y y x y y x x x y y y y y x x x x x x56编辑版pppt3.5.2 应用解:(1)提出假设42 52 61 63.5.2 应用应用(3)作出决策)作

34、出决策 根据根据m=10,n=10,=0.05查表得:查表得: 因为因为 ,所以拒绝,所以拒绝 ,可以认为在,可以认为在 下提问的顺序对学生正确回答问题的下提问的顺序对学生正确回答问题的能力有影响(也可以计算或查能力有影响(也可以计算或查P值判断)。值判断)。 57编辑版pppt3.5.2 应用(3)作出决策57编辑版pppt3.5.2 应用应用注意:如果出现同分,分值来自同一样本,游程注意:如果出现同分,分值来自同一样本,游程数数u不会受到影响;但若同分值来自不同样本,不会受到影响;但若同分值来自不同样本,u就可能会受到影响,并影响最后的结论。因此,就可能会受到影响,并影响最后的结论。因此,

35、在运用在运用Wald-Wolfowitz游程检验时,若同分值来游程检验时,若同分值来自两个不同的样本,一般应将各种排序的可能性自两个不同的样本,一般应将各种排序的可能性都进行考察,分别计算每种情况下的游程总数都进行考察,分别计算每种情况下的游程总数u,并查找相应的,并查找相应的P值。如果得出的结论一致,表值。如果得出的结论一致,表明同分没有带来什么问题;如果得出的结论不一明同分没有带来什么问题;如果得出的结论不一致,可以将致,可以将n个个P值求简单平均数,以此作为是否值求简单平均数,以此作为是否拒绝拒绝H的依据。如果同分在两个样本之间多次出的依据。如果同分在两个样本之间多次出现,现,u实际上是

36、不确定的,因而不宜采用实际上是不确定的,因而不宜采用Wald-Wolfowitz游程检验。游程检验。58编辑版pppt3.5.2 应用注意:如果出现同分,分值来自同一样本,游程数3.5.3 练习练习某年华北五省市区的某年华北五省市区的GDP指数为:指数为: 109.2 114.3 113.5 111.0 112.7 华东七省的华东七省的GDP指数为:指数为: 113.0 112.2 112.7 114.4 115.4 113.4 112.2试问:在试问:在 下下,利用利用 Wald-Wolfowitz游程检验法检验华北五省的游程检验法检验华北五省的GDP指数与华指数与华北七省的北七省的GDP指

37、数分布是否相同指数分布是否相同?59编辑版pppt3.5.3 练习某年华北五省市区的GDP指数为:59编辑版p3.6 两样本的 检验 单样本的 检验可以推广到两个独立样本的总体差异性的检验。 问题: 分别从两个分布函数为 和 的总体中,随机抽取 和 个样本数据,利用样本值推断两个总体是否具有某中差异。为了对假设作出判定,所需要的数据是两个样本,测量层次最低可为定类尺度。60编辑版pppt3.6 两样本的 检验 单样本的 3.6.1 基本方法与检验步骤61编辑版pppt3.6.1 基本方法与检验步骤61编辑版pppt3.6.1 基本方法与检验步骤用联表表示为: 组 别 观察频数 合计 期望频数

38、1 2 r合计 N62编辑版pppt3.6.1 基本方法与检验步骤用联表表示为: 3.6.1 基本方法与检验步骤63编辑版pppt3.6.1 基本方法与检验步骤63编辑版pppt3.6.1 基本方法与检验步骤64编辑版pppt3.6.1 基本方法与检验步骤64编辑版pppt3.6. 2 应用例:为了研究已婚和独身妇女请假和工作时间是否有差异,研究者随机抽取了100名已婚妇女和200名独身妇女,调查她们在一年内请假和工作的情况,得到了下列数据:注:没有工作的时间不包括正常休假(如怀孕、住院等);独身妇女一组包括离婚、分居、丧偶但身边无子女在一起生活的妇女。试问能否在0.05的显著性水平下认为已婚

39、妇女比独身妇女更容易请假而从事的工作时间更少?无工作日数分组已婚妇女(人)独身妇女(人) 03 47 811 1215 1619 20以上 60 21 11 4 2 2 130 50 10 6 3 1 合 计 100 20065编辑版pppt3.6. 2 应用例:为了研究已婚和独身妇女请假和工作时间是3.6.2 应用66编辑版pppt3.6.2 应用66编辑版ppptxf1f2fi.e1e20-36013019063.33126.670.17510.08754-721507123.6747.330.30120.15068-111110217.0014.002.28571.142912-1546

40、103.336.670.13480.067316-192352.675.330.66250.331920以上213合计1002003003.55931.7802Q=3.5593+1.7802=5.8395 df=5-1=4Q统计量计算表67编辑版ppptxf1f2fi.e1e20-36013019063.3312(3)做出决策)做出决策68编辑版pppt(3)做出决策68编辑版pppt3.6.3 练习练习学生按性别和考试成绩分组的调查数据如下:学生按性别和考试成绩分组的调查数据如下:试判断在试判断在0.05的显著性水平下学生的考试成绩是的显著性水平下学生的考试成绩是否与性别有关?否与性别有关?

41、 成绩 人数 性别 及 格 不及格 合计 男 女 2600 2180 130 90 2730 2270 合 计 4780 220 500069编辑版pppt3.6.3 练习学生按性别和考试成绩分组的调查数据如下: 3.7 Kolmogorov-Smirnov检验单样本的Kolmogorov-Smirnov检验可以推广应用于两个独立样本。两样本的Kolmogorov-Smirnov检验,简称Smirnov拟合优度检验,主要用于检验主要用于检验两个独立样本是否抽自两个相同分布的总体两个独立样本是否抽自两个相同分布的总体,也为其基本思路和检验步骤与单样本的K-S检验完全一致,只是在检验时需要将前面的

42、假设改为:70编辑版pppt3.7 Kolmogorov-Smirnov检验单样本的Ko 是第一个样本的经验分布函数,它可以用第一个样本观察值小于等于的x的次数除以总次数m (m为第一个样本的数据个数)求得; 是第二个样本的经验分布函数,它可以用第二个样本观察值小于等于x的次数除以总次数n(n为第二个样本的数据个数)求得。若两个总体是连续的,检验统计量 的抽样分布已知。当 为真时, 应该很小,与其相应的概率和临界值可以在Smirnov检验临界值(王书第306页)中查到,它满足: 。当时,不能拒绝 ;当 时,拒绝 。 3.7.1 两样本K-S检验基本思想71编辑版pppt 是第一个样本的经验分布

43、函数,它可以用第一个样本观察72编辑版pppt72编辑版pppt双侧检验对于总体分布的任何一种差异,如位置差异(集中趋势)、离散度差异、偏斜度差异等都很敏感。K-S检验的单侧检验则用来检验某一总体值是否大于或小于另一总体的值。其假设为: 或或其检验统计量是: 73编辑版pppt双侧检验对于总体分布的任何一种差异,如位置差异(集中趋势)、例1:随即抽取9个远郊县和7个近郊县调查其近10年的人口增长速度(%): 近郊县:3.1 2.1 8.2 2.7 3.4 7.9 3.2 远郊县:5.3 3.7 5.8 3.5 4.8 5.6 6.8 9.3 10.3 根据这些资料,能否认为近郊县比远郊县的人口

44、增长速度低? 解(1)提出假设3.7.2 两样本K-S检验实例74编辑版pppt例1:随即抽取9个远郊县和7个近郊县调查其近10年的人口增长例1(2)计算检验统计量计算检验统计量人口增长速度(%)2.12.73.13.23.43.53.74.85.35.65.86.87.98.29.310.311111000000011000000011111110011123455555555677700000123456777891/72/73/74/75/75/75/75/75/75/75/75/76/7111000001/92/93/94/95/96/97/97/97/98/91 1/7 0.149

45、2/7 0.2857 3/7 0.4286 4/7 0.5714 5/7 0.714338/63 0.603231/63 0.492124/63 0.381017/63 0.269810/63 0.1587 3/63 0.0476 -4/63 -0.0635 5/63 0.0794 2/9 0.2222 1/9 0.1111 0 0样本1的经验分布频数样本1的累积频数75编辑版pppt例1(2)计算检验统计量人口增长速度(%)2.110101/例1(3)作决策作决策查表得:查表得: 由于由于 ,所以拒绝,所以拒绝可以认为在可以认为在 下近郊县比远郊县的人口增长下近郊县比远郊县的人口增长速度低。

46、速度低。76编辑版pppt例176编辑版pppt例2解:(1)建立假设 (2)计算检验统计量考试成绩(分) 学生人数(人) 累积人数(人) 累积频率(%) 60分以下 6070 7080 8090 90以上 56 198 244 99 63 80 128 328 176 88 56 254 498 597 660 80 208 536 712 8000.08480.38480.75450.90451.0000 0.1 0.26 0.67 0.89 1.00 0.0152 0.1248 0.0845 0.0145 0 合 计 660 800 77编辑版pppt例2解:(1)建立假设考试成绩(分)

47、 学生人数(人) 例278编辑版pppt例278编辑版pppt练习某年华北五省市区的GDP指数为: 109.2 114.3 113.5 111.0 112.7 华东七省的GDP指数为: 113.0 112.2 112.7 114.4 115.4 113.4 112.2试问:在 下可否认为华北五省的GDP指数与华东七省的GDP指数分布相同? 79编辑版pppt练习某年华北五省市区的GDP指数为:79编辑版pppt此课件下载可自行编辑修改,供参考!此课件下载可自行编辑修改,供参考!部分内容来源于网络,如有侵权请与我联系删除!部分内容来源于网络,如有侵权请与我联系删除!80编辑版pppt此课件下载可自行编辑修改,供参考!80编辑版pppt

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号