非参数统计学讲义(第三章)两样本模型

上传人:平*** 文档编号:14841967 上传时间:2017-11-02 格式:DOC 页数:11 大小:444.64KB
返回 下载 相关 举报
非参数统计学讲义(第三章)两样本模型_第1页
第1页 / 共11页
非参数统计学讲义(第三章)两样本模型_第2页
第2页 / 共11页
非参数统计学讲义(第三章)两样本模型_第3页
第3页 / 共11页
非参数统计学讲义(第三章)两样本模型_第4页
第4页 / 共11页
非参数统计学讲义(第三章)两样本模型_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《非参数统计学讲义(第三章)两样本模型》由会员分享,可在线阅读,更多相关《非参数统计学讲义(第三章)两样本模型(11页珍藏版)》请在金锄头文库上搜索。

1、非参数统计学讲义主讲:统计系 袁靖第三章 两样本模型1 两个相关样本的非参数检验、问题的提出某种统计检验方法应用时,不仅与数据的测量层次有关,与抽样的特点有关。在抽取样本时有两种形式:相关的和独立的。苦第次抽样的所有样本某一属性的测量结果,不影响第二次抽样的所有样本同一属性的测量结果,则这种抽样是独立的;若一次抽样的测量结果影响另一次抽样测量结果,则这种抽样是相关的。本章介绍两个相关样本的非参数检验方法。实际问题中,常会有这样的情况:某种药物对治疗某种疾病是否有效,某种训练方法是否能提高人的能力,某次宣传是否能提高人们的认识,价格上涨是否会产生不良影响等等。当研究者希望知道两种处理结果是否相同

2、,或哪种更好时,往往需要采用两个样本的统计检验。这时,常用经过处理的一组和未经处理的一组比较,或者一种处理组与另一种处理组相比较,为了避免或尽量减少由于其它因素影引起的两组之间的附加差异,研究中通常采用两个相关样本。例如,在接受两种不同训练方法的人员中,由于智力、接受能力、耐力等方面的不同,会导致不同处理的结果产生差异,这不是所要研究的问题,而是其它因素影响产生的附加差异。这些因素在实施不同处理前必须排除。为获取相关样本,常应用两种方式: 一是让每一研究对象作为自身的对照者;一是将研究对象两两配对,分别给每一对两个成员以不同处理。 在进行配对时,应让每对在可能影响处理结果的其它因素分面尽量相似

3、,以尽量避免和减小附加差异。一般来说,用研究对象自身作为对照者要优于配对方法。因为很难在配对过程中,完全控制使其它的影响因素。、符号检验1基本方法设有两个连续总体 X、Y,累积的分布函狡分别为 F(x),F(y)。随机地分别从两个总体中抽取数目为n 的样本数据 和 ,将它们配对得到 , , 。若研究的问nx,21 ny,21 ),(1yx),(2),(nyx题是它们是否具有相同的分布,即 F(x)=F(y)是否成立。因而可以采用位置参数进行判断。若两个样本的总体具有相同分布,则中位数应相同,即在 n 个数对中, 大于 的个数与 小于 的个数应相差不多。ixiyixiy若 P 表示概率,则建立的

4、假设组为第 页1iyxPyxHii 对 所 有 的)()(:0ii 对 某 一 个1如果关心的是某一总体中位数是否大于另一总体中位数,则可建立单侧备挥,假设组为)()(:0iiyxPyx )()(:0iiyxPyxHiiH ii在 下, 有大于 的趋向,在 下, 有大于 的趋向。ixiyHiyix为对假设作出判定,所需的数据至少是定序尺度测量。与单样本的符号检验相同,两个相关样本的符号检验也定义 、 为检验统计量。 为 与 差值符号是正的数目, 为差值符号是负的数目,SSixiyS。若 H0 为真, 大于 的配对数目与 小于 的配对数目相等,也就是 与 的数值相等。nSixiyii S由于 、

5、 的抽样分布是二项分布 B(n,1/2),n 是配对数目,1/2 是各自出现的概率,因而合适的 P 值能够在二项分布表中查找到。当样本的观察数据 时,可以利用上面方法找到 P 值作出判定。若样本的观察数据 n20,可以20n用正态近似办法,根据(21)式计算 Z 值,查正态分布表得到相应的 P 值。nSZ5.0* MERGEFORMAT (3.1).2应用【例 3-1】教学参考资料对于指导学生自学是否有效为帮助学生通过自学提高对知识的掌握,编辑了符合教学大纲的教学参考资料。针对某一概念的掌握进行实验,随机选取了 15 名学生,他们在使用参考资料之前的得分如表 3l。学习参考资料后,重新对这一概

6、念进行测试,得分也列在表 3 一 l 中。检验这部资料是否促进学生掌握知识。表 3-1 学生两次测试成绩学生编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15第一次成绩 2 2 2 2 3 3 3 3 3 3 2 3 3 2 3第二次成绩 3 4 2 3 2 3 4 4 2 4 4 3 4 4 4分析:由于关心的是学生使用参考资料后是否对概念的掌握更好了,因此应建立单侧备择,假设组为 )()(:0iiyxPyxHii为一次检查的成绩, 为第二次测试的成绩。由表 3 一 l 的分数可知, 2, 10,有 3 对差值ixi S第 页2为 0,无法记“十”或“一”号,因此,

7、符号总数目 n 十 12,而不是 l5。在附表中查找,Sn12, 10 的右尾概率 P00193,对于显著性水平 显然 P 值够小,因而数据不支持 H。 ,S 05.即学生通过自学参考资料对提高知识有益,表明教学参考资料对促进学生掌握知识是有效的。【例 3-2】母亲是否比父亲更强烈地认识到父亲教育孩书在研究父亲对儿童发展的影响作用时,进行了一项调查。随机抽选 17 对夫妇,其家庭均因两地分居,在孩子出生时,由母亲一人抚养,一年后团聚。针对父亲的教育对孩子影响较大这一问题询问,结果如表 32。表中是对父、母态度的评分,5 分代表最强烈的认识,1 分相对最弱, 是父亲的态度, 是ixiy母亲的态度

8、。表 3-2 父母对父亲教育孩子重要性的认识编号 ixiy编号 ixiy编号 ixiy1 2 4 7 3 5 13 5 42 3 4 8 3 3 14 2 53 3 5 9 2 1 15 5 54 3 5 10 3 5 16 3 55 3 3 11 2 5 17 1 56 3 2 12 2 5分析:这是一个配对样本的例子 1,例 31 是将研究对象自身作为对照者,形成两个相关样本。此例中是采用夫妇配对,讨论同一孩子和同一家庭的情况,因而配对有意义,符合符号检验的条件。由于关心的是母亲比父亲更强烈地认识到父亲教育孩于重要,因此是单侧检验,建立的假设组为 )()(:0iiyxPyxHii因为预言母

9、亲比父亲的感受更强烈,因而评分应是母亲比父亲更高,故 0 的数目应较多,备择ixiy假设选择了 。由表 32 可知,其中 3 对夫妇的态度一样,分数相等,差值为 0,不记符号,因此,Hn14, 3, 11。查附表,得 =11 右尾概率 P00287。对于显著性水平 005,P 值足SS 够小。因此,数据不支持 H。 ,调查结果表明,母亲确实比父亲更强烈地感到父亲教育孩子很重要。、Wilcoxon 符号秩检验1基本方法1 配对样本位置的符号检验,在第二章中已介绍,实际上那也是两个相关样本的情况。第 页3两个相关样本的 Wilcoxon 符号秩检验也是用来检验配对本是否有差异的方法。它不仅借助于两

10、个样本差值的符号,而且利用了差值的大小,因此,它比符号检验有更精确的判断。设 X、Y 是两个连续总体,且均具有对称的分布,随机地分别从两个总体中抽取 n 个观察值,组成n 个数对 , , 。记 ,若 X 与 Y 具有相同的分布,则等式),(1yx),(2),(nyxiiyxD0iiDP成立,即 大于 的概率与 小于 的概率相等。这也意味着全部差值 的中位数等于零。因此,零假ixiyixiy iD设也可以是 0:0的 中 位 数iH这与第二章中配对样本的符号秩检验是一致的,当研究的问题关心两个总体的分布是否相同,或说两个总体中位数是否相同时采用双侧备择;若 X、Y 之间的相互关系中,存在某种趋势

11、,则应立单侧备择。如果认为 的大多数值大于相应的值 ,那么单侧备择为ixiy)0()(:iiDPH或 :的 中 位 数i如果认为 的大多数值大于相应的值 ,那么单侧备择为iyix)0()(:iiDPH或 :的 中 位 数i若将差值 的总体中位数记作 MD,那么,两个相关样本的 Wilcoxon 符号秩检验与第二章中配对样iD本位置的符号秩检验基本方法相同,判定假设是否成立的原则也一样。2应用【例 3-3】幼儿园的生活对孩子的社会知识是否有影响有人认为儿童上幼儿园有助于其认识社会,有人则认为儿童在家一样可以获得社会知识。为了解它们是否存在差异,对 8 个同性孪生儿童进行实验,随机指定 8 对中一

12、个上幼儿园,另一个则在家。经过一个时期后,通过对他们询问,给他们分别作出评价。评分结果如表 33。表 3-3 父母对父亲教育孩子重要性的认识配对号 上幼儿园儿童 在家儿童 配对号 上幼儿园儿童 在家儿童1 78 62 5 76 802 70 58 6 72 73第 页43 67 63 7 85 824 81 77 8 83 78分析:虽然可以相信得分多的孩子比得分少的孩子社会知识要多,但由于是定距尺度测量,无绝对零值,因此不能认为得 80 分的孩子社会知识是得 40 分的孩子的 2 倍,也不能认为 80 分与 60 分的社会知识之差一定是 60 分与 50 分之差的 2 倍。但是,可以肯定,8

13、0 分与 60 分所代表的社会知识之差一定大于 60 分与 50 分之间的差。所以将分数差值的绝对值排序是有意义的,这样就有可能运用 Wilcoxon 符号秩检验判定在家和上幼儿园对孩子的社会知识是否有影响。由于只关心两组儿童的社会知识是否有差异。因此应建立双侧备择。假设组为 0:0的 中 位 数iDH1的 中 位 数i用文字表述为:原假设为在家和上幼儿园的儿童社会知识没有差异,备择假设为两组儿童的社会知识有差异。根据表 33 的数据计算 及 、 ,计算过程如表 34。DW表 3-4 检验统计量计算表x y D=x-y D的秩 D 的符号78 62 16 16 8 70 58 12 12 7

14、67 63 4 4 4.5 81 77 4 4 4.5 76 78 -2 2 2 72 73 -1 1 1 85 82 3 3 3 83 78 5 5 6 由表可知 3785W312根据 n8, 与 中较大者 33,在附表中查找相应的 P 值,得到其右尾概率 P00195,W这一概率的 2 倍为 004,对于显著性水平 005,P 值显然较小,故调查结果不支持 H。 。这表明在5的显著性水平上,拒绝零假设,在家和上幼儿园对儿童的社会知识有影响。从计算结果看出, “十”号大大多于“一”号,表明上幼儿园的儿童社会知识成绩普遍高于在家的儿童。第 页52 Brown-Wood 中位数检验、列联表主要目

15、的:检验变量之间是否独立,它所讨论的主要是定性资料。【例 3-4】吸烟与肺癌之间的关系这里用变量 A 表示一个人是否患肺癌,用 B 表示一个人是否吸烟,调查结果如下:表 3-4 吸烟与肺癌关系统计表BA 吸烟 不吸烟患肺癌 60 3未患肺癌 32 11问:吸烟是否与肺癌有关?这即是 1 张 22 列联表,表中考察两个定性变量 A 和 B,每个变量有两类,表中间的数值是频数,一般的 22 列联表形式如下 2:表 3-5 22 列联表BA 12j1n1n1n2 2i 12实践中,可以将考察 A 和 B 的关联性 3问题转化为检验 A 与 B 是否独立,检验和判断的方法很多,这里介绍一种常用的 Pearson 拟合优度 检验。对 22 列联表,检验 A 与 B 是否独立,等价于检验2。其中 表示( )的概率, 和 是相应的边缘概率。当独立性成立时,理论jiijPH:0ijji,iPj频数为 ,其中 ;实际频数为: 。作 统计量:nnn2)1()()( 222 jijjijiijn该统计量反映了实际频与理论频数的偏差,偏差越大,对 H0 越不利。在例子中,可以计算出 。拒绝 H0,即说明吸烟与肺癌不独立,而是存在)1(84.36.9205.2关联的。2 可以推广到更高阶的列联表。3 关联性是线性相关的推广。独立 不关联

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号