文档详情

第九讲和第十讲 统计1107班 王凤娇 翻译

人***
实名认证
店铺
DOCX
45.25KB
约16页
文档ID:450641767
第九讲和第十讲 统计1107班 王凤娇 翻译_第1页
1/16

STA333第九讲检验配对数据:Wilcoxon符号-秩检验9.1 Wilcoxon 符号-秩检验我们回顾一下猴子数据:例:猴子的刺激一位生理学家希望知道猴子更喜欢大脑区域A的刺激还是大脑区 域 B 的刺激在该实验中,14 只猴子被教导要按下两个按钮当灯亮起时,压在按钮1 总是导致区 域A的刺激;压在按钮2总是导致区域B的刺激学习按按钮后,猴子再测试15分钟,在 这段时间内记录压两个按钮的频率频率越高,喜欢这种刺激的程度越高数据显示在下面每只猴子被测试两次,因此这是一个成对数据的例子该数据的形式 是(X, Y)对样本按钮1 (X)按钮2(Y)1204021825324384142755316262171532829389162510918112532123028133533141229我们已经在上一讲中做了这些数据的符号检验符号检验一个明显的问题是它丢弃了很多关于数据的信息它考虑到了差异的方向,但 不是每对数之间的差的大小在这一点上,我将讨论另一种方法,使用配对样本比较两个群体这种新的方法称为Wilcoxon 符号-秩检验,它不是一个基于二项分布的检验,所以我们将不得不考虑有点不同 的东西。

Wilcoxon符号-秩检验是可用于在同一受试者重复测量的配对样本的另一个非参数检 验不同于符号检验,它考虑到(至少在一定程度上)测量的幅度试验的性质假设在一个区间尺度上,我们有n对测量值(X1, Y1),(X2, Y2),...,(X,Y )的1 1 2 2 n n随机样本区间尺度测量是考虑测量值之间的距离有意义的一种测量令D = X.- Y,每对i i i 的不同分数(就像在符号检验)要试验的假设与在第8 讲的符号检验是相同的,即我们是在比较两个群体真实的 中位数 M 和 M :xyH : M = M 与 H : M工M (双侧检验)0 x y a x yMx > My (上尾检验)xy Mx < My (下尾检验)xy 与往常一样,基于相关研究的问题,你选择的合适的备择假设H检验统计量的推导让我们用相同猴子的刺激的数据来说明符号检验 14 组得分差(D「s)分别为:i-20,—7, —14, —13, —26, +5,—17, —9, -10,—9, —7, +3,+2,—17首先,删除其中D=0的所有观测值剩下的这些观测值,我们基于绝对值(即:不考 i虑符号)的基础对这些D.的值进行排序,然后给每个观测值分配秩。

结果如下:id.1+2+3+5-7-7-9-9-10-13-14-17-17-20-26秩1234.54.56.56.5891011.511.51314秩为 1 的与最小的值(绝对值)对应,秩为2的与下一个大的对应,以此类推如果两 个值的的得分差相同,我们通常将秩平均后对应这些观测值关于这个更多的请看下一节Wilcoxon符号-秩统计量V是得分差为正的秩的总和本例中,V=6 (即:1+2+3)课堂练习:工作周 5 天与 4 天的里程比较灵活地安排时间能减少资源的需求?湖 县伊利诺伊州卫生局对灵活的四天工作周做了试验该部门记录了一年中一个普通的每周5 天工作制的7 个工人的里程然后它变成一个灵活的4 天工作制,再记录一年的行驶里程 这项研究的目的是确定是否里程小而导致了4 天日程安排员工 5天里程 4天里程 D I Di I I Di I的秩 符号为+的秩2798BettyRogerTomAimeeGregLarry772475058384592810712286112617711023281499716952914计算 Wilcoxon 符号-秩统计量 V那么,现在我们要弄清楚如何得到p值。

要做到这一点,首先要了解V在不同情况下 的行为:• 如果原假设H0: M = M是真实的,正秩总和与负秩总和将大致相等在这种情况0 x y下,V9n(n+l)/4• 如果(假设)H : M〉M是真实的,它将会导致看到很多的组都是X > Y.,因a x y i i此更多的组的 D >0所以,较大的秩差将趋于正,最终我们将会看到 V 的值增 加了• 同样的观点也可用于进行下尾检验和双边检验检验统计量V的原分布只是一个提醒:这不是二项分布)V的抽样分布可以通过 查看标记(+)和(-)的可能的排列来获得,然后计算每一个可能的排列的与标记(+)有 关的秩和如果原假设H为真,那么每一个标记(+)和(-)的可能的排列很可能相等课堂练习假设我们有n=4 (X, Y)对不打结的秩,所以我们得到四个唯一的D.i 发现V的完整的原假设分布:与正得分有关的秩和根据定义,任何假设检验的 p 值是证明作为实际样本中观察到的样本至少违背H0 (并接受H )的可能性大小在这种情况下,p值将是来自V的原假设分布的一些可能 0a性我们将用R计算它然后,我们可以在一些预先确定的显着性水平a下比较它1. 样本是随机的2.样本是连续的。

3. 差的分布是对称的9.2 问题,问题:处理打结和零假设 2 基本上确保所有的观察值将是唯一的,即在任何地方都没有重复值但是当然, 人们四舍五入的值,使用独立尺度,等等这就是真实的世界因此,如果连续性的假设是 错误的,是否存在D.为零的值,或者绝对值D.打结?ii另外还有两种方式,违反连续性假设会影响结果:• 蒙混的零我们所谓的在符号检验的情况下的零点蒙混(因为它是相当虚假的)使 在符号-秩检验的情况下更有意义在Wilcoxon符号-秩检验中,Di= X.-Y.为零的i i i值,差异应该得到尽可能小的绝对值,因为零的绝对值小于任何其他数字我们不 妨给他们零秩,从零开始计数,而不是一他们对秩和的统计量V没有什么贡献• 打结的秩前面问题的处理情况,其中单个值给了一对完全相同的值但第二类错 误导致一个不同的问题:如果我们有两个单个值D.打结?(看看猴子数据:这种i情况是相当普遍存在的在这种情况下赋予秩并不是问题:如前所述,习惯上,以下列方式处理打结的秩:将打 结的秩平均后在赋予它们,如果不打结就不用了举例来说,如果你有两个打结的得分占据位置3和4,将它们的秩均记为3.5将占据 7,8,9位置的三个打结的得分对应的秩记为8。

这是处理打结数据较好的方法,因为不论是否 存在打结的得分,固定的得分数目的秩和将会是相同的事实上, R 固有的功能可以完成 这些:> d <-c(12,43,43,19)> rank(d)[1] 1.0 3.5 3.5 2.0然而,主要的问题是打结得分的出现会使V的原假设分布改变因为这个,检验的p 值或许会改变这有可能会改变测试的结果,慎重考虑很重要的!练习(你自己)和以前一样,假设我们有n=4(X,Y)对数,但不同的是在第3和4 位置的观测值之间有一个打结的数,因此对应的秩也就变成了1, 2.5, 2.5, 4找出这个 例子中 V 的原假设分布,看看它的原假设分布与没有打结秩的例子的不同9.3用R做Wilcoxon符号-秩检验我们可以用R中的附件软件包exactRankTests调用wilcox.exact()命令实施正确的 Wilcoxon符号-秩检验你必须先下载并安装这个附加到你的R安装才能使用它请参见第 1.3 节以了解更多信息你只需要安装一次,然后你就能很好的使用它例:猴子的刺激假设为:H : M = M 与 H : M 工 M0 x y a x yM是按按钮1的真实中位数,M是按按钮2的真实中位数。

原假设基本上指出按按 xy 钮之间没有偏好,但符号-秩检验指出这种假说在中位数的差异> x <- c(20,18,24,14,5,26,15,29,15,9,25,31,35,12)> y <- c(40,25,38,27,31,21,32,38,25,18,32,28,33,29)> library(exactRankTests)> wilcox.exact(x, y, paired=TRUE, alternative="two.sided")Exact Wilcoxon signed rank testdata: x and yV = 6, p-value = 0.001465alternative hypothesis: true mu is not equal to 0用(exactRankTests)库命令加载包到当前R会话在第四行上面运行双侧检验检验统计量的值为V =6,双侧备择的p值为0.0014由于p值<0.05,所以可以证明有 一个明显的偏好偏好是区域B重要提示:R基础的加载包中还有一个内置函数wilcox.test()可以运行Wilcoxon符号- 秩检验它运用的很广泛,但它计算p值的时候忽略了打结。

如果存在打结,wilcox.test() 会给你错误的p值> # NOT RECOMMENDED!!!!> wilcox.test(x, y, paired=TRUE, alternative="two.sided") Wilcoxon signed rank test with continuity correction data: x and yV = 6, p-value = 0.003854alternative hypothesis: true location shift is not equal to 0Warning message:In wilcox.test.default(x, y, paired = TRUE, alternative = "two.sided"): cannot compute exact p-value with ties至少它会警告你它搞砸了,但它至少给出了一个搞砸的结果!9.4 一些评论以下是有关 Wilcoxon 符号-秩检验的一些观察,你应该知道:1. 运行Wilcoxon符号-秩检验得出的结论比符号检验分析相同数据得出的结论更具说服力。

因为Wilcoxon符号-秩检验比符号检验的功效更大为什么功效更大呢?因为它相比符号检 验利用了更多的信息但是请注意,利用秩而不是得分本身也会丢弃一些信息(如成对 t- 检验一样)下面就来看看这三个相互竞争的过程:t-检验(参数)符号检验(第8讲)符号-秩检验• 利用实际的数字,包括 大小和符号• 稳健性低(崩溃点为0%)• 完全忽略了数字的大小, 只用自己的标志(即“正 数和负数的不同?”• 稳健性高(崩溃点为50%)• 同时利用的大小和符号, 但不利用的数字的实际 大小,只是秩的大小• 稳健性适中(崩溃点为29.3%)2. 对称性我们增加了得分差对称性假设这一过程(这不是符号检验的假设)这有两层含 义:a. 如果分布是对称的,均值和中位数是一致的,因为两者刚好都位于分布的中间(在对称 线)因此,加入对称的假设意味着有关中位数也是平均数的任何推论都是有效陈述b. 增。

下载提示
相似文档
正为您匹配相似的精品文档