非参数统计分析(0303)

上传人:F****n 文档编号:88060770 上传时间:2019-04-18 格式:PPT 页数:76 大小:926KB
返回 下载 相关 举报
非参数统计分析(0303)_第1页
第1页 / 共76页
非参数统计分析(0303)_第2页
第2页 / 共76页
非参数统计分析(0303)_第3页
第3页 / 共76页
非参数统计分析(0303)_第4页
第4页 / 共76页
非参数统计分析(0303)_第5页
第5页 / 共76页
点击查看更多>>
资源描述

《非参数统计分析(0303)》由会员分享,可在线阅读,更多相关《非参数统计分析(0303)(76页珍藏版)》请在金锄头文库上搜索。

1、00:49,1,第二章 单样本非参数检验,00:49,2,思考的要点,各种检验方法的思路 各种检验方法统计量的构造 各种检验方法的应用场合 在SAS与R中如何完成,00:49,3,第一节 符号检验 第二节 Cox-Stuart趋势检验 第三节 游程检验 第四节 Wilcoxon符号秩检验 第五节 正态记分检验 第六节 与参数检验相对效率比较,00:49,4,符号检验的统计量为B=得正号的个数。,符号检验。设随机变量X1,Xn是从某个总体X中抽出的简单随机样本。且分布函数F(X)在X=0是连续的。假设检验问题,检验的统计量可以取B。,第一节 符号检验,在原假设为真的条件下,B服从参数为n和0.5

2、的二项分布b(n,0.5)。由于原假设为真时,B应该不太大,也不太小,如果B太大或太小,应该拒绝原假设。,00:49,5,精确的符号检验是指检验的p值是由精确的概率给出的。 我们利用正号和负号的数目,来检验某假设,这是一种最简单的非参数方法。 【例4】联合国人员在世界上71个大城市的生活花费指数(上海是44位,数据为63.5)按自小至大的次序排列如下。,一、精确中位数的符号检验,00:49,6,有人说64应该是这种大城市花费指数的中位数,有人说64顶多是低位数(下四分位数),进行检验。数据如下: 122.4,109.4,105,104.6,104.1,100.6,100,99.3,99.1,9

3、8.2,97.5,95.2,92.8,91.8,90.8,90.3,89.5, 89.4,86.4,86.2,85.7,82.6,81,80.9,79.1,77.9, 77.7,76.8,76.6,76.2,74.5,74.3,73.9,71.7,71.2, 67.7,66.7,66.2,65.4,65.3,65.3,65.3,64.6,63.5, 62.7,60.8,58.2,55.5,55.3,55,54.9,52.7,51.8, 49.9,48.2,47.6,46,45.8,45.2,41.9,38.8,37.7,37.5,36.5, 36.4,32.7,32.7,32.2,29.1,2

4、7.8,27.8,00:49,7,00:49,8,通常在正态总体分布的假设下,关于总体均值的假设检验和区间估计是用与t检验有关的方法进行的。然而,在本例中,总体分布是未知的。为此,首先看该数据的直方图从图中很难说这是什么分布。假定用总体中位数来表示中间位置,这意味着样本点,取大于me的概率应该与取小于me的概率相等。所研究的问题,可以看作是只有两种可能“成功”或“失败”。,00:49,9,符号检验的思路,记 成功:X-0大于零,即大于中位数M,记为“+”; 失败:X-0小于零,即小于中位数M,记为“-”。 令 S+=得正符号的数目 S=得负符号得数目 可以知道S+或S 均服从二项分布B(65,

5、0.5)。则可以用来作检验的统计量。其假设为:,00:49,10,关于非参数检验统计量需要说明的问题,在非参数检验中,可以得到两个相互等价的统计量,比如在符号检验中,得负号与得正好的个数,就是一对等价的统计量,因为S+S-=N。那么我们在检验时应该用那个呢?约定选择统计量,00:49,11,00:49,12,该检验R的代码 x-c(122.4,109.4,105,104.6,104.1,100.6,100,99.3,99.1,98.2,97.5,95.2,92.8,91.8,90.8,90.3,89.5, 89.4,86.4,86.2,85.7,82.6,81,80.9,79.1,77.9,

6、77.7,76.8,76.6,76.2,74.5,74.3,73.9,71.7,71.2, 67.7,66.7,66.2,65.4,65.3,65.3,65.3,64.6,63.5, 62.7,60.8,58.2,55.5,55.3,55,54.9,52.7,51.8, 49.9,48.2,47.6,46,45.8,45.2,41.9,38.8,37.7,37.5,36.5, 36.4,32.7,32.7,32.2,29.1,27.8,27.8) y=sum(sign(x-64)=1) pbinom(71-y,71,0.50),00:49,13,二、大样本的情形,当样本容量足够大,我们可以利用

7、二项分布的正态近似来对该问题进行检验。因为计数统计量在原假设为真时,服从b(n,0.5)。且其均值为0.5n,方差为0.25n。则检验的统计量为,00:49,14,第二节 Cox-Stuart趋势检验,人们经常要看某项发展的趋势但是从图表上很难看出是递增,递减,还是大致持平 【例5】我国自1985年到1996年出口和进口的差额(balance)为(以亿美元为单位) 149.0 119.7 37.7 77.5 66.0 87.4 80.5 43.5 122.2 54.0 167.0 122.2,从这个数字,我们能否说这个差额总的趋势是增长,还是减,还是都不明显呢?下图为该数据的点图从图可以看出,

8、总趋势似乎是增长,但1993年有个低谷;这个低谷能否说明总趋势并不是增长的呢?我们希望能进行检验,00:49,15,00:49,16,三种假设:,怎么进行这些检验呢?可以把每一个观察值和相隔大约n2的另一个观察值配对比较;因此大约有n2个对子然后看增长的对子和减少的对子各有多少来判断总的趋势具体做法为取 和 。这里,00:49,17,在这个例子中n=12,因而c6。这6个对子为(x1,x7),(x2,x8),(x3,x9),(x4,x10),(x5,xl1),(x6,x12)。,00:49,18,用每一对的两元素差Di=xi-xi+c的符号来衡量增减。令S+为正Di=xi-xi+c的数目,而令

9、S-为负的Di=xi-xi+c的数。显然当正号太多时,即S+很大时(或S-很小时),有下降趋势,反之,则有增长趋势在没有趋势的零假设下它们应服从二项分布b(6,0.5),这里n为对子的数目(不包含差为0的对子)。该检验在某种意义上是符号检验的一个特例。,00:49,19,类似于符号检验,对于上面1,2,3三种检验,分别取检验统计量K=S+,K=S-和K=min(S+,S-)。在本例中,这6个数据对的符号为 5负1正, 所以我们不能拒绝原假设。,00:49,20,【 例6 】天津机场从1995年1月到2003年12月的108个月旅客旅客吞吐量数据如下:,54379 45461 55408 597

10、12 60776 57635 63335 71296 70250 76866 75561 66427 61330 58186 67799 76360 86207 75509 83020 89614 75791 80835 72179 61520 66726 60629 68549 73310 80719 67759 70352 82825 70541 74631 68938 53318 62653 58578 63292 69535 73379 62859 72873 87260 67559 76647 70590 58935 58161 64057 63051 58807 63663 573

11、67 70854 79949 66992 80140 62260 55942 58367 56673 61039 74958 85859 67263 87183 97575 79988 88501 68600 58442 68955 56835 67021 81547 85118 70145 95080 106186 86103 88548 70090 65550 69223 85138 89799 99513 98114 68172 97366 116820 95665 109881 87068 75362 88268 85183 87909 79976 27687 50178 100878

12、 131788 116293 120770 104958 109603 讨论是否存在显著的增长趋势。,00:49,21,00:49,22,SPSS无此检验,我们用R完成该检验,代码如下。,x-c(54379,45461,55408,59712,60776,57635,63335,71296,70250,76866,75561,66427,61330,58186,67799,76360,86207,75509,83020,89614,75791,80835,72179,61520,66726,60629,68549,73310,80719,67759,70352,82825,70541,7463

13、1,68938,53318,62653,58578,63292,69535,73379,62859,72873,87260,67559,76647,70590,58935,58161,64057,63051,58807,63663,57367,70854,79949,66992,80140,62260,55942,58367,56673,61039,74958,85859,67263,87183,97575,79988,88501,68600,58442,68955,56835,67021,81547,85118,70145,95080,106186,86103,88548,70090,655

14、50,69223,85138,89799,99513,98114,68172,97366,116820,95665,109881,87068,75362,88268,85183,87909,79976,27687,50178,100878,131788,116293,120770,104958,109603) d=x1:54-x55:108 y=sum(sign(d)=1) pbinom(y,54,0.5) 直接得到p值=0.0019190.05,拒绝无趋势的原假设原假设。,00:49,23,补充:检验的p值,在假设检验中,常常通过检验的p值来决策。 p值为拒绝原假设的最小概率。对于t检验,如

15、果计算出的统计量的值为t0,则 左尾检验的p值为概率p(t t0) 右尾检验的p值为概率p(t t0) 双尾检验的p值为概率p(|t| t0|)。 但是对于非参数检验来说由于有两个等价的统计量,如得正号的个数与得负号的个数之和等于样本容量n;两个总体的秩和等于N(N+1)/2。,00:49,24,比如是左侧检验,如果总体真实的中位数比假设的小,则检验的统计量w+表现出过小, w-表现出大,检验的p值为p( w+w小),此时用的最小的统计量。对于右侧检验,如果总体真实的中位数比假设的大,则检验的统计量w+表现出过大, w-表现出小。检验的p值为p( w+w大)。实际上 p( w+w大) = p(

16、 -w+-w大) = pN(N+1)/2-w+ N(N+1)/2 -w大 = pw-w小 可见检验的统计量用k=min(w+,w-)是合理的。另外双侧检验的p值是单侧的两倍。,00:49,25,游程检验是样本的随机性检验,其用途很广。例如当我们要考察生产中次品出现是随机的,还是成群的,一个时间序列是平稳的还是非平稳的。,第三节 游程检验,00:49,26,从生产线上抽取产品检验,是否应采用频繁抽取小样本的方法。在一个刚刚建成的制造厂内,质检员需要设计一种抽样方法,以保证质量检验的可靠性。生产线上抽取的产品可以分成两类,有瑕疵,无瑕疵。检验费用与受检产品数量有关。一般情况下,有毛病的产品如果是成群出现的,则要频繁抽取小样本,进行检验。如果有毛病的产

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号