非参数统计幻灯片课件

上传人:F****n 文档编号:88202203 上传时间:2019-04-20 格式:PPT 页数:28 大小:509KB
返回 下载 相关 举报
非参数统计幻灯片课件_第1页
第1页 / 共28页
非参数统计幻灯片课件_第2页
第2页 / 共28页
非参数统计幻灯片课件_第3页
第3页 / 共28页
非参数统计幻灯片课件_第4页
第4页 / 共28页
非参数统计幻灯片课件_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《非参数统计幻灯片课件》由会员分享,可在线阅读,更多相关《非参数统计幻灯片课件(28页珍藏版)》请在金锄头文库上搜索。

1、符号检验和分 位数推断,第三章,单一样本的推断问题,一、,3.1.1 基本概念,符号检验:如果用符号“+”和“-”区分,符号检验就是通过 符号“+”和“-”的个数来进行统计推断的,故称为符号检验。,假设总体F(x),Me是总体的中位数,对于假设检验问题:,M0是待检验的中位数取值.X1, X2, Xn是来自总F(x) 的独立同分布的样本,当XiM0时,记为+,当XiM0时, 记为-.当H0成立时,+和-出现的机会相等,所以+和-出现 的次数S+和S-大略相等。,-,例3.1. 假设某地16座预出售的楼盘均价,单位(百元/平方米)如下表所示: 36 32 31 25 28 36 40 32 41

2、 26 35 35 32 87 33 35 问该地平均楼盘价格是否与媒体公布的3700元/m2的说法相符?,二、例题讲解,这是用样本推断总体 位置参数的典型问题,确定假设,由抽样分布计算拒绝域或计算p值与显著性比较,检验统计量在零假 设下的抽样分布,做出决策,假定分布结构,解:设楼盘价格服从正太分布N(,2),可以建立如下零假设和备择假设:,根据自由度,可得t检验的p值为0.89,单样本t检验回顾,R的t检验的程序及运行的结果如下:,x=c(36,32,31,25,28,36,40,32,41,26,35,35,32,87,33,35); t.test(x,mu=37,alternative=

3、“two.sided“,conf.levei=0.95);,假设总 是总体的中位数,对于假设检验问题: 其中,M0是待检验的中位数取值.假设X1,X2,Xn,是从总体 中产生的简单样本,定义: , 在零假设情况kb(n,0.5) 在显著性水平为的拒绝域为: 其中k是满足上式最大的k值,例3.2(例3.1续解),于是,在显著性水平0.05之下,拒绝零假设,认为这些数 据的中心位置与3700元/m2存在显著性差异。,可计算k=3,拒绝域为:,由公式:,x=c(36,32,31,25,28,36,40,32,41,26,35,35,32,87,33,35);m0=37; sg=sum(xm0);sl

4、=sum(xm0);ml=sg+sl;k=min(sg,sl);p=pbinom(k,ml,0,5); binom.test(k,ml);,符号检验的R程序及其运行结果,R程序如下:,运行结果如下:,中位数的单样本符号检验一种针对单一总体的中位数的假 设检验。该过程使用总体中位数 () 等于假设值 (H0: =0) 的原假设,并针对备择假设进行检验,备择假设可以是左尾 ( 0) 或双尾 ( 0) 假设。 单样本符号检验是单样本 t 检验的非参数模拟,因为它不 要求数据来自正态分布的总体,而 t 检验则要求数据来自正态 分布的总体。此外单样本符号检验也不对总体对称作任何假设。,符号检验与t检验的

5、比较,结论:符号检验在总体分布未知的情况下优于t检验!,3.1.2大样本计算,一、当n较大时,可以使用二项分布的正太近似进行检验,n=S+S-,二、当n不够大的时候可用Z的正太性修正,如下式:,因此,当n不够大的时候可用下列修正公式进行调整。 双边: , p-值: 左侧: p-值: 右侧: p-值:,对离散分布应用正态性修正是非参数统计中较为普遍的做法,正太性修正,假设X服从离散分布,X所以的可能取值为0,1,n,如果X近似的正态分布为N(,2),当待估计的点X=kn/2时, k处的概率分布函数P(Xk)用正态分布N(-C,2)在k处的分布函数估计,C=1/2,这相当于位置参数向右平移1/2单

6、位的分布来估计k的概率分布;同理,当待估计的点X=kn/2时, k处的概率分布函数P(Xk)用正态分布N(-C,2)在k处的分布函数估计,C=-1/2,这相当于位置参数向右平移1/2单位的分布来估计k的概率分布。,例3.3 设某化妆品厂商有A和B两个品牌,为了解客户对A品牌和B品牌化妆品在使用上的差异,将A品牌和B品牌化妆品同时交给45位客户使用,一个月以后得到以下数据。 喜欢A品牌的客户人数:22人 喜欢A品牌的客户人数:18人 不能区分的人数:5人 分析在显著性水平=0.10下,是否能够认为两种品牌在市场上的被喜爱程度存在差异?,解:假设检验问题: H0:P(A)=P(B),喜欢A品牌的客

7、户和喜欢B品牌的客户比例相等 H1:P(A)P(B),喜欢A品牌的客户和喜欢B品牌的客户比例不等 分析:这是定性数据的假设检验问题,可以应用符合检验,喜欢A品牌的人数设为S+,S+=22;喜欢B品牌的人数设为S-,S-=18,S+S-=n=40, n/2=20,由于S+20,所以取正修正,应用公式有,3.1.3 符号检验在配对样本比较中的应用,在对两总体进行比较的时候,配对样本是经常遇到的情况,比如:生物的雌雄,人体疾病的有无,前后两次实验的结果,(x1,y1),(x2,y2),(xn,yn)。 n对样本数据中,若xiyi,则记为“+”,若xiyi,则记为“-” 若xi=yi,则记为“0”,于

8、是数据可能被分成三类(+,-,0),我们只比较“+”和“-” 的个数,记“+”和“-” 的个数和为n,nn。假设P+ 为“+”的比例, P- 为“-”的比例,那么假设检验问题: 可以用符号检验。,H0:P+=P- H1:P+=P-,例3.4 如下表是某种商品在12家超市促销活动前后的销售额对比表,用符号检验分析促销活动的效果如何?,连 促销前 促销后 锁 销售额 销售额 符号 店 1 42 40 + 2 57 60 - 3 38 38 0 4 49 47 + 5 63 65 - 6 36 39 - 7 48 49 - 8 58 50 + 9 47 47 0 10 51 52 - 11 83 7

9、2 + 12 27 33 -,解:假设检验问题: H0:P(促销前)=P(促销后), H1:P(促销前)P(促销后). 促销前的销售额大于促销后的销售额的样本个数为S+,则S+=4;促销前的销售额小于促销后的销售额的样本个数为S-,则S-=6;则 n=S+S-=10,n/2=5,应用公式有,本例R的符合检验的程序及运行的结果如下:,x0);sl=sum(xy0);n1=sg+sl; k=min(sg,sl); binom.test(k,n1);,根据符号检验原理,可以将中位数符号检验推广到单一总体p分位数的检验。,3.1.4 分位数检验符号检验的推广,假设总体F(Mp),Mp是总体的p分位数,

10、对于假设检验问题: 其中,Mp0是待检验的p0分位数. 上述检验问题等价于 类似中位数检验,定义: 在零假设下,ZiB(1,p0), 假设有效数字n=S+S-,零假设下S+b(n,p0),S-b(n,1-p0),第二节 Cox-Staut趋势存在性检验,H0:数据序列无趋势 H1:数据序列有增长或下降趋势 设数据序列:x1, x2 ,xn 独立,在零假设下,同分布为F(x), 令 取xi和 xi+c组成数对(xi, xi+c). 当n为偶数时,共有c对,当n为基数时,共有c-1对.计算每一数对前后两值之差: Di =xi-xi+c.用Di的符号度量增减. 令S+为正的数目,S-为负的数目, S

11、+S-=n,nn.K=minS+,S-,当K过小的时候,认为数据存在趋势,在零假设情况下 Di服从二项分布。从而转化为符号检验问题。,双边假设检验问题:,单边假设检验问题:,H0:数据序列无趋势 H1:数据序列有下降趋势 结果类似,S+很大时(S-很小时),有下降趋势,反之,当S+ 很小时(或S-很大时),有上升趋势。,H0:数据序列无趋势 H1:数据序列有上升趋势,例3.6 某地区32年来的降雨量如下表,年份 1971 1972 1973 1974 1975 1976 1977 1978 降雨量 206 223 235 264 229 217 188 204 年份 1979 1980 198

12、1 1982 1983 1984 1985 1986 降雨量 82 230 223 227 242 238 207 208 年份 1987 1988 1989 1990 1991 1992 1993 1994 降雨量 216 233 233 274 234 227 221 214 年份 1995 1996 1997 1998 1999 2000 2001 2002 降雨量 226 228 235 237 243 240 231 210,问(1):该地区前10年来降雨量是否有变化? (2):该地区32年来降雨量是否有变化?,解(1):假设检验问题: H0:该地区前10年来降雨量无上升趋势 H1:

13、该地区前10年来降雨量有上升趋势, C=10/2=5,前后观察值为下表:,由上表可以看出 K=2,则p值为,(2):这里的数据对增加到16对,原假设如下 H0:该地区32年来降雨量有无上升趋势 H1:该地区32年来降雨量有上升趋势,由上表可以看出 K=2,则p值为,前后观察值为下表:,x1y1);sl=sum(x1y1);n1=sg+sl;k=min(sg,sl); binom.test(k,n1);,本例R的符合检验的程序及运行的结果如下:,一般来说,样本量太少,很 难拒绝零假设,x1y1);sl=sum(x1y1);n1=sg+sl;k=min(sg,sl); binom.test(k,n1);,为了形象,我们直接做出直线,结果表明:数据的线性 趋势并不显著.,x1-c(206,223,235,264,229,217,188,204,182,230,223,227,242,238,207,208, 216,233,233,274,234,227,221,214,226,228,235,237,243,240,231,210); data(x1); year=seq(1971,2002); anova(lm(x1year),

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号