广义符号检验和有关的置信区间

上传人:宝路 文档编号:47862532 上传时间:2018-07-05 格式:PPT 页数:54 大小:1.20MB
返回 下载 相关 举报
广义符号检验和有关的置信区间_第1页
第1页 / 共54页
广义符号检验和有关的置信区间_第2页
第2页 / 共54页
广义符号检验和有关的置信区间_第3页
第3页 / 共54页
广义符号检验和有关的置信区间_第4页
第4页 / 共54页
广义符号检验和有关的置信区间_第5页
第5页 / 共54页
点击查看更多>>
资源描述

《广义符号检验和有关的置信区间》由会员分享,可在线阅读,更多相关《广义符号检验和有关的置信区间(54页珍藏版)》请在金锄头文库上搜索。

1、第二章 单样本问题 2.1 广义符号检验 和有关的置信区间 2.2 Wilcoxon符号秩检验 ,点估计和区间估计 2.3 正态记 分检验 2.4 Cox-Stuart 趋势检验 2.5 关于随机性的游程检验中心位置检验分布检验符号秩检验符号检验一般符号检验游程检验Cox-staut趋势检验正态记分检验分位数检验Lilliefor正态性检验KS正态性检验拟合优度检验Wilcoxon符号秩检验单样本推断 单一总体位置的 点估计,置信区间估计 和 假设检验 是参数统计推断的基本内容 在经典统计中,人们关心 总体均值(位置变量,描述 总体的“中心”位置); 方差、标准差和极差(关于数据 散步的参数,

2、描述总体的“尺度”的变量) 在非参数统计中,我们也关心数据所包含的关于总体的位置和尺度的信息:(a)对总体位置参数的推断:均值、中位数、众数、 分位数(b)数据的走势或走向,或者看一下这些数目是否完 全是随机的在以前我们接触的统计方法中,得到一个样本, 很自然的想知道它的“平均水平”是多少,这就涉及到 统计中对总体的均值、中位数、众数等位置参数的推断 。如果总体是均值为正态分布时,一个典型方法就 是t-检验,它的检验统计量定义为:其中,s为样本标准差,为样本均值。 t-检验在大样本或已知总体是正态分布是可以得到很 好的效果,但t-检验不稳健,在不知道总体分布,特别 是小样本时,风险很大。这时就

3、要考虑使用非参数方 法了。 t统计量在零假设下服从 n-1 个自由度的 t-分布。 t-检验统计 量是用样本标准差 s 代替了标准正态分布 的总体标准差 之后而产生的。首先来看一个简单的例题:例1. 假设某地16座预出售的楼盘均价,单位(百元/平米)如下 表所示36 32 31 25 28 36 40 32 41 26 35 35 32 87 33 35 问:该地平均楼盘价格能否与媒体公布的3700 /平米 的说法相符解一: 用 t 检验法(假设在统计时 楼盘价格服从正态分布 )One-sample t-Testdata: build.price - 37 t = -0.1412, df =

4、15, p-value = 0.8896 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: -8.045853 7.045853 sample estimates: mean of x -0.5补充: R中的t检验法的用法1) t-test(x)X1,X2,XnN(a, 2), H0 : a=a0 , H1: aa0补充: R中的t检验法的用法例如, 某食品厂用自动装罐机装罐头食品,每罐质量为500g, 现从每天生产的罐头中随机抽测9罐,其质量分别为:510, 505, 498

5、, 503, 492, 502, 497, 506, 495(单位:g)欲检验 H0: a=500, H1: a500 t.test(x-500) data: x - 500 t = 0.46, df = 8, p-value = 0.6578 alternative hypothesis: mean is not equal to 0 95 percent confidence interval: -3.567471 5.345249 sample estimates: mean of x 0.88888892) 配对t检验法X1,X2,XnN(a1, 12), Y1,Y2,YnN(a2,

6、22), H0 : a1=a2 , H1: a1 x y t.test(x,y,alternative=“less”,paired=T)补充: R中的t检验法的用法Paired t-Testdata: x and y t = 2.8312, df = 7, p-value = 0.9873 alternative hypothesis: mean of differences is less than 0 95 percent confidence interval:NA 534.1377 sample estimates: mean of x - y 320接受H0, 认为两种轮胎无显著性差

7、异. 在上面的逻辑推理中,假设分布结构的正态性是否 合理,是 t-检验 运用是否得当的关键 显然 3:13 支持的是3700元/平米 不能作为正态分布 对称中心的观点 现在,让我们换一个角度考虑位置推断问题:2.1.0 符号检验 符号检验(Sign Test)是最古老的检验方法,其检验最 早可追溯到 Arbuthnott 于1701年一项有关伦敦出生的男 婴比例是否超过12的研究 之所以称为符号检验,是因为该检验 只有两类观测值 ,如果用符号和区分,符号检验就是通过符号和 的个数来做统计推断,所以称为符号检验。 符号检验虽 然是最简单的非参数检验,但它体现了非参 数统计的一些基本思路。符号检验

8、检验 基本原理 基本思想:假定用总体中位数Me 来表示中间位置 ,那么样本点 取大于Me的值得概率与小 于Me的概率应该相等。如果排除样本中等于Me的 点,该概率应该为 0.5。 检验统计量:如果Me的确是有关总体的中位数,则每个 样本点都以0.5的概率小于(或大于)Me。这显然是一系 列伯努利(Bernoulli)试验。大于Me的样本点的个数 与小于Me的个数 都服从二项分布 b(n,1/2), 与 都可以作为检验统计量。令以例题1(楼盘价格问题)为例理解“符号检验的基本原理”如果假设问题 的结构是一般连续分布,将 37(百元)理解为总 体的中位数,则假设检验问题 表示为:其中 Me 是总体

9、的中位数。 如果零假设为真,即37是总体的中位数,则数据中应该 差不多各有一半在37的两侧 计算每一个数据与37的差,用 表示位于37右边的点的个 数, 表示位于37左边的点的个数,数据中没有等于37的数 ,+ =16 在零假设和独立同分布的随机抽样的条件下,每一个样本 等可能地出现在37的左右,这也就是说 从有利于接受备择假设的角度出发, 过大或过小,都 表示37不能作为总体的中心,这个思路就是符号检验的基本 原理。 同样的,在零假设和独立同分布的随机抽样的条件下, 也有下面给出规范的符号检验推断过程 :假设 Me是总体的中位数,对于假设检验问题 :其中 M0是待检验的中位数值。假设 是从总

10、体中产生的简单随机样本,定义符号检验与t检验得到了相反的结论,到底选择哪一种结果呢?结论结论 :符号检验检验 在总总体分布未知的情况下优优于t 检验检验 !我们可以对例1(楼盘价数据问题)用符号检验法求解解二: 用符号检验法在显著性水平0.05下,拒绝原假设 H0. 认为这 些数据与中心位置37存在显著差异.检验类型:需要说明的零假设一般就取等号。单边检验:右侧检验左侧检验双边检验:类似地,给出单边假设检验问题 的结果:其中 c 是满足上式的最小值 或其中 k 是满足上式的最大值 单边符号检验问题对于符号检验,使用检验的 p-值 进行检验将会比较简单 :单边符号检验问题双边符号检验问题 右侧检

11、验侧检验 思路: 对于检验假设 ,当 很大 时(即很多观察值大于M0),基于零假设的概率,即 p-值, 也不大。 因此M0可能太小,而Me应该比目前的M0大,这样,备择 假设会更有理一些。如果上述概率小于指定的显著性水平 ,就可以拒绝零假设。这种情况等价于 很小的情况。 在显著性水平 下,检验的拒绝域为: 其中, p值还可以通过Excel中的函数Binomdist(S+1,n,p,t/F)计 算。本检验可以通过输入Binomdist(S+1,n,0.5,1)计算 。 与参数的假设检验 相同,也可以计算检验的 p 值,它等 于一分布为二项分布 b(n,1/2) 的随机变量大于等于 的概 率: 判

12、别规则为 :p 值大于 ,则不能拒绝零假设。p 值小于 ,则拒绝零假设。 左侧检验侧检验 思路: 对于检验假设 ,当 很小 时(即只有少数观察值大于M0),基于零假设的概率,即 p-值,也不大。 因此M0可能太大,而 M 应该比目前的 M0 小,这样,备 择假设会更有理一些。如果上述概率小于指定的显著性 水平 ,就可以拒绝零假设。这种情况等价于 很大 的情况。 在显著性水平 下,检验的拒绝域为: 其中, p 值还可以通过Excel中的函数Binomdist(S+,n,p,t/F)计算。 本检验可以通过输入Binomdist(S+,n,0.5,1)计算。 与参数的假设检验 相同,也可以计算检验的

13、 p 值,它等于 一分布为二项分布 b(n,1/2) 的随机变量 小于等于 的概率 : 判别规则为 :p 值大于 ,则不能拒绝零假设。p 值小于 ,则拒绝零假设。 双侧检验侧检验 思路: 对于假设检验 ,当 不很大 或不很小时,不能拒绝零假设。否则,应该拒绝零假设. 检验的拒绝域为两个:或其中, 与参数的假设检验 相同,也可以计算检验的 p 值。 当 ,它等于二项分布b(n,1/2)的随机变量大于 的概率的2倍: 当 ,它等于二项分布b(n,1/2)的随机变量小于 的概率的2倍: 判别规则为 :p 值大于 ,则不能拒绝零假设。p 值小于 ,则拒绝零假设。特殊情形的处理:在实际问题中恰巧有一些观测值正好等于M0,则如何处理呢 ? 办法之一:省去,并减少样本容量。 办法之二:使用更小的计量单位。 办法之三:修正符号检验统计量如下:下面先看一个例子,由此来引出符号检验。 联合国人员在世界上66个大城市的生活花费指数(以纽 约市1996年12月为100)按资小至大的次序排列如下(北 京的指数为99):66757880818182838383838485858686868687878888888888898989899090919191919293939696969799 100101 102 103 103

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号