【2017年整理】非参数统计学讲义(第六章)分布检验和某些卡方检验

上传人:豆浆 文档编号:936368 上传时间:2017-05-23 格式:DOC 页数:10 大小:396KB
返回 下载 相关 举报
【2017年整理】非参数统计学讲义(第六章)分布检验和某些卡方检验_第1页
第1页 / 共10页
【2017年整理】非参数统计学讲义(第六章)分布检验和某些卡方检验_第2页
第2页 / 共10页
【2017年整理】非参数统计学讲义(第六章)分布检验和某些卡方检验_第3页
第3页 / 共10页
【2017年整理】非参数统计学讲义(第六章)分布检验和某些卡方检验_第4页
第4页 / 共10页
【2017年整理】非参数统计学讲义(第六章)分布检验和某些卡方检验_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《【2017年整理】非参数统计学讲义(第六章)分布检验和某些卡方检验》由会员分享,可在线阅读,更多相关《【2017年整理】非参数统计学讲义(第六章)分布检验和某些卡方检验(10页珍藏版)》请在金锄头文库上搜索。

1、非参数统计学讲义主讲:统计系 袁靖第六章 分布检验和某些卡方检验1 引 言本章属于拟合优度检验问题,即模型检验或分布的检验,属于非参数检验的范畴。在初等统计中,人们要想知道数据是否服从某一特定分布,可以通过直方图,或 P-P 图,Q-Q 图来直接判断,但这种直观的方式很不精确。本章将介绍几种分布的检验:K-S 检验,Lilliefors 检验和 检验。2实际上,K-S 检验是在针对 检验的缺点 1上提出的。它们是建立在经验分布函数基础上的检验结果。22 Kolmogorov 检验、基本假设一般地要检验手中的样本是否来自某个已知 ,假定其真实分布为 ,对应的检验类型有0()Fx()Fx对 至少有

2、一个 x00:()AHFxx10:()H对 至少有一个 xB 对 至少有一个 x00:()C 10:()x设 为该组数据的经验分布函数,则()Sx()ii IXxXnn的 目、基本方法Kolmogorov 于三十年代提出了一种基于经验分布的检验方法,基本思想是:由格里文科定理,当时,样本经验分布 以概率 1 一致收敛到总体分布 F,为此可以定义 到 的距离为nnF ()Sx0F00(),sup()DSxSx1 检验与 K-S 检验均属拟合优度检验,但 检验常用于定类尺度测量数据,K-S 检验还用于定序尺度测量数据;当预22期频数较小时, 检验常需要合并邻近的类别才能计算,K-S 检验则不需要,

3、因此它能比 检验保留更多的信息;对于2 2特别小的样本数目, 检验不能应用,而 K-S 检验则不受限制。此外, 检验需要人为对总体分布的支撑集进行划分, 2将总体分布转化成一种导出分布,后果:样本信息利用不充分;实际检验的是导出分布对数据的拟合优度,而不是假设分布对数据的拟合优度。第 页1当 H0 成立时,由格氏定理, D 以概率 1 收敛到 0,因此 D 的大小可以度量 对总体分布拟合的0()Fx好坏。可供选择的检验统计量分别为;类型 A 0()supxSFx类型 B ()xD类型 C 0(xSx在实际操作时,如果有 n 个观察值,用下面的统计量代替上面的 D0101max(),()(nii

4、iiiDFFxNOTE:由 的取值是离散的,考虑到跳跃性,该 能够保证 S 与 F0 之间取得最大距离;S n 在 H0 下的分布有表可查, P201n在大样本时,有近似分布 ,这里的分布函数 有表达式,P122,该分布()(nPDdK()Kd有表可查 P203:、应用举例【例 6-1】轴承的内径检验检验某车间生产的 20 个轴承外座圈的内径,测得数据如下(单位:mm )表 6-1 轴承内径数据15.04 15.36 14.57 14.53 15.57 14.69 15.37 14.66 14.52 15.4115.34 14.28 15.01 14.76 14.38 15.87 13.66

5、14.97 15.29 14.95按照设计要求,这个内径应在 150.2mm,检验是否符合标准,即检验该数据是否来自均值 ,15方差 的正态分布。20.分析:方法一,可以利用直方图、Q-Q 图、P-P 图进行直观判断;第 页2Histogram (6-1.sta v*20c)Var1 =20*.nlx,495, .16)13.4.613.84.01.24.1.64.815.0.215.4.615.86.01.2Var012345No fbsVar: SW- =09753, p=839; N= 2,Men =49, StdDv =0295,Mx58,Min 6;D50p s.,Lilfors-p

6、Quantile-til Potf Var1(6-.sta 1v*20c)Dsrbuin:NmlV1 =4.95+0.327*x-2.5-.0-1.5-.0-.50.51.0.52.0.5Theortical Quntile0.10.5.10.2.50.9.50.9134.6814.02.146.8501.245.68Observd Value方法二,利用 Kolmogorov 检验由 P122 表中数据得: ,拒绝 H0,认为不满足要求。20 0.2.3近似 ,P-值=0.9790.05,接受 H0。1.56n【例 6-2】 数理统计与管理 论文作者服从洛特卡分布 2将 46 期的数理统计与

7、管理的文章按第一作者统计,得到表 7-2 的结果。论文作者数是否服从洛特卡分布。表 6-2 论文数目与作者数的统计表论文数(x) 1 2 3 4 5 6 7作者(y) 343 27 9 1 1 1 2分析:洛特卡得出这样的一个关系:若以 x 表示每一作者所著的论文数,与其相应的写 x 篇论文的作者数为 y,则 y 与 x 成反比关系。即有* MERGEFORMAT (6.1)myNCA式中,N 为论文总数,m、C 为两个特定的常数,在不同的学科领域数值不同。假定根据表 62 提供的数据,认为论文作者服从洛特卡分布,并对其真实性进行检验,首先必须确定它的理论分布,即计算出 m、C 的值。估计 m

8、 的值,通常采用最小二乘法。将(6.1)式进行对数变换,使其线性化,得到:* MERGEFORMAT (6.2)lnlnyNxAm 相当于一元线性回归方程 中的回归系数 b,根据表中的数据运用最小二乘法,得到Yabm=3.0550。关于 C 值,可以用这样一个公式进行近似计算。这是 1985 年美国情报学家 M.L.Pao 教授在数2 洛特卡定律是 1926 年 6 月 19 日洛特卡(Vlachy)在美国颇有影响的学术刊物华盛顿科学院杂志上首先提出,它第一次提示了作者与文献量的统计规律性。在这之后,洛特卡进一步发展了洛特卡定律,得出这样的一个关系:若以 x 表示每一作者所著的论文数,与其相应

9、的写 x 篇论文的作者数为 y,则 y 与 x 成反比关系。第 页3学家的协助之下提出的。计算式为: 19 11/(29)/()9/(249)mmmxCAAA经计算, 。因此 46 期数理统计与管理1/(.908.620.4.08.3C的论文与作者数的理论洛特卡分布为* MERGEFORMAT (6.3)3.05().9/fyx为了判定数理统计与管理论文作者的实际分布是否与理论分布一致,可以采用 Kolmogorov 检验。建立的假设组为对00:()nHSxFx至少有一个 x1理论累积频率 的各个值,可以将 x 分别代入(6.3)式计算得到,实际累积频率是将累计的作0()者数 分别除以作者总人

10、数得到。计算结果,作者实际累积频率及理论累积频率及各个差值如表 6-3。y表 6-3 作者实际累积频率与理论累积频率表x1 2 3 4 5 6 70()F0.8389 0.9398 0.9690 0.9811 0.9872 0.9907 0.9929nS0.8932 0.9635 0.9870 0.9896 0.9922 0.9948 1.00000x0.0543 0.0237 0.0180 0.0085 0.0050 0.0041 0.00710ma().543nDxF根据显著性水平 ,作者人数 ,查表,由于 ,得临界值.18ny45n。显然1.63/./3842dA050.d因此数据在 1

11、%的显著性水平上不能拒绝 H0,若显著性水平 ,查表得临界值0.5。显然1.36/./384.69dnA050Dd因此,数据在 5%的显著性水平上也不能拒绝 H0,可以认为, 数理统计与管理作者的分布服从洛特卡分布。第 页43 Lilliefors 正态性检验Lilliefors 正态性检验实质上是对 Kolmogorov 检验的一个改进。当用 Kolmogorov 检验某样本是否来自一正态总体 时,当 和 未知时,就会用样本均值 作为总体均值 的估计,样本方差2(,)N2X作为总体方差 的估计,从而将数据 标准化为: ,再用标准正态分布 作 来2S iXiZ()x0F计算 K 氏统计量 。n

12、D但这时统计量 在 H0 下的分布发生了改变, Lilliefors(1976)对 Kolmogorov 的检验临界值表作了修正。【例 6-3】以例 6-1 为例在该例中, , , ,对于 5%的显著性水平,14.9X0.52S20 0.5.1593.Dd不能拒绝原假设。而按照 Kolmogorov 的临界值表,在 5%显著性水平下的临界值为 0.294,要比 Lilliefors检验保守。第 页54 Smirnov 两样本检验、 Smirnov 检验主要用来检验两个样本是否同时来自于某一总体,设样本 来自 分布,而样本12,mX ()Fx来自分布为 的总体。Smirnov 检验的基本思想和

13、Kolmogorov 检验一样,因此经常通称这12,nY ()Gy两个检验为 Kolmogorov-Smirnov 拟合优度检验,简称 K-S 检验。1、基本假设检验类型为:类型 A 对 至少有一个 x0:()HFxGx1:()HFxG类型 B 对 至少有一个 x类型 C 对 至少有一个 x0:() 1:()2、基本方法设 和 分别为这两个样本的经验分布函数。()mFx()nGy则检验 A 的统计量可以取* MERGEFORMAT (6.4)ax(),max()()Nmini jnji jDFGFyG式中 nNOTE:含义其它检验类型的统计量仿此可以写出 的分布有表可查,P204,P205ND

14、大样本时,有近似分布 ()NmnPDdK、 应用举例【例 6-4】检验两个地区的 GDP 指数是否具有相同的分布华北五省市区和华东七省市 1996 年的 GDP 指数(前一年为 100)数据如下:表 6-4 两个地区的 GDP 指数华北 109.2 114.3 113.5 111.0 112.7华东 113.0 112.2 112.7 114.4 115.4 113.4 112.2检验这两个地区的 GDP 指数的分布是否相同。分析:数据的计算过程详见 P1260.22/50.471NDd第 页6接受 H0。5 2 拟合优度检验检验目的:检验样本是否来自于某一特定的分布或总体。在 20 世纪初,

15、Pearson 提出了拟合优度的 统计量。其基本做法是:首先将样本区间进行分割,抽2取 n 个观察值(相当于做了 n 次试验) ,则 X 落在每个区间中的数目服从多项分布,我们就是让这个多项分布去逼近 X 的分布* MERGEFORMAT (6.5)22211()(1)kkiiiipnQkrn其中:r 为总体分布里待估参数的个数, k 为划分的组数。卡方拟合优度检验就是用来检验一批分类数据所来自的总体分布是否与某种理论分布相一致,即检验 。00)(:FxH其基本思想是:设总体可以分成 类,现对总体作了 n 次观察,各类出现的频数分别为 ,k kn,21且 ,则在 成立时,应有实际频数 与理论频数 相差不大。为此,在 20 世纪初,Pearsonnki10 inip提出了拟合优度的 统计量。2* MERGEFORMAT (6.6)1(1)( 2212knpn

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号