分布拟合检验

上传人:飞*** 文档编号:49245194 上传时间:2018-07-26 格式:PPT 页数:24 大小:219.50KB
返回 下载 相关 举报
分布拟合检验_第1页
第1页 / 共24页
分布拟合检验_第2页
第2页 / 共24页
分布拟合检验_第3页
第3页 / 共24页
分布拟合检验_第4页
第4页 / 共24页
分布拟合检验_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《分布拟合检验》由会员分享,可在线阅读,更多相关《分布拟合检验(24页珍藏版)》请在金锄头文库上搜索。

1、 在实际问题中,有时不能预知总体服从什么类型的分布,则需要根据样本来检验关于分布假设.本讲我们学习c2检验法 和“偏度、峰度检验法偏度、峰度检验法” ”。(一)c2检验法在总体分布为未知时,根据样本x1, x2 ,xn来检验关于总体分布假设H0 : 总体x的分布函数为F(x), (1)H1 : 总体x的分布函数不是F(x),若总体x为离散型, 则假设(1)相当于H0 : 总体x的分布律为Px=ti=pi , i=1, 2, (2)若总体x为连续型, 则假设(1)相当于H0 : 总体x的概率密度为f(x). (3)在用2检验法检验假设H0时,若在假设H0下F(x)的形式已知,但其参数值未知,这时

2、需要先用极大似然估计法估计参数,然后再作检验.c2检验法的思想: 将随机试验可能结果的全体 分为k个互不相容的事件A1,A2 ,Ak(Ai=, AiAj=. ,ij,i,j=1,2,k).于是在假设H0下,我们可以计算pi=P(Ai), i=1, 2, ,k. 在n次试验中, 事件Ai出现的频率 fi/n 与pi往往有差异, 但一般来说,若H0为真, 且试验的次数又较多时, 则这种差异不应很大.基于这种想法,皮尔逊使用(4)作为检验假设的统计量, 并证明了以下定理定理 若n充分大(n50),则当H0为真时(不论H0中的 分布属什么分布),统计量总是近似地服从自由度为k- r- 1的2分布。其中

3、r是被估计 参数的个数。于是,在假设H0下计算(4),有.2 a2 (k-r-1), 则在显著性水平a下拒绝H0 ,否则接受H0。使用时必须注意n要足够大,以及npi不太小。n不小 于50, 以及每个npi都不小于5,而且npi最好在5以上,否则 应适当地合并Ai,以满足这个要求。例1 在一实验中,每隔一定时间观察一次由某种铀所放射的到达计数器上的a粒子数,共观察了100次,得结果如下表所示:其中fi是观察到有i个a粒子的个数。从理论上考虑x应服从泊松分布i 0 1 2 3 4 5 6 7 8 9 10 11 12fi 1 5 16 17 26 11 9 9 2 1 2 1 0Ai A0 A1

4、 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A12 问(6)式是否符合实际(a=0.05)? 即在水平0.05下检验假设 H0 : 总体服从泊松分布解 因在H0 中参数l 未具体给出,所以先估计l .由极大似然估计法得 .可将试验可能结果的全体分为两两不相容的事件A0, A1 , , A11 , A12 ,则Px=i有估计(6)例如例1 的2检验计算表A0 1 0.015 1.5 -1.8 0.415A1 5 0.063 6.3 A2 16 0.132 13.2 2.8 0.594 A6 9 0.114 11.4 -2.4 0.505A7 9 0.069 6.9 2.1

5、0.639A8 2 0.036 3.6 -0.5 0.0385A12 0 0.002 0.2 6.2185平0.05下接受H0 。即认为样本来自泊松分布总体。也就是说认为理论上的结论是符合实际的。例2 自1995年1月1日至1971年2月9日共2231天中,全世界记录到里氏震级4级和4级以上地震计162次,统计如下0-4 5-9 10-14 15-19 20-24 25-29 30-34 35-39 4050 31 26 17 10 8 6 6 8相继两次地 震相隔天数x出现的天数试检验相继两次地震的天数x服从指数分布(a=0.05).解 需检验假设H0 : x的概率密度为 先由极大似然估计法

6、求得q的估计为x为连续型随机变量,将0, )分为k=9个互不重叠的子区间ai ,ai+1), i=1, 2, , , 9。如表所列,取Ai=aixai+1, i=1, 2, , , 9。若H0为真,x的分布函数的估计为由上式可得概率pi =P(Ai)的估计结果列表如下 例2 的2检验计算表A1: 0x0.5633,故在水平0.05下接受H0,认为x服从指数分布。例3 下面列出了84个伊特拉斯坎人男子的头颅的最大宽度(mm), 试检验这些数据是否来自正态总体(取a=0.1).141 148 132 138 154 142 150 146 155 158150 140 147 148 144 15

7、0 149 145 149 158 142 149 142 137 134 144 146 147 140 142140 137 152 145 解解 先作直方图:1. 把样本值x1,x2, xn进行分组。 找出最小值,最大值分别为126,158。 取a,b, 得124.5, 159.5,并7等分区间,小区间长度=(b-a)/m=5, 称为组距,小区间端点称为组限。 用唱票方法,数出样本值落在每个区间(ti , ti+1)中的频数,记为fi 。2. 计算 ri= fi /n , (n=84,I=1, 2, , 7 ).详见下页表。由于n个样本独立, 则ri近似于样本落入区间(ti , ti+1

8、)的概率 。即 riPti xiti+1 i=0, 1, 2, ,m.问题是如何去估计f (x).组限 频数fi 频率 fi/n 积累频率124.5129.5 1 0.0119 0.0119129.5134.5 4 0.0476 0.0595134.5139.5 10 0.1191 0.1786139.5144.5 33 0.3929 0.5715144.5149.5 24 0.2857 0.8572149.5154.5 9 0.1071 0.9524154.5159.5 3 0.0357 13. 在xoy平面上,从左自右依次做以(fi/n)/为高的小矩形,即得直方图。易见,这种小矩形的面积等

9、于数据落在该小区间的 频率fi/n.因频率近似于概率, 因而一般来说每一个小区间上 的小矩形面积接近于概率密度曲线之下该小区间上的曲边 梯形的面积,故直方图的外廓曲线接近于总体x的概率密 度曲线f(x). 从本例看,单峰对称,近似正态总体。作2检验如下,检验假设:H0 : x的概率密度为按上式查标准分布表可得p(Ai)的估计. 如例3的2检验计算表A1: x129.5 1 0.0087 0.73 A2:129.5x134.5 4 0.0519 4.36 A3:134.5x139.5 10 0.1752 14.72 -4.72 1.51A4:139.5x144.5 33 0.3120 26.21

10、 6.79 1.76A5:145.5x149.5 24 0.2811 23.61 0.39 0.01 A6:149.5x154.5 9 0.1336 11.22 A7:154.5x 3 0.0375 3.15 3.67故在水平0.1下接受H0 ,即认为数据来自正态分布总体.二二偏度、峰度检验偏度、峰度检验随机变量的偏度、峰度指的是x的标准化变量的 三阶中心矩和四阶中心矩当随机变量x服从正态分布时, v1 = 0 且 v2 = 3.设x1, x2 , xn是来自总体x的样本,则v1 ,v2的 矩估计分别为其中Bk(k=2, 3, 4)是样本k阶中心矩, 分别称g1, g2为样本偏度和样本峰度。若

11、总体x为正态变量,则可证当n充分大时,近似地有设x1, x2 , xn是来自总体x的样本, 现在来检验假 设H0:x为正态总体. 当H0为真且n充分大时,近似地有u1 N(0, 1), u2 N(0, 1).由第六章知样本偏度g1、g2分别依概率收敛于总体偏度v1和总体峰度v2. 因此当H0为真且n充分大时,一般来说, g1与v1=0的偏度不应太大,而g2与v2=3的偏离不应太大. 故从直观来看当|u1|或|u2|过大时就拒绝H0. 取显著水平为a, H0的拒绝域为|u1|k1 或 |u2|k2 ,其中k1, k2由下式确定.即有 k1=Za/4,k2=Za/4 .于是拒绝域为|u1|Za/4

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 企业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号