《精编》分布拟合检验

上传人:tang****xu3 文档编号:134472265 上传时间:2020-06-05 格式:PPT 页数:24 大小:221.50KB
返回 下载 相关 举报
《精编》分布拟合检验_第1页
第1页 / 共24页
《精编》分布拟合检验_第2页
第2页 / 共24页
《精编》分布拟合检验_第3页
第3页 / 共24页
《精编》分布拟合检验_第4页
第4页 / 共24页
《精编》分布拟合检验_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《《精编》分布拟合检验》由会员分享,可在线阅读,更多相关《《精编》分布拟合检验(24页珍藏版)》请在金锄头文库上搜索。

1、 分布拟合检验 在实际问题中 有时不能预知总体服从什么类型的分布 则需要根据样本来检验关于分布假设 本讲我们学习c2检验法和 偏度 峰度检验法 一 c2检验法在总体分布为未知时 根据样本x1 x2 xn来检验关于总体分布假设H0 总体x的分布函数为F x 1 H1 总体x的分布函数不是F x 若总体x为离散型 则假设 1 相当于H0 总体x的分布律为P x ti pi i 1 2 2 若总体x为连续型 则假设 1 相当于H0 总体x的概率密度为f x 3 在用c2检验法检验假设H0时 若在假设H0下F x 的形式已知 但其参数值未知 这时需要先用极大似然估计法估计参数 然后再作检验 c2检验法

2、的思想 将随机试验可能结果的全体 分为k个互不相容的事件A1 A2 Ak Ai AiAj i j i j 1 2 k 于是在假设H0下 我们可以计算pi P Ai i 1 2 k 在n次试验中 事件Ai出现的频率fi n与pi往往有差异 但一般来说 若H0为真 且试验的次数又较多时 则这种差异不应很大 基于这种想法 皮尔逊使用 4 作为检验假设的统计量 并证明了以下定理定理若n充分大 n 50 则当H0为真时 不论H0中的分布属什么分布 统计量 总是近似地服从自由度为k r 1的 2分布 其中r是被估计参数的个数 于是 在假设H0下计算 4 有 2 a2 k r 1 则在显著性水平a下拒绝H0

3、 否则接受H0 使用时必须注意n要足够大 以及npi不太小 n不小于50 以及每个npi都不小于5 而且npi最好在5以上 否则应适当地合并Ai 以满足这个要求 例1在一实验中 每隔一定时间观察一次由某种铀所放射的到达计数器上的a粒子数 共观察了100次 得结果如下表所示 其中fi是观察到有i个a粒子的个数 从理论上考虑x应服从泊松分布 i01234567891011 12fi15161726119921210AiA0A1A2A3A4A5A6A7A8A9A10A11A12 问 6 式是否符合实际 a 0 05 即在水平0 05下检验假设H0 总体服从泊松分布 解因在H0中参数l未具体给出 所以

4、先估计l 由极大似然估计法得 可将试验可能结果的全体分 为两两不相容的事件A0 A1 A11 A12 则P x i 有估计 6 例如 例1的 2检验计算表 A010 0151 5 1 80 415A150 0636 3A2160 13213 22 80 594 A690 11411 4 2 40 505A790 0696 92 10 639A820 0363 6 0 50 0385A1200 0020 2 6 2185 平0 05下接受H0 即认为样本来自泊松分布总体 也就是说认为理论上的结论是符合实际的 例2自1995年1月1日至1971年2月9日共2231天中 全世界记录到里氏震级4级和4

5、级以上地震计162次 统计如下 0 45 910 1415 1920 2425 2930 3435 39 4050312617108668 相继两次地震相隔天数x 出现的天数 试检验相继两次地震的天数x服从指数分布 a 0 05 解需检验假设H0 x的概率密度为 先由极大似然估计法求得q的估计为 x为连续型随机变量 将 0 分为k 9个互不重叠的子区间 ai ai 1 i 1 2 9 如表所列 取Ai ai x ai 1 i 1 2 9 若H0为真 x的分布函数的估计为 由上式可得概率pi P Ai 的估计 结果列表如下 例2的 2检验计算表 A1 0 x 4 5500 278845 1656

6、 4 8440 5176A2 4 5 x 9 5310 219635 57524 57520 5884A3 9 5 x 14 5260 152724 7374 1 26260 0644 A7 29 5 x 34 560 03585 7996 0 20040 0069A8 34 5 x 39 560 02484 0176A9 39 5 x 80 05689 2016 0 05633 因为c0 052 k r 1 c0 052 8 1 1 c0 052 6 12 592 0 5633 故在水平0 05下接受H0 认为x服从指数分布 例3下面列出了84个伊特拉斯坎人男子的头颅的最大宽度 mm 试检验

7、这些数据是否来自正态总体 取a 0 1 141148132138154142150146155158150140147148144150149145149158 142149142137134144146147140142140137152145解先作直方图 1 把样本值x1 x2 xn进行分组 找出最小值 最大值分别为126 158 取a b 得 124 5 159 5 并7等分区间 小区间长 度 b a m 5 称为组距 小区间端点称为组限 用唱票方法 数出样本值落在每个区间 ti ti 1 中的频数 记为fi 2 计算ri fi n n 84 I 1 2 7 详见下页表 由于n个样本独立

8、 则ri近似于样本落入区间 ti ti 1 的概率 即ri P ti xi ti 1 i 0 1 2 m 问题是如何去估计f x 组限频数fi频率fi n积累频率124 5 129 510 01190 0119129 5 134 540 04760 0595134 5 139 5100 11910 1786139 5 144 5330 39290 5715144 5 149 5240 28570 8572149 5 154 590 10710 9524154 5 159 530 03571 3 在xoy平面上 从左自右依次做以 fi n 为高的小矩形 即得直方图 易见 这种小矩形的面积等于数据

9、落在该小区间的频率fi n 因频率近似于概率 因而一般来说每一个小区间上的小矩形面积接近于概率密度曲线之下该小区间上的曲边梯形的面积 故直方图的外廓曲线接近于总体x的概率密度曲线f x 从本例看 单峰对称 近似正态总体 作c2检验如下 检验假设 H0 x的概率密度为 按上式查标准分布表可得p Ai 的估计 如 例3的 2检验计算表 A1 x 129 510 00870 73A2 129 5 x 134 540 05194 36A3 134 5 x 139 5100 175214 72 4 721 51A4 139 5 x 144 5330 312026 216 791 76A5 145 5 x

10、 149 5240 281123 610 390 01A6 149 5 x 154 590 133611 22A7 154 5 x 30 03753 15 3 67 故在水平0 1下接受H0 即认为数据来自正态分布总体 二偏度 峰度检验 随机变量的偏度 峰度指的是x的标准化变量 的三阶中心矩和四阶中心矩 当随机变量x服从正态分布时 v1 0且v2 3 设x1 x2 xn是来自总体x的样本 则v1 v2的矩估计分别为 其中Bk k 2 3 4 是样本k阶中心矩 分别称g1 g2为样本偏度和样本峰度 若总体x为正态变量 则可证当n充分大时 近似地有 设x1 x2 xn是来自总体x的样本 现在来检验

11、假设H0 x为正态总体 当H0为真且n充分大时 近似地有u1 N 0 1 u2 N 0 1 由第六章知样本偏度g1 g2分别依概率收敛于总体偏度v1和总体峰度v2 因此当H0为真且n充分大时 一般来说 g1与v1 0的偏度不应太大 而g2与v2 3的偏离不应太大 故从直观来看当 u1 或 u2 过大时就拒绝H0 取显著水平为a H0的拒绝域为 u1 k1或 u2 k2 其中k1 k2由下式确定 即有k1 Za 4 k2 Za 4 于是拒绝域为 u1 Za 4或 u2 Za 4下面验证当n充分大时 上述检验近似满足显著性水平a的要求 事实上 n充分大时有 例4试用偏度 峰度检验法检验例3中的数据是否来自正态总体 取a 0 1 解检验假设H0 数据来自正态总体 0 1 n 84 2 3 6 n 1 2 27294 样本偏度和峰度为g1 0 1363 g2 3 0948 而za 4 z0 025 1 96 则拒绝域为 u1 g1 s1 1 96或 u2 g2 m2 s2 1 96 计算得 u1 0 5285 1 96 u2 0 3381 1 96故接受H0 认为数据来自正态分布总体

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号