7.4 似然比检验与分布拟合检验

上传人:小** 文档编号:84763558 上传时间:2019-03-04 格式:PPT 页数:51 大小:882.50KB
返回 下载 相关 举报
7.4 似然比检验与分布拟合检验_第1页
第1页 / 共51页
7.4 似然比检验与分布拟合检验_第2页
第2页 / 共51页
7.4 似然比检验与分布拟合检验_第3页
第3页 / 共51页
7.4 似然比检验与分布拟合检验_第4页
第4页 / 共51页
7.4 似然比检验与分布拟合检验_第5页
第5页 / 共51页
点击查看更多>>
资源描述

《7.4 似然比检验与分布拟合检验》由会员分享,可在线阅读,更多相关《7.4 似然比检验与分布拟合检验(51页珍藏版)》请在金锄头文库上搜索。

1、第七章 假设检验,7.1 假设检验的基本思想与概念 7.2 正态总体参数假设检验 7.3 其它分布参数的假设检验 7.4 似然比检验与分布拟合检验 7.5 正态性检验,7.4 似然比检验与分布拟合检验,7.4.1 似然比检验,设 是来自密度函数(或分布率),为 的总体的简单样本,,考虑检验,问题:,一个比较直观且自然方法是考虑似然比,当 较大时,拒绝原假设 ,,这种检验方法称为似然比检验。,例1,对正态总体,方差已知,检验问题,似然比为,否则,接受 ,,令,则,因为 均已知且 ,,拒绝域为,的单调增函数,故由等式,所以 是,可得 。,这样检验统计量可取为,这是通常的单边 检验。,对一般的假设检

2、验问题,检验的拒绝域为,定义似然比检验统计量为,其中临界值 可由,确定。,下面也通过例子说明其具体应用。,似然比,对正态总体,方差未知,检验问题,这里,当 未知时,其极大似然估计分别为,当 已知时, 极大似然估计为,所以似然比为,若令 ,,则,当 成立时,,且 是 单调增函数,因此由,可得临界值为,这样检验统计量为,拒绝域为,当 成立时,,且 是 单调增函数,因此由,当然也可令,,则,这是通常的双边 检验。,拒绝域为,这样检验统计量也可以为,可得临界值为,可以证明这时的 检验和 检验是等价的。,从上述两个例子可得求似然比检验的一般步骤:,(1),在 内求 的极大似然估计 ,,在 内求 的极大似

3、然估计,增函数时,由 求临界值,(2),计算并化简,使成形式 ,,满足两个要求,,是 的单调增函数或单调减函数;,当 成立时, 的分布完全已知。,(3),减函数时,由 求临界值,(4),检验统计量取为,增函数时,拒绝域为,减函数时,拒绝域为,其一:,其二:,注:,(1),正态总体下参数的检验基本都是似然比检验,(2),似然比检验可用于检验样本来自两个不同类,型分布之一,,样本来自正态总体族,样本来自双参数指数分布族,其中,如,(3),似然比检验适应面广,,(4),一般情形下,,难获得,,总体均可以构造,,且构造的检验常具有一,些优良性质,,如在某种意义下具有最有性。,因此临界值的求法有两种。,

4、其一,,利用Monte-Carlo模拟计算;,其二,,当样本,容量 很大时,,利用似然比统计量的极限,分布近似给出。,正态总体和非正态,似然比统计量的精确分布很,先考虑总体分布只取有限个值的情况,设总体X 可以分成k 类,记为 ,现对该总体作了n 次观测,k 个类出现的频数分别为:,检验如下假设:,n1,nk , 且,其中诸,且,7.4.2 分布拟合检验,一 总体分布离散情况,在之前的比例问题的假设检验中,对于大样本的数据,1、诸 pi 均已知时,对于比例问题:P(X=1)=p,P(X=0)=1p 假设检验: H0:p=p0;H1:pp0。 样本统计:1的频数为k,0的频数为nk。,我们有,从

5、二项分布(01数据)的情形入手,与之对应地, 我们有如下等价的检验统计量,注意到,即,也可以写成:,该检验的检验统计量及其分布:,再考虑更一般的情形,对于多项分布问题:,假设检验:,数据结构:,英国统计学家K.Pearson提出如下检验统计量:,在近似计算方面,尽可能要求所有观测频数Oi5, 容许个别为3或4;否则,对某些类进行合并。,(7.4.2),并证明在H0 成立时对充分大的n, (7.4.2) 给出的检验统计量近似服从自由度为k-1的 分布。,如果H0 成立,则对每一类Ai,其频率ni /n与概率pi 应较接近。即观测频数ni 与理论频数npi 应相差不大。,反之,若观测频数ni 与理

6、论频数npi 相差较大,则应 拒绝原假设。,据此,我们可以得到如下的拒绝域形式,拒绝域为:,例7.4.1 为募集社会福利基金,某地方政府发 行福利彩票,中彩者用摇大转盘的方法确定 最后中奖金额。大转盘均分为20份,其中金 额为5万、10万、20万、30万、50万、100万 的分别占2份、4份、6份、4份、2份、2份。 假定大转盘是均匀的,则每一点朝下是等可 能的,于是摇出各个奖项的概率如下:,现20人参加摇奖,摇得5万、10万、20万、30万、50万和100万的人数分别为2、6、6、3、3、0,由于没有一个人摇到100万,于是有人怀疑大转盘是不均匀的,那么该怀疑是否成立呢?这就需要对转盘的均匀

7、性作检验。,解:这是一个典型的分布拟合优度检验,总体 共有6类,其发生概率分别为0.1、0.2、0.3、 0.2、0.1和0.1,选用如下卡方检验统计量,检验拒绝域为:,这里k=6,,由本例数据可以算出,若取 =0.05,则查附表3知,=,由于 未落入拒绝域,故接受原假设,,没有理由认为转盘不均匀。,本例中,以T 记服从 的随机变量,则使用统计软件可以算出,这个p 值就反映了数据与假设的分布拟合程度的高低,p 值越大,拟合越好。,在分布拟合检验中使用p 值也是方便的。,2、诸 pi 不完全已知时,若诸 由r (rk)个未知参数 确定,即,首先给出 的极大似然估计 然后给出诸 的极大似然估计 F

8、isher证明了,在H0成立时近似服从自由度,为k-r-1的 分布,于是检验拒绝域为,例7.4.2 卢瑟福在2608个等时间间隔内观测一 枚放射性物质放射的粒子数X,表7.4.1是观测 结果的汇总,其中ni表示2608次观测中放射粒 子数为i的次数。,试利用该组数据检验该放射物质在单位时间内放射出的粒子数是否服从泊松分布。,解:本例中,要检验总体是否服从泊松分布。,观测到 0, 1, , 11 共 12 个不同取值,这相当于把总体分成k=12类。这里有一个未知参数 ,采用极大似然估计,,将 代入可以估计出诸 。 选用检验统计量,列表如下。,若取 =0.05,则,本例中 =12.896718.3

9、07,故接受原假设。,拒绝域为,使用统计软件可以计算出此处检验的p 值是0.2295。,自1965年1月1日至1971年2月9日共2231天中,全世界记录到里氏震级4级和4级以上地震共162次, 统计如下:,二、连续情形的离散化,我们通过一个例子来看怎么利用卡方拟合检验处理 连续总体的情形,例7.4.3,(X 表示相继两次地震间隔天数, Y 表示出现的频数),试检验相继两次地震间隔天数 X 服从指数分布.,由最大似然估计法得,因X 为连续型随机变量,将 X的可能取值区间分为k=9个互不重叠的子区间如下,解:,=163.5633,13.2192,例3的,拟合检验计算表,在 H0 为真的前提下,X

10、 的分布函数的估计为,故在水平 0.05 下接受 H0 ,认为样本服从指数分布.,有估计,概率,),(,i,i,A,P,p,=,Kolmogorov的D检验,当我们需要检验一组观测值是否来自某一已知总体时,,我们常采用所谓kolmogorov的D检验法。,假设检验:,这里 为一事先给定的完全已知的连续分布函数,检验统计量:,1933年kolmogorov证明了当 成立时,有,该极限与 无关。,该检验方法与连续情形的卡方检验方法相比要好, 灵敏度较高。,该检验方法只适用于总体理论分布 完全已知的情形,若总体理论分布含有未知参数,即为 的情形,,虽然我们也可以采用 的估计量 类似于前面作替换,,但

11、此时的kolmogorov的检验方法就不如卡方拟合检验了。,列联表是将观测数据按两个或更多属性 (定性变量) 分类时所列出的频数表。例如,对随机抽取的1000人按性别(男或女)及色觉(正常或色盲) 两个属性分类,得到如下二维列联表,又称22表或四格表。,7.4.2 列联表的独立性检验,一般,若总体中的个体可按两个属性A与B分类,A 有r 个类 ,B 有c个类 从总体中抽取大小为n的样本,设其中有 个个体既属于 类又属于 类, 称为频数,将rc个 排列为一个r行c列的二维列联表,简称rc表(表7.4.3)。,表7.4.3 rc列联表,列联表分析的基本问题是: 考察各属性之间有无关联,即判别两属性

12、是否独立。如在前例中,问题是:一个人是否色盲与其性别是否有关?在rc表中,若以 和 分别表示总体中的个体仅属于 ,仅属于 和同时属于 与 的概率,可得一个二维离散分布表(表7.4.4),则“A、B两属性独立”的假设可以表述为,表7.4.4 二维离散分布表,这就变为上一小节中诸 不完全已知时的分布拟合检验。这里诸 共有rc个参数,在原假设H0成立时,这rc个参数 由r+c个参数 和 决定。在这r+c后个参数中存在两个约束条件:,所以,此时 实际上由r+c-2个独立参数所确定。据此,检验统计量为,在H0成立时,上式服从自由度为rc-(r+c-2)-1的 分布。,其中诸 是在H0成立下得到的 的极大

13、似然估计,其表达式为,对给定的显著性水平 ,检验的拒绝域为:,例7.4.3 为研究儿童智力发展与营养的关系,某 研究机构调查了1436名儿童,得到如表7.4.5的 数据,试在显著性水平0.05下判断智力发展与 营养有无关系。,表7.4.5 儿童智力与营养的调查数据,解:用A表示营养状况,它有两个水平: 表示 营养良好, 表示营养不良;B表示儿童智商, 它有四个水平, 分别表示表中四种 情况。沿用前面的记号,首先建立假设 H0:营养状况与智商无关联,即A与B独立的。 统计表示如下:,在原假设H0成立下,我们可以计算诸参数的极大似然估计值:,进而可给出诸 ,如,其它结果见表7.4.6,表7.4.6 诸 的计算结果,由表7.4.5和表7.4.6可以计算检验统计量的值,此处r=2,c=4,(r-1)(c-1)=3,若取 =0.05 ,查表有 ,由于19.27857.815,故拒绝原假设,认为营养状况对智商有影响。 本例中检验的p 值为0.0002。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号