第四章参数的假设检验 06.5.13.doc

上传人:pu****.1 文档编号:547460217 上传时间:2022-12-16 格式:DOC 页数:19 大小:1.68MB
返回 下载 相关 举报
第四章参数的假设检验 06.5.13.doc_第1页
第1页 / 共19页
第四章参数的假设检验 06.5.13.doc_第2页
第2页 / 共19页
第四章参数的假设检验 06.5.13.doc_第3页
第3页 / 共19页
第四章参数的假设检验 06.5.13.doc_第4页
第4页 / 共19页
第四章参数的假设检验 06.5.13.doc_第5页
第5页 / 共19页
点击查看更多>>
资源描述

《第四章参数的假设检验 06.5.13.doc》由会员分享,可在线阅读,更多相关《第四章参数的假设检验 06.5.13.doc(19页珍藏版)》请在金锄头文库上搜索。

1、第四章 参数的假设检验上一章我们讨论了对总体中未知参数的估计方法。本章将介绍统计推断的另一类重要问题:参数的假设检验。假设检验是对有关总体分布的某个参数提出一个假设值,然后根据样本作出推断的理论和方法。20世纪初,随着大工业的发展,产品验收问题引起了统计界的重视。如买卖双方约定:一批产品的废品率不超过0.03时方可出厂。怎样从抽样检查中推断“废品率”,这一命题是否正确?这就是一个假设检验问题。第一节 假设检验的原理及步骤一、基本原理通过下面的例子来说明这一原理。某箱中白球和黑球总数为100,但不知白球和黑球各是多少。现在提出假设:箱中有99个白球。现在我们需要检验这一假设是否正确。若为真,那么

2、从箱中任取一球得白球的概率为0.99,得黑球的概率为0.01。现在我们随机抽取一球(样本)居然抽到黑球。因而自然使人们怀疑的正确性,从而拒绝,做出箱中白球不是99个的判断。判断依据:我们做出拒绝的判断的根据是什么?这就是“小概率事件原理”,因为小概率事件在一次试验中几乎是不可能发生的。在为真的条件下,抽到黑球的概率为0.01,这是一个小概率事件。在抽取一球的情况下抽得黑球这一小概率事件几乎是不可能出现的,而现在居然发生了。这不能不使人们怀疑原假设的正确性,故作出推断:拒绝。两类错误:按上述原则由样本推断总体可能要犯两类错误。第一类错误:我们称之为“弃真”的错误,即为真时我们却做出了拒绝的推断,

3、犯第一类错误的概率为(称为显著水平),即: 拒绝为真=第二类错误:我们称之为 “取伪”的错误,即为假时我们却做出了接受的推断,犯第二类错误的概率为,即: 接受为假=显著性水平是人们事先指定的第类错误概率的最大允许值。显著性水平越小,犯第类错误的可能性自然就越小,但犯第类错误的可能性则随之增大。实际应用中,显著性水平是我们事先给出的一个值,但究竟确定一个多大的显著性水平值合适呢?一般情况下,人们认为犯第类错误的后果更严重一些,因此通常会取一个较小的值。著名的英国统计学家著名的英国统计学家Ronald Fisher在他的研究中心把小概率的标准定为0.05,所以作为一个普遍适用的原则,人们通常选择显

4、著性水平为0.05或比0.05更小的概率。常用的显著性水平有=0.01,=0.05,=0.1等,当然也可以取其他值。确定了显著性水平就等于控制了第类错误的概率,但犯第类错误的概率却是不确定的。在拒绝原假设时,我们犯错误的概率不超过给定的显著性水平,但当样本观测显示没有充分的理由拒绝原假设时,我们也无法确切知道第类错误发生的概率。因此,在假设检验中我们采用“不拒绝”而不采用“接受”的表述方法,这种说法实质上并未给出明确结论,在多数场合下便避免了第二类错误发生的风险,因为“接受”所得结论可靠性将由第类错误的概率来测量,而的控制又相对复杂。由于是根据样本来推断总体,故这两类错误是不可能完全避免的。人

5、们自然希望犯这两类错误的概率和越小越好。理论上已经证明在样本容量固定的条件下,犯两类错误概率、不可能同时减小,要同时减小必须扩大样本容量。因此在给定样本容量n的前提下,往往先限制犯第一类错误的概率,即给出一个较小的数再来考虑如何减小犯第二类错误的概率。在和固定的前提下,能使达到最小的检验法称为最优检验。寻找最优检验已超出本书的范围,我们不再进行讨论。下面所介绍的检验法都是最优(或近似最优)的检验方法。二、假设检验的步骤假设检验一般先对总体分布的某些参数或分布形式提出某种假设。然后抽取样本,根据样本提供的信息对所提出的假设的正确性做出判断。我们仍通过一例来说明步骤。例1 根据长期经验和资料分析,

6、某砖厂生产的砖的“抗断强度”服从正态分 布,方差为。今从该厂产品中随机抽取6块,测得抗断强度如下(单位:kg/cm):32.56, 29.66, 31.64, 30.00, 31.87,31.03试问这批砖的平均抗断强度为32.50 kg/cm是否成立?(=0.05)根据题意可知已知,问题是要回答:=32.50还是32.50分四步来解决这一问题。第一步:根据实际问题的要求提出假设:这里称为原假设,称为备择假设。然后根据样本提供的信息来判断是接受假设还是拒绝假设。第二步:为检验假设是否正确,提出检验统计量对这一类假设检验问题,根据第章三抽样分布定理,当为真时有,由于已知于是有我们采用:为检验统计

7、量第三步:根据拒绝为真= 确定拒绝域。当为真时,对于给定的显著性水平(01),有 我们称为拒绝域, 称为拒绝域的临界值。第四步:根据样本观察值做出判断,拒绝还是接受事实上=0.05事件是小概率事件,其概率为,在一次抽样中该事件不应该发生。当我们将样本观察代入(这里,)得到的观察值。若,说明在一次抽样中小概率事件发生了,因而我们有理由怀疑的正确性,于是做出判断拒绝。若,则没有理由拒绝,因此只能做出判断接受。在本例中通过计算,对=0.05查标准正态分布表得临界值于是的值落在拒绝域内,故拒绝,即认为这批砖的平均抗断强度不是32.50kg/cm.三、双侧检验和单侧检验(或称双尾检验和单尾检验)定义 4

8、.1 通常将研究者想收集证据予以支持的假设称为备择假设(alternative hypothesis),用表示。定义4.2 通常将研究者想收集证据予以反对的假设称为原假设(null hypothesis),或称零假设,用表示。类似例1中的假设检验问题,称对 :;的假设检验为双侧假设检验有时我们仅仅关心均值是否增大。例如试验新工艺以提高材料的强度,这时所考虑的均值银改越大越好。如果我们能判断在新工艺下总体均值较以往正常生产的大,则可以考虑采用新工艺,此时我们需要检验假设: : : 称这种检验为右侧检验,类似地有时我们需要检验假设: : : 称这种检验为左侧检验,右侧检验和左侧检验统称单侧检验。如

9、何设置原假设和备择假设:确定原假设和备择假设在假设检验中十分重要,它直接关系到检验的结论。下面通过几个例子来说明原假设和备择假设的建立方法。例2 一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量检测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设。解 设这台机床生产的所有零件平均直径的真值为。如果=10表明生产过程正常,如果10或10,则表明机床的生产过程不正常,研究者要检测这两种可能情况中的任何一种。根据原假设和备择假设的定义,研究者想

10、收集证据予以证明的假设应该是“生产过程不正常”,因为如果研究者事先认为生产过程正常,他也就没有必要去进行检验了。所以建立的原假设和备择假设应为 :10 , :10例3 某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500g。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设。解 设该品牌洗涤剂平均净含量的真值为。如果抽检的结果发现500,则表明该产品说明书中关于其净含量的内容是不真实的,有关部门应对其采取相应的措施。一般来说,研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述,因为这会损害消费者

11、的利益,如果研究者对产品说明丝毫没有质疑,也就没有抽检的必要了。所以500是研究者想要收集证据支持的观点。建立的原假设与备择假设应为:500(净含量符合说明书); :500(净含量不符合说明书)。例4 一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设。解 设该城市中家庭拥有汽车的比例真值为。显然,研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%。因此建立的原假设与备择假设应为 : 30% (家庭拥有汽车的比例不超过30%) : 30% (家庭拥有汽车的比例超过30%)通过

12、上面几个例子我们可以得到建立假设的如下几点认识: 原假设和备择假设是一个完备事件组,而且相互对立。这意味着,在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立。在建立假设时,通常是先确定备择假设,然后再确定原假设。这样做的原因是备择假设是我们所关心的,是想予以支持或证实的,因而比较清楚,容易确定。由于原假设和备择假设是对立的,只要确定了备择假设,原假设就很容易确定下来。在假设检验中,等号“=”总是放在原假设上。比如设假设的总体真值为,原假设总是:=,:或:。而相应的备择假设则为:,:或:。将符号“=”放在原假设上是因为我们向涵盖备择假设不出现的所有情况。假设检验也可以在原假设中只

13、写“=”,所以也可以将上面的例4写成 :=30%。因为我们感兴趣的备择假设是:30%。如果你作出拒绝原假设 : =30% 而倾向于备择假设:30%的决策,同样也就意味着你拒绝了:30%。换句话说,如果事实上备择假设不正确的话,:=30%就代表了可能有的最坏情况。这样,为数学表述上的方便,我们就将与对立的所有可能情况放进只含一个等号的原假设中。下边我们讨论单侧检验问题的拒绝域例5 某工厂生产的固体燃料推进器的燃烧率 =40cm/s, =2cm/s.现采用新方法生产了一批推进器,从中随机抽取=25只,测得燃烧率的样本均值为=41.25cm/s。设在新方法下,总体均方差仍然为2cm/s,问这批推进器

14、的燃烧率是否较以往生产的推进器的燃烧率有显著提高?(=0.05)解 (1)提出假设: :; : 这是右侧检验问题。 (2)提出检验统计量:对上述问题由于已知,我们采用检验统计量 (3)确定拒绝域: 对于显著性水平=0.05,当为真时有得到拒绝域为,。 (4)根据样本观察值作出判断: 查表得 的值落在拒绝域中,所以在显著性水平=0.05下拒绝,即认为这批推进器的燃烧率较以往生产的有显著提高。类似上边的讨论,对左侧检验问题: : : 根据, 拒绝域为 第二节 一个正态总体均值与方差的假设检验在对总体均值进行假设检验时,采用什么检验步骤和检验统计量取决于我们所抽取的样本是大样本(n30)还是小样本(

15、n30),此外还需要区分总体是否服从正态分布、总体方差是否已知等几种情况。下面我们讨论正态总体无论样本大小的情况和非正态总体大样本的情况。一、一个正态总体均值的检验(无论样本大小)设总体,为来自总体的样本观察值,给定显著性水平,检验假设::; : 双侧检验 (4.1)或 : : 右侧检验 (4.2)或 : : 左侧检验 (4.3)1. 已知时均值的检验根据第一节的讨论,当 已知时,(4.1)(4.2)(4.3)的检验,当为真时采用统计量 并有: 分别得到如下拒绝域如下: (4.1)拒绝域:(4.2)拒绝域: (4.3)拒绝域: 根据样本观察值通过计算得到的观察值,若落入拒绝域,则拒绝,反之则接受。以上检验法称

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号