第六章假设检验

上传人:豆浆 文档编号:48239991 上传时间:2018-07-12 格式:PPTX 页数:51 大小:329.85KB
返回 下载 相关 举报
第六章假设检验_第1页
第1页 / 共51页
第六章假设检验_第2页
第2页 / 共51页
第六章假设检验_第3页
第3页 / 共51页
第六章假设检验_第4页
第4页 / 共51页
第六章假设检验_第5页
第5页 / 共51页
点击查看更多>>
资源描述

《第六章假设检验》由会员分享,可在线阅读,更多相关《第六章假设检验(51页珍藏版)》请在金锄头文库上搜索。

1、统计学原理统计学原理第六章 假设检验第一节第一节 假设检验概述假设检验概述2一、假设检验的基本概念假设检验是统计推断的另一种方式,它与区间估 计的差别主要在于:区间估计是用给定的大概率 推断出总体参数的范围,而假设检验是以小概率 为标准,对总体的状况所做出的假设进行判断。 假设检验与区间估计结合起来,构成完整的统计 推断内容。假设检验分为两类:一类是参数假设 检验,另一类是非参数假设检验。本章分别讨论 这两类检验方法。 3假设检验是一种推理,特点: 1.用反证法思想,为了检验 是否成立,先假定 此假设是成立的,再看由此会产生什么后果。若 导致一个不合理现象出现,表明原假设不正确, 拒绝 。 2

2、.区别于数学中反证法,这里所谓“不合理”,并 不是形式逻辑中的绝对的矛盾,是基于人们在实 践中广泛应用的小概率原理。小概率原理:即指概率很小的事件在一次试验中 实际上不可能出现。这种事件称为“实际不可能 事件”。 4例1:消费者协会接到消费者投诉,指控品牌纸包 装饮料存在容量不足,有欺骗消费者之嫌。包装 上标明的容量为250毫升。消费者协会从市场上随 机抽取50盒该品牌纸包装饮品,测试发现平均含 量为248毫升,小于250毫升。这是生产中正常的 波动,还是厂商的有意行为?消费者协会能否根 据该样本数据,判定饮料厂商欺骗了消费者呢?5消费者协会实际要进行的是一项统计检验工 作。检验总体平均 =2

3、50是否成立。这就是一 个原假设(null hypothesis),通常用 表示 ,即: : =2506与原假设对立的是备选假设(alternative hypothesis) ,备选假设是在原假设被否定 时另一种可能成立的结论。备选假设比原假设 还重要,这要由实际问题来确定,一般把期望 出现的结论作为备选假设。 7构造一个统计量来决定是“接受原假设,拒绝 备选假设”,还是“拒绝原假设,接受备选假 设”。对不同的问题,要选择不同的检验统计 量。检验统计量确定后,就要利用该统计的分 布以及由实际问题中所确定的显著性水平,来 进一步确定检验统计量拒绝原假设的取值范围 ,即拒绝域。在给定的显著性水平

4、下,检验 统计量的可能取值范围被分成两部分:小概率 区域与大概率区域。小概率区域就是概率不超 过显著性水平的区域,是原假设的拒绝区域 ;大概率区域是概率为1-的区域,是原假设 的接受区域。 8一般步骤:一般步骤:依据实际问题,建立原假设 和备选假设确定检验统计量,确定该统计量的抽样分布给定显著性水平,查表得临界值,因此确定拒 绝 的区间范围(拒绝域)据样本观察值计算统计量,做出决策是接受原假设 ,还是拒绝原假设9二、两种类型的错误二、两种类型的错误 10接受拒绝真实判断正确弃真错误(第一 类错误或错误 ) 不真实取伪错误(第二类 错误或错误) 判断正确 越大,就也有可能犯第I类错误,即越有可能

5、否定真实 的原假设。 越大,就越有可能犯第II类错误,即越有可能接受非 真的原假设。我们希望犯这两类错误的概率都尽可能小,但在一定样本 容量下,减少 会引起 增大,减少 会引起 增大。在假设检验中,我们一般事先规定允许犯第I类错误的概 率 ,然后尽量减少犯第II类错误的概率 。11三、检验功效三、检验功效* *在犯第一类错误概率得到控制的条件下,犯取伪 错误的概率也要尽可能地小,或者说,不取伪的 概率1-应尽可能增大。1-越大,意味着当原 假设不真实时,检验判断出原假设不真实的概率 越大,检验的判别能力就越好;1-越小,意味 着当原假设不真实时,检验结论判断出原假设不 真实的概率越小,即犯“纳

6、伪”错误的可能性很 大,检验的判别能力就越差。可见1-是反映统 计检验判别能力大小的重要标志,我们称之为检 验功效或检验力。12一、单侧检验与双侧检验13/21/2-Z/2 Z/2Z 0 0 Z双侧检验左侧检验右侧检验用单侧检验还是双侧检验,使用左侧检验还是 右侧检验,决定于备选假设中的不等式形式与 方向。与“不相等”对应的是双侧检验,与“ 小于”相对应的是左侧检验,与“大于”相对 应的是右侧检验。 14第二节第二节 总体参数检验总体参数检验15双侧检验双侧检验当H0: ;H1: 时,就必须用双侧检验 ,其目的是观察在规定的显著性水平下所抽取 的样本统计量是否显著地高于或低于假设的总 体参数。

7、标准正态曲线下两个尾部面积各占 ,这样就 有了两个拒绝区域。如果样本统计量落在这两 个区域内,就拒绝原假设。注意:在双侧检验 中差距是不分正负的。16双侧检验的接受区域和拒绝区域双侧检验的接受区域和拒绝区域17单侧检验单侧检验单侧检验分为左侧检验和右侧检验两种,它们 都只有一个拒绝域左侧检验一般,若假设为H0: ,H1: 就用左侧 检验 右侧检验若假设为H0: ,H1: 就用右侧检验18二、总体平均数检验二、总体平均数检验参数检验都是先对样本所属总体的性质作出若 干的假定,或对总体的分布形状加以限定,然 后对总体的有关参数情况进行统计假设检验。 因此,参数检验又称为限定分布检验。如在总 体服从

8、正态分布条件下,对其均值进行检验。 下面通过具体例子来说明参数检验方法。19(一)总体标准差已知(一)总体标准差已知 在例1中,按历史资料,总体的标准差是4毫 升。我们通过检验总体均值是否等于250毫升, 来判断饮料厂商是否欺骗了消费者。程序如下 : 20第一步:确定原假设与备选假设。 : =250; : 1.645。27第四步:计算样本统计量第五步:由于计算的样本统计量z1.645,所以拒绝 原假设,说明该类型的电子元件的使用寿命确实有所 提高。28(二)总体标准差未知(二)总体标准差未知 总体标准差未知时对总体均值检验经常用t统 计量:但是,在大样本场合(样本容量n大于30时),t -统计

9、量与标准正态分布统计量近似,通常用z 检验代替t检验。29例3:某糖果生产基地,生产的标准是每袋糖果 的净重500克,今从一批产品中抽取10袋,实际 测定糖果的平均净重为500.7克,样本标准差为 6.601克。给定显著性水平0.01,试问该批糖果 的生产是否正常。30解:(1)建立假设(2)确定样本统计量及分布总体标准差未知,用样本标准差代替,使用t统计 量:(3)确定临界值,双侧检验,n=10,=0.01,查t 分布表得到 ,拒绝区域为31(4)计算样本统计量(5)判断,t=0.335在-3.25,3.25,所以不能拒 绝原假设,即在99%的可靠性下,可以认为该批生 产正常。32例4:接例

10、3,假定所要检验的是该批生产是否显 著的高于标准。解:此题变为右单侧检验。(1)建立假设(2)样本统计量同例3(3)确定临界值,属于单侧检验,n=10, =0.01,查t分布表得到 33(4)计算统计量,(5)t=0.335 30%。以上的备选假设是企业自我声明的结论,我们 希望该企业说的是实话。因此使用右侧检验。37第二步:构造z检验统计量。第三步:确定拒绝域。显著水平=0.05,查标准正态分布表得临界 值: =1.645,拒绝域是z1.645。38第四步:计算检验统计量的数值。样本成数P=220/600=0.37,总体假设的成数p =0.3,代入z检验统计量得:39第五步:判断。检验统计量

11、的样本取值z=3.51.645,落入拒 绝域。拒绝原假设,接受备选假设,认为样本 数据证明该企业声明属实。40四、四、P-P-值检验值检验一个假设检验问题的结论是简单的,给定显著性 水平,不是拒绝原假设,就是接受原假设,但是 有可能存在如下情况:在显著性水平=0.05时拒 绝了原假设,但在显著性水平=0.01下保留原假 设。因为降低显著性水平会导致拒绝域缩小,这 样原来落在=0.05的拒绝域中的检验统计量的观 察值有可能落在=0.01到接受域中。由此提出p- 值检验。 41p-值检验就是通过计算p-值,再将它与显著性水 平作比较,决定拒绝还是接受原假设。所谓p- 值就是拒绝原假设所需的最低显著

12、性水平。p-值 判断的原则是:如果p-值小于给定的显著性水平 ,则拒绝原假设;否则,接受原假设。或者, 更直观来说就是:如果p-值很小,拒绝原假设,p -值很大,接受原假设。请大家注意的是这里的p- 值是指概率,不要与成数指标相混淆。 42(一)z检验的p-值:检验统计量为z统计量的p-值计算公式, 表示检 验统计量的抽样数据,则p-值的计算方法如下:如果: , p-值= 如果: , p-值= 如果: , p-值= 43例6:利用p-值检验重新检验例1。解:第一、第二步与例1完全相同,故省略之。第三步:计算样本统计的数值。样本平均数 ,n=50,代入检验统计 量得: 44第四步:计算p-值。使

13、用左侧检验,p-值= 。查标准正态 分布表得:p-值= 1-F(3.54)/2 = (1-0.9996)/2 =0.0002第五步:判断。p-值小于给出的显著性水平(0.05),拒绝原假 设,接受备选假设,与例1的结论相同。45 例7:某国总统选举中,有位候选人几个月前支持率60%。近期一项调查,访问500人,发现他的 支持率变为55%。显著性水平取0.05,检验他的支 持率是否下降了?并用p-值方法进行检验。46解:(1)建立假设(2)构造检验统计量(3)确定拒绝域,左单侧检验,显著水平=0.05, 查标准正态分布表得临界值:- =-1.64547(4)计算检验统计量,P=55%(5)判断z

14、=-2.28-1.645,表明落入拒绝域,积极原假设, 说明该候选人的支持率已经下降了。48运用p-值方法:(1)-(3)同上,(4)计算p-值,由于左侧检验,(5)判断,p-值小于显著性水平0.05,没有 充分理由接受原假设,有足够的证据证明该候 选人的支持率已经下降了。与上述结论同 49(二)(二)T T检验的检验的P-P-值值与前者方法相同,区别在于进行t检验,其p-值查 t分布表,自由度是n-1。在大样本场合,此差别 可以不存在,因为此时t分布与标准正态分布近 似。50P-P-值检验一般步骤:值检验一般步骤:(1)建立原假设与备选假设;(2)确定检验统计量及其分布;(3)将样本观察值带入检验统计量计算其样本数 值;(4)计算p-值;(5)将p-值与显著性水平比较,作出判断。51

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号