统计学第8章节假设检验课件

上传人:E**** 文档编号:91154455 上传时间:2019-06-26 格式:PPT 页数:143 大小:1.50MB
返回 下载 相关 举报
统计学第8章节假设检验课件_第1页
第1页 / 共143页
统计学第8章节假设检验课件_第2页
第2页 / 共143页
统计学第8章节假设检验课件_第3页
第3页 / 共143页
统计学第8章节假设检验课件_第4页
第4页 / 共143页
统计学第8章节假设检验课件_第5页
第5页 / 共143页
点击查看更多>>
资源描述

《统计学第8章节假设检验课件》由会员分享,可在线阅读,更多相关《统计学第8章节假设检验课件(143页珍藏版)》请在金锄头文库上搜索。

1、第8章 假设检验,假设检验的一般问题 一个总体参数的假设检验 两个总体参数的假设检验 单因素方差分析多个总体均值的比较,假设:在统计学中,假设是需要通过样本资料去推断总体是否正确的一个命题。这个命题是对总体,不是样本。 假设检验:对总体的分布函数或某种数量特征作出某种假设,然后抽出样本,构建适当的统计量,利用小概率事件的原理,在一定概率把握程度下,检验我们的假设是否合理,从而作出接受或拒绝这个假设的结论。,没有信誉就没有生存读者2002.7P.28,有一名我们的德国留学生,毕业时成绩优异,求职时拜访过许多大公司,都被拒绝了。他收起高材生的架子到一家小公司,也被礼貌地拒绝了。他忍无可忍,终于拍案

2、而起,:“你们这是种族歧视,我要控告”。 对方从档案袋里抽出一张纸,记录的是他乘公共汽车曾经被抓住过3次逃票。 他很惊讶,也更气愤:原来就是因为这么点鸡毛蒜皮的小事,小题大做。,没有信誉就没有生存(续),讲述此故事的知名学者说,德国抽查逃票一般被查住的几率是万分之 3 。 这为高材生居然被抓住 3 次,在严肃严谨的德国人看来,大概那是永远不可饶恕的。,根据记录,我认为 不能相信你是诚实的,实际中的假设检验问题,产品自动生产线工作是否正常; 某种新生产方法是否会降低产品成本; 治疗某疾病的新药是否比旧药疗效更高; 厂商声称产品质量符合标准,是否可信; 学生考试成绩是否服从正态分布, 假设检验事先

3、作出关于总体参数、分布形式、相互关系等的命题,然后通过样本信息来判断该命题是否成立。可分为: 参数检验(限定分布检验)和非参数检验(自由分布检验) 。,假设检验的过程 (提出假设获取样本信息作出决策),一、假设检验的基本思想 二、假设检验的步骤 三、两类错误,8.1 假设检验的基本概念,8.1.1假设检验的基本思想,例1. 从1000件产品中抽出10件,有4件次品,问这批产品能否出厂(=整批产品的次品率P是否低于4% )? 提出假设:P4%,假设检验的基本思想(续),决策思路: 如果这一假设成立,则根据二项分布理论可算得:出现所抽样本的概率小于1 即在次品率为4%的总体中抽出10件产品就有4件

4、次品的概率小于1 。 这种可能性极小,但在一次抽样中发生了,显然不合理。 这种不合理性源于推论的假设前提,故上述假设不能接受。即这批产品不能出厂。,假设检验的基本思想(续),假设: =250,根据抽样分布理论,有:,上述假设前提下, =248 等价于 Z= -3.54,这是几乎肯定不可能出现的( “Z-3.54”的概率为0.0001)。然而但在一次抽样中它发生了,显然不合理(这表明原假设是不合理的)。,例1. 企业宣称产品平均容量=250ml,标准差=4ml。样本:n=50,平均容量=248。问:真实的平均容量=250 ?,假设检验的特点,采用逻辑上的反证法 先认为假设为真,观察在此前提下所抽

5、到样本的出现是否合理。若合理则判断假设可接受,反之拒绝假设。 判断是否合理的依据统计上的小概率原理 即这里的反证法是基于一定概率的反证法)。,假设检验中的小概率原理,小概率事件:发生概率很小的随机事件 小概率原理:小概率事件在一次试验(观察)中几乎不可能发生。 小概率原理在日常决策中广泛运用 什么样的概率才算小概率? 研究者事先确定(根据决策的风险或要求的把握程度来决定),没有统一的界定标准。 假设检验中把这个概率称为检验的 “显著性水平”。,基本思想(续),假设检验必须以有关的抽样分布理论为依据。,换个角度,从抽样误差范围来看这种差异的性质,8.1.2 假设检验的步骤,(一)提出原假设和备择

6、假设 (二)确定检验统计量及其分布 (三)规定显著性水平 (四)计算检验统计量的值及P值 (五)作出统计决策,(一)提出假设,包括原假设和备择假设。 原假设(Null Hypothesis)待检验的假设,也称为零假设,用 H0表示。 备择假设(Alternative Hypothesis )也称对立假设,与原假设内容完全相反的假设。准备在拒绝原假设后应接受的假设。用 H1表示。 事实上,对某个问题提出了原假设,也就同时给出了备择假设。,假设的三种形式:,严格地讲,单侧检验中原假设应该用“”或“”表示,且必须包括“”。但实际检验时,只取其边界值,该值能够拒绝,其它值更有理由拒绝。,怎样提出假设

7、(怎样提出原假设和备择假设?),(1) 明确所要检验的总体参数是什么 (2) 根据研究问题确定假设的形式(类型) 双侧:关心总体参数与某值有无差异。 单侧:关心总体参数是否比某值偏大或偏小(不仅在乎有无差异,也关心差异的方向),怎样提出假设(续),(3) 采用左侧还是右侧? (a) 本着“保守”或“不轻易拒绝 H0 ”的原则 H0 代表一种久以存在的状态,一般是理论设计或是以前大量资料所证明了的。而H1 反映反映一种改变,通常是样本资料所显示的与原假设相反的情况。,怎样提出假设(续),拒绝H0 时所犯错误的概率是受控制的、明确的、通常是很小的,说明H0 是受保护的,不至于轻易被否定。 H0 可

8、以是简单假设,H1往往是复合假设。若轻易否定了原假设而接受了备择假设,则对总体参数的具体数值仍然是模糊的。故一般不轻易否定原假设.,怎样提出假设(续),假设检验与对被告是否犯罪的审判很相似 原假设:被告是清白的无罪推定的原则 备择假设:被告是有罪的。 本着不轻易冤枉人的原则进行审判。 样本信息就象所获取的证据和证词。 当判有罪时,必须有充足的证据或理由;当证据不足时,只能判无罪或重新搜集新的证据。,怎样提出假设(续),有时还要顾及数学上的处理方便 当结论为拒绝原假设时,判断错误的可能性为很小而且很明确; 当接受(不能拒绝)原假设时,判断错误的可能性为不明确,也可能很大。 所以从检验结论的把握程

9、度看,希望能够否定原假设而支持备择假设。,怎样提出假设(续),(b) 检验某项声明的有效性 指导思想:除非我们有证据表明声明无效,否则就应认为此项声明是有效的 具体方法: 将所作出的声明(或承诺)作为 H0 先确立H0,再将相反的陈述(对该声明的质疑)作为 H1,例,例,某制造商宣称它所生产的产品的平均使用寿命在2000小时以上。对此进行假设检验,如何提出假设? 除非样本能提供证据表明使用寿命在2000小时以下,否则就应认为厂商的宣称是正确的 原假设与备择假设应为: H0: 2000, H1: 2000,怎样提出假设(续),(c) 把希望证明的假设作为备择假设 先确定备择假设,再将相反的命题作

10、为原假设H0 例如,改进生产工艺后,会使产品的平均成本降低到20元以下。 相应的原假设与备择假设应为: H0: 平均成本20 H1: 平均成本 20,怎样提出假设(续),(d)把样本显示的信息作为H1 先确定H1,再将相反的命题作为原假设H0 教材上的例题 统计软件计算P-值时一般自动把样本信息显示的方向作为H1的方向.,检验统计量是用于假设检验问题的统计量;检验统计量及其分布是假设检验的具体理论依据。 选择统计量的方法与参数估计相同: 是大样本还是小样本 总体方差已知还是未知 常用的检验统计量有:Z、t、卡方、F统计量等。如:,(二)确定检验统计量及其分布,是,n 30?,用Z统计量,否,总

11、体是否 近似正态,是,是否已知,是,用Z统 计量,否,用 估计,用t统计量,否,将样本容量增 加到n30,(三)规定显著性水平 ,显著性水平 原假设为真时,拒绝原假设的概率。 给定 了,也就确定了临界值 临界值原假设的拒绝区域与不能拒绝区域的分界点。 根据检验统计量的分布,给定的 查相应的概率分布表,即得临界值。 临界值还与检验形式(单双侧)有关. 如: 采用Z统计量时,=0.05对应的临界值Z0.05=1.645; Z0.025=1.96,双侧检验中的显著性水平与拒绝域,检验统计量,单侧检验中的显著性水平与拒绝域,抽样分布,a,(1 ),HO,临界值,(不能拒绝HO的区域),HO的拒绝区域,

12、检验统计量,(三)规定显著性水平 ,确定了显著性水平和临界值,也就等于建立了检验的具体规则。 由研究者根据具体情况事先确定,如 0.01, 0.05, 0.10,(四)计算检验统计量的值 根据样本资料计算出检验统计量的观测值。,(五)作出检验结论 将检验统计量的值与临界值进行比较,得出拒绝或不能拒绝原假设的结论。,双侧检验中的结论(1),检验统计量,双侧检验中的结论(2),检验统计量,单侧检验中的结论(1),抽样分布,a,(1 ),HO,临界值,检验统计量,单侧检验中的结论(2),抽样分布,a,(1 ),HO,临界值,检验统计量,8.1.3 假设检验中的两类错误,1.第一类错误( “弃真”或“

13、拒真” 错误) 原假设为真时拒绝原假设(例1,当产品本来合格时) 犯第一类错误的概率为 (即显著性水平) Prob (拒绝H0 / H0为真)= ,三、假设检验中的两类错误(续),2. 第二类错误(“取伪”或“采伪”错误) 原假设不真时未拒绝原假设 例如,产品销售方承诺次品率2%,这是假的。但买方检验时作出了信任卖方的错误判断 第二类错误的概率为 Prob(接受H0 / H0不真),决策结果与两类错误,两类错误的关系(右侧检验中),两类错误的关系(右侧检验中),a,0 1,拒绝域, 和 的关系,在检验中人们总希望犯两类错误的可能性都很小,然而,在其它条件不变的情况下, 和 不可能同时减小,就象

14、交易中买卖双方各自承担的风险一样。,控制,也就是主要控制第一类错误,一般说,哪一类错误带来的后果越严重、危害越大,就应该作为首要的控制目标. 在假设检验中,一般都首先控制第一类错误. 大家都遵守这个原则,讨论问题比较方便; 最主要的原因是:原假设是什么非常明确,而备择假设往往是模糊的。,确定时应考虑的因素,视两类错误所产生的后果轻重而定 当犯第一类错误的后果严重时,则希望尽可能不犯第一类错误,宁愿犯第二类错误,此时宜小。 当犯第二类错误的后果严重时,则希望尽可能不犯第二类错误,宁愿犯第一类错误,此时不宜太小 事前对原假设的信念 对原假设越有信心,则越小;反之则越大,影响 错误的因素,1. 显著

15、性水平 随 减少而增大 2. 总体参数的真值 随着总体参数的假设值与真实值的差异缩小而增大 3. 样本容量 n 随着 n 增大,检验统计量的分布曲线更集中,曲线尾端的面积 则减少。 4. 总体标准差 当 增大时 增大,8.2 一个总体参数的检验,8.2一个总体参数的检验,对正态总体均值的检验 一、总体方差已知时 z 检验法 二、总体方差未知时 t 检验法 对正态总体方差的检验 三、小样本时 卡方检验法,一、方差已知时对正态总体均值的检验z检验法,Z 检验法利用服从标准正态分布的 Z 统计量进行假设检验的方法。 对总体均值的 Z 检验,主要适用于: 若总体呈正态分布,且总体方差已知时; 若总体非正态分布, 但 n 30 时,可近似采用 Z 检验,8.2.1 一个总体均值的检验,一、方差已知时对正态总体均值的检验z 检验法,H0: ;H1: 根据抽样分布理论,总体方差已知时,对均值的检验统计量为: 临界值给定后,查标准正态分布表而得。 单侧检验时,临界值为 - Z 或 Z 双侧检验时,临界值为 - Z/2 和 Z/2,(一)双侧检验(例),例二 某企业生产一种零件,大量的历史资料表明,零件的平均长度为4厘米,标准差为0.02厘米。改企业改革生产工艺后,抽查了100个零件,其平均长度为3.948厘米。改革生产工艺后零件平均长度是否发生了显著变化

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号