第6章节假设检验课件

上传人:E**** 文档编号:91101583 上传时间:2019-06-22 格式:PPT 页数:65 大小:1.39MB
返回 下载 相关 举报
第6章节假设检验课件_第1页
第1页 / 共65页
第6章节假设检验课件_第2页
第2页 / 共65页
第6章节假设检验课件_第3页
第3页 / 共65页
第6章节假设检验课件_第4页
第4页 / 共65页
第6章节假设检验课件_第5页
第5页 / 共65页
点击查看更多>>
资源描述

《第6章节假设检验课件》由会员分享,可在线阅读,更多相关《第6章节假设检验课件(65页珍藏版)》请在金锄头文库上搜索。

1、第6章 假设检验,6.1 假设检验的基本原理 6.2 总体均值的检验 6.3 总体比例的检验,学习目标,假设检验的基本原理。掌握假设检验的基本思想和假设检验中的一些基本问题,包括如何陈述假设、假设检验中的两类错误和显著性水平、检验统计量和拒绝域以及利用P值进行检验等。 总体均值检验。掌握在大样本和小样本的条件下,对总体均值进行假设检验的程序。 总体比例检验。掌握大样本情形下总体比例的检验方法。,导入案例,航空公司的售票超时了吗? 航空公司服务规定,销售一张机票的平均时间为2分钟。为检验航空公司的售票服务质量,特抽验30名顾客购买机票所用时间组成的一个随机样本,下表是抽验的30个顾客的购买时间数

2、据,导入案例,根据样本数据计算的平均值是2.18分钟,标准差为0.41分钟。根据参数估计方法得到的顾客购买机票所用时间的95%的置信区间为(2.03,2.33)分钟。调查人员发现这个区间内并没有包括2分钟。因此提出航空公司的售票超时,没有达到规定的标准要求。我们能否根据这一样本断定航空公司的售票时间没有达标呢?本章的内容将提供一套标准统计程序来检验这样的结论。,6.1 假设检验的基本原理 6.1.1 假设检验的基本思想 6.1.2 原假设和备择假设及其提出 6.1.3 假设检验中的两类错误 6.1.4 显著性水平 6.1.5 检验统计量与拒绝域 6.1.6 利用P值进行决策,6.1.1 假设检

3、验的基本思想,基本思想:利用样本信息 来对总体参数提出的一个假设值做出拒绝和不拒绝的决策。 决策的依据: 小概率原理,是指概率很小的事件在一次试验中是不可能发生的。在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设,假设(hypothesis)就是对总体参数的一种事先猜想,并将这种猜想的具体数值陈述出来,也称为称统计假设。 假设检验(hypothesis test)就是对总体参数提出假设的基础上,利用样本信息来判断假设是否成立的一种统计方法。,原假设 (null hypothesis),又称“0假设”,研究者想收集证据予以反对的假设,用H0表示 所表达的含义总是指参数没有变化或变量之间没有

4、关系 最初被认为是成立的,之后根据样本数据确定是否有足够的证据拒绝它 总是有符号 , 或 H0 : = 某一数值 H0 : 某一数值 H0 : 某一数值 例如, H0 : 10cm,null,也称“研究假设”,研究者想收集证据予以支持的假设,用H1表示 所表达的含义是总体参数发生了变化或变量之间有某种关系 备择假设通常用于表达研究者自己倾向于支持的看法,然后就是想办法收集证据拒绝原假设,以支持备择假设 总是有符号 , 或 H1 : 某一数值 H1 : 某一数值 H1 : 某一数值,备择假设 (alternative hypothesis),原假设和备择假设是一个完备事件组,而且相互对立 在一项

5、假设检验中,原假设和备择假设有且只有一个成立 先确定备择假设,再确定原假设 等号“=”总是放在原假设上 因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论),提出假设 (结论与建议),备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailed test) 备择假设具有特定的方向性,并含有符号“”或“”,称为右侧检验,双侧检验与单侧检验,假设检验的基本形式,解:,【例6. 1】一种袋装酸奶采用自动生产线生产,每袋重量是150g,标准差为3g。为检验每袋重量是否符合要求,质检人员在某天生产的酸奶中随机抽取了50袋进行检验,试陈述用来检验生产过程

6、是否正常的原假设和备择假设。,(生产过程不正常),(生产过程正常),解:,【例6.2】一个生产宇航飞行器的工厂需要经常购置一种耐高温的零件,要求抗热的平均温度是1250度 。在过去,供货者提供的产品都符合要求,并从大量的数据获知零件抗热的标准差是150 度,在最近的一批进货中随机测试了100个零件,其平均的抗热为1200 度,问能否接受这批产品?试陈述用于检验的原假设与备择假设。,(抗热性能达标,不拒绝采购),(抗热性能没达标,拒绝采购),(由于接打电话而造成交通事故的比例不超过30%),【例6.3】一家研究机构估计,由于接打电话而造成交通事故的比例超过30%。为验证这一估计是否正确,该研究机

7、构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设。,(由于接打电话而造成交通事故的比例超过30%),假设提出的主观性与研究目的,尽管通过原假设与备择假设的概念就能确定两个假设的内容,但实质上它们是带有一定的主观色彩的,因为所谓的“将研究者对总体参数值提出的假设”和“研究者通过检验希望支持的假设”显然最终仍都取决于研究者本人的意向。所以,在面对某一实际问题时,由于不同的研究者有不同的研究目的,即使对同一问题也可能提出截然相反的原假设和备择假设,这是十分正常的,也并不违背关于原假设与备择假设的最初定义。无论怎样确定假设的形式,只要它们符合研究者的最终目的,便是合理的。,6.1.3假设

8、检验中的两类错误,研究者总是希望能做出正确的决策,但由于决策是建立在样本信息的基础之上,而样本又是随机的,因而就有可能犯错误。 原假设和备择假设不能同时成立,决策的结果要么拒绝H0,要么不拒绝H0。决策时总是希望当原假设正确时没有拒绝它,当原假设不正确时拒绝它,但实际上很难保证不犯错误 第类错误(错误) 原假设为正确时拒绝原假设 第类错误的概率记为,被称为显著性水平 4. 第类错误(错误) 原假设为错误时未拒绝原假设 第类错误的概率记为(Beta),6.1.3 假设检验中的两类错误,法官判案的结论与后果,假设检验的结论与后果, 错误和 错误的关系,你要同时减少两类 错误的惟一办法 是增加样本量

9、,和 的关系就像翘翘板,小 就大, 大 就小,两类错误的控制,一般来说,对于一个给定的样本,如果犯第类错误的代价比犯第类错误的代价相对较高,则将犯第类错误的概率定得低些较为合理;反之,如果犯第类错误的代价比犯第类错误的代价相对较低,则将犯第类错误的概率定得高些。 一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于犯第类错误的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第类错误的发生概率。,6.1.4 显著性水平,假设检验中犯第一类错误的概率,称为显著性水平(level of significance),记为,是人们事先指定的犯第一类错误概率的最大允许

10、值。 显著性水平是指当原假设实际上是正确时,检验统计量出现了本不应该出现的极端情况的概率。显著性水平越小,犯第一类错误的可能性自然就越小,但犯第二类错误的可能性则随之增大。 常用的显著性水平有=0.01、=0.05、=0.1 等,当然也可以取其他值,但一般不会大于0.1。,依据什么做出决策?,若假设为H0:=500,H1:500。样本均值为495,拒绝H0吗?样本均值为502,拒绝H0吗? 做出拒绝或不拒绝原假设的依据是什么? 传统上,做出决策所依据的是样本统计量,现代检验中人们直接使用由统计量算出的犯第类错误的概率,即所谓的P值,6.1.5 检验统计量与拒绝域,根据样本观测结果计算得到的,并

11、据以对原假设和备择假设做出决策的某个样本统计量,称为检验统计量(test statistic)。 标准化检验统计量(standardized test statistic)反映了点估计量(比如样本均值)与假设的总体参数(比如假设的总体均值)相比相差多少个标准差。 拒绝域(rejection region)就是由显著性水平 和相应的临界值所围成的区域。 根据给定的显著性水平确定的拒绝域的边界值,称为临界值(critical value)。,用统计量决策 (双侧检验 ),用统计量决策 (左侧检验 ),抽样分布,H0,临界值,a,拒绝H0,1 - ,置信水平,Region of Rejection,

12、Region of Nonrejection,用统计量决策 (右侧检验 ),抽样分布,H0,临界值,拒绝H0,1 - ,置信水平,Region of Nonrejection,Region of Rejection,统计量决策规则,给定显著性水平,并计算出其临界值 将检验统计量的值与 的临界值比较 作出决策 双侧检验:I统计量I 临界值,拒绝H0 左侧检验:统计量 临界值,拒绝H0,6.1.6 利用P值进行决策,如果原假设H0为是正确的,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值( P value),也称为观察到的显著性水平(observed significance l

13、evel)。决策规则:若p值, 拒绝 H0,用P值进行检验比根据统计量检验提供更多的信息 统计量检验是我们事先给出的一个显著性水平,以此为标准进行决策,无法知道实际的显著性水平究竟是多少 比如,根据统计量进行检验时,只要统计量的值落在拒绝域,我们拒绝原假设得出的结论都是一样的,即结果显著。但实际上,统计量落在拒绝域不同的地方,实际的显著性是不同的。比如,统计量落在临界值附近与落在远离临界值的地方,实际的显著性就有较大差异。而P值给出的是实际算出的显著水平,它告诉我们实际的显著性水平是多少,P 值决策与统计量的比较,P 值是用于确定是否拒绝原假设的另一个重要工具,它有效地补充了 提供的关于检验可

14、靠性的有限信息。,假设检验结论的表述 (“显著”与“不显著”),当拒绝原假设时,我们称样本结果是统计上显著的。 拒绝原假设时结论是清楚的 当不拒绝原假设时,我们称样本结果是统计上不显著的 不拒绝原假设时,并未给出明确的结论,不能说原假设是正确的,也不能说它不是正确的。,假设检验结论的表述 ( “不拒绝” 不等于“接受”),假设检验的目的在于试图找到证据拒绝原假设,而不在于证明什么是正确的。 当没有足够证据拒绝原假设时,不采用“接受原假设”的表述,而采用“不拒绝原假设”的表述。“不拒绝”的表述实际上意为着并未给出明确的结论,我们没有说原假设正确,也没有说它不正确。 “接受”的说法有时会产生误导,

15、因为这种说法似乎暗示着原假设已经被证明是正确的了。但实事上,H0的真实值我们永远也无法知道,H0只是对总体真实值的一个假定值,由样本提供的信息也就自然无法证明它是否正确。,第一步: 提出原假设H0和备择假设H1; 第二步:从总体中抽出一个随机样本; 第三步:构造合适的统计量,根据样本观测数据计算出检验统计量值; 第四步:确定检验的显著性水平 ,计算临界值,确定拒绝域; 第五步:利用P值或利用临界值进行决策。其中P值决策既简单又精确,双侧检验若2P ,不拒绝原假设;若2P ,拒绝原假设。在单侧检验中,若P ,不拒绝原假设;若P ,则要拒绝原假设。,假设检验的具体步骤:,第6章 假设检验,6.1

16、假设检验的基本原理 6.2 总体均值的检验 6.3 总体比例的检验,6.2 总体均值的检验 6.2.1 大样本总体均值的检验 6.2.2 小样本总体均值的检验,6.2.1 大样本总体均值的检验,1. 假定条件 大样本(n30),对于双侧检验,对于给定的显著性水平 ,当| z |z /2 ,拒绝原假设,否则不拒绝原假设;利用P值决策时,若2P ,拒绝原假设,否则不拒绝原假设。,1. 假定条件 大样本(n30),2. 使用z检验统计量 2 已知: 2 未知:,【例6.4】一种袋装酸奶采用自动生产线生产,每袋重量是150g,标准差为3g。为检验每袋重量是否符合要求,质检人员在某天生产的酸奶中随机抽取了50袋进行检验,测得每袋平均重量为150.4g。取显著性水平 ,检验该天生产的酸奶重量是否符合标准要

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号