第6章节假设检验课件

资源描述

《第6章节假设检验课件》由会员分享，可在线阅读，更多相关《第6章节假设检验课件（65页珍藏版）》请在金锄头文库上搜索。

1、第6章假设检验,6.1 假设检验的基本原理 6.2 总体均值的检验 6.3 总体比例的检验,学习目标,假设检验的基本原理。掌握假设检验的基本思想和假设检验中的一些基本问题，包括如何陈述假设、假设检验中的两类错误和显著性水平、检验统计量和拒绝域以及利用P值进行检验等。总体均值检验。掌握在大样本和小样本的条件下，对总体均值进行假设检验的程序。总体比例检验。掌握大样本情形下总体比例的检验方法。,导入案例,航空公司的售票超时了吗？航空公司服务规定，销售一张机票的平均时间为2分钟。为检验航空公司的售票服务质量，特抽验30名顾客购买机票所用时间组成的一个随机样本，下表是抽验的30个顾客的购买时间数

2、据,导入案例,根据样本数据计算的平均值是2.18分钟，标准差为0.41分钟。根据参数估计方法得到的顾客购买机票所用时间的95%的置信区间为（2.03，2.33）分钟。调查人员发现这个区间内并没有包括2分钟。因此提出航空公司的售票超时，没有达到规定的标准要求。我们能否根据这一样本断定航空公司的售票时间没有达标呢？本章的内容将提供一套标准统计程序来检验这样的结论。,6.1 假设检验的基本原理 6.1.1 假设检验的基本思想 6.1.2 原假设和备择假设及其提出 6.1.3 假设检验中的两类错误 6.1.4 显著性水平 6.1.5 检验统计量与拒绝域 6.1.6 利用P值进行决策,6.1.1 假设检

3、验的基本思想,基本思想:利用样本信息来对总体参数提出的一个假设值做出拒绝和不拒绝的决策。决策的依据: 小概率原理，是指概率很小的事件在一次试验中是不可能发生的。在一次试验中小概率事件一旦发生，我们就有理由拒绝原假设,假设（hypothesis）就是对总体参数的一种事先猜想，并将这种猜想的具体数值陈述出来，也称为称统计假设。假设检验（hypothesis test）就是对总体参数提出假设的基础上，利用样本信息来判断假设是否成立的一种统计方法。,原假设 (null hypothesis),又称“0假设”，研究者想收集证据予以反对的假设，用H0表示所表达的含义总是指参数没有变化或变量之间没有

4、关系最初被认为是成立的，之后根据样本数据确定是否有足够的证据拒绝它总是有符号 , 或 H0 ： = 某一数值 H0 ：某一数值 H0 ：某一数值例如, H0 ： 10cm,null,也称“研究假设”,研究者想收集证据予以支持的假设，用H1表示所表达的含义是总体参数发生了变化或变量之间有某种关系备择假设通常用于表达研究者自己倾向于支持的看法，然后就是想办法收集证据拒绝原假设，以支持备择假设总是有符号 , 或 H1 ：某一数值 H1 ：某一数值 H1 ：某一数值,备择假设 (alternative hypothesis),原假设和备择假设是一个完备事件组，而且相互对立在一项

5、假设检验中，原假设和备择假设有且只有一个成立先确定备择假设，再确定原假设等号“=”总是放在原假设上因研究目的不同，对同一问题可能提出不同的假设(也可能得出不同的结论),提出假设 (结论与建议),备择假设没有特定的方向性，并含有符号“”的假设检验，称为双侧检验或双尾检验(two-tailed test) 备择假设具有特定的方向性，并含有符号“”或“”，称为右侧检验,双侧检验与单侧检验,假设检验的基本形式,解：,【例6. 1】一种袋装酸奶采用自动生产线生产，每袋重量是150g，标准差为3g。为检验每袋重量是否符合要求，质检人员在某天生产的酸奶中随机抽取了50袋进行检验，试陈述用来检验生产过程

6、是否正常的原假设和备择假设。,（生产过程不正常）,（生产过程正常）,解：,【例6.2】一个生产宇航飞行器的工厂需要经常购置一种耐高温的零件，要求抗热的平均温度是1250度。在过去，供货者提供的产品都符合要求，并从大量的数据获知零件抗热的标准差是150 度，在最近的一批进货中随机测试了100个零件，其平均的抗热为1200 度，问能否接受这批产品？试陈述用于检验的原假设与备择假设。,（抗热性能达标，不拒绝采购）,（抗热性能没达标，拒绝采购）,（由于接打电话而造成交通事故的比例不超过30%）,【例6.3】一家研究机构估计，由于接打电话而造成交通事故的比例超过30%。为验证这一估计是否正确，该研究机

7、构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设。,（由于接打电话而造成交通事故的比例超过30%）,假设提出的主观性与研究目的,尽管通过原假设与备择假设的概念就能确定两个假设的内容，但实质上它们是带有一定的主观色彩的，因为所谓的“将研究者对总体参数值提出的假设”和“研究者通过检验希望支持的假设”显然最终仍都取决于研究者本人的意向。所以，在面对某一实际问题时，由于不同的研究者有不同的研究目的，即使对同一问题也可能提出截然相反的原假设和备择假设，这是十分正常的，也并不违背关于原假设与备择假设的最初定义。无论怎样确定假设的形式，只要它们符合研究者的最终目的，便是合理的。,6.1.3假设

8、检验中的两类错误,研究者总是希望能做出正确的决策，但由于决策是建立在样本信息的基础之上，而样本又是随机的，因而就有可能犯错误。原假设和备择假设不能同时成立，决策的结果要么拒绝H0，要么不拒绝H0。决策时总是希望当原假设正确时没有拒绝它，当原假设不正确时拒绝它，但实际上很难保证不犯错误第类错误(错误) 原假设为正确时拒绝原假设第类错误的概率记为，被称为显著性水平 4. 第类错误(错误) 原假设为错误时未拒绝原假设第类错误的概率记为(Beta),6.1.3 假设检验中的两类错误,法官判案的结论与后果,假设检验的结论与后果, 错误和错误的关系,你要同时减少两类错误的惟一办法是增加样本量

9、,和的关系就像翘翘板，小就大，大就小,两类错误的控制,一般来说，对于一个给定的样本，如果犯第类错误的代价比犯第类错误的代价相对较高，则将犯第类错误的概率定得低些较为合理；反之，如果犯第类错误的代价比犯第类错误的代价相对较低，则将犯第类错误的概率定得高些。一般来说，发生哪一类错误的后果更为严重，就应该首要控制哪类错误发生的概率。但由于犯第类错误的概率是可以由研究者控制的，因此在假设检验中，人们往往先控制第类错误的发生概率。,6.1.4 显著性水平,假设检验中犯第一类错误的概率，称为显著性水平（level of significance），记为，是人们事先指定的犯第一类错误概率的最大允许

10、值。显著性水平是指当原假设实际上是正确时，检验统计量出现了本不应该出现的极端情况的概率。显著性水平越小，犯第一类错误的可能性自然就越小，但犯第二类错误的可能性则随之增大。常用的显著性水平有=0.01、=0.05、=0.1 等，当然也可以取其他值，但一般不会大于0.1。,依据什么做出决策？,若假设为H0：=500，H1：500。样本均值为495，拒绝H0吗？样本均值为502，拒绝H0吗？做出拒绝或不拒绝原假设的依据是什么？传统上，做出决策所依据的是样本统计量，现代检验中人们直接使用由统计量算出的犯第类错误的概率，即所谓的P值,6.1.5 检验统计量与拒绝域,根据样本观测结果计算得到的，并

11、据以对原假设和备择假设做出决策的某个样本统计量，称为检验统计量（test statistic）。标准化检验统计量（standardized test statistic）反映了点估计量（比如样本均值）与假设的总体参数（比如假设的总体均值）相比相差多少个标准差。拒绝域（rejection region）就是由显著性水平和相应的临界值所围成的区域。根据给定的显著性水平确定的拒绝域的边界值，称为临界值（critical value）。,用统计量决策 (双侧检验 ),用统计量决策 (左侧检验 ),抽样分布,H0,临界值,a,拒绝H0,1 - ,置信水平,Region of Rejection,

12、Region of Nonrejection,用统计量决策 (右侧检验 ),抽样分布,H0,临界值,拒绝H0,1 - ,置信水平,Region of Nonrejection,Region of Rejection,统计量决策规则,给定显著性水平，并计算出其临界值将检验统计量的值与的临界值比较作出决策双侧检验：I统计量I 临界值，拒绝H0 左侧检验：统计量临界值，拒绝H0,6.1.6 利用P值进行决策,如果原假设H0为是正确的，所得到的样本结果会像实际观测结果那么极端或更极端的概率，称为P值（ P value），也称为观察到的显著性水平（observed significance l

13、evel）。决策规则：若p值, 拒绝 H0,用P值进行检验比根据统计量检验提供更多的信息统计量检验是我们事先给出的一个显著性水平，以此为标准进行决策，无法知道实际的显著性水平究竟是多少比如，根据统计量进行检验时，只要统计量的值落在拒绝域，我们拒绝原假设得出的结论都是一样的，即结果显著。但实际上，统计量落在拒绝域不同的地方，实际的显著性是不同的。比如，统计量落在临界值附近与落在远离临界值的地方，实际的显著性就有较大差异。而P值给出的是实际算出的显著水平，它告诉我们实际的显著性水平是多少,P 值决策与统计量的比较,P 值是用于确定是否拒绝原假设的另一个重要工具，它有效地补充了提供的关于检验可

14、靠性的有限信息。,假设检验结论的表述 (“显著”与“不显著”),当拒绝原假设时，我们称样本结果是统计上显著的。拒绝原假设时结论是清楚的当不拒绝原假设时，我们称样本结果是统计上不显著的不拒绝原假设时，并未给出明确的结论，不能说原假设是正确的，也不能说它不是正确的。,假设检验结论的表述 ( “不拒绝” 不等于“接受”),假设检验的目的在于试图找到证据拒绝原假设，而不在于证明什么是正确的。当没有足够证据拒绝原假设时，不采用“接受原假设”的表述，而采用“不拒绝原假设”的表述。“不拒绝”的表述实际上意为着并未给出明确的结论，我们没有说原假设正确，也没有说它不正确。 “接受”的说法有时会产生误导，

15、因为这种说法似乎暗示着原假设已经被证明是正确的了。但实事上，H0的真实值我们永远也无法知道，H0只是对总体真实值的一个假定值，由样本提供的信息也就自然无法证明它是否正确。,第一步: 提出原假设H0和备择假设H1；第二步：从总体中抽出一个随机样本；第三步：构造合适的统计量，根据样本观测数据计算出检验统计量值；第四步：确定检验的显著性水平，计算临界值，确定拒绝域；第五步：利用P值或利用临界值进行决策。其中P值决策既简单又精确，双侧检验若2P ,不拒绝原假设；若2P ,拒绝原假设。在单侧检验中，若P ，不拒绝原假设；若P ，则要拒绝原假设。,假设检验的具体步骤:,第6章假设检验,6.1

16、假设检验的基本原理 6.2 总体均值的检验 6.3 总体比例的检验,6.2 总体均值的检验 6.2.1 大样本总体均值的检验 6.2.2 小样本总体均值的检验,6.2.1 大样本总体均值的检验,1. 假定条件大样本(n30),对于双侧检验，对于给定的显著性水平，当| z |z /2 ，拒绝原假设，否则不拒绝原假设；利用P值决策时，若2P ，拒绝原假设，否则不拒绝原假设。,1. 假定条件大样本(n30),2. 使用z检验统计量 2 已知： 2 未知：,【例6.4】一种袋装酸奶采用自动生产线生产，每袋重量是150g，标准差为3g。为检验每袋重量是否符合要求，质检人员在某天生产的酸奶中随机抽取了50袋进行检验，测得每袋平均重量为150.4g。取显著性水平，检验该天生产的酸奶重量是否符合标准要

展开阅读全文