应用统计学(第四版)第6章假设检验课件

资源描述

《应用统计学(第四版)第6章假设检验课件》由会员分享，可在线阅读，更多相关《应用统计学(第四版)第6章假设检验课件（137页珍藏版）》请在金锄头文库上搜索。

1、第6章假设检验,假设检验在统计方法中的地位,学习内容,6.1 假设检验的基本问题 6.2 一个总体参数的检验 6.3 两个总体参数的检验,学习目标,假设检验的基本思想和原理假设检验的步骤一个总体参数的检验两个总体参数的检验 P 值的计算与应用用Excel进行检验,6.1 假设检验的基本问题,6.1.1 假设的陈述 6.1.2 两类错误与显著性水平 6.1.3 统计量与拒绝域 6.1.4 利用P值进行决策,假设的陈述,什么是假设?(hypothesis), 对总体参数的具体数值所作的陈述总体参数包括总体均值、比例、方差等分析之前必须陈述,我认为这种新药的疗效比原有的药物更有效!,什

2、么是假设检验? (hypothesis test),先对总体的参数(或分布形式)提出某种假设，然后利用样本信息判断假设是否成立的过程有参数检验和非参数检验逻辑上运用反证法，统计上依据小概率原理,假设检验的基本思想,. 因此我们拒绝假设 = 50,样本均值,m,= 50,抽样分布,H0,假设检验的过程,原假设与备择假设,原假设(null hypothesis),研究者想收集证据予以反对的假设又称“0假设” 总是有符号 , 或 4.表示为 H0 H0 ： = 某一数值指定为符号 =，或例如, H0 ： 10cm,null,为什么叫 0 假设？,之所以用零来修饰原假设，其原因是原假设的内

3、容总是表示没有差异或没有改变，或变量间没有关系等等零假设总是一个与总体参数有关的问题，所以总是用希腊字母表示。关于样本统计量如样本均值或样本均值之差的零假设是没有意义的，因为样本统计量是已知的，当然能说出它们等于几或是否相等,也称“研究假设” 总是有符号 , 或表示为 H1 研究者想收集证据予以支持的假设 H1 ：某一数值，或某一数值例如, H1 ： 10cm，或 10cm,备择假设 (alternative hypothesis),【例】一种零件的生产标准是直径应为10cm，为对生产过程进行控制，质量监测人员定期对一台加工机床检查，确定这台机床生产的零件是否符合标准要求。如果零件的

4、平均直径大于或小于10cm，则表明生产过程不正常，必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设,提出假设 (例题分析),解：研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为： H0 ： 10cm H1 ： 10cm,【例】某品牌洗涤剂在它的产品说明书中声称：平均净含量不少于500g。从消费者的利益出发，有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设,提出假设 (例题分析),解：研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为 H0 ： 5

5、00 H1 ： 500,【例】一家研究机构估计，某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确，该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设,提出假设 (例题分析),解：研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”。建立的原假设和备择假设为 H0 ： 30% H1 ： 30%,原假设和备择假设是一个完备事件组，而且相互对立在一项假设检验中，原假设和备择假设必有一个成立，而且只有一个成立先确定备择假设，再确定原假设等号“=”总是放在原假设上因研究目的不同，对同一问题可能提出不同的假设(也可能得出不同的结论),提出假设 (

6、结论与建议),双侧检验与单侧检验,备择假设没有特定的方向性，并含有符号“”的假设检验，称为双侧检验或双尾检验(two-tailed test) 备择假设具有特定的方向性，并含有符号“”或“”，称为右侧检验,双侧检验与单侧检验,双侧检验与单侧检验 (假设的形式),以总体均值的检验为例,两类错误与显著性水平,假设检验中的两类错误,1.第类错误(弃真错误) 原假设为正确时拒绝原假设第类错误的概率记为被称为显著性水平 2.第类错误(取伪错误) 原假设为错误时未拒绝原假设第类错误的概率记为(Beta),H0: 无罪,假设检验中的两类错误 (决策结果),假设检验就好像一场审判过程,统计检验过程, 错

7、误和错误的关系,你要同时减少两类错误的惟一办法是增加样本容量!,和的关系就像翘翘板，小就大，大就小,两类错误的控制,一般来说，对于一个给定的样本，如果犯第类错误的代价比犯第类错误的代价相对较高，则将犯第类错误的概率定得低些较为合理；反之，如果犯第类错误的代价比犯第类错误的代价相对较低，则将犯第类错误的概率定得高些一般来说，发生哪一类错误的后果更为严重，就应该首要控制哪类错误发生的概率。但由于犯第类错误的概率是可以由研究者控制的，因此在假设检验中，人们往往先控制第类错误的发生概率,影响错误的因素,1.总体参数的真值随着假设的总体参数的减少而增大 2.显著性水平当减少时增大 3

8、.总体标准差当增大时增大 4.样本容量 n 当 n 减少时增大,检验能力(power of test),拒绝一个错误的原假设的能力根据的定义，是指没有拒绝一个错误的原假设的概率。这也就是说，1- 则是指拒绝一个错误的原假设的概率，这个概率被称为检验能力,也被称为检验的势或检验的功效(power) 可解释为正确地拒绝一个错误的原假设的概率,显著性水平 (significant level),1.是一个概率值 2.原假设为真时，拒绝原假设的概率抽样分布的拒绝域 3.表示为 (alpha) 常用的值有0.01, 0.05, 0.10 4.由研究者事先确定,我们可以在事先确定用于拒绝原假

9、设H0的证据必须强到何种程度。这等于说我们要求多小的P 值。而这个P 值就叫显著性水平，用表示显著性水平表示总体中某一类数据出现的经常程度假如我们选择=0.05，样本数据能拒绝原假设的证据要强到：当H0正确时，这种样本结果发生的频率不超过5%；如果我们选择=0.01，就是要求拒绝H0的证据要更强，这种样本结果发生的频率只有1% 如果P 值小于或等于,我们称该组数据不利于原假设的证据有显著性水平,显著性水平 (significant level),significant(显著的)一词的意义在这里并不是“重要的”，而是指“非偶然的” 在假设检验中，如果样本提供的证据拒绝原假设，我们说检验的结果

10、是显著的，如果不拒绝原假设，我们则说结果是不显著的一项检验在统计上是“显著的”，意思是指：这样的(样本)结果不是偶然得到的，或者说，不是靠机遇能够得到的拒绝原假设，表示这样的样本结果并不是偶然得到的；不拒绝原假设(拒绝原假设的证据不充分) ，则表示这样的样本结果只是偶然得到的,统计显著性 (significant),假设检验中的小概率原理, 什么小概率？ 1.在一次试验中，一个几乎不可能发生的事件发生的概率 2.在一次试验中小概率事件一旦发生，我们就有理由拒绝原假设 3.小概率由研究者事先确定,统计量与拒绝域,根据样本观测结果计算得到的，并据以对原假设和备择假设作出决策的某个样本统计量对

11、样本估计量的标准化结果原假设H0为真点估计量的抽样分布,检验统计量 (test statistic),标准化的检验统计量,显著性水平和拒绝域(双侧检验 ),显著性水平和拒绝域(双侧检验 ),显著性水平和拒绝域(双侧检验 ),显著性水平和拒绝域(双侧检验 ),显著性水平和拒绝域(单侧检验 ),显著性水平和拒绝域(左侧检验 ),显著性水平和拒绝域(左侧检验 ),显著性水平和拒绝域(右侧检验 ),显著性水平和拒绝域(右侧检验 ),决策规则,给定显著性水平，查表得出相应的临界值z或z/2， t或t/2 将检验统计量的值与水平的临界值进行比较作出决策双侧检验：|统计量| 临界值，拒绝H0 左侧

12、检验：统计量临界值，拒绝H0,利用 P 值进行决策,什么是P 值? (P-value),如果原假设为真，所得到的样本结果会像实际观测结果那么极端或更极端的概率 P值告诉我们：如果原假设是正确的话，我们得到得到目前这个样本数据的可能性有多大，如果这个可能性很小，就应该拒绝原假设被称为观察到的(或实测的)显著性水平决策规则：若p值, 拒绝 H0,双侧检验的P 值,左侧检验的P 值,右侧检验的P 值,原假设的可信度有多高？如果H0所代表的假设是人们多年来一直相信的，就需要很强的证据(小的P值)才能说服他们拒绝的结论是什么？如果拒绝H0而肯定H1 ，就需要有很强的证据显示要支持H1。比如，H

13、1代表要花很多钱把产品包装改换成另一种包装，你就要有很强的证据显示新包装一定会增加销售量(因为拒绝H0要花很高的成本),多大的P 值合适?,显著性检验的目的是要描述样本所提供不利于原假设的证据有多强。P值就在做这件事。但是，要证明原假设不正确，P值要多小，才能令人信服呢？这要根据两种情况来确定,有了P值，我们并不需要用5%或1%这类传统的显著性水平。P值提供了更多的信息，它让我们可以选择任意水平来评估结果是否具有统计上的显著性，从而可根据我们的需要来决定是否要拒绝原假设只要你认为这么大的P值就算是显著了，你就可以在这样的P值水平上拒绝原假设传统的显著性水平，如1%、5%、10%等等，已经被

14、人们普遍接受为“拒绝原假设足够证据”的标准，我们大概可以说：10%代表有“一些证据”不利于原假设；5%代表有“适度证据”不利于原假设；1%代表有“很强证据”不利于原假设,固定显著性水平是否有意义,用P值进行检验比根据统计量检验提供更多的信息统计量检验是我们事先给出的一个显著性水平，以此为标准进行决策，无法知道实际的显著性水平究竟是多少比如，根据统计量进行检验时，只要统计量的值落在拒绝域，我们拒绝原假设得出的结论都是一样的，即结果显著。但实际上，统计量落在拒绝域不同的地方，实际的显著性是不同的。比如，统计量落在临界值附近与落在远离临界值的地方，实际的显著性就有较大差异。而P值给出的是实际算出

15、的显著水平，它告诉我们实际的显著性水平是多少,P 值决策与统计量的比较,拒绝H0,P 值决策与统计量的比较,拒绝H0的两个统计量的不同显著性,Z,拒绝H0,0,统计量1,P1 值,统计量2,P2 值,拒绝H0,临界值,与其人为地把显著性水平固定按某一水平上，不如干脆选取检验统计量的P值与其大致知道犯第错误的概率，不如干脆知道一个确切的犯第类错误的概率(P值) 与其为选取“适当的”的而苦恼，不如干脆把真正的 (P值)算出来,P 值决策与统计量的比较 (结论),样本容量对检验结果的影响,投掷硬币1000次、4040次和10000次时出现正面样本比例的抽样分布,0.5,0.507,这个结果出乎预料

16、吗？,假设检验结论的表述,假设检验结论的表述(“显著”与“不显著”),当拒绝原假设时，我们称样本结果是统计上显著的拒绝原假设时结论是清楚的当不拒绝原假设时，我们称样本结果是统计上不显著的不拒绝原假设时，并未给出明确的结论，不能说原假设是正确的，也不能说它不是正确的,假设检验结论的表述(“接受”与“不拒绝”),假设检验的目的在于试图找到证据拒绝原假设，而不在于证明什么是正确的当没有足够证据拒绝原假设时，不采用“接受原假设”的表述，而采用“不拒绝原假设”的表述。“不拒绝”的表述实际上意味着并未给出明确的结论，我们没有说原假设正确，也没有说它不正确 “接受”的说法有时会产生误导，因为这种说法似乎暗示着原假设已经被证明是正确的了。但事实上，H0的真实值我们永远也无法知道，H0只是对总体真实值的一个假定值，由样本提供的信息也就自然无法证明它是否正确,假设检验结论的表述 (为什么不说“接受”),【例】比如原假设为H0: =10，从该总体中抽出一个随机样本，得

展开阅读全文

应用统计学(第四版)第6章 假设检验课件

应用统计学(第四版)第6章假设检验课件