八章假设检验与方差分析

上传人:新** 文档编号:568664946 上传时间:2024-07-26 格式:PPT 页数:136 大小:1.99MB
返回 下载 相关 举报
八章假设检验与方差分析_第1页
第1页 / 共136页
八章假设检验与方差分析_第2页
第2页 / 共136页
八章假设检验与方差分析_第3页
第3页 / 共136页
八章假设检验与方差分析_第4页
第4页 / 共136页
八章假设检验与方差分析_第5页
第5页 / 共136页
点击查看更多>>
资源描述

《八章假设检验与方差分析》由会员分享,可在线阅读,更多相关《八章假设检验与方差分析(136页珍藏版)》请在金锄头文库上搜索。

1、八章假设检验与方差分析Stillwatersrundeep.流静水深流静水深,人静心深人静心深Wherethereislife,thereishope。有生命必有希望。有生命必有希望正正如如一一个个法法庭庭宣宣告告某某一一判判决决为“无无罪罪”而而不不为“清清白白(innocent)”(innocent)”,统计检验的的结论也也应为“不不拒拒绝”而不而不为“接受接受”。 Jan Kmenta假设检验1 假设检验的基本问题假设检验的基本问题 2 一个总体参数的检验一个总体参数的检验3 两个总体参数的检验两个总体参数的检验假设检验在统计方法中的地位第一节 假设检验的基本问题1 假设的陈述2 两类错

2、误与显著性水平3 统计量与拒绝域4 利用P值进行决策5 统计显著性与实际显著性请勿试图选出最合理的假设,只需要剔除无法证实的假设这就是假设检验的基础:证伪。参数估计是利用样本信息推断未知的总体参数,而假设检验则是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立。假设的陈述什么是假设?(hypothesis) 对总体参数的具体数值所作的陈述,称为假设总体参数包括总体均值总体均值、比例比例、方差方差等分析之前之前必须陈述我认为这种新药的疗效我认为这种新药的疗效比原有的药物更有效比原有的药物更有效! !什么是假设检验? (hypothesis test)1.假设检验:先对总体的参参数

3、数(或或分分布布形形式式)提出某种假假设设,然后利用样样本本信信息息判断假设是否成立的过程2.逻辑上运用反证法,统计上依据小概率原理小概率原理假设检验的基本思想假设检验的基本思想. . . 因此我们拒因此我们拒因此我们拒因此我们拒因此我们拒因此我们拒绝假设绝假设绝假设绝假设绝假设绝假设 = 50= 50= 50. . . 如果这是如果这是如果这是如果这是如果这是如果这是总体的假设均总体的假设均总体的假设均总体的假设均总体的假设均总体的假设均值值值值值值样本均值样本均值样本均值样本均值样本均值样本均值 = 50 = 50抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H H H0 00这个值不像

4、我这个值不像我这个值不像我这个值不像我这个值不像我这个值不像我们应该得到的们应该得到的们应该得到的们应该得到的们应该得到的们应该得到的样本均值样本均值样本均值样本均值样本均值样本均值 . . .202020总体总体总体总体假设检验的过程假设检验的过程抽取随机样本抽取随机样本抽取随机样本抽取随机样本均值均值均值均值 x x = 20= 20我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 提出假设提出假设提出假设提出假设 拒绝假设拒绝假设 别无选择别无选择! 作出决策作出决策作出决策作出决策原假设与备择假设原假设与备择假设原假设(null hypothesis)1.研究者想收集证据予以反

5、对的假设2.又称“0假设”3.总是有符号 , 或 4. 表示为 H0H0 : = 某一数值 指定为符号 =, 或 例如, H0 : 10cm为什么叫 0 假设?之之所所以以用用零零来来修修饰原原假假设,其其原原因因是是原原假假设的的内内容容总是是表表示示没没有有差差异异或或没没有有改改变,或或变量量间没有关系等等没有关系等等零零假假设设总总是是一一个个与与总总体体参参数数有有关关的的问问题题,所以总是用希腊字母表示。关于样本统计量如样本均值或样本均值之差的零假设是没有意义的,因为样本统计量是已知的,当然能说出它们等于几或是否相等1.研究者想收集证据予以支持的假设2.也称“研究假设研究假设”3.

6、总是有符号 , 或 4.表示为 H1H1 : 某一数值,或 某一数值例如, H1 : 10cm,或 10cm备择假设备择假设(alternative hypothesis)【例例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设提出假设提出假设(例题分析例题分析)解解解解解解:研研研究究究者者者想想想收收收集集集证证证据据据予予予以以以证证证明明明的的的假假假设设设应应应该该该是是是“

7、“ “生产过程不正常生产过程不正常生产过程不正常” ” ”。建立的原假设和备择假设为。建立的原假设和备择假设为。建立的原假设和备择假设为 H HH0 0 0 : 10cm 10cm 10cm H HH1 1 1 : 10cm 10cm 10cm (双侧检验)(双侧检验)(双侧检验)【例例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500g。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设提出假设提出假设(例题分析例题分析)解解解解解解:研研研究究究者者者抽抽抽检检检的的的意意意图图图是是是倾倾倾向向向于于于证证

8、证实实实这这这种种种洗洗洗涤涤涤剂剂剂的的的平平平均均均净净净含含含量量量并并并不不不符符符合合合说说说明明明书书书中中中的的的陈陈陈述述述 。建建建立的原假设和备择假设为立的原假设和备择假设为立的原假设和备择假设为 H H H0 0 0 : 500 500 500 H H H1 1 1 : 500 500 ”或“”的假设检验,称为单侧检验或单尾检验(one-tailed test)备择假设的方向为“”,称为右侧检验右侧检验 单侧检验与双侧检验单侧检验与双侧检验单侧检验与双侧检验 (假设的形式)假假设双双侧检验单侧检验单侧检验左左侧检验右右侧检验原假设原假设H0: : = 0 0H0: : 0

9、 0H0: : 0 0备择假设备择假设H1: : 0 0H1: : 0 0以总体均值的检验为例以总体均值的检验为例以总体均值的检验为例以总体均值的检验为例两类错误与显著性水平假设检验的目的是要根据样本信息作出决策,也就是作出是否拒绝原假设而倾向于备择假设的决策。决策是建立在样本信息的基础上决策是建立在样本信息的基础上,而样本是随机的,因此有可能犯错误。理想的状态是:当原假设H H0 0正确时没有拒绝它;当原假设H H0 0不正确时拒绝它。假设检验中的两类错误1. 第第类错误类错误(弃真错误弃真错误)原假设为正确时拒绝原假设第类错误的概率被称为显著性显著性水平,水平,记为2. 第第类错误类错误(

10、取伪错误取伪错误)原假设为错误时未拒绝原假设第类错误的概率记为(Beta) H H0 0: : 无罪无罪无罪无罪假设检验中的两类错误假设检验中的两类错误(决策结果决策结果)陪审团审判陪审团审判裁决裁决实际情况实际情况无罪无罪有罪有罪无罪无罪正确正确错误错误有罪有罪错误错误正确正确H0 检验检验决策决策实际情况实际情况H0为真为真H0为假为假未拒绝未拒绝H0正确决策正确决策(1 )第第类错类错误误( )拒绝拒绝H0第第类错类错误误()正确决策正确决策(1-1- )假设检验就好像一场审判过程假设检验就好像一场审判过程假设检验就好像一场审判过程假设检验就好像一场审判过程统计检验过程统计检验过程统计检

11、验过程 错误和 错误的关系12 你你要要同同时时减减少少两两类类错错误误的的惟惟一一办办法法是是增增加加样样本本容容量量!减减少少抽抽样样分分布的分散性布的分散性 和和和和 的关系就像的关系就像的关系就像的关系就像翘翘板,翘翘板,翘翘板,翘翘板, 小小小小 就就就就大,大,大,大, 大大大大 就小就小就小就小第二类错误(取伪取伪)是把不正确的原假设当做正确的接受而犯的错误。记概率为 第一类错误(弃真弃真)是在原假设为真的情况下,检验统计量刚好落入小概率的拒绝区域,使我们下了拒绝原假设的结论。犯第一类错误的概率大小就等于显著性水平的大小。越小,犯第一类错误的可能性就越小。 弃真取伪 和和和和 的

12、关系就像的关系就像的关系就像的关系就像翘翘板,翘翘板,翘翘板,翘翘板, 小小小小 就就就就大,大,大,大, 大大大大 就小就小就小就小两类错误的控制111.一般来说,对于一个给定的样本,如果犯第类错误的代价比犯第类错误的代价相对较高,则将犯第类错误的概率定得低些较为合理;反之,如果犯第类错误的代价比犯第类错误的代价相对较低,则将犯第类错误的概率定得高些2.一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于犯第类错误的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第类错误的发生概率检验能力(power of test)1.拒绝一个错误的原假设的能力2.根

13、据 的定义,是指没有拒绝一个错误的原假设的概率。这也就是说,1-则是指拒绝一个错误的原假设的概率,这个概率被称为检验能力,也被称为检验的势或检验的功效(power)3.可解释为正确地拒绝一个错误的原假设的概率4.此外,样本容量是另一个重要指标显著性水平显著性水平 (significant level)1. 是一个概率值2. 原假设为真时,拒绝原假设的概率抽样分布的拒绝域抽样分布的拒绝域3. 表示为 (alpha)常用的 值有0.01, 0.05, 0.10 ,小概率的界,小概率的界限。限。4. 由研究者事先确定(标准)1.我们可以在事先确定用于拒绝原假设H0的证据必须强到何种程度。这等于说我们

14、要求多小的P值。而这个P值就叫显著性水平显著性水平,用表示显著性水平表示总体中某一类数据出现的经常程度假如我们选择=0.05,样本数据能拒绝原假设的证据要强到:当H0正确时,这种样样本本结结果果发发生生的的频频率率不超过5%;如果我们选择=0.01,就是要求拒绝H0的证据要更强,这种样本结果发生的频率只有1%2.如果P值小于或等于 ,我们称该组数据不利于原假设的证据有的显著性水平显著性水平(significant level)1.significant(显著的)一词的意义在这里并不是“重重要的要的”,而是指“非偶然的非偶然的”2.在假设检验中,如果样本提供的证据拒绝原假设,我们说检验的结果是显

15、著的,如果不拒绝原假设,我们则说结果是不显著的3.一项检验在统计上是“显显著著的的”,意思是指:这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的拒绝原假设,表示这样的样本结果并不是偶然得到的;不拒绝原假设(拒绝原假设的证据不充分) ,则表示这样的样本结果只是偶然得到的统计显著性(significant)假设检验中的假设检验中的小概率原理小概率原理 什么小概率?什么小概率?1. 在一次试验中,一个几乎不可能发生的事件发生的概率(10%,5%,1%?)2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设拒绝原假设3. 小概率由研究者事先确定统计量与拒绝域在一般的假设检验过程中

16、,研究者倾向于通过样本信息提供对备择假设的支持,而倾向于作出“拒绝原假设”的结论。样本提供的信息繁杂,往往需要对这些信息进行压缩和提炼,检验统计量检验统计量便是对样本信息进行压缩和概括的结果。1.根根据据样样本本观观测测结结果果计计算算得得到到的,并据以对原假设和备择假设作出决策的某个样本统计量2.对样本估计量标准化的依据是原假设H0为真点估计量的抽样分布 检验统计量检验统计量(test statistic)3.3. 标准化标准化的检验统计量(如的检验统计量(如Z Z* *) 假设检验的基本原理根据检验统计量建立一个准则准则,依据这个准则( 及及 下的下的Z /2)和计算得到的检验统检验统计量

17、计量(Z*),研究者就可以决定是否拒绝原假设。能够拒绝原假设的检验统计量的所有可能取值的集合,称为拒绝域。是由显著性水平所围成的区域。(小概率区域概率为 )(大概率区域概率为1-)根据给定的限制性水平确定的拒绝域的边界值,称为临界值。显著性水平和拒绝域(双侧检验 )抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H HH000临界值临界值临界值临界值临界值临界值临界值临界值临界值临界值临界值临界值 /2 /2 /2 /2/2 拒绝拒绝拒绝H HH000拒绝拒绝拒绝H HH0001 - 1 - 1 - 置信水平置信水平置信水平置信水平置信水平置信水平拒绝域拒绝域拒绝域非拒绝域非拒绝域非拒绝域拒绝

18、域拒绝域拒绝域显著性水平和拒绝域(双侧检验 )H H0 0临界值临界值临界值临界值/2/2 /2/2 样本统计量样本统计量拒绝拒绝H H0 0拒绝拒绝H H0 0抽样分布抽样分布抽样分布抽样分布1 - 1 - 置信水平置信水平置信水平置信水平显著性水平和拒绝域(双侧检验 )H H0 0临界值临界值临界值临界值 /2 /2 /2/2 样本统计量样本统计量样本统计量样本统计量拒绝拒绝H H0 0拒绝拒绝H H0 0抽样分布抽样分布抽样分布抽样分布1 - 1 - 置信水平置信水平置信水平置信水平显著性水平和拒绝域(双侧检验 )H H0 0临界值临界值临界值临界值/2/2 /2/2 样本统计量样本统计

19、量样本统计量样本统计量拒绝拒绝H H0 0拒绝拒绝H H0 0抽样分布抽样分布抽样分布抽样分布1 - 1 - 置信水平置信水平置信水平置信水平显著性水平和拒绝域(单侧检验 )H H0 0临界值临界值 拒绝拒绝H H0 0抽样分布抽样分布抽样分布抽样分布1 - 1 - 置信水平置信水平置信水平置信水平Region of RejectionRegion of RejectionRegion of Rejection非拒绝域非拒绝域非拒绝域Region of NonrejectionRegion of NonrejectionRegion of Nonrejection显著性水平和拒绝域(左侧检验

20、)H HH0 00临界值临界值临界值 拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平置信水平置信水平样本统计量样本统计量样本统计量显著性水平和拒绝域(左侧检验 )H HH0 00临界值临界值临界值 样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平显著性水平和拒绝域(右侧检验 )H HH0 00临界值临界值临界值 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH0 00抽样分布抽样分

21、布抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平置信水平置信水平显著性水平和拒绝域(右侧检验 )H HH0 00临界值临界值临界值 样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平拒绝拒绝拒绝H HH0 00决策规则1.给定显著性水平(误犯错的风险),查表得出相应的临界值临界值z 或或z /2 /2, t 或或t /2 /22.将检验统计量的值与 水平的临界值水平的临界值进行比较3.作出决策双侧检验:I统计量I 临界值,拒绝H0左侧检验:统计量 临界值,

22、拒绝H0利用利用 P 值值 进行决策进行决策什么是P 值? (P-value)1.如果原假设H0为真条件下,观测到至少和由样本计算值一样大的经验统计量值的条件概率。P值值告告诉诉我我们们:如果原假设是正确的话,我们得到得到目前这个样本数据的可能性有多大,如果这个可能性很小,就应该拒绝原假设。P值值度度量量了了数数据据对对零零假假设设有有多多大大的的支支持持:P值值越越小小,支支持越小。但是怎样的支持水平认为是小的持越小。但是怎样的支持水平认为是小的2.被称为观察到的观察到的(或实测的或实测的)显著性水平显著性水平3.决策规则:若p值, 拒绝 H0双侧检验的P 值 / / 2 2 / / 2 2

23、 Z Z拒绝拒绝拒绝拒绝H H0 0拒绝拒绝拒绝拒绝H H0 00 0 0临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值1/2 1/2 1/2 P P P 值值值1/2 1/2 1/2 P P P 值值值左侧检验的P 值0 0 0临界值临界值临界值 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水

24、平计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值右侧检验的P 值0 0 0临界值临界值临界值 拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值原原假假设设的的可可信信度度有有多多高高?如果H0所代表的假设是人们多年来一直相信的,就需要很强的证据(小的P值)才能说服他们拒拒绝绝的的结结论论是是什

25、什么么?如果拒绝H0而肯定H1 ,就需要有很强的证据显示要支持H1。比如,H1代表要花很多钱把产品包装改换成另一种包装,你就要有很强的证据显示新包装一定会增加销售量(因为拒绝H0要花很高的成本)多大的多大的P 值合适值合适?显显显著著著性性性检检检验验验的的的目目目的的的是是是要要要描描描述述述样样样本本本所所所提提提供供供不不不利利利于于于原原原假假假设设设的的的证证证据据据有有有多多多强强强,P P P值值值就就就在在在做做做这这这件件件事事事。但但但是是是,要要要证证证明明明原原原假假假设设设不不不正正正确确确,P P P值值值要要要多多多小小小,才才才能能能令令令人人人信信信服服服呢呢

26、呢?这这这要要要根根根据据据两两两种情况来确定种情况来确定种情况来确定1.有有了了P值值,我我们们并并不不需需要要用用5%或或1%这这类类传传统统的的显显著著性性水水平平。P值提供了更多的信息,它让我们可以选择任意水平来评估结果是否具有统计上的显著性,从而可根据我们的需要来决定是否要拒绝原假设只要你认为这么大的P值就算是显著了,你就可以在这样的P值水平上拒绝原假设2.传统的显著性水平,如1%、5%、10%等等,已经被人们普遍接受为“拒绝原假设足够证据”的标准,我们大概可以说:10%代表有“一一些些证证据据”不利于原假设;5%代表有“适适度度证证据据”不利于原假设;1%代表有“很强证据很强证据”

27、不利于原假设固定显著性水平是否有意义固定显著性水平是否有意义1.用P值进行检验比根据统计量检验提供更多的信息2.统计量检验是我们事先给出的一个显著性水平,以此为标准进行决策,无法知道实际的显著性水平究竟是多少比如,根据统计量进行检验时,只要统计量的值落在拒绝域,我们拒绝原假设得出的结论都是一样的,即结果显著。但实际上,统计量落在拒绝域不同的地方,实际的显著性是不同的。比如,统计量落在临界值附近与落在远离临界值的地方,实际的显著性就有较大差异。而P值给出的是实际算出的显著水平,它告诉我们实际的显著性水平是多少P 值决策与统计量的比较值决策与统计量的比较1.与其人为地把显著性水平固定按某一水平上,

28、不如干脆选取检验统计量的P值2.与其大致知道犯第错误的概率,不如干脆知道一个确切的犯第类错误的概率(P值)3.与其为选取“适当的”的而苦恼,不如干脆把真正的 (P值)算出来P 值决策与统计量的比较值决策与统计量的比较(结论结论)统计显著与实际显著性统计显著与实际显著性显著与不显著 (统计上显著不一定有实际意义)1.当原假设被拒绝时,我们称样本结果在统统计计上上是是显显著著的的(statistically significant),当不拒绝原假设时,我们称样本结果在统计上是不显著的统计上是不显著的P值越小,表明结果越显著。但检验结果究竟是“显著的”、“中度显著的”还是“高度显著的”,需要由研究者

29、自己根据P值大小和实际问题来决定 2.在“显著”和“不显著”之间没有清楚的界限,只是在P值越来越小时,我们就有越来越强的证据,检验的结果也就越来越显著3.一个在统计上显著的结论在实际中却不见得很重要,也不意味着就有实际意义。因为P值不仅和样本的大小密切相关,也和总体参数的真值有关 样本容量越大,P值就越小大的样本几乎总是导致拒绝原假设显著与不显著 (统计上显著不等于实际显著)1.在实际检验中,不要把统计上的显著性与实际上的显著性混同起来2.当我们设定一个原假设,比方说,H0:=1,其意义很可能是接近于1,且接近到这样一种程度,以至为了实际目的都可以把它看作是13.然而,1.1是否“实际上无异于

30、”1?这在某种程度上已不是一个统计学问题,而是一个与你的研究相关联的实际问题,因而不能靠假设检验来解决这个问题1.较大的样本会让显著性检验比较敏感 2.用小样本作的显著性检验敏感度又常常不够 3.在总体真值不变的情况下,大的样本会使P值变小,而小的P值也不一定就有实际显著性 4.无论总体的状况如何,观测值多一点,就可以让我们抓P值抓得准些5.在假设检验时,不仅要报告P值,而且也要报告样本大小样本容量对检验结果的影响样本容量对检验结果的影响(大样本导致结果显著大样本导致结果显著)样本容量对检验结果的影响投掷硬币投掷硬币投掷硬币100010001000次、次、次、404040404040次和次和次

31、和100001000010000次时出现正面样本比例的抽样分布次时出现正面样本比例的抽样分布次时出现正面样本比例的抽样分布 0.50.50.5070.507这个结果出这个结果出乎预料吗?乎预料吗?n n = 1000 = 1000n n = 4040 = 4040n n = 10000 = 10000假设检验结论的表述假设检验结论的表述假设检验结论的表述(“显著”与“不显著”)1.当拒绝原假设时,我们称样本结果是统统计计上显著的上显著的拒绝原假设时结论是清楚的2.当不拒绝原假设时,我们称样本结果是统统计上不显著的计上不显著的不拒绝原假设时,并未给出明确的结论,不能说原假设是正确的,也不能说它不

32、是正确的假设检验结论的表述(“接受”与“不拒绝”)1.假设检验的目的在于试图找到证据拒绝原假设,而不在于证明什么是正确的2.当没有足够证据拒绝原假设时,不采用“接接受受原原假假设设”的表述,而采用“不不拒拒绝绝原原假假设设”的表述。“不拒绝”的表述实际上意味着并未给出明确的结论,我们没有说原假设正确,也没有说它不正确3.“接受”的说法有时会产生误导,因为这种说法似乎暗示着原假设已经被证明是正确的了。但事实上,H0的真实值我们永远也无法知道,H0只是对总体真实值的一个假定值,由样本提供的信息也就自然无法证明它是否正确假设检验结论的表述 (为什么不说“接受”)【例】比如原假设为H0: =10,从该

33、总体中抽出一个随机样本,得到x=9.8,在=0.05的水平上,样本提供的证据没有推翻这一假设,我们说“接受”原假设,这意味着样本提供的证据已经证明=10是正确的。如果我们将原假设改为H0: =10.5,同样,在=0.05的水平上,样本提供的证据也没有推翻这一假设,我们又说“接受”原假设。但这两个原假设究竟哪一个是“真实的”呢?我们不知道假设检验结论的表述 (为什么不说“接受”)1.表述为“接受”一个原假设,应该注意到另一个原假设也可能同样地与数据相符。因此,我们宁愿说“不拒绝”2.当然,在实际检验中,针对一个具体问题,将检验结果表述为“不拒绝”原假设,这似乎让人感到无所适从比如,你想购买一批产

34、品,检验的结果没有拒绝原假设,即达到合同规定的标准要求,你是否购买这批产品呢?这时,你可以对检验的结果采取某种默认态度,退一步说,你可以将检验结果表述为“可可以以接接受受”原假设,但这并不等于说你“确实接受确实接受”它假设检验步骤的总结1.陈述原假设和备择假设2.从所研究的总体中抽出一个随机样本3.确定一个适当的检验统计量,并利用样本数据算出其具体数值4.确定一个适当的显著性水平,并计算出其临界值,指定拒绝域5.将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用P值值作出决策第二节第二节 总体参数的检验总体参数的检验1.总体均值的检验一个总体参数

35、的检验z 检验检验(单尾和双尾单尾和双尾) t 检验检验(单尾和双尾单尾和双尾)z 检验检验(单尾和双尾单尾和双尾) 2 2检验检验(单尾和双尾单尾和双尾)均值均值总体参数总体参数比例比例方差方差总体均值的检验一个总体参数的检验z 检验检验(单尾和双尾单尾和双尾) t 检验检验(单尾和双尾单尾和双尾)z 检验检验(单尾和双尾单尾和双尾) 2 2检验检验(单尾和双尾单尾和双尾)均值均值总体参数总体参数比例比例方差方差总体均值的检验(作出判断) 是否已是否已知知小小小小小小样本容量样本容量n大大大大大大 是否已是否已知知否否否否否否 t 检验检验否否否否否否z 检验检验是是是是是是z 检验检验 是

36、是是是是是z 检验检验总体均值的检验(大样本)总体均值的检验 (大样本)1. 假定条件正态总体或非正态总体大样本(n30)2.使用z检验统计量2 已知:2 未知:总体均值的检验(2 已知)(例题分析)【例例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05 ,检验该天生产的饮料容量是否符合标准要求?双侧检验双侧检验标准差已知总体均值的检验(2 已知)(例题分析)H0 : = 255H1 : 255 = 0.05n = 40临界值临界值(

37、c):检验统计量:z z0 01.961.96-1.96-1.960.0250.025拒绝拒绝 H H0 0拒绝拒绝 H H0 00.0250.025决策决策决策决策: :结论结论结论结论: : 不拒绝不拒绝H H0 0样样本本提提供供的的证证据据还还不不足足以以推推翻翻“ “该该天天生生产产的的饮饮料料符符合合标标准准要要求求 ” ”的看法的看法已知总体均值的检验(2 未知)(例题分析)【例例】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检

38、验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比 是 否 有 显 著 降 低 ? (=0.01) 左侧检验左侧检验50个零件尺寸的误差数据个零件尺寸的误差数据 (mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86总体均值的检

39、验(2 未知)(例题分析)H0 : 1.35H1 : 5200 = 0.05n = 36临界值临界值(c):检验统计量检验统计量检验统计量检验统计量: : 拒绝拒绝H H0 0 ( (P P = = 0.000088 0.000088 = 0.05) = 0.05)改良后的新品种产量有显著提高改良后的新品种产量有显著提高 决策决策决策决策: :结论结论结论结论: :z z0 0拒绝拒绝H H0 00.050.051.6451.645总体均值的检验(z检验) (P 值的图示)抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布P P P = = = 0.000088 0.000088 0.00008

40、8 0 0 01.6451.6451.645 0.050.050.05拒绝拒绝拒绝H HH0 001 - 1 - 1 - 计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量=3.75=3.75=3.75P P P 值值值总体均值的检验 (大样本检验方法的总结)假设假设双侧检验双侧检验左左侧检验右右侧检验假设形式假设形式H0:=0H1 :0H0 :0H1 :0统计量统计量 已知 未知拒绝域拒绝域P值决策值决策拒绝H0总体均值的检验(小样本)总体均值的检验 (小样本)1. 假定条件总体服从正态分布小样本(n 30)2.检验统计量2 已知:2

41、 未知:t分布分布当总体的标准差或方差未知时可相应地用样本的标准差与方差代替。但此时检验统计量不服从标准正态分布,而是服从自由度为n-1的t分布。总体均值的检验 (小样本检验方法的总结)假设假设双侧检验双侧检验左左侧检验右右侧检验假设形式假设形式H0:=0H1 :0H0:0H1 :0统计量统计量 已知 未知拒绝域拒绝域P值决策值决策拒绝H0注:注:注:注: 已知的拒绝域同大样本已知的拒绝域同大样本已知的拒绝域同大样本已知的拒绝域同大样本总体均值的检验 (例题分析)【例例】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中

42、标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求? 10个零件尺寸的长度个零件尺寸的长度 (cm)12.210.812.011.811.912.411.312.212.012.3总体均值的检验 (例题分析正态性检验)汽车配件的正态概率图汽车配件的正态概率图 总体均值的检验 (例题分析)H0 : =12H1 : 12 = 0.05df = 10 - 1= 9临界值临界值(c):检验统计量检验统计量检验统计量检验统计量: : 不拒绝不拒绝H H0 0样

43、样本本提提供供的的证证据据还还不不足足以以推推翻翻“ “该该供供货货商商提提供供的的零零件件符符合合要要求求 ” ”的看法的看法决策:决策:决策:决策:结论:结论:结论:结论:t t0 02.2622.262-2.262-2.2620.0250.025拒绝拒绝 H H0 0拒绝拒绝 H H0 00.0250.025第三节第三节 方差分析方差分析学习目标1.解释方差分析的概念解释方差分析的概念2.解释方差分析的基本思想和原理解释方差分析的基本思想和原理3.掌握单因素方差分析的方法及应用掌握单因素方差分析的方法及应用4.理解多重比较的意义理解多重比较的意义方差分析引论1 方差分析及其有关术语方差分

44、析及其有关术语2 方差分析的基本思想和原理方差分析的基本思想和原理3 方差分析的基本假定方差分析的基本假定4 问题的一般提法问题的一般提法方差分析及其有关术语什么是方差分析(ANOVA)?(analysis of variance) 1.检验多个总体均值是否相等通过分析数据的误差数据的误差判断各总体均值是否相等2.研究分类型自变量分类型自变量对数值型因变量数值型因变量的影响 一个或多个分类型自变量两个或多个 (k 个) 处理水平或分类一个数值型因变量3.有单因素方差分析和双因素方差分析单因素方差分析:涉及一个分类的自变量双因素方差分析:涉及两个分类的自变量什么是方差分析? (例题分析)消费者对

45、四个行业的投诉次数消费者对四个行业的投诉次数 行业行业观测值观测值零售业零售业旅游业旅游业航空公司航空公司家电制造业家电制造业12345675766494034534468392945565131492134404451657758【 例例例例 】为了对几个行业的服务质量进行评价,消费者协会为了对几个行业的服务质量进行评价,消费者协会在在4 4个行业分别抽取了不同的企业作为样本。最近一年中消个行业分别抽取了不同的企业作为样本。最近一年中消费者对总共费者对总共2323家企业投诉的次数如下表家企业投诉的次数如下表什么是方差分析? (例题分析)1.分析4个行业之间的服务质量是否有显著差异,也就是要判

46、断“行行业业”对“投投诉诉次次数数”是否有显著影响2.作出这种判断最终被归结为:检验这四个行业被投诉次数的均值是否相等3.若它们的均值相等,则意味着“行业”对投诉次数是没有影响的,即它们之间的服务质量没有显著差异;若均值不全相等,则意味着“行业”对投诉次数是有影响的,它们之间的服务质量有显著差异方差分析中的有关术语1.因素因素或因子(factor)所要检验的对象分析行业对投诉次数的影响,“行业”是要检验的因子。因素的每一个水平可以看作一个总体。2.水平水平或处理(treatment)因子的不同表现零售业、旅游业、航空公司、家电制造业等是“行业”这一因素的具体表现。3.观察值观察值在每个因素水平

47、下得到的样本数据每个行业被投诉的次数又如要在不同的温度下做一项试验,温度就是一个因素,在20,25,30,35等4个温度下做试验,每个温度值就是一个水平,共有4个水平,在每个温度下试验得到的数据就是观察值。方差分析的基本思想和原理方差分析的基本思想和原理方差分析的基本思想和原理(图形分析散点图) 零售业 旅游业 航空公司 家电制造1.从散点图上可以看出不同行业被投诉的次数有明显差异同一个行业,不同企业被投诉的次数也明显不同家电制造被投诉的次数较高,航空公司被投诉的次数较低2.行业与被投诉次数之间有一定的关系如果行业与被投诉次数之间没有关系,那么它们被投诉的次数应该差不多相同,在散点图上所呈现的

48、模式也就应该很接近方差分析的基本思想和原理(图形分析)1.散点图观察不能提供充分的证据证明不同行业被投诉的次数之间有显著差异显著差异这种差异可能是由于抽样的随机性造成的?这种差异可能是由于抽样的随机性造成的?2.需要有更准确的方法来检验这种差异是否显著,也就是进行方差分析方差分析之所以叫方差分析,因为虽然我们感兴趣的是均值,但在判断均值之间是否有差异时则需要借助于方差这个名字也表示:它是通过对数据误误差差来来源源的分析判断不同总体的均值是否相等。因此,进行方差分析时,需要考察数据误差的来源方差分析的基本思想和原理方差分析的基本思想和原理(两类误差两类误差)1.随机误差随机误差因素的同一水平同一

49、水平(总体)下,样本各观察值之间的差异比如,同一行业下不同企业被投诉次数之间的差异这种差异可以看成是随机因素的影响,称为随机误差随机误差 2.系统误差系统误差因素的不同水平(不同总体)之间观察值的差异比如,不同行业之间的被投诉次数之间的差异这种差异可能是由于抽样的随机性所造成的,也可能是由于行业本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差系统误差方差分析的基本思想和原理(误差平方和SS)1.数据的误差用平方和(sum of squares)表示2.组内组内平方和(within groups)因素的同一水平下数据误差的平方和比如,零售业被投诉次数的误差平方和只包含随机误差随机

50、误差3.组间组间平方和(between groups)因素的不同水平之间数据误差的平方和比如,4个行业被投诉次数之间的误差平方和既既包括随机误差随机误差,也也包括系统误差系统误差方差分析的基本思想和原理(均方MS)1.均方,平方和除以相均方,平方和除以相应的自由度的自由度2.若原假设成立,组间均方与组内均方的数值就应该很接近,它们的比值就会接近13.若原假设不成立,组间均方会大于组内均方,它们之间的比值就会大于14.当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异,即自变量对因变量有影响判断行业对投诉次数是否有显著影响,也就是检验被投诉次数的差异主要是由于什么原因所引起的。如果这种

51、差异主要是系统误差,说明不同行业对投诉次数有显著影响方差分析的基本假定方差分析的基本假定1.每个总体都应服从正态分布服从正态分布对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本比如,每个行业被投诉的次数必须服从正态分布2.各个总体的方差必须相同方差必须相同各组观察数据是从具有相同方差的总体中抽取的比如,4个行业被投诉次数的方差都相等3.观察值是独立独立的比如,每个行业被投诉的次数与其他行业被投诉的次数独立方差分析中的基本假定在上述假定条件下,判断行业对投诉次数是否有显著影响,实际上也就是检验具有同方差的4个正态总体的均值是否相等如果4个总体的均值相等,可以期望4个样本的均值也

52、会很接近4个样本的均值越接近,推断4个总体均值相等的证据也就越充分样本均值越不同,推断总体均值不同的证据就越充分 方差分析中的基本假定 如果原假设成立如果原假设成立,即H0 : 1 = 2 = 3 = 44个行业被投诉次数的均值都相等意味着每个样本都来自均值为、方差为 2的同一正态总体 X X Xf(X)f(X)f(X) 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 方差分析中的基本假定若备择假设成立,即H1 : i (i=1,2,3,4)不全相等至少有一个总体的均值是不同的4个样本分别来自均值不同的4个正态总体 X X Xf(X)f(X)f(X) 3 3 3 3 1 1 1

53、 1 2 2 2 2 4 4 4 4 问题的一般提法问题的一般提法1.设因素有k个水平,每个水平的均值分别用 1 , 2, , k 表示2.要检验k个水平(总体)的均值是否相等,需要提出如下假设: H0 : 1 2 k H1 : 1 , 2 , , k 不全相等不全相等3.设 1为零售业被投诉次数的均值, 2为旅游业被投诉次数的均值, 3为航空公司被投诉次数的均值, 4为家电制造业被投诉次数的均值,提出的假设为H0 : 1 2 3 4 H1 : 1 , 2 , 3 , 4 不全相等不全相等 单因素方差分析1 数据结构数据结构2 分析步骤分析步骤3 关系强度的测量关系强度的测量4 方差分析中的多

54、重比较方差分析中的多重比较单因素方差分析的数据结构(one-way analysis of variance) 观察值观察值 ( j )因素因素(A) i 水平水平A1 水平水平A2 水平水平Ak12:n x11 x21 xk1 x12 x22 xk2 : : : : : : : : x1nx2n xkn分析步骤分析步骤提出假设提出假设构造检验统计量构造检验统计量统计决策统计决策提出假设1.一般提法H0 :1 = 2 = k 自变量对因变量没有显著影响 H1 :1 ,2 , ,k不全相等自变量对因变量有显著影响 2.注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相

55、等 构造检验的统计量构造统计量需要计算水平水平的均值全部观察值全部观察值的总均值误差平方和均方(MS) 构造检验的统计量(计算水平的均值)1.假定从第i个总体中抽取一个容量为ni的简单随机样本,第i个总体的样本均值为该样本的全部观察值总和除以观察值的个数2.计算公式为 式中:式中: n ni i为第为第 i i 个总体的样本观察值个数个总体的样本观察值个数 x xij ij 为第为第 i i 个总体的第个总体的第 j j 个观察值个观察值 构造检验的统计量(计算全部观察值的总均值)1.全部观察值的总和除以观察值的总个数2.计算公式为 构造检验的统计量(例题分析)构造检验的统计量(计算总误差平方

56、和总误差平方和 SST)1.全部观察值 与总平均值 的离差平方和2.反映全部全部观察值的离散状况3.其计算公式为 前例的计算结果前例的计算结果 SST SST = (57-47.869565)= (57-47.869565)2 2+ +(58-47.869565)(58-47.869565)2 2 =115.9295 =115.9295构造检验的统计量(计算组间组间平方和 SSA)1.各组平均值 与总总平均值 的离差平方和2.反映各总体的样本均值之间的差异程度3.该平方和既包括随机误差随机误差,也包括系统误差系统误差4.计算公式为 前例的计算结果前例的计算结果 SSA SSA = 1456.6

57、08696= 1456.608696构造检验的统计量(计算组内平方和 SSE )1.每个水平或组的各样本数据与其组平均值的离差平方和2.反映每个样本每个样本各观察值的离散状况3.该平方和反映的是随机误差随机误差的大小4.计算公式为 前例的计算结果前例的计算结果 SSE SSE = 2708= 2708构造检验的统计量(三个平方和的关系)总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和 (SSA) 之间的关系SST = SSA + SSE 前例的计算结果前例的计算结果 4164.608696=1456.608696+2708 4164.608696=1456.608696+2

58、708 构造检验的统计量(计算均方MS)1.各误差平方和的大小与观察值的多少有关,为消除观察值多少对误差平方和大小的影响,需要将其平均,这就是均方均方,也称为方差2.由误差平方和除以相应的自由度求得3.三个平方和对应的自由度分别是SST 的自由度为n-1,其中n为全部观察值的个数SSA的自由度为k-1,其中k为因素水平(总体)的个数SSE 的自由度为n-k构造检验的统计量(计算均方 MS)1.组组间间方方差差:SSA的均方,记为MSA,计算公式为2.组组内内方方差差:SSE的均方,记为MSE,计算公式为构造检验的统计量(计算检验统计量 F )1.将MSA和MSE进行对比,即得到所需要的检验统计

59、量F2.当H0为真时,二者的比值服从分子自由度为k-1、分母自由度为 n-k 的 F 分布,即 构造检验的统计量(F分布与拒绝域)如果均值相等如果均值相等如果均值相等如果均值相等如果均值相等如果均值相等,F=MSA/MSEF=MSA/MSEF=MSA/MSE1 1 1 F 分布分布F (k-1,n-k)0 0拒绝拒绝拒绝拒绝HH0 0不能拒绝不能拒绝不能拒绝不能拒绝H H H H0 0 0 0F F统计决策 将统计量的值F与给定的显著性水平的临界值F进行比较,作出对原假设H0的决策根据给定的显著性水平,在F分布表中查找与第一自由度df1k-1、第二自由度df2=n-k 相应的临界值 F 若FF ,则拒绝原假设H0 ,表明均值之间的差异是显著的,所检验的因素对观察值有显著影响若FF ,则不拒绝原假设H0 ,无证据表明所检验的因素对观察值有显著影响 单因素方差分析表(基本结构)误差来源误差来源平方和平方和(SS)自由度自由度(df)均方均方(MS)F值值P值值F临界值临界值组间组间(因素影响因素影响)SSAk-1MSAMSAMSE组内组内(误差误差)SSEn-kMSE总和总和SSTn-1单因素方差分析(例题分析)

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号