卫生统计学:第7章 假设检验

上传人:m**** 文档编号:568769198 上传时间:2024-07-26 格式:PPT 页数:47 大小:1.12MB
返回 下载 相关 举报
卫生统计学:第7章 假设检验_第1页
第1页 / 共47页
卫生统计学:第7章 假设检验_第2页
第2页 / 共47页
卫生统计学:第7章 假设检验_第3页
第3页 / 共47页
卫生统计学:第7章 假设检验_第4页
第4页 / 共47页
卫生统计学:第7章 假设检验_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《卫生统计学:第7章 假设检验》由会员分享,可在线阅读,更多相关《卫生统计学:第7章 假设检验(47页珍藏版)》请在金锄头文库上搜索。

1、假设检验在统计方法中的地位第第7章章 假设检验假设检验【案例案例7-1】为了解为了解1岁婴儿的血红蛋白浓岁婴儿的血红蛋白浓度,某医生从该地抽取了度,某医生从该地抽取了1岁婴儿岁婴儿25名,名,测得其血红蛋白浓度的均数为测得其血红蛋白浓度的均数为123.5g/l,标标准差为准差为11.6g/l,而而一般正常婴儿一般正常婴儿的血红蛋白浓度平均为的血红蛋白浓度平均为125g/l,故认为该地,故认为该地1岁婴儿的血红蛋白浓岁婴儿的血红蛋白浓度低于一般正常婴儿的血红蛋白浓度平均度低于一般正常婴儿的血红蛋白浓度平均值。值。该结论是否正确,为什么?该结论是否正确,为什么?如何解决此类问题?如何解决此类问题?

2、 第一节第一节 假设检验的基本思想及步骤假设检验的基本思想及步骤一、假设检验的基本思想一、假设检验的基本思想该次抽样得出该次抽样得出1岁婴儿岁婴儿123.5g/l 低于一般正常婴儿低于一般正常婴儿125g/l 的原因?的原因?0?0?IF: x 与与0 相差不大,接近,则可能是由于抽样引起,相差不大,接近,则可能是由于抽样引起,则可以认为样本来自一般正常小儿。则可以认为样本来自一般正常小儿。IF: x 与与0 相差很大,则不能用抽样误差解释,则怀相差很大,则不能用抽样误差解释,则怀疑本次抽样的疑本次抽样的1岁婴儿不是来自一般正常小儿这个总体。岁婴儿不是来自一般正常小儿这个总体。 =0 由抽样误

3、差引起由抽样误差引起0 由本质差别引起由本质差别引起 x 与与0相差多大可以认为是由抽样误差导致的?相差多大可以认为是由抽样误差导致的?什么是假设检验假设检验是推论统计的重要内容,是先对总体的未知数量特征作出某种假设,然后抽取样本,利用样本信息对假设的正确性进行判断的过程。n统计假设有统计假设有参数假设、总体分参数假设、总体分布假设、相互关系假设布假设、相互关系假设(两个变量是否独立,两个分布是否相同)等。)等。n参数假设参数假设是是对总体参数的一种对总体参数的一种看法。总体参数包括看法。总体参数包括总体均值、总体均值、总体比例、总体方差总体比例、总体方差等。分析等。分析之前必需陈述。之前必需

4、陈述。我认为德国我认为德国我认为德国我认为德国6 6岁儿童平均岁儿童平均岁儿童平均岁儿童平均身高为身高为身高为身高为1.251.25米米米米! !参数假设检验参数假设检验是参数假设检验是通过样本信息对关于总体参数的通过样本信息对关于总体参数的某种假设合理与否进行检验的过程。某种假设合理与否进行检验的过程。即即先先对未知的总体参数的取值提出某种假设,对未知的总体参数的取值提出某种假设,然然后后抽取样本,抽取样本,利用利用样本信息去检验这个假设是否样本信息去检验这个假设是否成立。成立。如果如果成立就接受这个假设,成立就接受这个假设,如果不成立如果不成立就就放弃这个假设。放弃这个假设。例例1:根据:

5、根据1989年年的统计资料,某地女性新生儿的统计资料,某地女性新生儿的平均体重为的平均体重为3190克克。为判断该地为判断该地1990年的年的女性新生儿体重与女性新生儿体重与1989年相比有无显著差异年相比有无显著差异,从该地从该地1990年的女性新生儿中随机抽取年的女性新生儿中随机抽取30人,人,测得其平均体重为测得其平均体重为3210克克。 1989年年3190克克 1990年年3210克克 但这种差异可能是由于抽样的但这种差异可能是由于抽样的随机性随机性带来的,带来的,也许这两年新生儿的体重并没有显著差异。究也许这两年新生儿的体重并没有显著差异。究竟是否存在显著差异?竟是否存在显著差异?

6、可以先假设这两年新生可以先假设这两年新生儿的体重没有显著差异,然后利用样本信息检儿的体重没有显著差异,然后利用样本信息检验这个假设能否成立。验这个假设能否成立。这是一个关于总体均值这是一个关于总体均值的假设检验问题。的假设检验问题。 例例2:某公司进口一批钢筋,根据要求,钢筋的平均拉某公司进口一批钢筋,根据要求,钢筋的平均拉力强度不能低于力强度不能低于2000克,而供货商强调其产品的平均克,而供货商强调其产品的平均拉力强度已达到了这一要求,这时需要进口商对供货拉力强度已达到了这一要求,这时需要进口商对供货商的说法是否真实作出判断。商的说法是否真实作出判断。 进口商进口商假设假设平均拉力强度不低

7、于平均拉力强度不低于2000克,克, 然后用样本的平均拉力强度来检验假设是否正确。然后用样本的平均拉力强度来检验假设是否正确。 这也是一个关于总体均值的假设检验问题。这也是一个关于总体均值的假设检验问题。例例3:某种大量生产的袋装食品,按规定每袋重量某种大量生产的袋装食品,按规定每袋重量不得少于不得少于250克,现从一批该种食品中任意抽取克,现从一批该种食品中任意抽取50袋,发现有袋,发现有6袋重量低于袋重量低于250克。若规定食品克。若规定食品不符合标准的比例达到不符合标准的比例达到5就不得出厂,问该批就不得出厂,问该批食品能否出厂。食品能否出厂。 可以可以先假设该批食品的不合格率不超过先假

8、设该批食品的不合格率不超过5,然然后用样本不合格率来检验假设是否正确。后用样本不合格率来检验假设是否正确。 这是一个关于总体比例的假设检验问题。这是一个关于总体比例的假设检验问题。 假设检验的基本思想假设检验所依据的基本原理是小概率原理。假设检验所依据的基本原理是小概率原理。什么是小概率?什么是小概率?q概率是概率是01之间的一个数,因此小概率就是接近之间的一个数,因此小概率就是接近0的一个数的一个数q著名的英国统计家著名的英国统计家Ronald Fisher 把把20分之分之1作为作为标准,也就是标准,也就是0.05,从此,从此0.05或比或比0.05小的概率都小的概率都被认为是小概率被认为

9、是小概率qFisher没有任何深奥的理由解释他为什么选择没有任何深奥的理由解释他为什么选择0.05,只是说他忽然想起来的,只是说他忽然想起来的什么是小概率原理?小概率原理小概率原理发生概率很小的随机事件(小概率事件发生概率很小的随机事件(小概率事件p5% )在一次实验中几乎是不可能发生的。)在一次实验中几乎是不可能发生的。根据这一原理,根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其发生可以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进行观察,的可能性很大,然后抽取一个样本进行观察,如果样本信息显示出现了与事先假设相反的结果且与原假如果样本信息显示出

10、现了与事先假设相反的结果且与原假设差别很大,则说明原来假定的小概率事件在一次实验中设差别很大,则说明原来假定的小概率事件在一次实验中发生了,发生了,这是一个违背小概率原理的不合理现象,因此有理由怀疑这是一个违背小概率原理的不合理现象,因此有理由怀疑和拒绝原假设;否则不能拒绝原假设。和拒绝原假设;否则不能拒绝原假设。检验中使用的小概率是检验前人为指定的。检验中使用的小概率是检验前人为指定的。例如例如:某厂产品合格率为某厂产品合格率为99%,从一批从一批(100件件)产产品中随机抽取一件品中随机抽取一件,恰好是次品的概率为恰好是次品的概率为1%。随。随机抽取一件是次品几乎是不可能的机抽取一件是次品

11、几乎是不可能的, 但是这种情但是这种情况发生了况发生了,我们有理由怀疑该厂的合格率为我们有理由怀疑该厂的合格率为99%.这时我们犯错误的概率是这时我们犯错误的概率是1%。 检验统计量用于假设检验问题的统计量称为检验统计量。 与参数估计相同,需要考虑: 总体是否正态分布; 大样本还是小样本; 总体方差已知还是未知。假设检验相关概念假设检验相关概念 显著性水平显著性水平用样本推断用样本推断H0是否正确,必有犯错误的可能。是否正确,必有犯错误的可能。 原假设原假设H0正确,而被我们拒绝,犯这种错误正确,而被我们拒绝,犯这种错误的概率用的概率用 表示。把表示。把 称为假设检验中的称为假设检验中的显著显

12、著性水平性水平( Significant level), 即决策中的风险。即决策中的风险。显著性水平显著性水平就是指当原假设正确时人们却把就是指当原假设正确时人们却把它拒绝了的概率或风险。它拒绝了的概率或风险。通常取通常取 0.05或或 =0.01或或 =0.001, 那么那么, 接受原假设时正确的可能性接受原假设时正确的可能性(概率概率)为为:95%, 99%, 99.9%。 假设检验的一些基本概念 接受域与拒绝域接受域:原假设为真时允许范围内的变动,应该接受原假设。拒绝域:当原假设为真时只有很小的概率出现,因而当统计量的结果落入这一区域便应拒绝原假设,这一区域便称作拒绝域。 例:例: 0.

13、05时的接受域和拒绝域时的接受域和拒绝域双侧检验与单侧检验假设检验根据实际的需要可以分为 :双侧检验(双尾): 指只强调差异而不强调方向性的检验。单侧检验(单尾)单侧检验(单尾):强调某一方向性的检验。:强调某一方向性的检验。左侧检验左侧检验右侧检验右侧检验假设检验中的单侧检验示意图假设检验中的单侧检验示意图 拒绝域拒绝域 拒绝域拒绝域 (a)右侧检验右侧检验 (b)左侧检验左侧检验二、假设检验的基本步骤二、假设检验的基本步骤(一)建立检验假设,确定检验水准(一)建立检验假设,确定检验水准(二)选定检验方法,计算检验统计量(二)选定检验方法,计算检验统计量(三)确定(三)确定P值,做出推断结论

14、值,做出推断结论(一)建立检验假设,确定检验水准(一)建立检验假设,确定检验水准假设检验中,我们称作为检验对象的待检验假设为原假设或零假设,用H0表示。原假设的对立假设称为备择假设或备选假设,用H1表示。 原假设H0:1岁婴儿 = 一般正常小儿备择假设H1:1岁婴儿 一般正常小儿(二)选定检验方法,计算检验统计量(二)选定检验方法,计算检验统计量If H0成立,则成立,则(三)确定(三)确定P值,做出推断结论值,做出推断结论0.64662.064, P0.05,所以,不拒绝H0第二节第二节假设检验中的两类错误假设检验中的两类错误 H0 检验检验决策决策实际情况实际情况H0为真为真H0为假为假接

15、受接受H0正确决策正确决策(1 )第二类错误第二类错误( (b)b)拒绝拒绝H0第一类错误第一类错误( ()正确决策正确决策(1-(1-b)b)假设研究的问题双侧检验左侧检验右侧检验H0 = 0 0 0H1 0 0第四节第四节 单侧和双侧检验单侧和双侧检验双侧检验(显著性水平与拒绝域 )抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H HH000值值值临界值临界值临界值临界值临界值临界值 /2 /2 /2 /2/2 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域1 - 1 - 1 - 置信水平置信水平置信水平置信水平置信水平置信水平单侧检验(显著性水平与拒绝域)H H0

16、0值值临界值临界值 样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1 - 1 - 置信水平置信水平置信水平置信水平左侧检验 (显著性水平与拒绝域)H HH0 00值值值临界值临界值临界值 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量左侧检验 (显著性水平与拒绝域)H HH0 00值值值临界值临界值临界值 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1 -

17、 1 - 1 - 置信水平置信水平置信水平置信水平右侧检验 (显著性水平与拒绝域)H HH0 00值值值临界值临界值临界值 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量右侧检验 (显著性水平与拒绝域)H HH0 00值值值临界值临界值临界值 样本统计量样本统计量样本统计量抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平拒绝域拒

18、绝域拒绝域抽样估计与假设检验都是统计推断的重要内容。抽样估计与假设检验都是统计推断的重要内容。参数估计是根据样本统计量估计总体参数的真参数估计是根据样本统计量估计总体参数的真值;值;假设检验是根据样本统计量来检验对总体参数假设检验是根据样本统计量来检验对总体参数的先验假设是否成立。的先验假设是否成立。 第五节 区间估计与假设检验 1.区间估计与假设检验都是根据样本信息对总体参数进区间估计与假设检验都是根据样本信息对总体参数进行推断,都是以行推断,都是以抽样分布抽样分布为理论依据,都是建立在为理论依据,都是建立在概概率基础上率基础上的推断,的推断,推断结果都有一定的可信程度或风推断结果都有一定的

19、可信程度或风险。险。2. 对同一问题的参数进行推断,二者使用同一样本、对同一问题的参数进行推断,二者使用同一样本、同一统计量、同一分布,因而二者可以相互转换。区同一统计量、同一分布,因而二者可以相互转换。区间估计问题可以转换成假设问题,假设问题也可以转间估计问题可以转换成假设问题,假设问题也可以转换成区间估计问题。换成区间估计问题。3. 区间估计中的置信区间对应于假设检验中的接受区区间估计中的置信区间对应于假设检验中的接受区域,置信区间以外的区域就是假设检验中的拒绝域。域,置信区间以外的区域就是假设检验中的拒绝域。区间估计与假设检验的主要联系区间估计与假设检验的主要联系区间估计与假设检验的主要

20、区别1.区间估计通常求得的是以样本估计值为中心区间估计通常求得的是以样本估计值为中心的双侧置信区间,而假设检验以假设总体参的双侧置信区间,而假设检验以假设总体参数值为基准,不仅有双侧检验也有单侧检验数值为基准,不仅有双侧检验也有单侧检验2.区间估计立足于大概率,通常以较大的把握区间估计立足于大概率,通常以较大的把握程度(置信水平)程度(置信水平)1-去保证总体参数的置去保证总体参数的置信区间。而假设检验立足于小概率,通常是信区间。而假设检验立足于小概率,通常是给定很小的显著性水平给定很小的显著性水平去检验对总体参数去检验对总体参数的先验假设是否成立。的先验假设是否成立。课外阅读课外阅读小概率原

21、理举例:某工厂质检部门规定该厂产品次品率不超过4方能出厂。今从1000件产品中抽出10件,经检验有4件次品,问这批产品是否能出厂? 如果假设这批产品的次品率P4,则可计算事件“抽10件产品有4件次品”的出现概率为: 可见,概率是相当小的,1万次实验中可能出现4次,然而概率如此小的事件,在一次实验中居然发生了,这是不合理的,而不合理的根源在于假设次品率P4 ,因而认为假设次品率P4是不能成立的,故按质检部门的规定,这批产品不能出厂。单侧检验 (原假设与备择假设的确定) 一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立研研究究者者总总是是想想证证

22、明明自自己己的的研研究究结结论论(寿寿命命延长延长)是正确的是正确的备择假设的方向为备择假设的方向为“”(寿命延长寿命延长)建立的原假设与备择假设应为建立的原假设与备择假设应为 H0: 1500 H1: 1500单侧检验 (原假设与备择假设的确定)q一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立研研究究者者总总是是想想证证明明自自己己的的研研究究结结论论(废废品品率降低率降低)是正确的是正确的备择假设的方向为备择假设的方向为“”(废品率降低废品率降低)建立的原假设与备择假设应为建立的原假设与备择假设应为 H0: 2% H1: 2%单侧检验 (原假设与备择假设

23、的确定)q某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上。如果你准备进一批货,怎样进行检验检验权在销售商一方检验权在销售商一方作作为为销销售售商商,你你总总是是想想收收集集证证据据证证明明生生产产商商的说法的说法(寿命在寿命在1000小时以上小时以上)是不是正确的是不是正确的备备择择假假设设的的方方向向为为“”(寿寿命命不不足足1000小小时时)建立的原假设与备择假设应为建立的原假设与备择假设应为 H0: 1000 H1: 1000双侧检验 双侧检验属于决策中的假设检验。即不论是拒绝H0还是接受H0,都必需采取相应的行动措施。例如,某种零件的尺寸,要求其平均长度为10厘米

24、,大于或小于10厘米均属于不合格。待检验问题是该企业生产的零件平均长度是10厘米吗?(属于决策中的假设)则建立的原假设与备择假设应为 H0: X = 10 H1: X 10单侧检验原假设与备择假设的确定应区别不同情况采取不同的建立假设方法。一一般般是是将将研研究究的的预预期期效效果果(希希望望、想想要要证证明明的的假假设设)作作为为备备择择假假设设H1,将将认认为为研研究究结结果果无无效效作作为为原原假假设设H0。先确立备择假设H1。因为只有当检验结果与原假设有明显差别时才能拒绝原假设而接受备择假设,原假设不会轻易被拒绝,就使得希望得到的结论不会轻易被接受,从而减少结论错误。q例如,有研究预计

25、,采用新技术生产后将会使某产品的使用寿命明显延长到1500小时以上。则建立的原假设与备择假设应为: H0: X 1500 H1: X 1500q例例如如,有有研研究究预预计计,改改进进生生产产工工艺艺后后会会使使某某产产品品的的废废品品率率降降低低到到2%以以下下。则则建建立立的的原原假假设设与与备备择择假假设设应为:应为: H0: X 2% H1: X 2% 用置信区间进行检验均值双侧检验1.求出双侧检验均值的置信区间 2 2已知时:已知时: 2 2未知时:未知时:2.若样本统计量若样本统计量 x的值落在置信区间外,的值落在置信区间外, 则拒绝则拒绝H0 用置信区间进行检验 均值单侧检验1.

26、左侧检验:求出单边置信下限 若样本统计量若样本统计量x的值小于单边置信下限,则拒绝的值小于单边置信下限,则拒绝H02.右侧检验:求出单边置信上限右侧检验:求出单边置信上限 若样本统计量若样本统计量x的值大于单边置信上限,则拒绝的值大于单边置信上限,则拒绝H0用置信区间进行检验 (例题分析) 例 一种袋装食品每包的标准重量应为1000克。现从生产的一批产品中随机抽取16袋,测得其平均重量为991克。已知这种产品重量服从标准差为50克的正态分布。试确定这批产品的包装 重 量 是 否 合 格 ? (= 0.05)双侧检验!双侧检验!双侧检验!双侧检验!香香香香香香脆脆脆脆脆脆蛋蛋蛋蛋蛋蛋卷卷卷卷卷卷用置信区间进行检验(例题分析)解:提出假设: H0: X = 1000 H1: X 1000已知:n = 16,=50,=0.05双侧检验/2=0.025 临界值: Z0.025=1.96置信区间为置信区间为决策决策:结论结论: X = 1000 在置信区间内,在置信区间内,不拒绝不拒绝H0可以认为这批产品的包可以认为这批产品的包装重量合格装重量合格Z01.96- -1.960.025拒绝拒绝 H0拒绝拒绝 H00.025

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号