医学]总体均数的区间估计和假设检验

上传人:tia****nde 文档编号:70183403 上传时间:2019-01-16 格式:PPT 页数:78 大小:1.13MB
返回 下载 相关 举报
医学]总体均数的区间估计和假设检验_第1页
第1页 / 共78页
医学]总体均数的区间估计和假设检验_第2页
第2页 / 共78页
医学]总体均数的区间估计和假设检验_第3页
第3页 / 共78页
医学]总体均数的区间估计和假设检验_第4页
第4页 / 共78页
医学]总体均数的区间估计和假设检验_第5页
第5页 / 共78页
点击查看更多>>
资源描述

《医学]总体均数的区间估计和假设检验》由会员分享,可在线阅读,更多相关《医学]总体均数的区间估计和假设检验(78页珍藏版)》请在金锄头文库上搜索。

1、第3章 总体均数的区间估计和假设检验,目 录,第五节 均数的 u 检验,第二节 t 分布,第三节 总体均数的区间估计,第四节 假设检验的意义和基本步骤,第一节 均数的抽样误差与标准误,第六节 均数的 t 检验,第八节 型错误和型错误,第九节 应用假设检验应注意的问题,第七节 两总体方差的齐性检验和t检验,学习要求,掌握:抽样误差的概念和计算方法 掌握:总体均数区间的概念,意义和计算方法 掌握:假设检验的基本步骤及思路 掌握:u检验和t检验的概念,意义,应用条件和计算方法 熟悉:第一类错误和第二类错误的概念和意义 熟悉:假设检验的注意问题,统计推断(statistical inference)

2、:根据样本信息来推论总体特征。 均数的抽样误差 :由抽样引起的样本均数与总体均数的差异称为均数的抽样误差。 标准误(standard error):反映均数抽样误差大小的指标。,第一节 均数的抽样误差与标准误,一、标准误的意义及其计算,Population ,sample2,sample1,sample3,sample4,sample5,已知:,标准误计算公式,未知:,实例:如某年某市120名12岁健康男孩,已求得均数为143.07cm,标准差为5.70cm,按公式计算,则标准误为:,1.表示抽样误差的大小 ; 2.进行总体均数的区间估计; 3.进行均数的假设检验等。,二、标准误的应用,第二节

3、 t 分布,一、t 分布的概念,t分布于1908年由英国统计学家W.S.Gosset以“Student”笔名发表,故又称“Student t”分布,正态变量X采用u(X)/变换,则一般的正态分布N (,)即变换为标准正态分布N (0,1)。 又因从正态总体抽取的样本均数服从正态分布 N(, ),同样可作正态变量的u变换,即,实际工作中由于理论的标准误往往未知,而用样本的标准误作为的估计值, 此时就不是u变换而是t变换了,即下式:,二、t分布曲线的特征,t分布曲线是单峰分布,以0为中心,左右两侧对称, 曲线的中间比标准正态曲线(u分布曲线)低,两侧翘得比标准正态曲线略高。 t分布曲线随自由度而变

4、化,当样本含量越小(严格地说是自由度 =n-1越小),t分布与u分布差别越大;当逐渐增大时,t分布逐渐逼近于u分布,当 =时,t分布就完全成正态分布。 t分布曲线是一簇曲线,而不是一条曲线。 T界值表。,t 分布示意图,t分布曲线下双侧或单侧尾部合计面积,我们常把自由度为的t分布曲线下双侧尾部合计面积或单侧尾部面积为指定值时,则横轴上相应的t界值记为t,。 如当=20, =0.05时,记为t0.05, 20;当 =22, =0.01时,记为t0.01, 22。对于t, 值,可根据和值,查附表,t界值表。,t分布是t检验的理论基础。由公式可知,t值与样本均数和总体均数之差成正比,与标准误成反比。

5、 在t分布中t值越大,其两侧或单侧以外的面积所占曲线下总面积的比重就越小 ,说明在抽样中获得此t值以及更大t值的机会就越小,这种机会的大小是用概率P来表示的。 t值越大,则P值越小;反之,t值越小,P值越大。根据上述的意义,在同一自由度下,t t ,则P ; 反之,tt,则P。,第三节 总体均数的区间估计,参数估计:用样本指标(统计量)估计总体指标(参数)称为参数估计。 估计总体均数的方法有两种,即: 点值估计(point estimation ) 区间估计(interval estimation)。,一、点值估计,点值估计:是直接用样本均数作为总体均数的估计值。 此法计算简便,但由于存在抽样

6、误差,通过样本均数不可能准确地估计出总体均数大小,也无法确知总体均数的可靠程度。,二、区间估计,区间估计是按一定的概率(1-)估计包含总体均数可能的范围,该范围亦称总体均数的可信区间(confidence interval,缩写为CI)。 1-称为可信度,常取1-为0.95和0.99,即总体均数的95%可信区间和99%可信区间。 1-(如95)可信区间的含义是:总体均数被包含在该区间内的可能性是1-,即(95),没有被包含的可能性为,即(5)。,总体均数的可信区间的计算,1.未知且n较小(n100) 按t分布的原理,2.已知或 未知但n较大(n100) 按u分布的原理,95%的可信区间为123

7、.72.0642.38,即(118.79, 128.61)。故该地1岁婴儿血红蛋白平均值95的可信区间为118.7128.61(g/L)。,例3.1 为了了解某地1岁婴儿的血红蛋白浓度,从该地随机抽取了1岁婴儿25人,测得其血红蛋白的平均数为123.7g/L,标准差为11.9g/L。试求该地1岁婴儿的血红蛋白平均值95的可信区间。,例3.2 上述某市120名12岁健康男孩身高均数为143.07cm,标准误为0.52cm,试估计该市12岁康男孩身高均数95%和99%的可信区间。,95%的可信区间为 143.071.960.52,即(142.05,144.09)。 99%的可信区间为 143.07

8、2.580.52, 即(141.73,144.41)。,注 意 点,标准误愈小,估计总体均数可信区间的范围也愈窄,说明样本均数与总体均数愈接近,对总体均数的估计也愈精确; 反之,标准误愈大,估计总体均数可信区间的范围也愈宽,说明样本均数距总体均数愈远,对总体均数的估计也愈差。,表3-1 标准差和标准误的区别,第四节 假设检验的意义和基本步骤,假设检验(hypothesis test)亦称显著性检验(significance test),是统计推断的重要内容。它是指先对总体的参数或分布作出某种假设,再用适当的统计方法根据样本对总体提供的信息,推断此假设应当拒绝或不拒绝。,例3.3 根据调查,已知

9、健康成年男子脉搏的均数为72次/分钟,某医生在一山区随机测量了25名健康成年男子脉搏数,求得其均数为74.2次/分钟,标准差为6.5次/分钟,能否认为该山区成年男子的脉搏数与一般健康成年男子的脉搏数不同?,本例两个均数不等有两种可能性: 山区成年男子的脉搏总体均数与一般健康成年男子的脉搏总体均数是相同的,差别仅仅由于抽样误差所致; 受山区某些因素的影响,两个总体的均数是不相同的。 如何作出判断呢?按照逻辑推理,如果第一种可能性较大时,可以接受它,统计上称差异无统计学意义; 如果第一种可能性较小时,可以拒绝它而接受后者,统计上称差异有统计学意义。,假设检验的一般步骤,1.建立检验假设 一种是无效

10、假设(null hypothesis)符号为H0; 一种是备择假设(alternative hypothesis)符号为H1。,H0:,H1:,表3-2 样本均数所代表的未知总体均数 与已知总体均数的比较,表3-3 两样本均数所代表的未知总体均数的比较,2.确定检验水准 检验水准(size of a test)亦称显著性水准(significance level),符号为 。它是判别差异有无统计意义的概率水准,其大小应根据分析的要求确定。通常取= 0.05。 3.选定检验方法和计算统计量 根据研究设计的类型和统计推断的目的要求选用不同的检验方法。如完全随机设计中,两样本均数的比较可用t检验,样

11、本含量较大时(n100),可用u检验。不同的统计检验方法,可得到不同的统计量,如t值和u值。,4.确定概率P值 P值是指在H0所规定的总体中作随机抽样,获得等于及大于(或小于)现有统计量的概率。 t t, ,则P ;t 。,5.作出推断结论 当P时,表示在H0成立的条件下,出现等于及大于现有统计量的概率是小概率,根据小概率事件原理,现有样本信息不支持H0,因而拒绝H0,结论为:按所取检验水准拒绝H0,接受H1,即差异有统计学意义。如例3.3 认为两总体脉搏均数有差别。 当P时,表示在H0成立的条件下,出现等于及大于现有统计量的概率不是小概率,现有样本信息还不能拒绝H0,结论为按所取检验水准不拒

12、绝H0,即差异无统计意义,如例3.3 尚不能认为两总体脉搏均数有差别。,下结论时的注意点:,P ,拒绝H0,不能认为H0肯定不成立,因为虽然在H0成立的条件下出现等于及大于现有统计量的概率虽小,但仍有可能出现; 同理,P ,不拒绝H0,更不能认为H0肯定成立。 由此可见,假设检验的结论是具有概率性的,无论拒绝H0或不拒绝H0,都有可能发生错误,即第一类错误或第二类错误,第五节 均数的u检验,国外统计书籍及统计软件亦称为单样本u检验(one sample u-test)。 样本均数与总体均数比较的u检验适用于: 总体标准差已知的情况; 样本含量较大时,比如n100时。对于后者,是因为n较大,也较

13、大,则t分布很接近u分布的缘故。,一、样本均数与总体均数比较的u检验,u 值的计算公式为:,总体标准差已知 时,不管n的大小。,总体标准差未知 时,但n100时。,例3.4 某托儿所三年来测得2124月龄的47名男婴平均体重11kg。查得近期全国九城市城区大量调查的同龄男婴平均体重11.18kg,标准差为1.23kg。问该托儿所男婴的体重发育状况与全国九城市的同期水平有无不同?(全国九城市的调查结果可作为总体指标),(1)建立检验假设 H0: 0 ,即该托儿所男婴的体重发育状况与全国九城市的同期水平相同, 0.05(双侧) H1: 0 ,即该托儿所男婴的体重发育状况与全国九城市的同期水平不同。

14、 (2)计算u值 本例因总体标准差已知,故可用u检验。 本例n=47, 样本均数=11, 总体均数=11.18,总体标准差=1.23, 代入公式,(3)确定P值,作出推断结论 查u界值表(t界值表中为一行),得u0.05=1.96,u=1.0030.05。按=0.05水准,不拒绝H0,差异无统计学意义。 结论:可认为该托儿所男婴的体重发育状况与全国九城市的同期水平相同。,二、两样本均数比较的u检验,该检验也称为独立样本u检验(independent sample u-test),适用于两样本含量较大(如n150且n250)时,u值可按下式计算:,例3.5 测得某地2024岁健康女子100人收缩

15、压均数为15.27kPa,标准差为1.16kPa;又测得该地2024岁健康男子100人收缩压均数为16.11kPa,标准差为1.41kPa。问该地2024岁健康女子和男子之间收缩压均数有无差别?,(1)建立检验假设 H0:1 2 ,即该地2024岁健康女子和男子之间收缩压均数相同; H1: 12 ,即该地2024岁健康女子和男子之间收缩压均数不同。 0.05(双侧) (2)计算u值 本例 n1=100, 均数1=15.27, S1=1.16 n2=100, 均数2=16.11, S2=1.41,(3)确定P值,作出推断结论 查u界值表(附表7,t界值表中为一行),得u0.05=1.96,现uu

16、0.05=1.96,故P0.05。按水准 =0.05,拒绝H0,接受H1,差异有统计学意义。 结论:可认为该地2024岁健康人的收缩压均数男性不同于女性。,第六节 均数的 t 检验,当样本含量较小(如n50)时,t分布和u分布有较大的出入,所以小样本的样本均数与总体均数的比较以及两个样本均数的比较要用t检验。 t检验的适用条件:样本来自正态总体或近似正态总体;两样本总体方差相等。,t检验的类型,1.单样本t检验(样本均数与总体均数比较t检验) 2.配对样本t检验 3.独立样本t检验(两样本均数比较t检验),即样本均数代表的未知总体均数与已知的总体均数(一般为理论值、标准值或经过大量观察所得的稳定值等)进行比较。 这时检验统计量t值的计算在H0成立

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号