[医药卫生]总体均数估计与假设检验

资源描述

《[医药卫生]总体均数估计与假设检验》由会员分享，可在线阅读，更多相关《[医药卫生]总体均数估计与假设检验（102页珍藏版）》请在金锄头文库上搜索。

1、总体均数估计与假设检验,流病与统计教研室杨超 Y,复习,集中趋势与离散程度指标正态分布及其应用均数的抽样误差与标准误,集中趋势指标均数、几何均数、中位数离散程度指标极差、四分位数间距、方差和标准差、变异系数,集中趋势及离散程度指标,几种集中趋势指标的适用条件,均数正态分布或近似正态分布几何均数呈正偏态分布，但数据经过对数变换后呈正态分布的资料，也可用于观察值之间呈倍数或近似倍数变化(等比关系)的资料中位数偏态分布资料以及频数分布的一端或两端无确切数据资料,几种离散程度指标的适用条件,极差（全距）常用于描述单峰对称分布小样本资料的变异程度或用于初步了解资料。四分位数间距常用

2、于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。方差和标准差正态分布和近似正态分布。变异系数比较计量单位不同以及均数相差悬殊的几组资料。,描述定量变量的指标的正确选择,正态或近似正态分布的资料均数和标准差偏态分布的资料中位数和四分位数间距等比级数或对数正态分布的资料几何均数,正态分布的概念和特征标准正态分布正态分布的应用,正态分布及其应用,正态分布的特征,正态曲线在横轴上方均数处最高正态分布以均数为中心，左右对称正态分布有两个参数，即均数与标准差正态曲线下的面积分布有一定的规律,标准正态分布(standard normal distribution),

3、向左平移个单位后再缩小倍，即按式进行变量代换得到标准正态分布标准正态分布用N(0, 1)表示,常用的三个区间, 1.645区间面积占总面积(或总观察例数)的90% 1.96区间面积占总面积(或总观察例数)的95% 2.58区间面积占总面积(或总观察例数)的99%,正态分布的应用,估计总体变量值的频率分布制定医学参考值范围质量控制正态分布是许多统计方法的理论基础,均数的抽样误差与标准误,为什么进行抽样？概念：由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异称为抽样误差(sampling error) 均数的抽样误差：抽样引起的样本均数与总体均数的差异称为均数的抽样误差

4、。,均数的标准误 (standard error of mean, SEM),样本均数的标准差称为均数的标准误用符号表示说明各样本均数围绕总体均数的离散程度，可用来描述样本均数的抽样误差大小,标准误的计算,标准误的计算标准误的估计值,总体均数估计与假设检验,t分布总体均数估计假设检验的基本思想及基本步骤 I型错误与II型错误单侧检验与双侧检验假设检验需要注意的问题假设检验与区间估计的联系,t分布,t分布的概念 t分布的特征 t界值,t分布的概念,变量变换,总体,样本均数,中心极限定理,标准正态分布,变量变换,未知,自由度,随机变量能够自由取值的个数 = n - 限制条

5、件的个数,t分布的特征,以t=为中心左右对称的单峰分布分布曲线的形态取决于自由度的大小自由度越小，曲线的峰部越低自由度逐渐增大时，t 分布逐渐逼近标准正态分布当=时，t 分布就是标准正态分布,图. 自由度分别为1、5、的t分布,t界值,t界值表，附表3 由界值表还可看出同一概率下，自由度越大，越小同一自由度下，越大，概率值越小同一自由度下，双侧概率为单侧概率的2倍时，所对应的t界值相等当时的t界值即为相应概率下的值,总体均数的估计,就是用样本统计量来估计总体参数总体均数估计的两种方法点估计：直接用统计量估计总体参数区间估计：按一定的概率( )，估计总体参数的所在范

6、围，这个范围称为参数的置信区间(confidence interval, CI),点估计,150例 7岁男童平均身高 123.8 cm ，标准差 4.7 cm ，试估计该地7岁男童身高总体均数？,区间估计,置信区间(confidence interval, CI) 置信度(confidence level) 置信下限(lower confidence limit) 置信上限(upper confidence limit),总体均数置信区间的估计,在到之间的概率为1-,置信区间的计算,未知，且n小未知，但n足够大已知,例6.3,(次/min) (次/min),该地成年男性脉搏总体均数的

7、95%置信区间为(68.7, 75.3)次/分。,例6.,(mmol/L) (mmol/L),该地40岁以上正常人平均空腹血糖值的95%置信区间为(4.81, 5.01)mmol/L 。,两总体均数差值的置信区间,例6.5,置信区间的含义,总体均数的95%置信区间的含义是什么总体均数以95%的概率落入置信区间内？有95%的总体均数在该区间内，而5%的均数不在该区间内？,置信区间的两个要素,准确度：反映置信度(1-)的大小，即置信区间包含总体均数的概率，从准确度的角度看，愈接近1愈好，如置信度99%比95%好精密度：反映为置信区间的宽度，从精确度的角度来看，置信区间的宽度愈窄愈好当样

8、本含量确定后，准确度和精确度是此消彼长的,假设检验,假设检验(hypothesis test) 亦称显著性检验(significance test)，是统计推断的另一个重要方面。,基本思想,例7.1 将病情相似的某病患者随机分配到两组，分别接受A和B两种不同的治疗方法，观察两组疗效的差异，结果见表7.1。,未知总体A,未知总体B,样本A,样本B,A组与B组有效率之差为12.7%，其产生的原因可能有两种抽样误差造成两种疗法效果确实存在差异，即总体率不同。,？,例7.2 某医生研究一种新的治疗充血性心力衰竭的方法。对50位心功能在23级之间的成年男性患者进行4周的治疗，考察其疗效。评价疗效的

9、一个指标是锻炼持续时间的增加量(分钟)。以前常规的治疗方法能使患者的锻炼持续时间平均增加3分钟。该医生通过50位接受新方法治疗的患者的数据算得锻炼持续时间平均增加4分钟，标准差为1.5分钟。该新疗法使患者锻炼持续时间的平均增加量是否多于常规疗法的3分钟？,已知总体 3min,样本,未知总体,？,例7.2,样本均数不等于已知的总体均数，原因可能有两种 min，只是由于抽样误差造成样本均数不等于总体均数样本对应的总体均数本来就不等于3 min，即,假设检验的基本思想,小概率反证法在总体参数相等这一假设成立的前提下，计算出现等于及大于(或等于及小于)现有样本统计量的可能性( 值)。如果值很小

10、，小于等于事先规定的一个界值(例如5%)，结论就是拒绝假设“总体参数相等”，认为总体参数之间存在差异。如果值大于事先规定的界值，就不能拒绝这个假设，尚不能认为总体参数之间存在差异。,两种假设,零假设(null hypothesis)，也称无效假设或无差异假设，记为，表示目前的差异是由抽样误差引起的。备择假设(alternative hypothesis)或对立假设，记为，表示两者的疗效存在本质不同。,P 0.05,P0.05,假设检验的基本步骤,建立检验假设，确定检验水准选定检验方法，计算检验统计量确定P值，作出统计推断,例7.3 一般正常成年男子血红蛋白的平均值为140g/L，

11、某研究者随机抽取60名高原地区健康成年男性进行检查，测得血红蛋白均数为155g/L，标准差为24g/L。可否认为高原地区成年男性居民的血红蛋白平均水平不同于一般正常成年男子？,建立检验假设，确定检验水准,零假设H0高原地区成年男性居民血红蛋白的总体均数等于140g/L 备择假设H1 高原地区成年男性居民血红蛋白的总体均数不等于140g/L,检验水准,检验水准(level of significance or level of a test) ，符号为，习惯上通常取0.05或0.01 。检验水准应在设计时根据专业知识和研究目的确定。,选定检验方法，计算检验统计量,已知观察变量血红蛋白值服从正态

12、分布，其中总体标准差未知,确定P值，作出统计推断,P值是指在H0成立时，出现等于及大于(或等于及小于)现有样本统计量的概率。,t0.05,59=2.000,1.6,结论,拒绝，接受，认为高原地区成年男性的血红蛋白平均水平不等于140g/L 。,若P，表示在H0成立的条件下，出现等于及大于现有统计量的概率是小概率，按小概率事件原理现有样本信息不支持H0，因而拒绝H0。因此，当P时，按所取检验水准，拒绝H0，接受H1。若P时，表示在H0成立的条件下，出现等于及大于现有统计量的概率不是小概率，现有样本信息还不足以拒绝H0。,抉择标准,型错误与型错误,拒绝了实际上成立的H0，这类“弃真”的

13、错误为型错误(type I error)；不拒绝实际上不成立的H0，这类“存伪”的错误为型错误(type II error)。,客观实际拒绝H0 不拒绝H0 H0成立 I 型错误() 推断正确(1-) H0不成立推断正确(1-) II 型错误(),，的关系,当样本量确定时，愈小，愈大；反之，愈大，愈小。增大样本量，可同时减小，。,t (界值),图7.1 两型错误示意图(以单侧t检验为例),检验效能,1-称为或把握度(power of a test)，其统计学意义是若两总体确有差别，按水准能检出其差别的能力。值的大小很难确切估计，只有在已知样本含量n、两总体参数差值以及所规定的检验

14、水准的条件下, 才能估算出大小。或通过非中心的t界值表得到。,单侧检验与双侧检验,双侧检验(two-sided test) 单侧检验(one-sided test) 选用双侧检验还是单侧检验需要根据分析目的及专业知识进行确定应该在假设检验的第一步建立检验假设时确定，不应该在算得检验统计量后主观确定，否则可能得到相反的结论,例7.4,研究者关心的是新仪器的测量误差是否比旧仪器的低，而且知道改进后的仪器的测量误差不会比旧仪器高，因此属于单侧检验问题,假设检验中的注意事项,数据应该来自设计科学严密的实验或调查数据应该满足假设检验方法的前提条件正确理解假设检验中概率值的含义结论不能绝对化

15、统计学意义与实际意义,假设检验与区间估计的联系,置信区间估计和假设检验都属于统计推断的方法置信区间用于推断总体参数的可能范围，假设检验用于推断总体参数是否不相等两者既有区别，又有联系,例7.5,结合例7.3的资料，计算高原地区成年男性的血红蛋白的总体均数的95%置信区间,(g/L),: 不在此区间之内。这与按照水准拒绝的推断结论是等价的,t 检验杨超,戈斯特（William Sealy Gosset ）,主要内容,样本均数与总体均数的比较两样本均数的比较配对设计均数的比较正态性检验与方差齐性检验变量变换,亦称为单样本检验(one sample t test) 就是样本均数代表的未知总体均数与已知总体均数 (一般为理论值或标准值)的比较,样本均数与总体均数比较,为样本均数, 为样本标准差, 为自由度。,例8.1 已知某地新生儿出生体重均数为3.36 kg。从该地农村随机抽取40名新生儿，测得其平均体重为3.27 kg，标准差为0.44 kg，问该地农村新生儿出生体重是否与该地新生儿平均出生体重不同？,两样本均数比较,又称两独立样本的 t 检验，或成组设计的 t 检验（independent samples t test）,

展开阅读全文