总体均数估计和假设检验正式

资源描述

《总体均数估计和假设检验正式》由会员分享，可在线阅读，更多相关《总体均数估计和假设检验正式（86页珍藏版）》请在金锄头文库上搜索。

1、1 第三章第三章总体均数的估计总体均数的估计与假设检验与假设检验华中科技大学公共卫生学院华中科技大学公共卫生学院流行病与卫生统计学系流行病与卫生统计学系蒋红卫蒋红卫 Email JHWCCC 21CN COMEmail JHWCCC 21CN COM 2 uu均数的抽样误差与标准误均数的抽样误差与标准误 uu t t 分布分布 uu总体均数的估计总体均数的估计 uu t t 检验检验 uu假设检验的注意事项假设检验的注意事项 uu正态性检验和两样本方差比较的正态性检验和两样本方差比较的F F检验检验讲课内容讲课内容 3 第一节第一节均数的抽样误差与标准误均数的抽样误差与标准误 4

2、 u了解总体特征的最好方法是对总体的每一个体进行观察试验但这在医学研究实际中往往不可行 u对无限总体不可能对所有个体逐一观察对有限总体限于人力财力物力时间或个体过多等原因不可能也没必要对所有个体逐一研究如对一批罐头质量检查 u借助抽样研究 5 u欲了解某地18岁男生身高值的平均水平随机抽取该地10名男生身高值作为样本 u由于个体变异与抽样的影响抽得的样本均数不太可能等于总体均数造成样本统计量与总体参数间的差异表现为来自同一总体的若干样本统计量间的差异称为抽样误差 u抽样误差是不可避免的 u抽样误差是有规律的 6 1999年某市18 岁男生身高值 Xi

3、N 2 167 7cm 5 3cm 样本号 1 167 41 2 74 2 165 56 6 57 3 168 20 5 36 99 169 40 5 57 100 165 69 5 09 ni 10 7 样本均数抽样分布具有如下特点 u各样本均数未必等于总体均数 u各样本均数间存在差异 u样本均数围绕 167 69cm呈正态分布 u样本均数变异度较原总体个体值变异度 5 3cm 大大缩小 8 9 中心极限定理 central limit theorem 从均数为标准差为的总体中独立随机抽样当样本含量n较大时样本均数的分布将趋于正态分布此分布的均数为标准差为 10 中心极限定

4、理 central limit theorem 若 X i 服从正态分布则服从正态分布若 X i 不服从正态分布 n大 n 60 则近似服从正态分布 n小 n60 按u分布原理 2 两总体均数之差的可信区间 27 1 单一总体均数的1 可信区间双侧 1 未知单侧 28 故该地18岁男生身高均数的 95 可信区间为 164 35 169 55 cm 167 7cm 双尾例在例3 1中抽得第15号样本的 166 95 cm S 3 64 cm 求其总体均数的95 可信区间 166 95 2 262 1 1511 164 35 169 55 cm 29 1 单一总体均数的1 可信区间

5、双侧单侧 2 已知或未知但n足够大 30 例某地抽取正常成年人200名测得其血清胆固醇均数为3 64 mmol L 标准差为 1 20mmol L 估计该地正常成年人血清胆固醇均数95 可信区间 31 2 两总体均数之差的1 可信区间双侧单侧 32 三可信区间的确切含义 u从1999年某市18岁男生身高值总体 N 167 7cm 5 3cm 中随机抽取100个样本计算了100个估计的95 CI u其中有95个CI包含了有5个不包含 167 7cm 20号 161 00 165 57 31号 161 17 167 33 54号 168 05 171 00 76号 167

6、 71 174 84 82号 167 98 174 27 来自N 0 1 的100个样本所计算的95 可信区间示意 34 u如果能够进行重复抽样试验平均有 1 的可信区间包含了总体参数而不是总体参数落在该范围的可能性为 1 u在实际工作中只能根据一次试验结果计算一个可信区间就认为该区间包含了相应总体参数该结论犯错误的概率 u可信区间一旦形成它要么包含总体参数要么不包含总体参数二者必居其一无概率可言可信度是事前概率可信区间的确切含义 35 u正确性可信度1 即区间包含总体参数的理论概率大小愈接近1愈好 u精确性区间的宽度区间愈窄愈好 u当样本含量为定值时

7、上述两者互相矛盾若只顾提高可信度则可信区间会变宽评价可信区间估计的优劣 36 四可信区间与参考值范围的区别 u可信区间用于估计总体参数总体参数只有一个 u参考值范围用于估计个体值的分布范围个体值有很多 u95 可信区间中的95 是可信度即所求可信区间包含总体参数的可信程度为95 u95 参考值范围中的95 是一个比例即所求参考值范围包含了95 的正常人 37 第四节第四节 t t 检验检验 38 例某医生测量了36名从事铅作业男性工人的血红蛋白含量算得其均数为130 83g L 标准差为25 74g L 问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值14

8、0g L u样本均数与总体均数间差异的原因 1 总体均数不同 2 总体均数相同差异由抽样误差造成 u统计推断方法假设检验 hypothesis test 39 1 进行检验假设假设样本来自某一特定总体 2 确定检验水准确定最大允许误差 3 选定检验方法计算检验统计量计算样本与总体的偏离程度 4 计算与统计量对应的P值 5 作出结论根据小概率反证法思想作出推断假设检验一般步骤 40 t 检验 Student s t test 设计完全随机设计单样本完全随机设计两样本配对设计要求 1 n较小单组 60或两组合计 60 2 样本随机地取自正态总体 3 两样本均数比较时所对应两

9、总体方差相等 homogeneity of variance 41 例某医生测量了36名从事铅作业男性工人的血红蛋白含量算得其均数为130 83g L 标准差为25 74g L 问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g L 一单样本t 检验 1 建立检验假设确定检验水准 H0 0 140g L 铅作业男性工人的平均血红蛋白含量与正常成年男性的相等 H1 0 0 05 42 2 计算检验统计量 3 确定P值作出推断结论 2 138 t0 05 2 35 2 030 P 2 或 1 2 单侧检验 H0 1 2 H1 1 2 双侧检验单双侧检验主要根据专业

10、知识预先确定双侧检验较保守和稳妥 u检验水准预先规定的拒绝假设H0时的最大允许误差它确定了小概率事件标准在实际工作中常取0 05 但并非一成不变 63 u应根据变量和资料类型设计方案统计推断的目的方法的适用条件等选择检验统计量 u所有检验统计量都是在H0成立的前提条件下计算出来的 u检验统计量大小反映样本与总体的偏离程度如t值反映样本均数与总体均数的偏离程度以标准误进行标准化 2 计算检验统计量 64 uP值是决策的依据 uP的含义是指从H0规定的总体中随机抽样其检验统计量等于及大于现有样本的检验统计量的概率即从H0假设总体中随机抽到差别至少等于现有样本差

11、别的机会 u根据获得的事后概率P 与事先规定的概率检验水准进行比较看其是否为小概率事件而得出结论 3 确定P 值作出推断结论 65 uP 按检验水准拒绝H0 接受H1 有统计学意义统计结论 statistical significance 可认为不同高于专业结论 uP 按检验水准不拒绝H0 无统计学意义统计结论 no statistical significance 还不能认为不同专业结论不拒绝H0不等于接受H0 因此时证据不足 66 三 I型错误和II型错误健康人与肝病病人的肝大指数分布所拟合的两个正态曲线各按100 面积绘制肝大指数健康人

12、H0 肝病病人 H1 第一类错误误诊率假阳性率第二类错误漏诊率假阴性率 6 1 7 0 8 4 5 6891011 4 大小大小增加n可同时缩小 68 u 可取单尾亦可取双尾 uII型错误的概率大小用表示只取单尾值的大小一般未知须在知道两总体差值如 1 2等及n 时才能算出 u1 称检验效能 power of a test 过去称把握度为当两总体确有差异按检验水准所能发现该差异的能力 1 只取单尾 u拒绝H0 只可能犯I型错误不可能犯II型错误不拒绝H0 只可能犯II型错误不可能犯I型错误 69 四假设检验应注意的问题 1 要有严密的研究设

13、计组间应均衡具有可比性除对比的主要因素如临床试验用新药和对照药外其它可能影响结果的因素如年龄性别病程病情轻重等在对比组间应相同或相近 70 u配对设计计量资料配对t检验 u完全随机设计两样本计量资料小样本任一ni 60 且方差齐两样本t检验方差不齐近似t 检验大样本所有ni 60 u检验 2 不同资料应选用不同检验方法 71 3 正确理解 significance 一词的含义 u过去称差别有或无显著性易造成两样本统计量之间比较相差很大的误解 u现在称差别有或无统计学意义相应推断为可以认为或还不能认为两个或多个总体参数有差别 72 4 结论

14、不能绝对化 u因统计结论具有概率性质故肯定一定必定等词不要使用 u在报告结论时最好列出检验统计量的值尽量写出具体P值而不简单写成 P 0 05 以便读者与同类研究进行比较或进行循证医学时采用Meta分析 73 5 统计有意义与医学有意义 u统计有意义对应统计结论医学有意义对应专业结论 u统计结论有意义专业结论无意义最终结论没有意义样本含量过大或设计存在问题 u统计结论无意义专业结论有意义检查设计是否合理样本含量是否足够 74 6 可信区间与假设检验区别和联系 u可信区间可回答假设检验问题 H0 0 140g L 铅作业男性工人的平均血

15、红蛋白含量与正常成年男性的相等 H1 0 0 05 铅作业男性工人平均血红蛋白含量总体均数的95 CI为 122 12 139 54 g L 未包括 0 140g L 按 0 05水准拒绝H0 接受H1 75 u可信区间说明量的大小即推断总体均数所在范围假设检验推断质的不同即判断两总体均数是否不等 u可信区间不但能回答差别有无统计学意义还能提示差别有无实际专业意义 u可信区间不能够完全代替假设检验可信区间只能在预先规定概率的前提下进行计算而假设检验能获得一较为确切的P值 76 图可信区间在统计推断上提供的信息 77 第六节第六节正态性检验正态性检验和两样本方

16、差比较的和两样本方差比较的F F检验检验 78 两小样本t 检验前提条件相应的两总体为正态总体两总体方差相等即方差齐性配对t 检验前提条件每对数据差值的总体为正态总体 79 一正态性检验了解 1 图示法 u概率图 probability probability plot 以实际累积频率 X 对正态分布理论累积频率 Y 作散点图 u分位数图 quantile quantile plot 以实际分位数 X 对正态分布理论分位数作散点图 u如果实际值与理论值吻合图中散点几乎都在一直线上可认为该资料服从正态分布 80 168 167 69 1 69 0 18 164 167 69 1 69 2 18 172 167 69 1 69 2 55 81 2 计算法 u偏度 skewness 指分布不对称的程度和方向用偏度系数总体 1 样本 g1 衡量 1 0 对称 1 0 正偏态 1 0 负偏态 u峰度 kurtosis 指分布与正态曲线相比的冒尖或扁平程度用峰度系数总体 2 样本 g2 衡量 2 0 正态峰 2 0 尖峭峰 2 0 平阔峰 u当同时满足对称和正态峰

展开阅读全文