总体均数估计和假设检验正式

上传人:ap****ve 文档编号:119737370 上传时间:2020-01-24 格式:PPT 页数:86 大小:1.81MB
返回 下载 相关 举报
总体均数估计和假设检验正式_第1页
第1页 / 共86页
总体均数估计和假设检验正式_第2页
第2页 / 共86页
总体均数估计和假设检验正式_第3页
第3页 / 共86页
总体均数估计和假设检验正式_第4页
第4页 / 共86页
总体均数估计和假设检验正式_第5页
第5页 / 共86页
点击查看更多>>
资源描述

《总体均数估计和假设检验正式》由会员分享,可在线阅读,更多相关《总体均数估计和假设检验正式(86页珍藏版)》请在金锄头文库上搜索。

1、1 第三章第三章 总体均数的估计总体均数的估计 与假设检验与假设检验 华中科技大学公共卫生学院华中科技大学公共卫生学院 流行病与卫生统计学系流行病与卫生统计学系 蒋红卫蒋红卫 Email JHWCCC 21CN COMEmail JHWCCC 21CN COM 2 uu均数的抽样误差与标准误均数的抽样误差与标准误 uu t t 分布分布 uu总体均数的估计总体均数的估计 uu t t 检验检验 uu假设检验的注意事项假设检验的注意事项 uu正态性检验和两样本方差比较的正态性检验和两样本方差比较的F F检验检验 讲课内容讲课内容 3 第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误 4

2、 u了解总体特征的最好方法是对总体的每一 个体进行观察 试验 但这在医学研究实 际中往往不可行 u对无限总体不可能对所有个体逐一观察 对有限总体限于人力 财力 物力 时间 或个体过多等原因 不可能也没必要对所 有个体逐一研究 如对一批罐头质量检查 u借助抽样研究 5 u欲了解某地18岁男生身高值的平均水平 随机抽取该地10名男生身高值作为样本 u由于个体变异与抽样的影响 抽得的样本 均数不太可能等于总体均数 造成样本统 计量与总体参数间的差异 表现为来自同一 总体的若干样本统计量间的差异 称为抽 样误差 u抽样误差是不可避免的 u抽样误差是有规律的 6 1999年某市18 岁男生身高值 Xi

3、N 2 167 7cm 5 3cm 样本号 1 167 41 2 74 2 165 56 6 57 3 168 20 5 36 99 169 40 5 57 100 165 69 5 09 ni 10 7 样本均数抽样分布具有如下特点 u各样本均数未必等于总体均数 u各样本均数间存在差异 u样本均数围绕 167 69cm呈正态分布 u样本均数变异度 较原总体个 体值变异度 5 3cm 大大缩小 8 9 中心极限定理 central limit theorem 从均数为 标准差为 的总体中独立随机 抽样 当样本含量n较大时 样本均数的分布将趋于正态分布 此分布的均数为 标准差为 10 中心极限定

4、理 central limit theorem 若 X i 服从正态分布 则 服从正态分布 若 X i 不服从正态分布 n大 n 60 则 近似服从正态分布 n小 n60 按u分布原理 2 两总体均数之差的可信区间 27 1 单一总体均数的1 可信区间 双侧 1 未知 单侧 28 故该地18岁男生身高均数的 95 可信区间为 164 35 169 55 cm 167 7cm 双尾 例 在例3 1中抽得第15号样本的 166 95 cm S 3 64 cm 求其总体均数的95 可信区间 166 95 2 262 1 1511 164 35 169 55 cm 29 1 单一总体均数的1 可信区间

5、 双侧 单侧 2 已知或 未知但n足够大 30 例 某地抽取正常成年人200名 测得其血 清胆固醇均数为3 64 mmol L 标准差为 1 20mmol L 估计该地正常成年人血清胆 固醇均数95 可信区间 31 2 两总体均数之差的1 可信区间 双侧 单侧 32 三 可信区间的确切含义 u从1999年某市18岁男生身高值总体 N 167 7cm 5 3cm 中随机抽取100个样本 计算了100个估计 的95 CI u其中有95个CI包含了 有5个不包含 167 7cm 20号 161 00 165 57 31号 161 17 167 33 54号 168 05 171 00 76号 167

6、 71 174 84 82号 167 98 174 27 来自N 0 1 的100个样本所计算的95 可信区间示意 34 u如果能够进行重复抽样试验 平均有 1 的可信区间包含了总体参数 而不是 总体参数落在该范围的可能性为 1 u在实际工作中 只能根据一次试验结果计 算一个可信区间 就认为该区间包含了相应 总体参数 该结论犯错误的概率 u可信区间一旦形成 它要么包含总体参数 要么不包含总体参数 二者必居其一 无 概率可言 可信度是事前概率 可信区间的确切含义 35 u正确性 可信度1 即区间包含总体参数 的理论概率大小 愈接近1愈好 u精确性 区间的宽度 区间愈窄愈好 u当样本含量为定值时

7、上述两者互相矛盾 若只顾提高可信度 则可信区间会变宽 评价可信区间估计的优劣 36 四 可信区间与参考值范围的区别 u可信区间用于估计总体参数 总体参数只 有一个 u参考值范围用于估计个体值的分布范围 个体值有很多 u95 可信区间中的95 是可信度 即所求可 信区间包含总体参数的可信程度为95 u95 参考值范围中的95 是一个比例 即 所求参考值范围包含了95 的正常人 37 第四节第四节 t t 检验检验 38 例 某医生测量了36名从事铅作业男性工人的 血红蛋白含量 算得其均数为130 83g L 标 准差为25 74g L 问从事铅作业工人的血红蛋 白是否不同于正常成年男性平均值14

8、0g L u样本均数与总体均数间差异的原因 1 总体均数不同 2 总体均数相同 差异由抽样误差造成 u统计推断方法 假设检验 hypothesis test 39 1 进行检验假设 假设样本来自某一特定总体 2 确定检验水准 确定最大允许误差 3 选定检验方法计算检验统计量 计算样本与总体的偏离程度 4 计算与统计量对应的P值 5 作出结论 根据小概率反证法思想作出推断 假设检验一般步骤 40 t 检验 Student s t test 设计 完全随机设计单样本 完全随机设计两样本 配对设计 要求 1 n较小 单组 60或两组合计 60 2 样本随机地取自正态总体 3 两样本均数比较时所对应两

9、总体 方差相等 homogeneity of variance 41 例 某医生测量了36名从事铅作业男性工人的 血红蛋白含量 算得其均数为130 83g L 标 准差为25 74g L 问从事铅作业工人的血红蛋 白是否不同于正常成年男性平均值140g L 一 单样本t 检验 1 建立检验假设 确定检验水准 H0 0 140g L 铅作业男性工人的平均血红蛋 白含量与正常成年男性的相等 H1 0 0 05 42 2 计算检验统计量 3 确定P值 作出推断结论 2 138 t0 05 2 35 2 030 P 2 或 1 2 单侧检验 H0 1 2 H1 1 2 双侧检验 单双侧检验主要根据专业

10、知识预先确定 双侧检验较保守和稳妥 u检验水准 预先规定的拒绝假设H0时的最 大允许误差 它确定了小概率事件标准 在实际工作中常取0 05 但并非一成不变 63 u应根据变量和资料类型 设计方案 统 计推断的目的 方法的适用条件等选择 检验统计量 u所有检验统计量都是在H0成立的前提条 件下计算出来的 u检验统计量大小反映样本与总体的偏离 程度 如t值反映样本均数与总体均数 的偏离程度 以标准误进行标准化 2 计算检验统计量 64 uP值是决策的依据 uP的含义是指从H0规定的总体中随机抽样 其检验统计量等于及大于现有样本的检验 统计量的概率 即从H0假设总体中随机抽 到差别至少等于现有样本差

11、别的机会 u根据获得的事后概率P 与事先规定的 概率 检验水准 进行比较 看其是否为 小概率事件而得出结论 3 确定P 值 作出推断结论 65 uP 按 检验水准 拒绝H0 接受H1 有统计学意义 统计结论 statistical significance 可认为 不同 高于 专业结论 uP 按 检验水准 不拒绝H0 无统计学意义 统计结论 no statistical significance 还不能认为 不同 专业结论 不拒绝H0不等于接受H0 因此时证据不足 66 三 I型错误和II型错误 健康人与肝病病人的肝大指数分布 所拟合的两个正态曲线各按100 面积绘制 肝 大 指 数 健康人

12、H0 肝病病人 H1 第一类错误 误诊率 假阳性率 第二类错误 漏诊率 假阴性率 6 1 7 0 8 4 5 6891011 4 大 小 大 小 增加n可同时缩小 68 u 可取单尾亦可取双尾 uII型错误的概率大小用 表示 只取单尾 值的大小一般未知 须在知道两总体差值 如 1 2等 及n 时 才能算出 u1 称检验效能 power of a test 过去称 把 握度 为当两总体确有差异 按检验水准 所能发现该差异的能力 1 只取单尾 u拒绝H0 只可能犯I型错误 不可能犯II型 错误 不拒绝H0 只可能犯II型错误 不 可能犯I型错误 69 四 假设检验应注意的问题 1 要有严密的研究设

13、计 组间应均衡 具有可比性 除对比的主要因 素 如临床试验用新药和对照药 外 其它可 能影响结果的因素 如年龄 性别 病程 病情轻重等 在对比组间应相同或相近 70 u配对设计计量资料 配对t检验 u完全随机设计两样本计量资料 小样本 任一ni 60 且方差齐 两样本t检验 方差不齐 近似t 检验 大样本 所有ni 60 u检验 2 不同资料应选用不同检验方法 71 3 正确理解 significance 一词的含义 u过去称差别有或无 显著性 易造成两 样本统计量之间比较相差很大的误解 u现在称差别有或无 统计学意义 相应推断为 可以认为或还不能认为两 个或多个总体参数有差别 72 4 结论

14、不能绝对化 u因统计结论具有概率性质 故 肯定 一定 必定 等词不要使用 u在报告结论时 最好列出检验统计量的 值 尽量写出具体P值 而不简单写成 P 0 05 以便读者与同类研究进行比 较或进行循证医学时采用Meta分析 73 5 统计 有意义 与医学 有意义 u统计 有意义 对应统计结论 医学 有意 义 对应专业结论 u统计结论有意义 专业结论无意义 最 终 结论没有意义 样本含量过大或设计存在 问题 u统计结论无意义 专业结论有意义 检 查 设计是否合理 样本含量是否足够 74 6 可信区间与假设检验区别和联系 u可信区间可回答假设检验问题 H0 0 140g L 铅作业男性工人的平均血

15、红蛋 白含量与正常成年男性的相等 H1 0 0 05 铅作业男性工人平均血红蛋白含量总体 均数 的95 CI为 122 12 139 54 g L 未包括 0 140g L 按 0 05水准 拒绝H0 接受H1 75 u可信区间说明量的大小即推断总体均数 所在范围 假设检验推断质的不同即判 断两总体均数是否不等 u可信区间不但能回答差别有无统计学意 义 还能提示差别有无实际专业意义 u可信区间不能够完全代替假设检验 可 信区间只能在预先规定概率 的前提下 进行计算 而假设检验能获得一较为确 切的P值 76 图 可信区间在统计推断上提供的信息 77 第六节第六节 正态性检验正态性检验 和两样本方

16、差比较的和两样本方差比较的F F检验检验 78 两小样本t 检验前提条件 相应的两总体为正态总体 两总体方差相等 即方差齐性 配对t 检验前提条件 每对数据差值的总体为正态总体 79 一 正态性检验 了解 1 图示法 u概率图 probability probability plot 以实际累积频率 X 对正态分布理论累积频率 Y 作散点图 u分位数图 quantile quantile plot 以实际分位数 X 对正态分布理论分位数 作散点图 u如果实际值与理论值吻合 图中散点几乎 都在一直线上 可认为该资料服从正态分布 80 168 167 69 1 69 0 18 164 167 69 1 69 2 18 172 167 69 1 69 2 55 81 2 计算法 u偏度 skewness 指分布不对称的程度和方向 用偏度系数 总体 1 样本 g1 衡量 1 0 对称 1 0 正偏态 1 0 负偏态 u峰度 kurtosis 指分布与正态曲线相比的冒 尖或扁平程度 用峰度系数 总体 2 样本 g2 衡量 2 0 正态峰 2 0 尖峭峰 2 0 平阔 峰 u当同时满足对称和正态峰

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号