总体均数的估计与假设检验

上传人:206****923 文档编号:51474036 上传时间:2018-08-14 格式:PPT 页数:106 大小:1.93MB
返回 下载 相关 举报
总体均数的估计与假设检验_第1页
第1页 / 共106页
总体均数的估计与假设检验_第2页
第2页 / 共106页
总体均数的估计与假设检验_第3页
第3页 / 共106页
总体均数的估计与假设检验_第4页
第4页 / 共106页
总体均数的估计与假设检验_第5页
第5页 / 共106页
点击查看更多>>
资源描述

《总体均数的估计与假设检验》由会员分享,可在线阅读,更多相关《总体均数的估计与假设检验(106页珍藏版)》请在金锄头文库上搜索。

1、LOGO总体均数的估计与假设检验 Estimation of Population Mean and Hypothesis Test1Content1. Sampling error and standard error of mean2. t- distribution 3. Estimation of Population Mean 4. t-test 5. Notice of hypothesis test 6. Normality test and homogeneity of variancetest2第一节 均数的抽样误差与标准误3统计推断:由样本信息推断总体特征。样本统计指标 (

2、统计量)总体统计指标 (参数) 正态(分布)总体: 推断 ! 说明!为说明抽样误差规律,先用一个实例,后 引出理论。4图3-1 1999年某市18岁男生身高N(167.7, 5.32)的抽样示意图 5将此100个样本均数看成新变量值,则这100个样本均数构成一新分布,绘制直方图。图3-2 从正态分布总体N(167.7, 5.32)随机抽样所得样本均数分布6 ,各样本均数 未必等于总体均数; 各样本均数间存在差异; 样本均数的分布为中间多,两边少,左右基本 对称。 样本均数的变异范围较之原变量的变异范围大 大缩小。 可算得这100个样本均数的均数为167.69cm、标准 差为1.69cm。样本均

3、数的抽样分布具有如下特点:71、抽样误差:由个体变异产生的、抽样造成的样本统计 量与总体参数的差别均数的抽样误差:由于抽样造成的样本均 数与总体均数的差别原因:1)抽样2)个体差异8本书以n=60为界限9表示样本统计量抽样误差大小的统计 指标。 均数标准误:说明均数抽样误差的 大小,总体计算公式(3-1)2、标准误(standard error, SE)实质:样本均数的标准差10数理统计证明: 11若用样本标准差S 来估计 ,(3-2)降低抽样误差的途径有:通过增加样本含量n;通过设计减少S。12第二节 t 分布 (t-distribution)13vt分布概述v 抽样误差的分布规律 v v

4、样本 总体 v t分布 理论 v 手段 (桥梁) 目的14一、t 分布的概念 1516式中 为自由度(degree of freedom, df)3实际工作中,由于 未知,用 代替,则 不再服从标准正态分布,而服从t 分布。 17二、t 分布的图形与特征 分布只有一个参数,即自由度18图3-3 不同自由度下的t 分布图191特征: 202 t界值表:详见附表2,可反映t分布曲 线下的面积。单侧概率或单尾概率:用 表示;双侧概率或双尾概率:用 表示。 21-tt022举例: 23第三节 总体均数的估计24一、参数估计用样本统计量推断总体参数。总体均数估计:用样本均数(和标准差)推断总体均数。25

5、26按预先给定的概率(1)所确定的包含 未知总体参数的一个范围。总体均数的区间估计:按预先给定的 概率(1)所确定的包含未知总体均数的一 个范围。 如给定=0.05,该范围称为参数的95%可信区间或置信区间; 如给定=0.01,该范围称为参数的99%可信区间或置信区间。2区间估计(interval estimation):27二、总体均数可信区间的计算28v总体均数可信区间的计算 v需考虑: v(1)总体标准差是否已知, v (2)样本含量n的大小 v通常有两类方法: v(1)t分布法(2)u分布法291. 单一总体均数的可信区间 3031P25,15号样本323334例3-3 某地抽取正常成

6、年人200名,测得其血清胆固醇的均数为3.64 mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数的95%可信区间。 35故该地正常成年人血清胆固醇均数的双 侧95%可信区间为(3.47, 3.81)mmolL。36373839例3-4 为了解氨甲喋呤(MTX)对外周血IL-2水平的影响,某医生将61名哮喘患者随机分为两组。其中对照组29例( ),采用安慰剂;实验组32例( ),采用小剂量氨甲喋呤(MTX)进行治疗。测得对照组治疗前IL-2的均数为20.10 IU/ml ( ),标准差为7.02 IU/ml ( );试验组治疗前IL-2的均数为16.89 IU/ml

7、( ),标准差为8.46 IU/ml ( )。问两组治疗前基线的IL-2总体均数相差有多大?40第一步: 41能否下:两组IL-2的总体均数“不 同”或“有差别”的结论?42三、可信区间的确切涵义43v 1. 95%的可信区间的理解:v (1)所要估计的总体参数有95%的可能在我们所估计的可信区间内。v (2)从正态总体中随机抽取100个样本,可算得100个样本均数和标准差,也可算得100个均数的可信区间,平均约有95个可信区间包含了总体均数 。v (3)但在实际工作中,只能根据一次试验结果估计可信区间,我们就认为该区间包含了总体均数。 44v 2.可信区间的两个要素v (1)准确度:用可信度

8、(1)表示:即区间包含总体均数的理论概率大小 。v 当然它愈接近1愈好,如99%的可信区间比95%的可信区间要好 。v (2)精确度:即区间的宽度 v 区间愈窄愈好,如95%的可信区间比99%的可信区间要好 。45v 当n确定时,上述两者互相矛盾。v 提高准确度(可信度),则精确度降低v (可信区间会变宽),势必降低可信区间的实际应用价值 ,故不能笼统认为99%可信区间比95%可信区间要好。v 相反,在实际应用中,95%可信区间更为常用。46v在可信度确定的情况下,增加样本含量可减小区 间宽度,提高精确度。47四、总体均数可信区间 与参考值范围的区别48* 也可用对应于双尾概率时), *也可用

9、对应于双尾概率时 )表3-2 总体均数的可信区间与参考值范围的区别49第四节 t 检验501、样本均数 与已知某总体均数 比较t检验 目的:推断一个未知总体均数 与已知总体均 数 是否有差别,用单样本设计。 2、两个样本均数 与 比较的t检验 目的:推断两个未知总体均数 与 是否有差别,用成组设计。 3、配对设计资料均数比较的t检验 目的:推断两个未知总体均数 与 是否有差别 用配对设计。t 检验,亦称student t 检验,有下述情况:51对于大样本,也可以近似用u检验。52vt检验和u检验的应用条件:v 1. t检验应用条件:v 样本含量n较小时(如n0.05。按=0.05 水准,不拒绝

10、H0,无统计学意义。还不能认为 用两种不同药物的病人其HbA1c下降值不同。863. Satterthwaite近似t检验 :Cochran & Cox法是对临界值校正而Satterthwaite法则是对自由度校正。 87以=28.428、t=0.965查附表2的t界值 表得0.2060),则可选用大样本u检验。98v3.正确理解“显著性”一词的含义 差别有或无统计 学意义,过去称差别有或无“显著性”,是对样本 统计量与总体参数或样本统计量之间的比较而言 ,相应推断为:可以认为或还不能认为两个或多 个总体参数有差别。99v4.结论不能绝对化 因统计结论具有概率性质,故 “肯定”、“一定”、“必

11、定”等词不要使用。在报告结 论时,最好列出检验统计量的值,尽量写出具体 的P值或P值的确切范围,如写成P=0.040或 0.02P0.05,而不简单写成P0.05,以便读者 与同类研究进行比较或进行循证医学时采用Meta 分析。100v 5.假设检验是为专业服务的,统计结论必须和专业结论有 机地相结合,才能得出恰如其分、符合客观实际的最终结 论。若统计结论和专业结论一致,则最终结论就和这两者 均一致(即均有或均无意义);若统计结论和专业结论不一 致,则最终结论需根据实际情况加以考虑。若统计结论有 意义,而专业结论无意义,则可能由于样本含量过大或设 计存在问题,那么最终结论就没有意义。 1016.可信区间与假设检验各自不同的作用,要结合 使用。一方面,可信区间亦可回答假设检验的问题,算得的可信区间若包含了H0,则按水准,不拒绝H0;若不包含H0,则按水准,拒绝H0,接受H1。 102另一方面,可信区间不但能回答差别有无统计学意义,而且还能比假设检验提供更多的信息,即提示差别有无实际的专业意义。 103图3-7 可信区间在统计推断上提供的信息 104虽然可信区间亦可回答假设检验的问题,并能提供更多的信息,但并不意味着可信区间能够完全代替假设检验。可信区间只能在预先规定的概率 检验水准的前提下进行计算,而假设检验能够获得一较为确切的概率P值。 105106

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号