总体均数估计及假设检验

资源描述

《总体均数估计及假设检验》由会员分享，可在线阅读，更多相关《总体均数估计及假设检验（73页珍藏版）》请在金锄头文库上搜索。

1、医学统计学Medical Statistics,第五章参数估计基础第六章假设检验基础 Parameter estimation and hypothesis testing,统计学的分析思路,sample,population,Sampling (抽样研究),Inferring (统计推断),统计推断(statistical inference),总体参数的估计（第五章） (parameter estimation)假设检验（第六章） (hypothesis testing),Outline,均数的抽样误差与标准误 t分布总体均数的估计假设检验的概念和原理 t检验假设检验的注意事项

2、正态性检验和方差齐性检验,总体,第一节均数的抽样误差与标准误,抽样误差(sampling error)有两种表现形式：（1）样本统计量与总体参数间的差异，例如样本均数与总体均数间的差异。（2）样本统计量间的差异。均数的抽样误差：由个体变异产生、随机抽样造成的样本均数与总体均数之间的差异。,抽样误差产生的原因 (1) 抽样研究。抽样是抽样误差产生的基本条件之一。样本例数越少，抽样误差可能会越大。 (2) 个体变异。变异是抽样误差产生的又一基本条件。变异是普遍存在的，也正是医学统计学所要研究的。变异大的事物其抽样误差也大，反之则小。,抽样误差的特点与意义,抽样误差的特点抽样研究中抽样误差

3、不可避免可以估计和控制抽样误差抽样误差的意义用于参数估计和假设检验,描述抽样误差的指标,样本含量相等的样本均数的变异度可描述均数的抽样误差。样本均数的变异度如何度量？样本均数的标准差,中心极限定理（central limit theorem） 1、当原始观察值的分布为正态分布时，样本均数的分布服从正态分布（特点：4个）。即使从非正态总体中随机抽样，只要样本含量足够大，样本均数的分布也趋于正态分布。见表5-2，图5-1、5-2 2、样本均数的均数等于原总体的总体均数（），样本均数的标准差等于。,标准误通常将样本统计量的标准差称为标准误 (standard error，SE)样本均数的标准差称

4、为均数的标准误（理论值）（估计值）,标准差与标准误的区别与联系,应用：标准差属统计描述参考值范围标准误为统计推断置信区间估计和假设检验意义：标准差越小，均数代表性越好；标准误越小，抽样误差越小，样本均数估计总体均数可靠性越大。与n的关系：n越大，标准差越稳定； n越大，标准误越小。都是描述变异度的指标。样本含量固定，标准差越大，标准误越大。,区别,联系,第二节 t 分布,W.S. Gosset（18761937） 1908年， Gosset首次以Student为笔名，在Biometrika杂志上发表了“The probable error of a mean”。由于这篇文章

5、提供了“t检验”的基础，为此，许多统计学家把1908年看作是统计推断理论发展史上的里程碑。,William Sealy Gosset,Gosset是英国一家酿酒厂的化学技师，在长期从事实验和数据分析工作中，发现了t分布。但当时Gosset的公司害怕商业机密外泄，禁止员工对外发表文章。所以Gosset在1908年以“Student”笔名发表此项结果，故后人又称它为“Student t分布”。在当时正态分布一统天下的情况下， Gosset的分布没有被外界理解和接受，只能在他的酿酒厂中使用，直到1923年英国统计学家Fisher给出分布的严格推导并于1925年编制了t分布表后，t分布才得到学术界的

6、承认，并获得迅速的传播、发展和应用。,William Sealy Gosset,英国统计学家，小样本理论和方法的创立者，现代统计方法及其应用于实验设计与分析的先驱。 Gosset的主要贡献是创立了t分布，开创了小样本理论的先河。由于Gosset开创的理论使统计学开始由大样本向小样本、由描述向推断发展，因此，有人把Gosset推崇为推断统计学(尤其是小样本理论研究)的先驱者。,随机变量X N（m，s2）,标准正态分布 N（0，12）,z变换,均数 ,标准正态分布 N（0，12）,Student t分布自由度：n-1,S,t 分布的图形（u 分布是t 分布的特例）,t分布的特征,以0为中心，

7、左右对称的单峰分布；t分布曲线是一簇曲线，其形态变化与自由度的大小有关。自由度越小，则t值越分散，曲线越低平；自由度逐渐增大时，t分布逐渐逼近u分布(标准正态分布)；当趋于时，t分布即为u分布。,t 界值表应用1 已知和，求t,1.812,2.228,-2.228,t,f (t),=10的t分布图,t界值表应用2,已知和t，求面积P举例： =10，t=2，P的范围（单、双侧） =10，t=3，P的范围 =10，t=5，P的范围结论：自由度一定，t绝对值越大，P值越小。自由度一定，t值一定，双侧概率为单侧概率的2倍。,参数估计 Parameter estimation,点估计(poi

8、nt estimation) ：由样本统计量直接估计总体参数,区间估计(interval estimation): 获得一个置信区间(confidence interval,CI)按预先给定的概率(1)所确定的包含未知总体参数的一个范围。,第三节总体均数的估计,置信区间的计算,总体均数置信区间估计的通式,(1)或100 (1) 称为置信度（confidence level），常取95（90、99）。即95置信区间，或95%CI。,置信区间的有关概念,置信区间的两个界值即两个置信限(confidence limit，CL)：较小的称为置信下限（lower limit，L），较大的称为置信上限

9、（upper limit，U），,换句话说，做出所有18岁男生身高总体均数为164.4 169.6cm的结论，说对的概率是95%，说错的概率是5%。,置信区间的含义：虽然不能知道某地所有18岁男生身高总体均数的确切数值，所有18岁男生身高均数在164.4 169.6cm之间的可能性是95%。,置信区间的两个要素准确度：即置信度，越高越好。精度：即区间的宽度，越窄越好。置信区间与参考值范围的区别,第六章假设检验基础,补充例子通过以往大规模调查，已知某地正常成年男子的脉搏均数为72次/分，某医生在该地某山区随机调查了25名正常成年男子，脉搏均数为74.2次/分，标准差为6.0次/分，可否

10、认为该山区成年男子的脉搏总体均数高于一般？,假设检验的基本步骤,步骤1：建立假设，确定检验水准。检验假设 (null hypothesis)、原假设，或零假设，记为H0，表示目前的差异是由于抽样误差引起的。 H0：72次/分，山区正常成年男子与一般正常成年男子的平均脉搏相等；备择假设(alternative hypothesis)，记为H1，表示目前的差异是主要由于本质上的差别引起的。H1： 72次/分，山区正常成年男子平均脉搏高于一般正常成年男子。,假设检验的一般步骤,H0假设比较单纯、明确，且在该假设的前提下有规律可寻。而H1假设包含的情况比较复杂。因此，检验是针对H0的。,假设检

11、验的基本原理,“反证法”的原理提出一个假设如果假设成立，得到现有样本的可能性可能性很小（小概率事件），在一次试验中本不该得到，居然得到了，即样本信息不支持H0，说明我们的假设有问题，拒绝之。有可能得到手头的结果，故根据现有的样本无法拒绝事先的假设（没理由）。,双侧检验与单侧检验,双侧检验（two-sided test）H0 : 0H1 : 0,单侧检验（one-sided test）H0 : 0 H0 : 0H1 : 0 H1 : 0,双侧检验与单侧检验,选择要结合专业实际；在相同的检验水准下，正确地选择单侧检验将比双侧检验得到更多的检验效能。选择要在计算检验统计量之前；,假设检

12、验的一般步骤,检验水准（size of a test，significance level）符号常取用于判断小概率事件的概率值，表示拒绝实际上成立的H0时，推断错误的最大允许概率。,假设检验的一般步骤,步骤2：选定检验方法，计算检验统计量。根据设计类型和资料类型选择假设检验方法。,假设检验的一般步骤,样本均数与总体均数0 间的差别可以用统计量t来表示：例子t=1.833,假设检验的一般步骤,步骤3：确定P值，作出推断结论。根据小概率原理作出推断根据t分布曲线下面积的分布规律(抽样分布规律)，在H0成立的前提下出现现有差别或更大差别的可能性小于0.05，是小概率事件，这在一次试验中是不太可

13、能发生的。然而不太可能发生的事件在一次试验中居然发生了，即现有样本信息不支持H0。因此，拒绝H0。注意这时拒绝H0有冒犯错误的风险,假设检验的一般步骤,若P0.05，说明在H0成立的前提下出现现有差别或更大差别的可能性不是小概率事件，因此，没有理由拒绝H0。抉择的标准为：当P 时，拒绝H0，接受H1；差别有统计学意义（statistically significant）。当P 时，不拒绝H0。差别无统计学意义（ statistically non-significant ，NS）。,第2节 t检验,t test，Student t test单样本t检验配对样本t检验两独立样本t检验,t

14、检验的应用条件,独立性：两样本数据互相独立。正态性：两样本资料均服从正态分布（对小样本而言）方差齐性：两总体方差相等。,1、单样本t检验,One-sample t test检验的目的是手头的样本所来自的总体均数是否与已知的总体均数一致。这里已知的总体均数一般指理论值、标准值或大量观察得到的稳定值。,三个实例,例1：山区成年男子脉搏数与一般成年男子脉搏数（72次/分）比较例2：铅作业男性工人血红蛋白与正常成年男性血红蛋白（140g/L）比较例3：陈旧性心肌梗死患者血浆载脂蛋白E与正常人血浆载脂蛋白E（5.22mmol/L）比较,2、配对样本t检验,Paired samples t test配对设

15、计（paired design）Why paired？控制可能存在的非处理因素，增加两组的可比性。配对设计的形式条件相近者配对（异体配对）自身配对,条件相近者配对,自身配对,配对设计,优点：组间同质性（可比性）好。缺点：条件相近者配对实施困难。自身前后配对为非同期对照，可比性可能有问题。,配对样本t检验原理,分析策略：差值总体均数与0比较,（1）H0 : 1 2；或d0; H1 : 1 2；或d0。 0.05 （2）（3）确定 P 值，做出推断结论。,3、两独立样本t检验,Two independent samples t test完全随机设计/成组设计：优点：实施简便缺点：组间同质性（可比性）可能差,问题：,A药组 B药组,？,两独立样本t检验,(1) H0 : 12H1 : 120.05 (2) 计算检验统计量 t 自由度 = n1+n2 -2 。 (3)确定P值，作出推断结论。,两独立样本t检验,合并方差(方差的加权平均)均数之差的标准误,第七节正态性检验和方差齐性检验,单样本t检验要求样本来自正态分布的总体。配对样本t检验要求差值d来自正态分布的总体。两独立样本t检验要求两个样本都来自正态分布并具有相同的方差。,

展开阅读全文