第三章总体均数的估计与假设检验课件

资源描述

《第三章总体均数的估计与假设检验课件》由会员分享，可在线阅读，更多相关《第三章总体均数的估计与假设检验课件（130页珍藏版）》请在金锄头文库上搜索。

1、1,第三章总体均数的估计与假设检验 Estimation of Population Mean and Hypothesis Test,2,Content 1. Sampling error and standard error of mean 2. t- distribution 3. Estimation of Population Mean 4. t-test 5. Notice of hypothesis test 6. Normality test and homogeneity of variance test,3,第一节均数的抽样误差与标准误,4,统计推断：由样本信息推断总体

2、特征。,正态（分布）总体：推断！说明！为说明抽样误差规律，先用一个实例，后引出理论。,5,图3-1 1999年某市18岁男生身高N(167.7, 5.32)的抽样示意图,6,见P3436表3-1,7,将此100个样本均数看成新变量值，则这100个样本均数构成一新分布，绘制直方图。,图3-2 从正态分布总体N(167.7, 5.32)随机抽样所得样本均数分布,8, ，各样本均数未必等于总体均数；各样本均数间存在差异；样本均数的分布为中间多，两边少，左右基本对称。样本均数的变异范围较之原变量的变异范围大大缩小。可算得这100个样本均数的均数为167.69cm、标准差为1.69cm

3、。,样本均数的抽样分布具有如下特点：,9,1、抽样误差：,由个体变异产生的、抽样造成的样本统计量与总体参数的差别均数的抽样误差：由于抽样造成的样本均数与总体均数的差别原因：1）抽样 2）个体差异,10,本书以n=60为界限,11,表示样本统计量抽样误差大小的统计指标。均数标准误：说明均数抽样误差的大小，总体计算公式（3-1）,2、标准误(standard error, SE),实质：样本均数的标准差,12,数理统计证明：,13,若用样本标准差S 来估计 , （3-2）降低抽样误差的途径有：通过增加样本含量n；通过设计减少S。,14,第二节 t 分布 (t-distribution

4、),15,t分布概述抽样误差的分布规律样本总体 t分布理论手段（桥梁）目的,16,一、t 分布的概念,17,18,式中为自由度(degree of freedom, df),3实际工作中，由于未知，用代替，则不再服从标准正态分布，而服从t 分布。,19,二、t 分布的图形与特征,分布只有一个参数，即自由度,20,图3-3 不同自由度下的t 分布图,21,1特征：,22,2 t界值表：详见附表2，可反映t分布曲线下的面积。单侧概率或单尾概率：用表示；双侧概率或双尾概率：用表示。,23,24,举例：,25,第三节总体均数的估计,26,一、参数估计用样本统计量推断总

5、体参数。总体均数估计：用样本均数（和标准差）推断总体均数。,27,28,按预先给定的概率(1)所确定的包含未知总体参数的一个范围。总体均数的区间估计：按预先给定的概率(1)所确定的包含未知总体均数的一个范围。如给定=0.05,该范围称为参数的95%可信区间或置信区间；如给定=0.01,该范围称为参数的99%可信区间或置信区间。,2区间估计(interval estimation)：,29,二、总体均数可信区间的计算,30,总体均数可信区间的计算需考虑：（1）总体标准差是否已知，（2）样本含量n的大小通常有两类方法：（1）t分布法（2）u分布法,31,1. 单一总体均数的可信

6、区间,32,33,P25,15号样本,34,35,36,例3-3 某地抽取正常成年人200名，测得其血清胆固醇的均数为3.64 mmol/L，标准差为1.20mmol/L，估计该地正常成年人血清胆固醇均数的95%可信区间。,37,故该地正常成年人血清胆固醇均数的双侧95%可信区间为(3.47, 3.81)mmolL。,38,39,40,41,例3-4 为了解氨甲喋呤(MTX)对外周血IL-2水平的影响，某医生将61名哮喘患者随机分为两组。其中对照组29例( )，采用安慰剂；实验组32例( )，采用小剂量氨甲喋呤(MTX)进行治疗。测得对照组治疗前IL-2的均数为20.10 IU/ml ( )，

7、标准差为7.02 IU/ml ( )；试验组治疗前IL-2的均数为16.89 IU/ml ( )，标准差为8.46 IU/ml ( )。问两组治疗前基线的IL-2总体均数相差有多大？,42,第一步：,43,能否下：两组IL-2的总体均数“不同”或“有差别”的结论？,44,三、可信区间的确切涵义,45,1. 95%的可信区间的理解：（1）所要估计的总体参数有95%的可能在我们所估计的可信区间内。（2）从正态总体中随机抽取100个样本，可算得100个样本均数和标准差，也可算得100个均数的可信区间，平均约有95个可信区间包含了总体均数。（3）但在实际工作中，只能根据一次试验结果估计可信区间

8、，我们就认为该区间包含了总体均数。,46,2.可信区间的两个要素（1）准确度：用可信度（1）表示：即区间包含总体均数的理论概率大小。当然它愈接近1愈好，如99%的可信区间比95%的可信区间要好。（2）精确度：即区间的宽度区间愈窄愈好，如95%的可信区间比99%的可信区间要好。,47,当n确定时，上述两者互相矛盾。提高准确度（可信度），则精确度降低（可信区间会变宽），势必降低可信区间的实际应用价值，故不能笼统认为99%可信区间比95%可信区间要好。相反，在实际应用中，95%可信区间更为常用。,48,在可信度确定的情况下，增加样本含量可减小区间宽度，提高精确度。,49,四、总体

9、均数可信区间与参考值范围的区别,50,* 也可用对应于双尾概率时), *也可用对应于双尾概率时),表3-2 总体均数的可信区间与参考值范围的区别,51,第四节 t 检验,52,1、样本均数与已知某总体均数比较的t检验目的：推断一个未知总体均数与已知总体均数是否有差别，用单样本设计。 2、两个样本均数与比较的t检验目的：推断两个未知总体均数与是否有差别,用成组设计。 3、配对设计资料均数比较的t检验目的：推断两个未知总体均数与是否有差别用配对设计。,t 检验，亦称student t 检验,有下述情况:,53,对于大样本,也可以近似用u检验。,54,t检验和u检验的应用

10、条件: 1. t检验应用条件: 样本含量n较小时(如n60) (1)正态分布 (2)方差齐性(homogeneity of variance) 2. u 检验应用条件: 样本含量n较大，或n虽小但总体标准差已知 (1)正态分布 (2)方差齐性(homogeneity of variance),55,假设检验过去称显著性检验。它是利用小概率反证法思想，从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量，最后获得P值来判断。,假设检验基本思想及步骤,56,例3-5 某医生测量了36名从事铅作业男性工人的血红蛋白含量，算得其均数为130.83g/L，

11、标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L？ 130.83g/L 140g/L 原因： 1.可能是总体均数不同 2.是抽样造成的,57,58,H1的内容直接反映了检验单双侧。若H1中只是 0 或 0，则此检验为单侧检验。它不仅考虑有无差异，而且还考虑差异的方向。单双侧检验的确定，首先根据专业知识，其次根据所要解决的问题来确定。若从专业上看一种方法结果不可能低于或高于另一种方法结果，此时应该用单侧检验。一般认为双侧检验较保守和稳妥。,59,(3) 检验水准，过去称显著性水准，是预先规定的概率值，它确定了小概率事件的标准。在实际工作中常取 = 0

12、.05。可根据不同研究目的给予不同设置。,60,61,62,图3-5 例3-5中P值示意图,63,64,若，是否也能下“无差别”或“相等”的结论？,65,一、单样本 t 检验 (one sample / group t-test),即样本均数（代表未知总体均数）与已知总体均数0(一般为理论值、标准值或经过大量观察所得稳定值等)的比较。其检验统计量按下式计算,66,例3-5 某医生测量了36名从事铅作业男性工人的血红蛋白含量，算得其均数为130.83g/L，标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L？ (1)建立检验假设，确定检验水准 H0:

13、 =0 =140g/L，即铅作业男性工人平均血红蛋白含量与正常成年男性平均值相等 H1: 0=140g/L，即铅作业男性工人平均血红蛋白含量与正常成年男性平均值不等 =0.05,67,(2)计算检验统计量,68,(3)确定P值，作出推断结论,69,配对t 检验适用于配对设计的计量资料。配对设计类型：两同质受试对象分别接受两种不同的处理；同一受试对象分别接受两种不同处理；同一受试对象(一种)处理前后。,二、配对t 检验 (paired / matched t-test),70,例3-6 为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同，某人随机抽取了10份乳酸饮料制品，分别用脂肪酸水解法

14、和哥特里罗紫法测定其结果如表3-3第(1)(3)栏。问两法测定结果是否不同？,71,表3-3 两种方法对乳酸饮料中脂肪含量的测定结果(%),72,(1)建立检验假设，确定检验水准 H0：d0，即两种方法的测定结果相同 H1：d0，即两种方法的测定结果不同 =0.05 (2)计算检验统计量本例n=10，d=2.724，d2=0.8483，,73,按公式(3-16) (3)确定P值，作出推断结论查附表2的t界值表得P0.001。按=0.05水准，拒绝H0，接受H1，有统计学意义。可认为两种方法对脂肪含量的测定结果不同，哥特里罗紫法测定结果较高。,74,三、两样本t检验 (two-sample

15、/ group t-test),又称成组 t 检验，适用于完全随机设计两样本均数的比较，此时人们关心的是两样本均数所代表的两总体均数是否不等。两组完全随机设计是将受试对象完全随机分配到两个不同处理组。,75,适用范围：完全随机设计两样本均数的比较检验方法：依两总体方差是否齐性而定。,76,77,例3-7 为研究国产四类新药阿卡波糖胶囊的降血糖效果，某医院用40名II型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等分到试验组(用阿卡波糖胶囊)和对照组(用拜唐苹胶囊)，分别测得试验开始前和8周后的空腹血糖，算得空腹血糖下降值见表3-4，能否认为该国产四类新药阿卡波糖胶囊与拜唐苹胶囊对空

16、腹血糖的降糖效果不同？,78,79,(2)计算检验统计量,80,(3)确定P值，作出推断结论,81,若变量变换后总体方差齐性可采用t 检验(如两样本几何均数的t 检验，就是将原始数据取对数后进行t 检验)；若变量变换后总体方差仍然不齐可采用t 检验或Wilcoxon秩和检验。,若两总体方差不等（），？,82,2. Cochran & Cox近似t 检验（t 检验）调整 t 界值,83,84,例3-8 在上述例3-7国产四类新药阿卡波糖胶囊的降血糖效果研究中，测得用拜唐苹胶囊的对照组20例病人和用阿卡波糖胶囊的试验组20例病人，其8周时糖化血红蛋白HbA1c(%)下降值如表3-5。问用两种不同药物的病人其HbA1c下降值是否不同？,85,表3-5 对照组和试验组HbA1c下降值(%),对照组方差是试验组方差的3.77

展开阅读全文

第三章 总体均数的估计与假设检验课件

第三章总体均数的估计与假设检验课件