第三章 总体均数的估计与假设检验课件

上传人:我*** 文档编号:141314059 上传时间:2020-08-06 格式:PPT 页数:130 大小:524KB
返回 下载 相关 举报
第三章 总体均数的估计与假设检验课件_第1页
第1页 / 共130页
第三章 总体均数的估计与假设检验课件_第2页
第2页 / 共130页
第三章 总体均数的估计与假设检验课件_第3页
第3页 / 共130页
第三章 总体均数的估计与假设检验课件_第4页
第4页 / 共130页
第三章 总体均数的估计与假设检验课件_第5页
第5页 / 共130页
点击查看更多>>
资源描述

《第三章 总体均数的估计与假设检验课件》由会员分享,可在线阅读,更多相关《第三章 总体均数的估计与假设检验课件(130页珍藏版)》请在金锄头文库上搜索。

1、1,第三章 总体均数的估计与假设检验 Estimation of Population Mean and Hypothesis Test,2,Content 1. Sampling error and standard error of mean 2. t- distribution 3. Estimation of Population Mean 4. t-test 5. Notice of hypothesis test 6. Normality test and homogeneity of variance test,3,第一节 均数的抽样误差与标准误,4,统计推断:由样本信息推断总体

2、特征。,正态(分布)总体: 推断 ! 说明! 为说明抽样误差规律,先用一个实例,后引出理论。,5,图3-1 1999年某市18岁男生身高N(167.7, 5.32)的抽样示意图,6,见P3436表3-1,7,将此100个样本均数看成新变量值,则这100个样本均数构成一新分布,绘制直方图。,图3-2 从正态分布总体N(167.7, 5.32)随机抽样所得样本均数分布,8, ,各样本均数 未必等于总体均数; 各样本均数间存在差异; 样本均数的分布为中间多,两边少,左右基本对称。 样本均数的变异范围较之原变量的变异范围大大缩小。 可算得这100个样本均数的均数为167.69cm、标准差为1.69cm

3、。,样本均数的抽样分布具有如下特点:,9,1、抽样误差:,由个体变异产生的、抽样造成的样本统计量与总体参数的差别 均数的抽样误差:由于抽样造成的样本均数与总体均数的差别 原因:1)抽样 2)个体差异,10,本书以n=60为界限,11,表示样本统计量抽样误差大小的统计指标。 均数标准误:说明均数抽样误差的大小,总体计算公式 (3-1),2、标准误(standard error, SE),实质:样本均数的标准差,12,数理统计证明:,13,若用样本标准差S 来估计 , (3-2) 降低抽样误差的途径有: 通过增加样本含量n; 通过设计减少S。,14,第二节 t 分布 (t-distribution

4、),15,t分布概述 抽样误差的分布规律 样本 总体 t分布 理论 手段 (桥梁) 目的,16,一、t 分布的概念,17,18,式中 为自由度(degree of freedom, df),3实际工作中,由于 未知,用 代替,则 不再服从标准正态分布,而服从t 分布。,19,二、t 分布的图形与特征,分布只有一个参数,即自由度,20,图3-3 不同自由度下的t 分布图,21,1特征:,22,2 t界值表:详见附表2,可反映t分布曲线下的面积。 单侧概率或单尾概率:用 表示; 双侧概率或双尾概率:用 表示。,23,24,举例:,25,第三节 总体均数的估计,26,一、参数估计 用样本统计量推断总

5、体参数。 总体均数估计:用样本均数(和标准差)推断总体均数。,27,28,按预先给定的概率(1)所确定的包含未知总体参数的一个范围。 总体均数的区间估计:按预先给定的概率(1)所确定的包含未知总体均数的一个范围。 如给定=0.05,该范围称为参数的95%可信区间或置信区间; 如给定=0.01,该范围称为参数的99%可信区间或置信区间。,2区间估计(interval estimation):,29,二、总体均数可信区间的计算,30,总体均数可信区间的计算 需考虑: (1)总体标准差是否已知, (2)样本含量n的大小 通常有两类方法: (1)t分布法 (2)u分布法,31,1. 单一总体均数的可信

6、区间,32,33,P25,15号样本,34,35,36,例3-3 某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64 mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数的95%可信区间。,37,故该地正常成年人血清胆固醇均数的双侧95%可信区间为(3.47, 3.81)mmolL。,38,39,40,41,例3-4 为了解氨甲喋呤(MTX)对外周血IL-2水平的影响,某医生将61名哮喘患者随机分为两组。其中对照组29例( ),采用安慰剂;实验组32例( ),采用小剂量氨甲喋呤(MTX)进行治疗。测得对照组治疗前IL-2的均数为20.10 IU/ml ( ),

7、标准差为7.02 IU/ml ( );试验组治疗前IL-2的均数为16.89 IU/ml ( ),标准差为8.46 IU/ml ( )。问两组治疗前基线的IL-2总体均数相差有多大?,42,第一步:,43,能否下:两组IL-2的总体均数“不同”或“有差别”的结论?,44,三、可信区间的确切涵义,45,1. 95%的可信区间的理解: (1)所要估计的总体参数有95%的可能在我们所估计的可信区间内。 (2)从正态总体中随机抽取100个样本,可算得100个样本均数和标准差,也可算得100个均数的可信区间,平均约有95个可信区间包含了总体均数 。 (3)但在实际工作中,只能根据一次试验结果估计可信区间

8、,我们就认为该区间包含了总体均数。,46,2.可信区间的两个要素 (1)准确度:用可信度(1)表示:即区间包含总体均数的理论概率大小 。 当然它愈接近1愈好,如99%的可信区间比95%的可信区间要好 。 (2)精确度:即区间的宽度 区间愈窄愈好,如95%的可信区间比99%的可信区间要好 。,47,当n确定时,上述两者互相矛盾。 提高准确度(可信度),则精确度降低 (可信区间会变宽),势必降低可信区间的实际应用价值,故不能笼统认为99%可信区间比95%可信区间要好。 相反,在实际应用中,95%可信区间更为常用。,48,在可信度确定的情况下,增加样本含量可减小区间宽度,提高精确度。,49,四、总体

9、均数可信区间 与参考值范围的区别,50,* 也可用对应于双尾概率时), *也可用对应于双尾概率时),表3-2 总体均数的可信区间与参考值范围的区别,51,第四节 t 检验,52,1、样本均数 与已知某总体均数 比较的t检验 目的:推断一个未知总体均数 与已知总体均 数 是否有差别,用单样本设计。 2、两个样本均数 与 比较的t检验目的:推断两个未知总体均数 与 是否有差 别,用成组设计。 3、配对设计资料均数比较的t检验目的:推断两个未知总体均数 与 是否有差别用配对设计。,t 检验,亦称student t 检验,有下述情况:,53,对于大样本,也可以近似用u检验。,54,t检验和u检验的应用

10、条件: 1. t检验应用条件: 样本含量n较小时(如n60) (1)正态分布 (2)方差齐性(homogeneity of variance) 2. u 检验应用条件: 样本含量n较大,或n虽小但总体标准差已知 (1)正态分布 (2)方差齐性(homogeneity of variance),55,假设检验过去称显著性检验。它是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。,假设检验基本思想及步骤,56,例3-5 某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,

11、标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L? 130.83g/L 140g/L 原因: 1.可能是总体均数不同 2.是抽样造成的,57,58,H1的内容直接反映了检验单双侧。若H1中只是 0 或 0,则此检验为单侧检验。它不仅考虑有无差异,而且还考虑差异的方向。 单双侧检验的确定,首先根据专业知识,其次根据所要解决的问题来确定。若从专业上看一种方法结果不可能低于或高于另一种方法结果,此时应该用单侧检验。一般认为双侧检验较保守和稳妥。,59,(3) 检验水准,过去称显著性水准,是预先规定的概率值,它确定了小概率事件的标准。在实际工作中常取 = 0

12、.05。可根据不同研究目的给予不同设置。,60,61,62,图3-5 例3-5中P值示意图,63,64,若 ,是否也能下“无差别”或“相等”的结论?,65,一、单样本 t 检验 (one sample / group t-test),即样本均数 (代表未知总体均数)与已知总体均数0(一般为理论值、标准值或经过大量观察所得稳定值等)的比较。其检验统计量按下式计算,66,例3-5 某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L? (1)建立检验假设,确定检验水准 H0:

13、 =0 =140g/L,即铅作业男性工人平均血红 蛋白含量与正常成年男性平均值相等 H1: 0=140g/L,即铅作业男性工人平均血红 蛋白含量与正常成年男性平均值不等 =0.05,67,(2)计算检验统计量,68,(3)确定P值,作出推断结论,69,配对t 检验适用于配对设计的计量资料。 配对设计类型:两同质受试对象分别接受两种不同的处理;同一受试对象分别接受两种不同处理;同一受试对象(一种)处理前后。,二、配对t 检验 (paired / matched t-test),70,例3-6 为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,某人随机抽取了10份乳酸饮料制品,分别用脂肪酸水解法

14、和哥特里罗紫法测定其结果如表3-3第(1)(3)栏。问两法测定结果是否不同?,71,表3-3 两种方法对乳酸饮料中脂肪含量的测定结果(%),72,(1)建立检验假设,确定检验水准 H0:d0,即两种方法的测定结果相同 H1:d0,即两种方法的测定结果不同 =0.05 (2)计算检验统计量 本例n=10,d=2.724,d2=0.8483,,73,按公式(3-16) (3)确定P值,作出推断结论 查附表2的t界值表得P0.001。按=0.05水准,拒绝H0,接受H1,有统计学意义。可认为两种方法对脂肪含量的测定结果不同,哥特里罗紫法测定结果较高。,74,三、两样本t检验 (two-sample

15、/ group t-test),又称成组 t 检验,适用于完全随机设计两样本均数的比较,此时人们关心的是两样本均数所代表的两总体均数是否不等。两组完全随机设计是将受试对象完全随机分配到两个不同处理组。,75,适用范围: 完全随机设计两样本均数的比较 检验方法:依两总体方差是否齐性而定。,76,77,例3-7 为研究国产四类新药阿卡波糖胶囊的降血糖效果,某医院用40名II型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等分到试验组(用阿卡波糖胶囊)和对照组(用拜唐苹胶囊),分别测得试验开始前和8周后的空腹血糖,算得空腹血糖下降值见表3-4,能否认为该国产四类新药阿卡波糖胶囊与拜唐苹胶囊对空

16、腹血糖的降糖效果不同?,78,79,(2)计算检验统计量,80,(3)确定P值,作出推断结论,81,若变量变换后总体方差齐性 可采用t 检验(如两样本几何均数的t 检验,就是将原始数据取对数后进行t 检验); 若变量变换后总体方差仍然不齐 可采用t 检验或Wilcoxon秩和检验。,若两总体方差不等( ),?,82,2. Cochran & Cox近似t 检验(t 检验) 调整 t 界值,83,84,例3-8 在上述例3-7国产四类新药阿卡波糖胶囊的降血糖效果研究中,测得用拜唐苹胶囊的对照组20例病人和用阿卡波糖胶囊的试验组20例病人,其8周时糖化血红蛋白HbA1c(%)下降值如表3-5。问用两种不同药物的病人其HbA1c下降值是否不同?,85,表3-5 对照组和试验组HbA1c下降值(%),对照组方差是试验组方差的3.77

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号