医学统计学第4讲抽样误差与t分布参考PPT

上传人:日度 文档编号:149515134 上传时间:2020-10-27 格式:PPT 页数:45 大小:1,017KB
返回 下载 相关 举报
医学统计学第4讲抽样误差与t分布参考PPT_第1页
第1页 / 共45页
医学统计学第4讲抽样误差与t分布参考PPT_第2页
第2页 / 共45页
医学统计学第4讲抽样误差与t分布参考PPT_第3页
第3页 / 共45页
医学统计学第4讲抽样误差与t分布参考PPT_第4页
第4页 / 共45页
医学统计学第4讲抽样误差与t分布参考PPT_第5页
第5页 / 共45页
点击查看更多>>
资源描述

《医学统计学第4讲抽样误差与t分布参考PPT》由会员分享,可在线阅读,更多相关《医学统计学第4讲抽样误差与t分布参考PPT(45页珍藏版)》请在金锄头文库上搜索。

1、1,第三章 抽样误差与t分布,2,如:总体均数 总体标准差,如:样本均数 样本标准差S,总体,样本,抽取部分观察单位,统计量,参 数,统计推断,统计推断,3,在医疗卫生实践和医学研究中,往往难以对所要研究的总体进行全部观察,通常从总体中随机抽取样本进行观察,然后由样本的信息去推断总体特征,这种研究方法叫做抽样研究方法。 用样本的信息去推断总体特征,这种分析方法称为统计推断。,4,总体参数的估计,均数的抽样误差 t分布 总体均数的估计,5,抽样误差的定义,假如事先知道某地七岁男童的平均身高为119.41cm。为了估计七岁男童的平均身高(总体均数),研究者从所有符合要求的七岁男童中每次抽取100人

2、,共计抽取了三次。,6,三次抽样得到了不同的结果! 原因何在?,7,如果没有个体变异,No Variation! No Sampling Error!,8,No Random sampling! No Sampling Error!,如果没有抽样研究,9,三次抽样得到了不同的结果,原因何在?,10,【定义】由于个体变异的存在,在抽样研究中产生样本统计量和总体参数之间的差异,称为抽样误差(sampling error)。,各种参数估计都有抽样误差,这里我们以均数为研究对象,11,抽样误差产生的条件,抽样研究 个体变异,12,抽样误差是不可避免的,可以通过保证总体的同质性及增大样本含量来缩小抽样误

3、差。,13,从正态分布总体N(5.00,0.502)中,每次随机抽取样本含量n5,并计算其均数与标准差;重复抽取1000次,获得1000份样本;计算1000份样本的均数与标准差,并对1000份样本的均数作直方图。 按上述方法再做样本含量n10、样本含量n30的抽样实验;比较计算结果。,抽样误差的规律性正态分布抽样,14,抽样试验(n=5),15,抽样试验(n=10),16,抽样试验(n=30),17,1000份样本抽样计算结果,18,3个抽样实验结果图示,19,非正态分布抽样,分别从各总体中抽取10000个样本含量为n的样本,计算每个样本的均数,并绘制频数分布图。 n分别取2、4、10、25。

4、,20,偏三角分布抽样,21,均匀分布,22,指数分布,23,双峰分布,24,从正态总体中随机抽样,其样本均数服从正态分布; 从任意总体中随机抽样,当样本含量足够大时,其样本均数的分布逐渐逼近正态分布; 样本均数之均数的位置始终在总体均数的附近; 随着样本含量的增加,样本均数的离散程度越来越小,表现为样本均数的分布范围越来越窄,其高峰越来越尖。,25,中心极限定理,26,中心极限定理,27,标准误的定义,样本统计量(如均数)也服从一定的分布。,与描述观测值离散趋势的指标类似,样本统计量的标准差就反映了从某个总体中随机抽样所得样本之均数分布的离散程度。,用样本统计量的标准差来反映抽样误差的大小。

5、又称标准误(standard error)。,28,标准误,29,标准误的意义,反映了样本统计量(样本均数,样本率)分布的离散程度,体现了抽样误差的大小。,标准误越大,说明样本统计量(样本均数,样本率)的离散程度越大,即用样本统计量来直接估计总体参数越不可靠。反之亦然。,标准误的大小与标准差有关,在例数n一定时,从标准差大的总体中抽样,标准误较大;而当总体一定时,样本例数越多,标准误越小。说明我们可以通过增加样本含量来减少抽样误差的大小。,30,用途:,(1)衡量样本均值的可靠性,(2)估计总体均值的可信区间,(3)用于均数的假设检验,31,t分布,随机变量X N(m,s2),标准正态分布 N

6、(0,12),u变换,标准正态分布 N(0,12),均数,Student t分布 自由度=n-1,t变换,32,由W.S. Gosset提出,33,对于不同的n,有不同的t分布曲线。,(n-1)称为 t分布的自由度,34,自由度分别为1、5、 时的 t 分布,35,t分布的特征:,t分布为一簇单峰分布曲线。,t分布以0为中心,左右对称。,t分布与自由度有关,自由度越小,t分布的峰越低,而两尾越高;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。,36,t分布曲线下面积规律,t分布曲线下总面积仍为1或100% t分布曲线下面积以0为中心左右对称 由于t分

7、布是一簇曲线,故t分布曲线下面积固定面积(如95%或99%)的界值不是一个常量,而是随自由度的大小而变化,37,其通式为 单侧:P(t-t,)=或P(tt,)= 双侧:P(t-t/2,)+P(tt/2,)= 图中非阴影部分面积的概率为, P(-t/2,tt/2,)=1-,38,t分布的界值,t, ,检验水准 (尾端概率),自由度,39,t 界值表 横标目:自由度, 纵标目:尾端概率, p, 即曲线下阴影部分的面积; 表中的数字:相应的 |t | 界值。,40,附表2,t分布表的特点,附表2的横标目为自由度,纵标目为概率P,表中数值为其相应的t界值,记作t, 。 附表2只列出正值,若计算的t值为

8、负值时,可用其绝对值查表 。 附表2右上附图的阴影部分表示t,以外尾部面积的概率 。,41,单侧t0.05,30=1.697,表示=30时,t1.697的概率或t-1.697的概率为0.05,记作P(t -1.697)=0.05或P(t 1.697)=0.05;,双侧t0.05,30=2.042,表示=30时, t2.042的概率和t-2.042的概率之和为0.05,记作P(t -2.042)+ P(t 2.042)=0.05,42,图中非阴影部分面积的概率为: P(-/2,t t/2,)=1- 从附表2中还可以看出,双侧概率P为单侧概率的两倍,如双侧t0.10/2,30=单侧t0.05,30=1.697,43,标准误与标准差的关系,44,联系 1.两者都是变异指标,说明个体之间的变异用标准差,说明统计量之间的变异用标准误。 2.当样本含量不变时,标准差大,标准误亦大,均数的标准差与标准误成正比。,45,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号