医学统计学04抽样误差

上传人:tian****1990 文档编号:75784371 上传时间:2019-02-01 格式:PPT 页数:38 大小:1.18MB
返回 下载 相关 举报
医学统计学04抽样误差_第1页
第1页 / 共38页
医学统计学04抽样误差_第2页
第2页 / 共38页
医学统计学04抽样误差_第3页
第3页 / 共38页
医学统计学04抽样误差_第4页
第4页 / 共38页
医学统计学04抽样误差_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《医学统计学04抽样误差》由会员分享,可在线阅读,更多相关《医学统计学04抽样误差(38页珍藏版)》请在金锄头文库上搜索。

1、抽样误差 Sampling Error,Medical statistics 医学统计学,2,主要内容(Content),抽样误差及其规律性 标准误 抽样分布与t分布 总结,3,了解抽样误差规律的重要性,总体 同质个体、个体变异,总体参数 未知,样本 代表性、抽样误差,随机 抽样,样本统计量 已知,统计推断,风 险,4,两种研究思路,概率论:已知总体样本具有什么性质? 统计学:已知样本总体具有什么性质? 概率论:规律性中的随机性 统计学:随机性中的规律性,5,抽样误差的定义,假如事先知道某地七岁男童的平均身高为119.41cm。为了估计七岁男童的平均身高(总体均数),研究者从所有符合要求的七岁

2、男童中每次抽取100人,共计抽取了三次。,6,抽样误差的定义,三次抽样得到了不同的结果,原因何在?,7,【定义】由于个体变异的存在,在抽样研究中产生样本统计量和总体参数之间的差异,称为抽样误差(sampling error)。 各种参数都有抽样误差,这里我们以均数为研究对象,抽样误差的定义,8,抽样误差的表现,9,抽样误差的规律性,既然抽样误差是有规律的,那么它的分布规律到底是怎样的?,抽样误差是不可避免的! 抽样误差是有规律的!,10,模拟试验,假设一个已知总体,从该总体中抽样,对每个样本计算样本统计量(均数、方差等),观察样本统计量的分布规律抽样分布规律。 考察: 不同的分布 不同的样本含

3、量 对统计量的影响。,11,均数的模拟试验,从不同总体中进行抽样,观察均数的抽样分布规律。 正态分布总体 对数正态分布总体 U型分布总体 考察: 样本均数的均数与总体均数有何关系? 样本均数的标准差与总体标准差有何关系? 样本均数的分布形状如何? 不同的样本含量对上述性质的影响如何?,12,从已知正态总体中抽样,样本含量n =10 抽样次数m =1000,13,SAMPLE 1:x11 x12 x13 x14.x1n,SAMPLE 2:x21 x22 x23 x24.x2n,SAMPLE k:xk1 xk2 xk3 xk4.xkn,A Simulation Study,原始 总体 ,k个样本均

4、数的频数分布图,14,模拟试验,随机现象的模拟系统,Sampling distribution for means,16,从正态总体中随机抽样,其样本均数服从正态分布; 从任意总体中随机抽样,当样本含量足够大时,其样本均数的分布逐渐逼近正态分布; 样本均数之均数的位置始终在总体均数的附近; 随着样本含量的增加,样本均数的离散程度越来越小,表现为样本均数的分布范围越来越窄,其高峰越来越尖。,17,均数的抽样误差之特点,各样本均数未必等于总体均数; 样本均数间存在差异; 样本均数的分布很有规律,围绕总体均数,中间多两边少,左右基本对称; 样本均数的变异范围较之原变量的变异范围大大缩小; 随着样本含

5、量的增加,样本均数的变异范围逐渐缩小。,18,中心极限定理(central limit theorem),Case 1: 从正态分布总体N (,) 中随机抽样(每个样本的含量为n ),可得无限多个样本,每个样本计算样本均数,则样本均数也服从正态分布。 样本均数的均数为 ; 样本均数的标准差为 。,19,中心极限定理(central limit theorem),Case 2: 从非正态(nonnormal)分布总体(均数为,方差为) 中随机抽样(每个样本的含量为n ),可得无限多个样 本,每个样本计算样本均数,则只要样本含量足够 大(n 50),样本均数也近似服从正态分布。 样本均数的均数为

6、; 样本均数的标准差为 。,20,标准误(standard error),样本统计量的标准差称为标准误。 样本均数的标准差称为均数的标准误。 均数的标准误表示样本均数的变异度。 当总体标准差未知时,用样本标准差代替, 前者称为理论标准误,后者称为样本标准误。,21,标准误的意义,反映了样本统计量(样本均数,样本率)分布的离散程度,体现了抽样误差的大小。 标准误越大,说明样本统计量(样本均数,样本率)的离散程度越大,即用样本统计量来直接估计总体参数越不可靠。反之亦然。 标准误的大小与标准差有关,在例数n一定时,从标准差大的总体中抽样,标准误较大;而当总体一定时,样本例数越多,标准误越小。说明我们

7、可以通过增加样本含量来减少抽样误差的大小。,22,与样本含量的关系,n 越大,均数的均数就越接近总体均数; n 越大,变异越小,分布越窄; 对称分布接近正态分布的速度,大于非对称分布。分布越偏,接近正态分布所需样本含量就越大。,23,抽样误差的规律性(1),均数的抽样误差规律: 在样本含量足够大时,无论总体分布如何,其均数的分布趋于正态分布(大数定律) 在样本含量较小时: 总体为正态分布时:正态分布 总体为非正态分布时:?,24,正态分布的标准化变化,若 X N(,) , 则 。,因 , 则 。,25,从N(0,1)中1000次抽样的 u 值的分布(n=4),Fraction,u,-4,-3,

8、-2,-1,0,1,2,3,4,0,.05,.1,.15,.2,均数为 0.007559 标准差为 1.006294,26,t 分布的概念,实际工作中,总体方差未知。所以,用样本方差代替总体方差, 此时 的分布如何?,27,从N(0,1)中1000次抽样的 t 值的分布(n=4),Fraction,t,-8,-6,-4,-2,0,2,4,6,8,0,.05,.1,.15,.2,.25,.3,.35,均数为 0.05696 标准差为 1.55827,28,t 分布的概念,用样本方差代替总体方差,此时 不服从正态分布。而服从 t 分布。记为:,29,t分布,1908年Gosset以笔名Studen

9、t发表。故又称Student t 分布。 t 分布是一簇分布,与自由度有关。 自由度: degree of freedom,30,t分布,t 分布的高峰位置比 u 分布低,尾部重。即相同的尾部面积对应的界值,比 u 分布大。 例如: P=0.05,u=1.96,而自由度为3的 t 分布界值,t = 3.182。,31,自由度分别为1、5、 时的 t 分布,t分布的图形,32,t分布的性质,t分布为一簇单峰分布曲线,高峰在0的位置上,说明从正态总体中随机抽样所得样本计算出的t值接近0的可能性较大。 t分布以0为中心,左右对称。 分布的高峰位置比 u 分布低,尾部高。 t分布与自由度有关,自由度越

10、小,t分布的峰越低,而两侧尾部翘得越高;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。 每一自由度下的t分布曲线都有其自身分布规律。t界值表 。,33,样本统计量的抽样分布,任何一个样本统计量均有其分布规律。 从正态分布总体中抽样: 均数的抽样分布为正态分布; 样本方差的分布服从2分布; 样本方差之比服从F分布; t 值服从 t 分布; ,34,抽样误差的规律性(2),t 的抽样误差规律: 总体为正态时:t t 分布 总体为非正态时: 样本含量较大时:近似正态分布 样本含量较小时:?,William Sealey Gosset 18761937,35,抽样误差的规律性(3),方差的抽样误差规律: 在正态总体时:方差的分布服从2分布。,Karl Pearson 18571936,36,抽样误差的规律性(4),方差比值的抽样误差规律: 在正态总体时:方差之比的分布服从F分布。,RA Fisher,37,研究抽样分布的目的,样本统计量的抽样分布规律是统计推断(statistical inference)的理论基础。 只有了解抽样分布规律,才能深刻理解统计推断的内涵。,38,Thank U,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号