第3章抽样误差陆精编版

上传人:ahu****ng1 文档编号:143855229 上传时间:2020-09-02 格式:PPTX 页数:59 大小:950.51KB
返回 下载 相关 举报
第3章抽样误差陆精编版_第1页
第1页 / 共59页
第3章抽样误差陆精编版_第2页
第2页 / 共59页
第3章抽样误差陆精编版_第3页
第3页 / 共59页
第3章抽样误差陆精编版_第4页
第4页 / 共59页
第3章抽样误差陆精编版_第5页
第5页 / 共59页
点击查看更多>>
资源描述

《第3章抽样误差陆精编版》由会员分享,可在线阅读,更多相关《第3章抽样误差陆精编版(59页珍藏版)》请在金锄头文库上搜索。

1、第三章 抽样误差Sampling Error,Department of Epidemiology 样本均数的变异范围较之原变量的变异范围大大缩小;,2.中心极限定理 Central Limit Theorem,抽样误差 中心极限定理 标准误 分布,中心极限定理(central limit theorem) (一)从均数为、标准差为 的正态总体中,独立随机抽取例数为n的样本,样本均数 的分布服从正态分布; 样本均数的均数为 ; 样本均数的标准差为 。,不同类型的总体分布,对于统计量分布有何影响? 正态分布总体 偏三角分布总体 均匀分布总体 指数分布总体 双峰分布总体,中心极限定理,中心极限定理

2、,(二)从非正态(nonnormal)分布总体(均数为,方差为)中随机抽样(每个样本的含量为n),可得无限多个样本,每个样本计算样本均数,则只要样本含量足够大(n50),样本均数也近似服从正态分布。 样本均数的均数为 ; 样本均数的标准差为 。,3.标准误 standard error,抽样误差 中心极限定理 标准误 分布,标准误(standard error),样本统计量的标准差称为标准误。样本均数的标准差称为均数的标准误。 均数的标准误表示样本均数的变异度。 当总体标准差未知时,用样本标准差代替, 前者称为理论标准误,后者称为样本标准误。,与标准差的关系,1、意义上 标准差描述个体值之间的

3、变异,即观察值间的离散程度; 而标准误是描述统计量的抽样误差,即样本统计量和总体参数的接近程度; 2、用途上 标准差常用于表现观察值的波动范围; 标准误常表示抽样误差的大小,估计总体参数可信区间。 3、与样本含量 标准差是随着样本含量的增多,逐渐趋于稳定。 标准误是随着样本含量的增多,逐渐减少。,区别,与标准差的关系,首先,标准差和标准误都是变异指标,说明个体之间的变异用标准差,说明统计量之间的变异用标准误。 其次,当样本含量不变时,标准差大,标准误亦越大,均数的标准误与标准差成正比。,联系,4. t分布 t-distribution,抽样误差 中心极限定理 标准误 分布,正态分布的标准化变化

4、,若 X N(,) , 则 。,因 ,则 。,从正态分布总体中1000次抽样的 u 值的分布(n=4),Fraction,u,-4,-3,-2,-1,0,1,2,3,4,0,.05,.1,.15,.2,均数为 0.007559 标准差为 1.006294,t 分布的概念,实际工作中,总体方差未知。所以,用样本方差代替总体方差, 此时 的分布如何?,从正态分布总体中1000次抽样的 值的分布(n=4),Fraction,t,-8,-6,-4,-2,0,2,4,6,8,0,.05,.1,.15,.2,.25,.3,.35,均数为 0.05696 标准差为 1.55827,t 分布的概念,用样本方差

5、代替总体方差,此时 不服从正态分布。,1908年,W.S.Gosset (1876-1937)以笔名Student发表了著名的t分布,证明了: 设从正态分布N(,2)中随机抽取含量为n的样本,样本均数和标准差分别为 和s,设:,则t值服从自由度为n-1的t分布。,t 分布的概念,记为:,图 自由度分别为1、5、时的t分布,t分布图形,t分布的特征,t分布是一簇曲线,当不同时,曲线形状不同; 单峰分布,以0为中心,左右对称; 当逼近时,t分布逼近u分布,故标准正态分布是t分布的特例; t分布曲线下面积是有规律的。,请看演示,t 分布,t界值表,表上阴影部分,表示t,以外的尾部面积占总面积百分数,

6、即概率P。 表中数据表示与确定时相应的t界值(critical value),常记为t,。,抽样,总体,样本,统计量,分布,t分布表明,从正态分布总体中随机抽取的样本,由样本计算的t值接近0的可能性较大,远离0的可能性较小。,例如,当=10,单尾概率=0.05时,查表得单尾t0.05,10=1.812,则: P(t-1.812)=0.05 或P(t1.812)=0.05,表明:按t分布的规律,从正态分布总体中抽取样本含量为n=11的样本,则由该样本计算的t值大于等于1.812的概率为0.05,或者小于等于-1.812的概率亦为0.05。,-1.812,0,0.05,0.05,1.812,例如,

7、当=10,双尾概率=0.05时,查表得双尾t0.05,102.228,则: P(t-2.228)+P(t2.228)0.05 或:P(-2.228t2.228)=1-0.05=0.95。,表明:按t分布的规律,从正态分布总体中抽取样本含量为n=11的样本,则由该样本计算的t值大于等于2.228的概率为0.025,小于等于-2.228的概率亦为0.025。,-2.228,0,0.025,0.025,2.228,单尾:P(t- t,)=,或P(tt,)= 双尾:P(t- t/2,)+P(tt/2,)=, 即P(-t/2,t t/2,)=1-,-t,0,t,t分布曲线下面积规律,5. 2分布 chi

8、-distribution,抽样误差 中心极限定理 标准误 分布,2 分布,设从正态分布N(,2)中随机抽取含量为n的样本,样本均数和标准差分别为 和s,设: 2值服从自由度为n-1的2分布(2-distribution),2 分布,请看演示,c2 分布,2分布的特征,(1) 2分布为一簇单峰正偏态分布曲线 ;随的逐渐加大,分布趋于对称。 (2) 自由度为的2分布,其均数为,方差为2。 (3) 自由度为的2分布实际上是个标准正态分布变量之平方和。 2=u12+ u22+ uv2,3.84,0.05,0.025,0.025,1.96,-1.96,2分布与正态分布的关系,(4) 每一自由度下的2分

9、布曲线都有其自身分布规律。,自由度为1的2分布界值,0.0,0.1,0.2,0.3,0.4,0.5,2分布是方差的抽样分布。 2分布说明,从正态分布的总体中随机抽样,所得样本的方差s2接近于总体方差2的可能性大,远离总体方差的可能性小。 即2值接近其均数n-1的可能性大,远离n-1的可能性小。,2分布的特征,自由度10时,20.025,1020.48,20.975,103.25。 从正态分布的总体中随机抽样,得到的样本其2值大于等于20.48的概率为0.025,小于等于3.25的概率亦为0.025。 P(23.25)+P(220.48)0.05,2分布的特征,2分布近似描述具有某种属性的实际频

10、数Ai与理论频数Ti之间的抽样误差,2分布的特征,6. F分布 F-distribution,抽样误差 中心极限定理 标准误 分布,F分布,设从两个方差相等的正态分布N(1,2)和N(2,2)总体中随机抽取含量分别为n1和n2的样本,样本均数和标准差分别为 、s1和 和s2。设: 则F值服从自由度为(n1-1,n2-1)的F分布(F-distribution)。,F分布的特征,(1) F分布为一簇单峰正偏态分布曲线,与两个自由度有关。 (2) 若F服从自由度为(1,2)的F分布,则其倒数1/F服从自由度为(2,1)的F分布。 (3) 自由度为(1,2)的F分布,其均数为2/(2-2),与第一自

11、由度无关。 (4) 第一自由度11时,F分布实际上是t分布之平方;第二自由度2时,F分布实际上等于2分布。,请看演示,F分布,(5) 每一对自由度下的F分布曲线下的面积分布规律。,F分布的特征,F分布表明,从两个方差相等的正态分布总体中随机抽取含量分别为n1和n2的样本,计算所得F值,应接近v2/(v2-2)。 F(0.05;20,20)= 2.12表示,从方差相等的正态分布总体中随机抽取n1=n2=21的样本,则由两样本计算的F值大于等于2.12的可能性为0.025,而小于1/2.12=0.4717的可能性亦为0.025。,F分布的特征,F分布的特征,样本统计量的抽样分布,任何一个样本统计量

12、均有其分布规律。 从正态分布总体中抽样: 均数的抽样分布为正态分布; 样本方差的分布服从2分布; 样本方差之比服从F分布; t 值服从 t 分布; ,总结,抽样误差 中心极限定理 标准误 统计分布,1、有时候读书是一种巧妙地避开思考的方法。20.9.220.9.2Wednesday, September 2, 2020 2、阅读一切好书如同和过去最杰出的人谈话。15:20:2515:20:2515:209/2/2020 3:20:25 PM 3、越是没有本领的就越加自命不凡。20.9.215:20:2515:20Sep-202-Sep-20 4、越是无能的人,越喜欢挑剔别人的错儿。15:20:

13、2515:20:2515:20Wednesday, September 2, 2020 5、知人者智,自知者明。胜人者有力,自胜者强。20.9.220.9.215:20:2515:20:25September 2, 2020 6、意志坚强的人能把世界放在手中像泥块一样任意揉捏。2020年9月2日星期三下午3时20分25秒15:20:2520.9.2 7、最具挑战性的挑战莫过于提升自我。2020年9月下午3时20分20.9.215:20September 2, 2020 8、业余生活要有意义,不要越轨。2020年9月2日星期三3时20分25秒15:20:252 September 2020 9、

14、一个人即使已登上顶峰,也仍要自强不息。下午3时20分25秒下午3时20分15:20:2520.9.2 10、你要做多大的事情,就该承受多大的压力。9/2/2020 3:20:25 PM15:20:252020/9/2 11、自己要先看得起自己,别人才会看得起你。9/2/2020 3:20 PM9/2/2020 3:20 PM20.9.220.9.2 12、这一秒不放弃,下一秒就会有希望。2-Sep-202 September 202020.9.2 13、无论才能知识多么卓著,如果缺乏热情,则无异纸上画饼充饥,无补于事。Wednesday, September 2, 20202-Sep-2020.9.2 14、我只是自己不放过自己而已,现在我不会再逼自己眷恋了。20.9.215:20:252 September 202015:20,谢谢大家,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号