参数估计基础PPT课件

上传人:pu****.1 文档编号:593272891 上传时间:2024-09-24 格式:PPT 页数:44 大小:598KB
返回 下载 相关 举报
参数估计基础PPT课件_第1页
第1页 / 共44页
参数估计基础PPT课件_第2页
第2页 / 共44页
参数估计基础PPT课件_第3页
第3页 / 共44页
参数估计基础PPT课件_第4页
第4页 / 共44页
参数估计基础PPT课件_第5页
第5页 / 共44页
点击查看更多>>
资源描述

《参数估计基础PPT课件》由会员分享,可在线阅读,更多相关《参数估计基础PPT课件(44页珍藏版)》请在金锄头文库上搜索。

1、参数估计基础-抽样分布1抽样误差o从总体均数 为155.4cm,标准差 为5.3cm的正态分布总体中随机抽样。样本大小为30n=30 .2从正态总体 抽样得到的1000个样本均数的频数分布(ni=30)3Mean=155.426 Std=0.9664抽样误差o结果:n各样本均数不一定等于总体均数n样本均数间存在差异n样本均数的分布规律:围绕总体均数上下波动n样本均数的变异:由样本均数的标准差描述。5抽样误差o抽样误差Sampling error n由抽样引起的样本统计量与总体参数间的差异o来源:n个体变异n抽样o表现n样本统计量与总体参数间的差异n样本统计量间的差异6o样本均数的规律性n随机的

2、n在概率意义下是有规律的-抽样分布n通过大量重复抽样,借助频数表描述n样本均数的变异规律(抽样分布)与个体观察值变异规律有关o即使只有一个样本资料,也可由样本资料的个体观察值的变异规律间接得到样本均数的变异规律抽样分布7正态总体样本均数的分布o已知某地高三男生的平均身高为 ,标准差为 ,将其视为一个总体。o从该总体中随机抽样n样本含量为nn每次抽取10000个样本并计算各自的样本均数n以10000个样本均数作为一个新的样本制作频数图8抽样1样本含量n=4 的平均数 =168.19 的标准差 =2.9670 9抽样2样本含量 n=16 的平均数 =168.158 的标准差 =1.4884 10抽

3、样3样本含量 n=36 的平均数 =168.1493 的标准差 =0.9997 11o从正态分布的总体 中随机抽取样本含量为n的样本X1,X2,Xn,其样本均数 n服从正态分布,总体均数为 ;n样本均数的总体标准差o若 ,则其中任意一个随机样本Xn的均数正态总体样本均数的分布12o样本均数的标准差 ,称为样本均数的标准误(standard error of mean ,SE),简称均数标准误o它反映样本均数之间的离散程度,也反映样本均数抽样误差的大小。o误差大小 ,实质是要估计 的分布特征 正态总体样本均数的分布13o由于实际 往往未知,需要用样本 来估计 ,样本均数标准误的估计式为o注意区别

4、:o证明:正态总体样本均数的分布14非正态总体样本均数的分布o从总体均数为1的指数分布中抽样,样本大小分别为4,9,100。每次抽10000个样本制作频数分布图151617抽样1样本含量n=4 的平均数 =1.0133 的标准差 =0.5031 的中位数 =0. 929818抽样2样本含量n=9 的平均数 =0.9959 的标准差 =0. 3332 的中位数 =0.957419抽样3样本含量n=100 的平均数 =0.9993 的标准差 =0.1001 的中位数 =0.995820o从非正态指数分布总体中随机抽样所得样本均数 :n在样本含量较小时呈偏态(非指数型)n样本含量较大时接近正态分布n

5、均数 始终在总体均数 附近n均数 的标准差非正态总体样本均数的分布21中心极限定理及其应用o样本均数 总体标准差是个体资料X的总体标准差的 ;即理论标准误o理论标准误的样本估计值为o样本均数 与 个体资料X的集中位置相同,即样本均数 的总体均数与 个体资料X的总体均数 相同22中心极限定理及其应用o若个体资料X服从正态总体 ,则样本均数 也服从正态分布 ;o个体资料X服从偏态分布,当样本量n较大时,样本均数 近似服从正态分布23o例3.3 已知在某地7岁正常发育男孩的身高服从正态分布N(121,52)o正常发育7岁男孩身高的95%范围为 (111.2,130.8)o若在该地正常7岁男孩中随机抽

6、一个样本,样本含量为100,则样本均数的95范围为 =(120.2,121.98), 24 t分布o , 标准正态分布与t统计量 o实际研究中未知,用样本的标准差S作为的一个近似值(估计值)代替,得到变换后的统计量并记为 25o如在正态总体N(168.18,62)中随机抽样,样本量分别取n =5,n =100,均抽10000个样本,分别计算t值和U值并作相应t的频数图 t分布26 t分布样本含量n=5样本含量n=100 t统计量的频数图 27o结果n小样本时,t统计量和U统计量的分布有明显差别n大样本时,t统计量和U统计量的分布非常接近。o频数图n当样本量较大时,统计量t的频数图与标准正态分布

7、曲线非常接近n样本含量较小时,t统计量的峰值比标准正态分布的峰值略小,双侧尾部的值则较标准正态分布略大 t分布28o英国统计学家W. S. Gosset(1908)设 并给出了统计量t的分布规律,并称统计量t的分布规律为t分布,自由度为v,记为t(v)分布。 o每个自由度v对应一个分布,因此t分布是一簇分布 ot分布仅与总体均数有关,与总体标准差无关 t分布29o三条t分布密度曲线 t分布v=1v=5v=30t分布的图形特征o分布特征 nt分布曲线是单峰的n关于t = 0对称n自由度越大,t值越小o t分布与正态分布的关系 n自由度v较小时,t分布与标准正态分布相差较大,并且t分布曲线的尾部面

8、积大于标准正态分布曲线的尾部面积n当自由度 时,t分布逼近于标准正态分布。31t分布的界值 o给定自由度v,t分布曲线的双侧尾部面积为时对应的t值,记为并称 为t的双侧界值 o单侧界值 :一侧尾部面积为时对应的t值o对称性得:单侧曲线下面积=2双侧曲线下面积o同样的尾部面积,t分布的界值要大于标准正态分布的界值 32 t分布界值示意图,表示阴影的面积 33样本率的分布 o总体率由样本率估计n例如,设样本的个体数(即样本含量)为n,若x为样本的某指标阳性个体数,则可用样本阳性率 估计研究人群的阳性率 (总体阳性率); o由于个体差异和偶然性的影响,样本率也存在抽样误差-由抽样造成样本率与总体率(

9、研究人群的率)的差异 o样本率是随机的,但在概率意义下也是有规律的-样本率的分布。34o随机抽样试验,分别在总体率=0.4,0.5,0.01的总体中随机抽样,其总体率和样本含量no每种情况分别随机抽10000个样本,每个样本计算其样本率,把同一种情况的10000个样本率视为一个新的样本资料作频数图 样本率的分布 35抽样136抽样137抽样338抽样439o结果n总体率相同时,样本含量越大,样本率的分布越趋向对称。n样本含量n相同时,越偏离0.5,样本率的分布越偏态分布。n总体率0.5时,任意样本含量的样本率都呈对称分布。n样本率p的样本标准差 。样本率的分布 40中心极限定理及其推论o若样本

10、中的个体个数(即样本含量)为n,总体率为,样本率为p,则n样本率的总体均数等于总体率n样本率的总体标准差(即率的标准误) n由于总体率通常是未知的,因而用样本率p来估计,故率的标准误的估计值常表示为 41n对于大量重复随机抽样而言,样本率p围绕着总体率波动n样本含量n越大,这种波动越小。当n的值充分大时,p的分布就近似于均数为 ,标准差为 的正态分布。这里样本含量n “充分大”指 、 且n40。n当总体率0.5时,则样本率p的分布为对称分布 n当样本含量n为定值时,总体率越接近0.5,样本率p近似正态分布的程度就越好 中心极限定理及其推论42STATA命令模拟各种分布o模拟正态分布的样本均数分布 Simumean 样本量 均数 标准差o模拟类似卡方分布的均数分布 Simuchis 样本量 均数o模拟指数分布的均数分布 Simuexp 样本量 均数43STATA命令模拟各种分布o模拟双峰分布的均数分布 Simubpeak 样本量 均数o模拟三角形分布的均数分布 Simutrang 样本量 均数44

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号