抽样误差与参数估计

资源描述

《抽样误差与参数估计》由会员分享，可在线阅读，更多相关《抽样误差与参数估计（37页珍藏版）》请在金锄头文库上搜索。

1、抽样误差与参数估计抽样误差与标准误Sampling error andstandard errorpopulationsamplesamplinginferring统计学的分析思路抽样实验例7-1：某地区正常成年男子的红细胞计数服从正态分布N(5.00,0.502)(1012/L),随机抽取100份样本，每份样本含有10个个体。样本1样本2样本99样本3样本100正常男子红细胞计数抽样实验结果No 红细胞计数s123991005.595.494.564.824.085.115.564.875.304.734.265.475.215.194.845.045.194.715.304.660.44

2、0.420.330.390.46抽样误差通过对研究总体中随机抽取部分有代表性的样本，用统计量样本均数来推断总体参数。由于抽样的随机性而造成样本统计量样本均数与总体参数总体均数间的差异，称为均数的抽样误差。从总体N(5.00,0.502)中抽样实验结果n=30n=10 各样本均数未必等于总体均数各样本均数之间也存在差异样本均数的分布也是正态分布样本均数的变异范围较原变量的变异范围大大缩小样本均数的标准误统计上，将统计量如样本均数、样本率等的标准差称为标准误,用以衡量抽样误差的大小 n固定时，标准差越大，标准误越大标准差固定时，n越大，标准误越小实际工作中，总体标准差常未知例72

3、：某样本 =5.03，s=0.52，n=10，试计算标准误。实际工作中，只能根据一份样本计算出一个标准误说明抽样误差的大小，即估计的可靠程度例73： 2003年，在某地20岁应征男青年中随机抽取85人，平均身高为171.2cm，标准差为5.3cm，计算当地20岁应征男青年身高的标准误。反映了本次调查身高均数171.2cm的抽样误差大小估计值样本均数的分布原分布为正态分布，那么新分布也为正态分布，如原分布为非正态分布，当n足够大时(如n60)，新分布也近似正态分布新分布可用样本均数的均数和均数的标准差来描绘其特征，其理论值分别为 t分布(t-distribution, student

4、 distribution, Gosset, 1908)=,标标准正态态分布=5=1t分布特征单峰分布，以t=0为中点，两侧对称；样本(自由度)越小，t分布曲线峰值越低，t值越分散；随着自由度的增大，t分布接近于标准正态分布，当时，t分布的极限分布是标准正态分布。图中阴影部分表示t/2，以外尾部面积占总面积的百分比P 同一时，t与P呈反向关系当=时，t/2，=u/2 当一样时，单侧P与双侧2P对应一样的t界值,如t0.05,= t0.10/2,可(置)信区间Confidence interval,CIStatistical inferenceParameterestimationH

5、ypothesis testingInterval estimationPoint estimation 点估计(point estimation)：就是用样本指标直接地估计总体指标。总体均数总体率即样本均数和样本率分别是总体均数和总体率的估计值。区间估计(confidence interval estimation)指用和确定一个具有较大置信度的包含总体参数的区间，该区间包含总体均数的概率为1-，称为总体均数的1-可信区间。1-一般取0.95或0.99。样本统计量标准误的估计值总体均数的可信区间1. 未知时，按t分布的原理的概率之和为或2. 时，或未知但n足够大n足够大，用样

6、本标准差S来估计例74：某样本的，s=0.52， n=10，试计算该总体正常成年男子平均红细胞计数的95%可信区间。解：v=9，=0.05(双侧，查t界值表，得例75：试估计2003年当地20岁应征男青年身高总体均数的95%可信区间。解：n=85，大样本时用代替可信区间的解释从总体中做随机抽样，据每个样本可算得一个可信区间，如95%可信区间意味着做100次抽样，算得100个可信区间，平均有95个包括,只有5个不包括。实际工作中,为估计总体均数，我们只做一次抽样,只算得一个可信区间，用以估计的范围，理论上有95%的可能是正确的(1-),只有5%的可能发生错误。可信区间两个要素

7、1. 准确度：反映可信度1-的大小。1-越接近1，越准确2. 如可信度99%比95%准确3. 准确度：反映区间范围宽窄。范围越窄越好4. 95%可信区间精度优于99%5. 在n确定的情况下，准确度，准确度;6. 在兼顾准确度和准确度时，一般取95%可信区间;7. 在可信度确定的情况下，增加样本例数，可进步准确度; 两样本均数之差的分布与标准误从两个正态总体中随机抽样，分别得n1、、s1和n2、、s2 那么：假如两总体标准差未知合并方差两总体均数之差的估计两总体均数之差1-2的1-可信区间为: 大样本时总体均数的可信区间自由度：例77：某药治疗流行性乙型脑炎，将72名患者随机分为试验组和对照组，得两组退热天数结果如下，试估计该药是否有效。分组nS试验组322.91.9对照组405.22.71-2 的95%可信区间即标准差和标准误的比较标准差SD标准误SE意义个体变异大小抽样误差大小用途CV,参考值范围CI，假设检验计算随n增加渐趋于稳定渐趋于0 (1-)100%参考值范围与可信区间的区别含义前者指该区间包含了(1-)100%的观察值；后者指该区间包含总体均数的可能性是(1-)100%。计算双侧参考值范围可信区间小结标准差和标准误的比较区间估计和医学参考值范围的区别可信区间的涵义

展开阅读全文

抽样误差与参数估计

最新文档