抽样与参数估计

上传人:汽*** 文档编号:510976201 上传时间:2022-12-11 格式:DOC 页数:17 大小:161KB
返回 下载 相关 举报
抽样与参数估计_第1页
第1页 / 共17页
抽样与参数估计_第2页
第2页 / 共17页
抽样与参数估计_第3页
第3页 / 共17页
抽样与参数估计_第4页
第4页 / 共17页
抽样与参数估计_第5页
第5页 / 共17页
点击查看更多>>
资源描述

《抽样与参数估计》由会员分享,可在线阅读,更多相关《抽样与参数估计(17页珍藏版)》请在金锄头文库上搜索。

1、第四章抽样与参数估计推断统计:利用样本统计量对总体某些性质或数量特征进行 推断。从数据得到对现实世界的结论的过程就叫做统计推断(statistical inferen ce)。这个调查例子是估计总体参数(某种意见的比例)的一个过程。估计(estimatio n)是统计推断的重要内容之一统计推断的另一个主要内容是本章第二节要介绍的假设检验(hypothesis testi ng) 。因此本节内容就是由样本数据对总体参数进行估计,即:广均值了 1由样本标推羞呼1统计量比例P 1成数)丿厂均值元=总体标推羞/比例P学习目标:了解抽样和抽样分布的基本概念理解抽样分布与总体分布的关系了解点估计的概念和估

2、计量的优良标准掌握总体均值、总体比例和总体方差的区间估计第一节抽样与抽样分布回顾相关概念:总体、个体和样本抽样推断:从所研究的总体全部元素(单位)中抽取一部分元 素(单位)进行调查,并根据样本数据所提供的信息来推断总体的 数量特征。总体(Populatio n):调查研究的事物或现象的全体 参数个体(Item unit):组成总体的每个元素样本(Sample):从总体中所抽取的部分个体统计量样本容量(Sample size):样本中所含个体的数量一般将样本单位数不少于三十个的样本称为大样本,样本单位数不到三十个的样本称为小样本。一、抽样方法及抽样分布1抽样方法(1)、概率抽样:根据已知的概率选

3、取样本 、简单随机抽样:完全随机地抽选样本,使得每一个 样本都有相同的机会(概率)被抽中。注意:在有限总体的简单随机抽样中, 由抽样 是否具有可重 复性 ,又可分为 重复抽样 与不重复抽样 。而且,根据抽样中 是否排序 , 所能抽到的样本个数往往不同。 、分层抽样:总体分成不同的“层”(类),然后在每一层内进行抽样 、整群抽样:将一组被调查者(群)作为一个抽样单位 、等距抽样:在样本框中每隔一定距离抽选一 个被调查者( 2)非概率抽样:不是完全按随机原则选取样本 、非随机抽样:由调查人员自由选取被调查者 、判断抽样:通过某些条件过滤来选择被调查 者(3)、配额抽样:选择一群特定数目、满足特定条

4、件的被 调查者2、抽样分布 一般地,样本统计量的所有可能取值及其取值概率所形成的 概率分布,统计上称为抽样分布( sampling distribution )。3 / 29某个样本统计量(如均值、比例、方差等)的抽样分布,从 理论上说就是在重复选取容量为 n的样本时,由每一个样本计算 出的该统计量数值的相对频数分布或概率分布。二、样本均值的抽样分布与中心极限定理1样本均值的抽样分布(一个例子)【例】设一个总体,含有 4个元素(个体),即总体单位数N=4 4个个体分别为 X1=1 X2=2、X3=3、X4=4。总体的均值、方差及分布如下均值和方差NX ii 1N2 .5(Xi )i 11.25

5、总体数据的直方图接收样本均值的抽样分布现从总体中抽取n= 2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表所有可能的n=2的样本(共16个)第一个观察值第二个观察值1,11,21,31,42,12,22,32,4J 3,13,23,33,44,14,24,34,4计算出各样本的均值,如下表。并给出样本均值的抽样分布所有样本均值的均值和方差:(兀x)2(1.0 2.5(4.0 2.5)20.62516个样本的均值(x)第一个观察值第二个观察值1.01.52.02.51.52.02.53.02.02.53.03.52.53.03.54.0Xiii 11.0 1.540

6、 2516 .式中:M为样本数目比较及结论:1.样本均值的均值(数学期望)等于总体均 值2.样本均值的方差等于总体方差的 1/n2、中心极限定理当总体服从正态分布 N(卩,a 2 )时,来自该总体的所有 容量为n的样本的均值X也服从正态分布,X的数学期望为卩,方差为a2/n。即xN(卩,a 2/ n)中心极限定理:设从均值为,方差为a 2的一个任意总体 中抽取容量为n的样本,当n充分大时(一般,n 30就可以用 中心极限定理了),样本均值X的抽样分布近似服从均值为 卩、 方差为a 2/n的正态分布。即有:EX也即有,z X N 0,1其实,样本均值抽样分布的数字特征一方面与总体分布的均 值和方

7、差有关,另一方面也与抽样的方法是重复抽样还是不重复 抽样有关。无论是重复抽样或不重复抽样,样本均值的数学期望 始终等于总体的均值。但在不重复抽样条件下,样本均值的方差 需要用修正系数E去修正重复抽样时均值的方差。当N很大,V N 1而n/N 5%时,其修正系数口 1,可视不重复抽样与重复抽N 1样一致。图样本均值的抽样分布与总体分布的关系三、样本比例的抽样分布 (Sampli ng Distribution ofp样本比例的抽样分布是样本比例所有可能值的概率分布。(The sampling distribution of p is the probabilitydistributi onof

8、all possible values of the sampleproportionp.)样本比例抽样分布的相关信息,艮卩p的期望值、标准差、 抽样分布形状等。主要应用于分类变量:在经济与商务的许多场合,需要用样本比例p对总体比例P进行统计推断根据中心极限定理有:当样本容量增大时(大样本:经验上, 当下面两个条件(n p=5且n(1- p)=5)满足时,与p相关的样 本为大样本),样本比例抽样分布趋向于以样本期望值为中心、 以样本方差为方差的正态分布1、期望值(Expected value of p): E ( p)=P2、 标准差(Standard deviation ofp):重复抽样:

9、不重复抽样:fcd-p)N-u(1_尸)Ar - 1 V灯*四、样本方差的抽样分布要用样本方差s2去推断总体的方差彷2,必须知道样本方差 的分布。设总体服从正态分布 XNg , (T 2 ) , Xi, X2,,Xn为2来自该正态总体的样本,统计证明比值丄鼻的抽样分布为自由 度是(n-1 )的2分布,即:-21 s22Xixi22分布的性质:(1) 、2分布的变量始终为正;(2) 、2分布的期望为E 2n n ,方差为D 2( n) 2n第二节参数估计的基本方法一、估计量和估计值参数是总体的数值特征(A parameter is a numericalcharacteristic of a p

10、opulati on。)参数估计:就是用样本统计量去估计总体的参数。数字特征总体参数()样本统计量(?)个 总 体均值X比例Pp方差22 s估计量(?) (estimator )用于估计总体某一参数的样本统 计量(随机变量)的名称。样本均值,样本比例、样本方差等都可以是一个估计量。 估计值(est i mat e):用来估计总体参数时计算出来的估计 量的具体数值。例如:样本均值就是总体均值的一个估计量如果样本均值X = 3,则3就是的估计值二、点估计与判断估计量的优良性准则(一)、点估计点估计(Point Estimate)就是用样本估计量的值直接作为总体参数的估计值。设 是总体分布中一个要估

11、计的参数。例如,总体分布的均值、方差等。现在从总体中得到一个随机样本Xi,X2, ,Xn,如何估计 ?记估计 的估计量(统计量)为 ? X1,X2, ,Xn ,简记为 ?若得到一组样本观察值Xi,X2,.,Xn,就可以得到 的估计值:? x1 ,x2 ,., xn ,也记为 ?。总体分布参数 的点估计,就是求出的估计值 ?。 点估计的方法一般有矩估计发法、极大似然估计法等。概念要点 :1. 从总体中抽取一个样本, 根据该样本的统计量对总体的未 知参数作出一个数值点的估计。例如: 用样本均值作为总体未知均值的估计值就是一 个点估计2. 点估计没有给出估计值接近总体未知参数程度的信息3. 其理论基

12、础是抽样分布(二)、估计量的优良性准则要估计总体的某一指标, 并非只能用一个样本指标, 而可能有多个指标可供选择, 即对同一总体参数, 可能会有不同的估计 量。作为一个好的估计量,估计量必须具有如下性质:无偏性、 有效性、一致性。1、无偏性(Un biased ness ):样本估计量的数学期望(均值)等 于被估总体参数的真值;如果E(?),则称?为的无偏估计量。可以证明,总体方差2的样本矩估计量s2是无偏估计量。2、有效性(Efficiency):好的点估计量应具有较小的方差;在用估计量?来估计总体的某个参数时,如果对其它所有 对的估计量总是有:Var ? Var那么,这个估计量?就是总体参

13、数的有效估计量。3、一致性(Consi st ency):随着样本容量的增大,估计量越来越接近被估计的总体参数。如果?n满足:lim P( ?) 1,即:nlim彳n则称为?的一致估计量。可以证明:样本均值、样本比例、样本标准差的点估计是无偏、有效、一致的。三、抽样误差与区间估计(一)、抽样误差(Sampling Error )一个样本可以得到总体参数的一个点估计,该点估计值与总 体参数真值之间的差异,即为 抽样误差。有三个相互联系的概念:1、实际抽样误差:具体样本的估计值?与总体参数的实际值 之间的离差。(?)2、抽样平均误差:所有可能样本估计值与相应总体参数的平均差异程度。卫仏J能H木个数

14、3、抽样极限误差一定概率下抽样误差的可能范围(也称允许误差): 、统计学上往往用抽样极限误差来测度抽样误差的大小或者说测度点估计的精度。原因:总体参数值往往并不知道,因此, 实际抽样误差与抽样平均误差也往往无法求出,但在抽样分布大体知道的情况下,抽样极限误差是可以估计出来的。 、抽样平均误差是所有可能样本值与总体指标值之间的平 均离差,它表明抽样估计的准确度;而抽样极限误差是样本指标值与总体指标值的离差绝对值是表明抽样估计的准确程度的范 围。这也就决定了两者存在一定的联系。通常,把抽样极限误差 与抽样平均误差相比,从而使单一样本的抽样极限误差标准化, 一般称为概率度或相对误差范围,即置信度。 抽样极限误差的估计总是要和一定的概率保证程度联系 在一起的。原因:样本统计量往往是一随机变量,它与总体参数 真值之差也是一个随机变量, 因此就不能期望某次抽样的样本估 计值落在一定区间内是一个必然事件, 而只能给予一定的概率保 证。因此,在进行抽样估计时, 既需要考虑抽样误差的可能范围, 同时还需考虑落到这一范围的概率大小。 前者是估计的准确度问 题,后者是估计的可靠性问题,两者紧密联系不可分开。这也正 是区间估计所关心的主要问题。(二)、区间估计( Int

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 活动策划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号