第九章(多阶段抽样)

上传人:l**** 文档编号:136701601 上传时间:2020-07-01 格式:PPT 页数:67 大小:1.13MB
返回 下载 相关 举报
第九章(多阶段抽样)_第1页
第1页 / 共67页
第九章(多阶段抽样)_第2页
第2页 / 共67页
第九章(多阶段抽样)_第3页
第3页 / 共67页
第九章(多阶段抽样)_第4页
第4页 / 共67页
第九章(多阶段抽样)_第5页
第5页 / 共67页
点击查看更多>>
资源描述

《第九章(多阶段抽样)》由会员分享,可在线阅读,更多相关《第九章(多阶段抽样)(67页珍藏版)》请在金锄头文库上搜索。

1、当总体单元的数目大、分布广时,若采用简单随机抽样,则需要编制包含全部总体单元的抽样框,工作量相当大;若采用系统抽样,则需将全部总体单元按一定标志进行有序排列,实施起来仍然很麻烦;若采用分层抽样,则需掌握一定的辅助信息进行分层,而实际应用中并不一定能找到合适的辅助变量;若采用单级整群抽样,则必需掌握全部总体单元的有关资料后进行分群,并在入样群内进行全面调查,工作量也是极其庞大的。例如,欲做农户家计调查,我国约有两亿农户,如果按上述几种方式进行抽样,其工作量之大难以想象。此时若采用多阶段抽样,可以简化抽样框的编制,便于最终样本单元的抽取,使得组织工作容易进行,避免上述抽样设计过程中的麻烦。,第一节

2、 概述,一.什么是多阶段抽样 分多个阶段抽到最终接受调查的样本。 初级单元(PSU)-Primary Sampling Unit 二级单元 (SSU)-Second-stage Sampling Unit 三级单元(TSU)-Third-stage Sampling Unit 最终单元 (SSU)-Ultimate Sampling Unit,假设总体由 个初级单元组成,每个初级单元又由若干个二级(次级)单元组成,若在总体中按一定方法抽取 个初级单元,对每个抽中的初级单元再抽取若干二级单元进行调查,这种抽样方法称为二阶段抽样(two-stage sampling)(也称二阶抽样、二级抽样)。

3、在二阶段抽样中,全部抽样是分两步实施的:第一步是从总体中抽初级单元,称为第一阶段抽样(第一阶抽样);第二步是从每个被抽中的初级单元中抽二级单元,称为第二阶段抽样(第二阶抽样)。,如果每个二级单元又由更小的三级单元组成,那么在第二阶段抽样后,若在每个被抽中的二级单元中再进行三级单元的抽样,则是三阶段抽样(三阶抽样)。同样的道理,还可以定义更高阶段抽样。对于二阶段以上的抽样,称为多阶段抽样(多阶抽样)。,以上述我国农户调查为例,可以定义全国的县为初级单元,乡镇为二级单元,自然村为三级单元,户为四级单元。在全国抽取若干样本县,在样本县中再抽若干样本乡镇,在样本乡镇中,抽取若干自然村,在自然村中抽取样

4、本户,这是一个四阶段抽样。,二、多阶段抽样特点,1.构造抽样框相对容易 多阶段抽样的一优点是不需要编制所有小单元的抽样框。抽取初级单元时,只需编制初级单元的抽样框,对被抽中的初级单元,再去编制二级单元抽样框,依此类推,每阶段只需编制该阶段的抽样框,从而大大降低编制抽样框的工作量,实际中非常方便。,即使是在某个城市范围内的居民调查,也不可能且没有必要编制全市的居民名单抽样框,多阶段抽样方法就可以解决这一问题。 此外,对于有些调查问题,抽样框的变动非常频繁,待抽样框整理完毕后,可能与实际情况相去甚远,多阶段抽样也是解决这类问题的办法。,2.节省人力、物力,发挥了抽样的效率 多阶段抽样保持了整群抽样

5、样本单元相对集中的特点,因此与简单随机抽样相比,实施方便,每个基本单元的调查费用较低;另一方面,它并不像整群抽样那样对入样群的所有单元进行调查,而是在中选的初级单元中抽取二级单元,避免了一阶整群抽样由于调查过多的小单元而造成人力、物力与财力的浪费,充分发挥了抽样的效率。因此,多阶段抽样既保持了样本相对集中的优点,又克服了样本信息相似重复、降低抽样效率的缺点。,3.行政上便于组织,某些条件可满足各级需要 全国范围内的调查一般都用到多阶段抽样技术,尤其是根据我国目前政治、经济体制的特点,各级党政机关为了宏观控制经济,都需要统计数字,而全国的抽样调查数字往往不能满足各级政府的需要,如果把多阶段抽样和

6、各地的需要结合起来,可以利用现成的行政区划或组织系统来划分阶段,为抽样调查的组织工作提供方便,满足各级政府的数据需求。,4.可用于散料的抽样 所谓“散料”,是指连续松散的、不易区分的个体或抽样单元的材料。例如一堆煤、一车水泥、储藏在一个仓库的粮食等。进行散料的抽样时,抽样单元可以人为划分,也可以取其自然的单位。例如,一级单元是自然或人为划分的分装(例如一袋水泥),二级单元则是从分装中抽取一定数量(如一千克)的份样作调查。,5.划分阶段不宜过多,三、推断原理 多阶段抽样属于分步抽样,对分步抽样,讨论估计量 的均值及其方差要分步进行。 性质1 对于二步抽样,有 式中, 、 为在固定初级单元时对第二

7、步抽样求均值和方差; 、 为对第一步抽样求均值和方差。二阶段抽样的抽样是分两步进行的,所以具有上述性质。,性质1可以推广到分多步抽样的情形,例如对于三阶段抽样,有,第二节 初级单元大小相 等时的二阶抽样,第 个初级单元二级单元内的方差:,由 的表达式注意到 是所有 的平均值,即: 同理有:,估计量方差一般公式为: 于是有:,(1),的无偏估计为: 式中估计量的方差由两项组成:第一项源于第一阶段抽样,主要取决于第一阶段抽样的样本量 与初级单元间的方差 ;第二项源于第二阶段抽样,主要取决于第二阶段抽样的总样本量 与初级单元内的方差 。,一般而论,第一项占总方差的绝大部分,第二项的分母是第一项的 倍

8、,且要乘以小于1的因子 ,相对于第一项要小得多,因此在二级单元样本量 固定的条件下, 越大( 越小),则方差越小,即提高 、减小 可以大大提高估计的精度。此外,可以证明(见附录)初级单元内样本方差 仍是总体相应方差 的无偏估计,但样本初级单元间的方差 并不是总体相应方差 的无偏估计。,如果第一阶的抽样比 可以忽略,则方差估计式可以简单为如下的结果: 这个结果在实际工作中可以作为参考,因为当第二阶段采用等距抽样或某些复杂抽样时,方差 的无偏估计很难得到,当 可以忽略时,只需要初级单元的均值 就可以得到方差近似估计。当然,从另一个方面看, 可以忽略,意味着总体中初级单元 很大而抽选出的 却很小,结

9、果是样本分布相对集中,势必增大抽样误差,因此应用时要多加斟酌。,相应地,总体总量 及方差 的无偏估计量分别为:,(4),(5),由上式看出,m与 , 成正比,与 , 成反比。 求出m后,利用(4),(5)式,即可求出n.,一般说来, 不为整数,而在实际应用时,要取整数,为此,Cameron(1951)给出了下面的取值规则: 若令 是 的整数部分,即 ,则有: (1)若 ,取 ; (2)若 ,取 ; (3)若 或 ,则取 。,第三节 初级单元大小不等时的二阶抽样,如果初级单元之间的规模差异不是很明显,并不能将其严格分层,仍然可以采用简单随机抽样抽取初级单元。若二阶抽样中每个阶段都采用简单随机抽样

10、,并且每个初级单元中二级单元的抽样是相互独立的,当初级单元大小不等,且按初级单元的规模分层后,各层级初级单元的大小差别仍很大,或者合理的分层是按其他指标进行的,对初级单元抽样一般采用不等概抽样。这个过程可以通过放回不等概率抽样(PPS)或者不放回不等概率抽样(PS)实现。,为常数,实际工作中,如果初级单元大小不相等,通常人们第一阶段采取PPS抽样,第二阶段采用简单随机抽样,且每个样本初级单元的样本量都相同,这样得到的样本是自加权的,估计量的形式非常简单。,欲估计某幼儿园每个小孩每天平均吃糖果数,该幼儿园共有三个班,其人数如下表所示。,该幼儿园各班人数信息,现采用PPS抽样方法抽选两个班,然后在

11、抽中的每个班中抽选5孩子。假设抽中的班级为A班、B班。在A班中用简单随机抽样抽中5个小孩,他们平均吃糖果为4,6,4,4,3;在B班抽选的5个孩子吃糖果数为3,5,4,5,3。试估计全幼儿园平均每人每天吃糖果数并给出估计的标准差。,第四节 不等概抽样在 多阶段抽样中的应用,二阶抽样效率分析,1.与简单随机抽样比较 为方便比较,接下来的分析均建立在下面的前提下:假设总体很大,抽样比很小,计算方差时的有限总体修正系数均可忽略不计。 二阶段抽样中第一阶段的总体方差可以看作是群间方差,第二阶段的方差可以看作是群内方差,因此总方差为两者之和,即 。若二阶段抽样时,第一阶段抽取 个初级单元,第二阶段在入样

12、初级单元中抽取 个基本单元,则其样本均值的方差为,若在简单随机抽样的情况下取相同的样本量,即总样本量为 ,则样本均值的方差为 因此二阶段抽样的设计效果为,通常情况下, ,因此二阶段抽样设计的效果大于1,即 ,这意味着二阶段抽样效率低于简单随机抽样。但是结合费用问题后注意到,二阶段抽样的优点是样本的分布比简单随机抽样要集中,可以节省人力、物力和财力,因此从费用效益来说,二阶段抽样效率就不一定低于简单随机抽样。,2 .与分层抽样比较,在二阶段抽样中,如果把初级单元看作是分层抽样的层,那么分层抽样可以看作是一种特殊的二阶段抽样,它是在第一阶段进行100%的抽样。当样本量也同为 时,第二阶段把这些样本

13、单元分布在 个初级单元之中。由于分层抽样的误差只受层内方差的影响(分层抽样在各层是全面调查,其抽样方差不受第一阶段方差的影响),因此,分层抽样样本均值的方差为,与二阶段抽样的方差相比较,由于 ,因此有: 这说明二阶段抽样效率通常也低于分层抽样,但是通过上面的分析看出,在一定程度上运用二阶段抽样仍然起到节省成本的作用。,3. 与整群抽样比较,如果在二阶段抽样中把初级单元看作群,那么整群抽样也可以看作是一种特殊二阶段抽样,它相当于第二阶段的抽样比为100%。故若要保持样本量为 ,就要少抽一些群,设群的大小为 ,则第一阶段所抽群数为 。根据前面的介绍,整群抽样的误差主要来自第一阶段的群间方差,因此其

14、方差可简化为,二阶段抽样的方差可以写成 要比较二者方差的大小,只要比较 与 即 与 的大小关系: 当 时, ,整群抽样的效率优于二阶段抽样; 当 时, ,整群抽样的效率等同于二阶段抽样;,当 时, ,整群抽样的效率劣于二阶段抽样。 所以,这两种抽样方法效率的高低,要视群间与群内方差的关系而定。,以上多阶段抽样与其他抽样方法间效率比较,都是假设二阶段抽样中的第一阶段初级单元作为分层抽样的层或整群抽样的群,实际情况往往并非如此,因此并不是严格的比较,对于一些具体的抽样方案而言,还需要作具体的分析。,此外,多阶段抽样的阶段增多,通常会增加抽样误差,使其效率降低,但多阶段抽样有其特殊的作用,在全国性的大规模抽样调查中,多阶段抽样有着不可替代的作用。同时,在实施过程中,还可以将它和其他抽样方法结合起来使用,提高抽样效率。,谢谢观看! 2020,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 工作范文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号