第九章(多阶段抽样)

上传人:博****1 文档编号:568003248 上传时间:2024-07-23 格式:PPT 页数:66 大小:572KB
返回 下载 相关 举报
第九章(多阶段抽样)_第1页
第1页 / 共66页
第九章(多阶段抽样)_第2页
第2页 / 共66页
第九章(多阶段抽样)_第3页
第3页 / 共66页
第九章(多阶段抽样)_第4页
第4页 / 共66页
第九章(多阶段抽样)_第5页
第5页 / 共66页
点击查看更多>>
资源描述

《第九章(多阶段抽样)》由会员分享,可在线阅读,更多相关《第九章(多阶段抽样)(66页珍藏版)》请在金锄头文库上搜索。

1、 抽样调查抽样调查 原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法当总体单元的数目大、分布广时,若采用简单随机抽样,则当总体单元的数目大、分布广时,若采用简单随机抽样,则当总体单元的数目大、分布广时,若采用简单随机抽样,则当总体单元的数目大、分布广时,若采用简单随机抽样,则需要编制包含全部总体单元的抽样框,工作量相当大;需要编制包含全部总体单元的抽样框,工作量相当大;需要编制包含全部总体单元的抽样框,工作量相当大;需要编制包含全部总体单元的抽样框,工作量相当大;若采用系统抽样,则需将全部总体单元按一定标志进行若采用系统抽样,则需将全部总体单元按一定标志进行若采用系统抽样,则需将全

2、部总体单元按一定标志进行若采用系统抽样,则需将全部总体单元按一定标志进行有序排列,实施起来仍然很麻烦;若采用分层抽样,则有序排列,实施起来仍然很麻烦;若采用分层抽样,则有序排列,实施起来仍然很麻烦;若采用分层抽样,则有序排列,实施起来仍然很麻烦;若采用分层抽样,则需掌握一定的辅助信息进行分层,而实际应用中并不一需掌握一定的辅助信息进行分层,而实际应用中并不一需掌握一定的辅助信息进行分层,而实际应用中并不一需掌握一定的辅助信息进行分层,而实际应用中并不一定能找到合适的辅助变量;若采用单级整群抽样,则必定能找到合适的辅助变量;若采用单级整群抽样,则必定能找到合适的辅助变量;若采用单级整群抽样,则必

3、定能找到合适的辅助变量;若采用单级整群抽样,则必需掌握全部总体单元的有关资料后进行分群,并在入样需掌握全部总体单元的有关资料后进行分群,并在入样需掌握全部总体单元的有关资料后进行分群,并在入样需掌握全部总体单元的有关资料后进行分群,并在入样群内进行全面调查,工作量也是极其庞大的。例如,欲群内进行全面调查,工作量也是极其庞大的。例如,欲群内进行全面调查,工作量也是极其庞大的。例如,欲群内进行全面调查,工作量也是极其庞大的。例如,欲做农户家计调查,我国约有两亿农户,如果按上述几种做农户家计调查,我国约有两亿农户,如果按上述几种做农户家计调查,我国约有两亿农户,如果按上述几种做农户家计调查,我国约有

4、两亿农户,如果按上述几种方式进行抽样,其工作量之大难以想象。此时若采用多方式进行抽样,其工作量之大难以想象。此时若采用多方式进行抽样,其工作量之大难以想象。此时若采用多方式进行抽样,其工作量之大难以想象。此时若采用多阶段抽样,可以简化抽样框的编制,便于最终样本单元阶段抽样,可以简化抽样框的编制,便于最终样本单元阶段抽样,可以简化抽样框的编制,便于最终样本单元阶段抽样,可以简化抽样框的编制,便于最终样本单元的抽取,使得组织工作容易进行,避免上述抽样设计过的抽取,使得组织工作容易进行,避免上述抽样设计过的抽取,使得组织工作容易进行,避免上述抽样设计过的抽取,使得组织工作容易进行,避免上述抽样设计过

5、程中的麻烦。程中的麻烦。程中的麻烦。程中的麻烦。 抽样调查抽样调查 原理与方法原理与方法第一节 概述一.什么是多阶段抽样分多个阶段抽到最终接受调查的样本。初级单元(PSU)-PrimarySamplingUnit二级单元(SSU)-Second-stageSamplingUnit三级单元(TSU)-Third-stageSamplingUnit最终单元(SSU)-UltimateSamplingUnit 抽样调查抽样调查 原理与方法原理与方法假设总体由个初级单元组成,每个初级单元又由若干个二级(次级)单元组成,若在总体中按一定方法抽取个初级单元,对每个抽中的初级单元再抽取若干二级单元进行调查,

6、这种抽样方法称为二阶段抽样(two-stagesampling)(也称二阶抽样、二级抽样)。在二阶段抽样中,全部抽样是分两步实施的:第一步是从总体中抽初级单元,称为第一阶段抽样(第一阶抽样);第二步是从每个被抽中的初级单元中抽二级单元,称为第二阶段抽样(第二阶抽样)。 抽样调查抽样调查 原理与方法原理与方法如果每个二级单元又由更小的三级单元组成,那么在第二阶段抽样后,若在每个被抽中的二级单元中再进行三级单元的抽样,则是三阶段抽样(三阶抽样)。同样的道理,还可以定义更高阶段抽样。对于二阶段以上的抽样,称为多阶段抽样(多阶抽样)。 抽样调查抽样调查 原理与方法原理与方法以上述我国农户调查为例,可以

7、定义全国的县为初级单元,乡镇为二级单元,自然村为三级单元,户为四级单元。在全国抽取若干样本县,在样本县中再抽若干样本乡镇,在样本乡镇中,抽取若干自然村,在自然村中抽取样本户,这是一个四阶段抽样。 抽样调查抽样调查 原理与方法原理与方法二、多阶段抽样特点二、多阶段抽样特点1.构造抽样框相对容易多阶段抽样的一优点是不需要编制所有小单元的抽样框。抽取初级单元时,只需编制初级单元的抽样框,对被抽中的初级单元,再去编制二级单元抽样框,依此类推,每阶段只需编制该阶段的抽样框,从而大大降低编制抽样框的工作量,实际中非常方便。 抽样调查抽样调查 原理与方法原理与方法即使是在某个城市范围内的居民调查,也不可能且

8、没有必要编制全市的居民名单抽样框,多阶段抽样方法就可以解决这一问题。此外,对于有些调查问题,抽样框的变动非常频繁,待抽样框整理完毕后,可能与实际情况相去甚远,多阶段抽样也是解决这类问题的办法。 抽样调查抽样调查 原理与方法原理与方法2.节省人力、物力,发挥了抽样的效率多阶段抽样保持了整群抽样样本单元相对集中的特多阶段抽样保持了整群抽样样本单元相对集中的特点,因此与简单随机抽样相比,实施方便,每个点,因此与简单随机抽样相比,实施方便,每个基本单元的调查费用较低;另一方面,它并不像基本单元的调查费用较低;另一方面,它并不像整群抽样那样对入样群的所有单元进行调查,而整群抽样那样对入样群的所有单元进行

9、调查,而是在中选的初级单元中抽取二级单元,避免了一是在中选的初级单元中抽取二级单元,避免了一阶整群抽样由于调查过多的小单元而造成人力、阶整群抽样由于调查过多的小单元而造成人力、物力与财力的浪费,充分发挥了抽样的效率。因物力与财力的浪费,充分发挥了抽样的效率。因此,多阶段抽样既保持了样本相对集中的优点,此,多阶段抽样既保持了样本相对集中的优点,又克服了样本信息相似重复、降低抽样效率的缺又克服了样本信息相似重复、降低抽样效率的缺点。点。 抽样调查抽样调查 原理与方法原理与方法3.行政上便于组织,某些条件可满足各级需要全国范围内的调查一般都用到多阶段抽样技术,尤其是根据我国目前政治、经济体制的特点,

10、各级党政机关为了宏观控制经济,都需要统计数字,而全国的抽样调查数字往往不能满足各级政府的需要,如果把多阶段抽样和各地的需要结合起来,可以利用现成的行政区划或组织系统来划分阶段,为抽样调查的组织工作提供方便,满足各级政府的数据需求。 抽样调查抽样调查 原理与方法原理与方法4.可用于散料的抽样所谓“散料”,是指连续松散的、不易区分的个体或抽样单元的材料。例如一堆煤、一车水泥、储藏在一个仓库的粮食等。进行散料的抽样时,抽样单元可以人为划分,也可以取其自然的单位。例如,一级单元是自然或人为划分的分装(例如一袋水泥),二级单元则是从分装中抽取一定数量(如一千克)的份样作调查。 抽样调查抽样调查 原理与方

11、法原理与方法5.划分阶段不宜过多 抽样调查抽样调查 原理与方法原理与方法三三、推断原理推断原理推断原理推断原理多多阶阶段段抽抽样样属属于于分分步步抽抽样样,对对分分步步抽抽样样,讨讨论论估估计计量量 的均值及其方差要分步进行。的均值及其方差要分步进行。性质性质性质性质1 1 对于二步抽样,有对于二步抽样,有式中,式中,、为在固定初级单元时对第二步抽样求均值为在固定初级单元时对第二步抽样求均值和方差;和方差;、为对第一步抽样求均值和方差。二为对第一步抽样求均值和方差。二阶段抽样的抽样是分两步进行的,所以具有上述性阶段抽样的抽样是分两步进行的,所以具有上述性质。质。 抽样调查抽样调查 原理与方法原

12、理与方法性质1可以推广到分多步抽样的情形,例如对于三阶段抽样,有 抽样调查抽样调查 原理与方法原理与方法第二节 初级单元大小相 等时的二阶抽样 抽样调查抽样调查 原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法第个初级单元二级单元内的方差: 抽样调查抽样调查 原理与方法原理与方法由的表达式注意到是所有的平均值,即:同理有: 抽样调查抽样调查 原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法估计量方差一般公式为:估计量方差一般公式为:于是有:于是有:(1

13、) 抽样调查抽样调查 原理与方法原理与方法的无偏估计为:式中估计量的方差由两项组成:第一项源于第一阶段式中估计量的方差由两项组成:第一项源于第一阶段抽样,主要取决于第一阶段抽样的样本量抽样,主要取决于第一阶段抽样的样本量与初级与初级单元间的方差单元间的方差;第二项源于第二阶段抽样,主;第二项源于第二阶段抽样,主要取决于第二阶段抽样的总样本量要取决于第二阶段抽样的总样本量与初级单元与初级单元内的方差内的方差。 抽样调查抽样调查 原理与方法原理与方法一般而论,第一项占总方差的绝大部分,第二项的分母是第一项的倍,且要乘以小于1的因子,相对于第一项要小得多,因此在二级单元样本量固定的条件下,越大(越小

14、),则方差越小,即提高、减小可以大大提高估计的精度。此外,可以证明(见附录)初级单元内样本方差仍是总体相应方差的无偏估计,但样本初级单元间的方差并不是总体相应方差的无偏估计。 抽样调查抽样调查 原理与方法原理与方法如如果果第第一一阶阶的的抽抽样样比比 可可以以忽忽略略,则则方方差差估估计计式式可可以以简简单为如下的结果:单为如下的结果:这这个个结结果果在在实实际际工工作作中中可可以以作作为为参参考考,因因为为当当第第二二阶阶段段采采用用等等距距抽抽样样或或某某些些复复杂杂抽抽样样时时,方方差差 的的无无偏偏估估计计很很难难得得到到,当当 可可以以忽忽略略时时,只只需需要要初初级级单单元元的的均

15、均值值 就就可可以以得得到到方方差差近近似似估估计计。当当然然,从从另另一一个个方方面面看看, 可可以以忽忽略略,意意味味着着总总体体中中初初级级单单元元 很很大大而而抽抽选选出出的的 却却很很小小,结结果果是是样样本本分分布布相相对对集集中中,势势必必增增大大抽抽样样误差,因此应用时要多加斟酌。误差,因此应用时要多加斟酌。 抽样调查抽样调查 原理与方法原理与方法相应地,总体总量及方差的无偏估计量分别为: 抽样调查抽样调查 原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法(4)(5) 抽样调查抽样调查

16、原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法由上式看出,m与,成正比,与,成反比。求出m后,利用(4),(5)式,即可求出n. 抽样调查抽样调查 原理与方法原理与方法一般说来,不为整数,而在实际应用时,要取整数,为此,Cameron(1951)给出了下面的取值规则:若令是的整数部分,即,则有:(1)若,取;(2)若,取;(3)若或,则取。 抽样调查抽样调查 原理与方法原理与方法第三节 初级单元大小不等时的二阶抽样初级单元大小不等时的二阶抽样 抽样调查抽样调查 原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法如果初级单元之间的规

17、模差异不是很明显,并不能将其严格分层,仍然可以采用简单随机抽样抽取初级单元。若二阶抽样中每个阶段都采用简单随机抽样,并且每个初级单元中二级单元的抽样是相互独立的 抽样调查抽样调查 原理与方法原理与方法当初级单元大小不等,且按初级单元的规模分层后,各层级初级单元的大小差别仍很大,或者合理的分层是按其他指标进行的,对初级单元抽样一般采用不等概抽样。这个过程可以通过放回不等概率抽样(PPS)或者不放回不等概率抽样(PS)实现。 抽样调查抽样调查 原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法 抽样调查抽样调

18、查 原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法为常数 抽样调查抽样调查 原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法实际工作中,如果初级单元大小不相等,通常人们第一阶段采取PPS抽样,第二阶段采用简单随机抽样,且每个样本初级单元的样本量都相同,这样得到的样本是自加权的,估计量的形式非常简单。 抽样调查抽样调查 原理与方法原理与方法欲估计某幼儿园每个小孩每天平均吃糖果数,该幼儿园共有三个班,其人数如下表所示。该幼儿园各班人数信息该幼儿园各班人数信息班级ABC人数251520 抽样调查

19、抽样调查 原理与方法原理与方法现采用PPS抽样方法抽选两个班,然后在抽中的每个班中抽选5孩子。假设抽中的班级为A班、B班。在A班中用简单随机抽样抽中5个小孩,他们平均吃糖果为4,6,4,4,3;在B班抽选的5个孩子吃糖果数为3,5,4,5,3。试估计全幼儿园平均每人每天吃糖果数并给出估计的标准差。 抽样调查抽样调查 原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法第四节 不等概抽样在 多阶段抽样中的应用 抽样调查抽样调查 原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法 抽样调查抽样调查 原理与方法原理与方法二阶抽样效率分析二阶抽

20、样效率分析1.1.与简单随机抽样比较与简单随机抽样比较与简单随机抽样比较与简单随机抽样比较为方便比较,接下来的分析均建立在下面的前提下:为方便比较,接下来的分析均建立在下面的前提下:假设总体很大,抽样比很小,计算方差时的有限假设总体很大,抽样比很小,计算方差时的有限总体修正系数均可忽略不计。总体修正系数均可忽略不计。二阶段抽样中第一阶段的总体方差可以看作是群间方二阶段抽样中第一阶段的总体方差可以看作是群间方差,第二阶段的方差可以看作是群内方差,因此差,第二阶段的方差可以看作是群内方差,因此总方差为两者之和,即总方差为两者之和,即。若二阶段。若二阶段抽样时,第一阶段抽取抽样时,第一阶段抽取个初级

21、单元,第二阶段个初级单元,第二阶段在入样初级单元中抽取在入样初级单元中抽取个基本单元,则其样本个基本单元,则其样本均值的方差为均值的方差为 抽样调查抽样调查 原理与方法原理与方法若若在在简简单单随随机机抽抽样样的的情情况况下下取取相相同同的的样样本本量量,即即总总样本量为样本量为,则样本均值的方差为,则样本均值的方差为因此二阶段抽样的设计效果为因此二阶段抽样的设计效果为 抽样调查抽样调查 原理与方法原理与方法通常情况下,因此二阶段抽样设计的效果大于1,即,这意味着二阶段抽样效率低于简单随机抽样。但是结合费用问题后注意到,二阶段抽样的优点是样本的分布比简单随机抽样要集中,可以节省人力、物力和财力

22、,因此从费用效益来说,二阶段抽样效率就不一定低于简单随机抽样。 抽样调查抽样调查 原理与方法原理与方法2 .2 .与分层抽样比较与分层抽样比较在二阶段抽样中,如果把初级单元看作是分层抽样的层,那么分层抽样可以看作是一种特殊的二阶段抽样,它是在第一阶段进行100%的抽样。当样本量也同为时,第二阶段把这些样本单元分布在个初级单元之中。由于分层抽样的误差只受层内方差的影响(分层抽样在各层是全面调查,其抽样方差不受第一阶段方差的影响),因此,分层抽样样本均值的方差为 抽样调查抽样调查 原理与方法原理与方法与二阶段抽样的方差相比较,由于与二阶段抽样的方差相比较,由于,因此有:,因此有:这说明二阶段抽样效

23、率通常也低于分层抽样,但是这说明二阶段抽样效率通常也低于分层抽样,但是通过上面的分析看出,在一定程度上运用二阶段通过上面的分析看出,在一定程度上运用二阶段抽样仍然起到节省成本的作用。抽样仍然起到节省成本的作用。 抽样调查抽样调查 原理与方法原理与方法3. 3. 与整群抽样比较与整群抽样比较如如果果在在二二阶阶段段抽抽样样中中把把初初级级单单元元看看作作群群,那那么么整整群群抽抽样样也也可可以以看看作作是是一一种种特特殊殊二二阶阶段段抽抽样样,它它相相当当于于第第二二阶阶段段的的抽抽样样比比为为100%100%。故故若若要要保保持持样样本本量量为为 ,就就要要少少抽抽一一些些群群,设设群群的的大

24、大小小为为 ,则则第第一一阶阶段段所所抽抽群群数数为为 。根根据据前前面面的的介介绍绍,整整群群抽抽样样的的误误差差主主要要来来自自第第一阶段的群间方差,因此其方差可简化为一阶段的群间方差,因此其方差可简化为 抽样调查抽样调查 原理与方法原理与方法二阶段抽样的方差可以写成二阶段抽样的方差可以写成 要比较二者方差的大小,只要比较要比较二者方差的大小,只要比较与与即即与与的大小关系:的大小关系:当当 时时, ,整整群群抽抽样样的的效效率率优优于于二二阶段抽样;阶段抽样;当当时,时,整群抽样的效率等同于,整群抽样的效率等同于二阶段抽样;二阶段抽样; 抽样调查抽样调查 原理与方法原理与方法当时,整群抽样的效率劣于二阶段抽样。所以,这两种抽样方法效率的高低,要视群间与群内方差的关系而定。 抽样调查抽样调查 原理与方法原理与方法以上多阶段抽样与其他抽样方法间效率比较,都是假设二阶段抽样中的第一阶段初级单元作为分层抽样的层或整群抽样的群,实际情况往往并非如此,因此并不是严格的比较,对于一些具体的抽样方案而言,还需要作具体的分析。 抽样调查抽样调查 原理与方法原理与方法此外,多阶段抽样的阶段增多,通常会增加抽样误差,使其效率降低,但多阶段抽样有其特殊的作用,在全国性的大规模抽样调查中,多阶段抽样有着不可替代的作用。同时,在实施过程中,还可以将它和其他抽样方法结合起来使用,提高抽样效率。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号