第六章 多阶段抽样#高等教育

上传人:枫** 文档编号:567703985 上传时间:2024-07-22 格式:PPT 页数:53 大小:1.42MB
返回 下载 相关 举报
第六章 多阶段抽样#高等教育_第1页
第1页 / 共53页
第六章 多阶段抽样#高等教育_第2页
第2页 / 共53页
第六章 多阶段抽样#高等教育_第3页
第3页 / 共53页
第六章 多阶段抽样#高等教育_第4页
第4页 / 共53页
第六章 多阶段抽样#高等教育_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《第六章 多阶段抽样#高等教育》由会员分享,可在线阅读,更多相关《第六章 多阶段抽样#高等教育(53页珍藏版)》请在金锄头文库上搜索。

1、第六章第六章 多阶段抽样多阶段抽样 Multi-Stage Sampling1高级材料第六章第六章 多阶段抽样多阶段抽样教学目的教学目的 通过本章的教学,使通过本章的教学,使学生了解多阶段抽样的学生了解多阶段抽样的定义和抽选方法与推断定义和抽选方法与推断原理;掌握初级单元大原理;掌握初级单元大小相等的二阶抽样和初小相等的二阶抽样和初级单元大小不等的二阶级单元大小不等的二阶抽样方法;明确多阶段抽样方法;明确多阶段抽样的其他有关问题。抽样的其他有关问题。 重点与难点重点与难点 本章的重点是初级单本章的重点是初级单元大小相等的二阶抽元大小相等的二阶抽样和初级单元大小不样和初级单元大小不等的二阶抽样方

2、法。等的二阶抽样方法。难点是初级单元大小难点是初级单元大小相等的二阶抽样和初相等的二阶抽样和初级单元大小不等的二级单元大小不等的二阶抽样方法。阶抽样方法。2高级材料本章结构本章结构 6.1 引言引言 6.2 初级单元大小相等的二阶抽样初级单元大小相等的二阶抽样 6.3 初级单元大小不等的二阶抽样初级单元大小不等的二阶抽样 4. 6.4三阶及多阶抽样三阶及多阶抽样3高级材料6.1 6.1 引言引言一、概念一、概念 在整群抽样中,如果抽中的群内所含的次级单元个数相在整群抽样中,如果抽中的群内所含的次级单元个数相当地多,此时对该群作普查会感到当地多,此时对该群作普查会感到“心有余而力不足心有余而力不

3、足”。特。特别当群内的次级单元差异不大,即别当群内的次级单元差异不大,即 比较大,这种情形下比较大,这种情形下对群内所有的次级单元一一访问似乎完全没有必要,一个省对群内所有的次级单元一一访问似乎完全没有必要,一个省时省钱又省力的念头会在调查者的头脑中油然而生,何不在时省钱又省力的念头会在调查者的头脑中油然而生,何不在抽到的群内再作一定方式的抽样呢?这种在选中的初级单元抽到的群内再作一定方式的抽样呢?这种在选中的初级单元中再进行抽样的方法称为中再进行抽样的方法称为二阶抽样二阶抽样。倘若在抽取的次级单元。倘若在抽取的次级单元中又包含许多更次一级的单元,在这些单元中继续抽样就自中又包含许多更次一级的

4、单元,在这些单元中继续抽样就自然地称为然地称为三阶抽样三阶抽样。4高级材料 二阶抽样与分层抽样、整群抽样的二阶抽样与分层抽样、整群抽样的一个共同特点是一个共同特点是:将:将总体分为若干个群;总体分为若干个群;所不同的是所不同的是:分层抽样是每个群内都进:分层抽样是每个群内都进行抽样,整群抽样是抽若干个群再在群内普查,而二阶抽样行抽样,整群抽样是抽若干个群再在群内普查,而二阶抽样则是抽若干个群再在群内抽样。则是抽若干个群再在群内抽样。因此,可将分层抽样与整群因此,可将分层抽样与整群抽样看作是二阶抽样的特殊情况。抽样看作是二阶抽样的特殊情况。抽样形式抽样形式第一阶段第一阶段第二阶段第二阶段分层抽样

5、分层抽样整群抽样整群抽样二阶抽样二阶抽样抽全部抽全部抽部分抽部分抽全部抽全部抽部分抽部分抽部分抽部分抽部分抽部分5高级材料抽样过程可以分为以下几个步骤(以二阶抽样为例):抽样过程可以分为以下几个步骤(以二阶抽样为例):N总体总体R4R3R2R1R130一阶单元一阶单元R1R4R33R98R110抽取一阶单元抽取一阶单元n样本样本n1n2n3n4n5抽取二阶单元抽取二阶单元可以看出,二阶抽样在组织技术上是整群抽样和分层抽样的综合可以看出,二阶抽样在组织技术上是整群抽样和分层抽样的综合.6高级材料 二、二阶与多阶抽样的优点二、二阶与多阶抽样的优点1、它具有实施上的方便,比如在编制抽样框时、它具有实

6、施上的方便,比如在编制抽样框时那些没有被抽到的群或次一级群内的单元就没有那些没有被抽到的群或次一级群内的单元就没有必要也去编制抽样框。仅需对那些已抽中的单元必要也去编制抽样框。仅需对那些已抽中的单元才去准备下一级单元的抽样框,而且许多抽样调才去准备下一级单元的抽样框,而且许多抽样调查常常采用行政系统及隶属单元,这给多阶抽样查常常采用行政系统及隶属单元,这给多阶抽样本身创造了有利的条件。本身创造了有利的条件。7高级材料2、 能够满足各级政府部门对抽样调查资料的需求。能够满足各级政府部门对抽样调查资料的需求。 因为各级政府领导都关心全国和本地区、本因为各级政府领导都关心全国和本地区、本部门的社会经

7、济发展状况,希望抽样调查能同时部门的社会经济发展状况,希望抽样调查能同时满足全国性和地方性的需要。因而采用二阶或多满足全国性和地方性的需要。因而采用二阶或多阶抽样,在一定程度上能够满足各级政府、部门阶抽样,在一定程度上能够满足各级政府、部门对调查资料的需求。对调查资料的需求。8高级材料3、有利于减少抽样误差、提高抽样估计精度。、有利于减少抽样误差、提高抽样估计精度。这种抽样调查方法,可以使每个一阶样本单位这种抽样调查方法,可以使每个一阶样本单位分布比较均匀,具有很好的代表性;对于方差分布比较均匀,具有很好的代表性;对于方差大的阶段多抽些样本单位以提高精度。大的阶段多抽些样本单位以提高精度。9高

8、级材料 另外,多阶抽样方法可以用到关于散料的抽另外,多阶抽样方法可以用到关于散料的抽样。所谓散料是指连续松散的不易区分为个体或样。所谓散料是指连续松散的不易区分为个体或抽样单元的材料。抽样单元的材料。 例如,煤、粮食、水泥、化肥等原料的质量例如,煤、粮食、水泥、化肥等原料的质量检测,此时抽样单元常常需要人为划分,一般取检测,此时抽样单元常常需要人为划分,一般取自然单位,诸如一公斤、一杯子等;而初级单元自然单位,诸如一公斤、一杯子等;而初级单元则为包装袋、一卡车、一个车皮等。这种数量众则为包装袋、一卡车、一个车皮等。这种数量众多的散料的质量检测采用二阶或多阶抽样也许是多的散料的质量检测采用二阶或

9、多阶抽样也许是最有效的手段最有效的手段. .为方便为方便, ,本章主要讨论二阶抽样。本章主要讨论二阶抽样。10高级材料6.2 6.2 初级单元大小相等的二阶抽样初级单元大小相等的二阶抽样 先作一些基本假设:先作一些基本假设: (1 1)初级单元中包含的次级单元个数同为)初级单元中包含的次级单元个数同为M,因此在抽中的初级单元中再抽取的次级单元个数也因此在抽中的初级单元中再抽取的次级单元个数也相等,记为相等,记为 m (2 2)两个阶段的抽样方法都是简单随机抽样。)两个阶段的抽样方法都是简单随机抽样。 (3 3)在抽中的若干初级单元中作第二阶抽样是)在抽中的若干初级单元中作第二阶抽样是相互独立进

10、行的。相互独立进行的。11高级材料 再引进一些必要的记号:再引进一些必要的记号:表示第表示第 初级单元中第初级单元中第 个次级单元个次级单元表示样本中第表示样本中第 初级单元中第初级单元中第 个次级单元的观测值个次级单元的观测值12高级材料第第 初级单元总和初级单元总和第第 初级单元平均值初级单元平均值总体平均值总体平均值初级单元初级单元(群群)内的方差内的方差总体中初级单元总体中初级单元(群群)间方差间方差将将 改为改为 ,N改为改为n,M改为改为m,则为相应的样本指标值,则为相应的样本指标值13高级材料第第 i 群内次级单元间的方差记为:群内次级单元间的方差记为:显然有显然有 所有所有 的

11、平均数。的平均数。14高级材料1、估计量及其方差、估计量及其方差 总体平均数总体平均数 的估计是用样本平均数进行估计的的估计是用样本平均数进行估计的容易证明,这个估计量容易证明,这个估计量 是是 的无偏估计。的无偏估计。15高级材料其方差为:其方差为:(6.1)其中其中 ,方差的无偏估计为:方差的无偏估计为:(6.2)总体总数总体总数 的估计为:的估计为:方差的无偏估计为:方差的无偏估计为:总体平均数总体平均数95的置信区间为的置信区间为总体总数总体总数95的置信区间为的置信区间为16高级材料i12345678910375.25408.30323.40502.50234.00387.75284

12、.20256.60314.10280.5011280.2512115.998752.7617833.753953.0011302.506573.044822.366921.015827.2525.0227.2221.5633.5015.6025.8518.9517.1120.9418.70135.0271.58127.1671.4321.6197.3784.7530.7924.5541.56例例6.1 新华书店某柜台上月共用去发票新华书店某柜台上月共用去发票70本,每本本,每本100张,张,现随机从中抽出现随机从中抽出10本,每本随机抽出本,每本随机抽出15张发票,得到数据张发票,得到数据如下

13、表:给出上月柜台营业总额的估计及其方差。如下表:给出上月柜台营业总额的估计及其方差。17高级材料解:解:N=70,n=10,M=100,m=15故上月柜台营业总额的估计为故上月柜台营业总额的估计为157108.00元元18高级材料标准差为标准差为 元元营业总额营业总额95的置信区间为的置信区间为19高级材料2、最优抽样比、最优抽样比 如果初级单元(或群)之间的旅行费用不占重要地位的如果初级单元(或群)之间的旅行费用不占重要地位的话,常采用简单线性费用函数:话,常采用简单线性费用函数: 二阶抽样存在两次概率抽样,因而存在两个抽样比二阶抽样存在两次概率抽样,因而存在两个抽样比 因此我们面临的问题是

14、:因此我们面临的问题是:(1)在总费用给定的条件下,如何在总费用给定的条件下,如何确定确定 与与 而使而使 的方差达到最小;的方差达到最小;(2)在给定估计量的精在给定估计量的精度度 条件下,如何确定条件下,如何确定 与与 以使总费用最小。以使总费用最小。其中其中 是基本费用,是基本费用, 是每调查一个初级单元与次级单元是每调查一个初级单元与次级单元所花费的费用。所花费的费用。(6.3)将方差表达成:将方差表达成:(6.4)20高级材料 于是,在固定于是,在固定C下极小化下极小化 或在固定或在固定 下极小化下极小化 C均等价于使下式极小化:均等价于使下式极小化:其中:其中: 。但这里要求。但这

15、里要求 。假如假如 ,表明群内差异明显地大于群间的差异,表明群内差异明显地大于群间的差异,因此对于抽到的群来说,最好作全面调查才能保证样本的代因此对于抽到的群来说,最好作全面调查才能保证样本的代表性,此时总使表性,此时总使mM。现考虑现考虑(6.5)21高级材料在在(6.5)式中,由于式中,由于 都是常数,为使都是常数,为使(6.5)达到最达到最小,只要小,只要达到最小,这两个加项的乘积恰好为常数达到最小,这两个加项的乘积恰好为常数 ,因此,因此只要这两项相等就可使只要这两项相等就可使Q达到最小,此时应取达到最小,此时应取或者或者m的最优取值为:的最优取值为:(6.7)一般地,一般地, 不是整

16、数,记不是整数,记 为为 的最小整数部分,那的最小整数部分,那么么 ( 为为 的小数部分,且的小数部分,且 )。)。(6.6)22高级材料如果如果 ,则取,则取如果如果 ,则取,则取易见,对于易见,对于 的小数部分大于或等于的小数部分大于或等于0.5的情况,我们总取的情况,我们总取 ,这符合通常的,这符合通常的“五入五入”规则,是否规则,是否“四舍四舍”?当当 时,就要看时,就要看 的最小整数部分的大小了。的最小整数部分的大小了。 由由 m 的选取,代入的选取,代入(6. .3)或或(6. .4)立即可以得到立即可以得到 n 的数值。的数值。23高级材料3、分层二阶抽样、分层二阶抽样 所谓分层

17、二阶抽样就是将总体分为所谓分层二阶抽样就是将总体分为 k 个层,在个层,在每层内进行二阶抽样。比如,一所大学有每层内进行二阶抽样。比如,一所大学有 8 个系,个系,每个系有若干个班级,每班大约人数为每个系有若干个班级,每班大约人数为40人,为了人,为了解学生的情况需要作一次抽样调查,在每个系都随解学生的情况需要作一次抽样调查,在每个系都随机抽几个班,再在抽中的班级里抽取若干人的简单机抽几个班,再在抽中的班级里抽取若干人的简单随机抽样,这就构成二阶分层抽样。随机抽样,这就构成二阶分层抽样。24高级材料 本节讨论的二阶分层抽样,假设在同一层内初级单元大本节讨论的二阶分层抽样,假设在同一层内初级单元

18、大小相等,但不同层可以不相等。设第小相等,但不同层可以不相等。设第 h 层含层含 个初级单元,个初级单元,每个初级单元包含每个初级单元包含 个次级单元,于是总体中共含有个次级单元,于是总体中共含有个次级单元。又假设在第个次级单元。又假设在第 h 层按照简单随机抽样方法抽取层按照简单随机抽样方法抽取个初级单元,在每个被抽中的初级单元中再抽取容量为个初级单元,在每个被抽中的初级单元中再抽取容量为 的的简单随机抽样。简单随机抽样。 设第设第 h 层中样本的层中样本的(二阶抽样二阶抽样)平均数为平均数为 ,因此按照分,因此按照分层估计的技巧,总体的层估计的技巧,总体的(按次级单元按次级单元)平均数平均

19、数 的分层二阶估的分层二阶估计量为:计量为:(6.8)其中其中 为第为第 h 层层(按次级单元按次级单元)的层权:的层权:25高级材料(6.9)(6.10)而而由于各层的抽样相互独立,而由二阶抽样的有关讨论,由于各层的抽样相互独立,而由二阶抽样的有关讨论, 的的方差及其方差估计是已知的,因此:方差及其方差估计是已知的,因此:(6.11)(6.12)其中其中 分别为第分别为第 h 层中的两个抽样比。层中的两个抽样比。26高级材料 和和 是第是第 h 层中的群间和群内方差,层中的群间和群内方差, 与与 是第是第 h 层中样本的群间和群内方差。层中样本的群间和群内方差。显然,总体总和的分层二阶抽样估

20、计为:显然,总体总和的分层二阶抽样估计为:(6.13)其方差及其方差估计为:其方差及其方差估计为:在分层二阶抽样中当然也存在最优抽样比的问题,不过此在分层二阶抽样中当然也存在最优抽样比的问题,不过此时假定费用函数一般应当与时假定费用函数一般应当与“层层”有关系:有关系:(6.14)27高级材料固定费用固定费用C而使方差达到最小或方差有一定精度要求下使而使方差达到最小或方差有一定精度要求下使费用达到最小,此时费用达到最小,此时 的最优选择为:的最优选择为:(6.15)其中总假设对所有的其中总假设对所有的 h ,都有,都有 。28高级材料6.3 6.3 初级单元大小不等的二阶抽样初级单元大小不等的

21、二阶抽样 在实践中,除少数情况外,初级单元的大小不在实践中,除少数情况外,初级单元的大小不一定相等当然理想一些的情况,我们在分群时就注一定相等当然理想一些的情况,我们在分群时就注意到先将单元按照大小分层,使得同一层中初级单意到先将单元按照大小分层,使得同一层中初级单元大小相等,然后利用上面所讲的分层二阶抽样的元大小相等,然后利用上面所讲的分层二阶抽样的办法来做。只可惜在实际操作中,分层分群常常有办法来做。只可惜在实际操作中,分层分群常常有一些一些“自然自然”形式,例如从行政系统划分等。因此,形式,例如从行政系统划分等。因此,我们只能面对初级单元大小不等的情形,由于初级我们只能面对初级单元大小不

22、等的情形,由于初级单元大小不一样,合理的手段是对初级单元采用不单元大小不一样,合理的手段是对初级单元采用不等概率抽样。等概率抽样。29高级材料 先给出一些相关的记号:先给出一些相关的记号:表示第表示第 初级单元中第初级单元中第 个次级单元个次级单元第第 初级单元总和初级单元总和第第 初级单元平均值初级单元平均值30高级材料总体总和总体总和总体平均数总体平均数(按次级单元按次级单元)第第 i 初级单元内方差初级单元内方差31高级材料1、只抽取一个初级单元情形(、只抽取一个初级单元情形(n=1) 先考虑从先考虑从 N N 个初级单元中随机选取个初级单元中随机选取 1 1 个以个以推断总体。这种情形

23、看起来似乎很特殊,但在生推断总体。这种情形看起来似乎很特殊,但在生活中也不少见,例如在随机地选的一个班级中抽活中也不少见,例如在随机地选的一个班级中抽取几个人进行考试以测试全年级的教育质量。只取几个人进行考试以测试全年级的教育质量。只选取选取 1 1 个单元,仍有等概率与不等概率之分。个单元,仍有等概率与不等概率之分。32高级材料(1)等概率抽取初级单元等概率抽取初级单元 考虑对总体平均数考虑对总体平均数 的估计的估计首先使用抽中的初级单元中的样本平均数首先使用抽中的初级单元中的样本平均数 对对 进行估计进行估计(6.16)对第对第 i 初级单元来讲初级单元来讲,由盒子模型可知,由盒子模型可知

24、, 是是 的无偏估计。的无偏估计。由于第由于第 i 个抽样单元是等概率抽取,相当于从盒子个抽样单元是等概率抽取,相当于从盒子中等可能抽取一次,那么所得之数一定是这个盒子平均数的中等可能抽取一次,那么所得之数一定是这个盒子平均数的无偏估计,即无偏估计,即而而 ,那么,那么 不是不是 的无偏估计,而是有偏估计!的无偏估计,而是有偏估计!33高级材料因此,对因此,对 只能求均方误差:只能求均方误差:作为作为 的有偏估计,的有偏估计, 的均方误差由三部分构成:一是由偏的均方误差由三部分构成:一是由偏倚引起的平方和,这就是倚引起的平方和,这就是(6.17)式右边的第一项;二是按初级式右边的第一项;二是按

25、初级单元单元(此时初级单元的特征指标当然只能是其平均数此时初级单元的特征指标当然只能是其平均数)而计算的而计算的总体方差,总体方差, (6.17)式右边的第二项恰好体现出这一点;最后一式右边的第二项恰好体现出这一点;最后一部分是初级单元中次级单元的方差平方和,这恰好是部分是初级单元中次级单元的方差平方和,这恰好是(6.17)式式右边的第三项。右边的第三项。 从从 的表达式可以看出,其第一项和第二项都与的表达式可以看出,其第一项和第二项都与 的选择没有任何关系,倘若要尽力减少误差,目标自然注意的选择没有任何关系,倘若要尽力减少误差,目标自然注意到第三项,然而第三部分是无法知道且也是无法估计的,因

26、为到第三项,然而第三部分是无法知道且也是无法估计的,因为既然我们只选取一个初级单元,又如何能估计所有的既然我们只选取一个初级单元,又如何能估计所有的 呢?呢?(6.17)34高级材料 由于是二阶抽样,也不可能取由于是二阶抽样,也不可能取 。在一般情况下,。在一般情况下,为了方便起见,常采用选取为了方便起见,常采用选取 常数,不管取到哪常数,不管取到哪一个初级单元,总抽预先指定好的样本容量,要不,取一个初级单元,总抽预先指定好的样本容量,要不,取 与与 成一定的比例比较合理一些。成一定的比例比较合理一些。 不是不是 的无偏估计这一缺陷是由的无偏估计这一缺陷是由“等可能等可能”抽取而引抽取而引起的

27、,这时候每一个起的,这时候每一个 有着同等重要的地位有着同等重要的地位而由于初级单元大小不同,在而由于初级单元大小不同,在 的构造中显然的构造中显然 不是有着不是有着同等地位的,这个事实使我们找到了一个弥补同等地位的,这个事实使我们找到了一个弥补“等可能等可能”所引所引起缺陷的办法,那就是在构造估计量时考虑被抽到的初级单起缺陷的办法,那就是在构造估计量时考虑被抽到的初级单元的大小作为元的大小作为“权权”:(6.18)35高级材料其中其中 表示所有初级单元的平均大小。这个估计的表示所有初级单元的平均大小。这个估计的意义很清楚,它的意义很清楚,它的 乘以乘以 成为第成为第 i 个初级单元内总和的个

28、初级单元内总和的估计,再乘以估计,再乘以 N 成为总体总和的估计,这个估计除以成为总体总和的估计,这个估计除以 作作为为 的估计量是合理的。的估计量是合理的。“权权” 的作用是使初级单元的指标化为次级单元的有关的作用是使初级单元的指标化为次级单元的有关指标。既然指标。既然 是第是第 i 个初级单元的总和的无偏估计,由于个初级单元的总和的无偏估计,由于第一阶抽样的第一阶抽样的“等可能性等可能性”, 应当是总体总和的无偏估应当是总体总和的无偏估计,于是有:计,于是有: (6.19)(6.20)的方差为:的方差为:36高级材料 应当指出,应当指出, 对对 弥补的只是弥补的只是“期望期望”或或“平均平

29、均”上的偏上的偏倚,至于在精度上是否获益则很难定。例如,倘若各个初级倚,至于在精度上是否获益则很难定。例如,倘若各个初级单元的平均数单元的平均数 比较稳定,而比较稳定,而 相距较大,引起相距较大,引起 前的系前的系数数 的差异较大,这种场合下的差异较大,这种场合下 比起比起 来变化范围来变化范围显然大得多,效果就比较差。显然大得多,效果就比较差。(2)不等概率抽取初级单元不等概率抽取初级单元 用等概率方法抽取初级单元对于大小不等的初级单元情用等概率方法抽取初级单元对于大小不等的初级单元情形显然不太合理,精度较差是可想而知的。一般地,我们采形显然不太合理,精度较差是可想而知的。一般地,我们采用的

30、不等概率抽取法有如下几种:用的不等概率抽取法有如下几种: 按概率按概率 抽取到第抽取到第 i 个初级单元,此时构造的估计个初级单元,此时构造的估计量为:量为:(6.21)37高级材料 与与 表面上形式相同,只不过表面上形式相同,只不过 取取 的概率为的概率为而而 取取 的概率为的概率为(6.22)即即 是是 的无偏估计量。的无偏估计量。(6.23)38高级材料抽取概率抽取概率按预先指定的一组概率按预先指定的一组概率 来实施,来实施,构造估计量为:构造估计量为:(6.24)(6.25)即即 是是 的无偏估计量。的无偏估计量。(6.26)39高级材料显然,若取显然,若取 ,则,则 。若取若取 ,则

31、,则 。抽取方式与抽取方式与相同,但构造的关于相同,但构造的关于 的估计量为:的估计量为:(6.27)此时,每个此时,每个 具有权具有权 ,因此,因此(6.28)一般地一般地 ,因此,因此 是有偏估计。其均方误差为:是有偏估计。其均方误差为:(6.29)40高级材料2、抽取、抽取 个初级单元情形个初级单元情形 两个以上的初级单元里进行第二阶抽样,合理的基本假两个以上的初级单元里进行第二阶抽样,合理的基本假定是在不同的初级单元内的抽样过程相互之间独立。为方便定是在不同的初级单元内的抽样过程相互之间独立。为方便起见,仍像以前一样假定第二阶抽样为简单随机抽样,在这起见,仍像以前一样假定第二阶抽样为简

32、单随机抽样,在这一小段讨论中,我们主要考虑总体总和的估计。一小段讨论中,我们主要考虑总体总和的估计。(1)初级单元按多项抽样方法抽取)初级单元按多项抽样方法抽取 设初级单元以给定的一组概率设初级单元以给定的一组概率 逐个放回地逐个放回地抽取抽取 n 次,在每个被抽中的初级单元里实施容量为次,在每个被抽中的初级单元里实施容量为 的简的简单随机抽样:假若第单随机抽样:假若第 i 个初级单元在第一阶抽样中被抽中二个初级单元在第一阶抽样中被抽中二次或二次以上,那么在第次或二次以上,那么在第 i 个初级单元中将独立地对全体次个初级单元中将独立地对全体次级单元进行二次或二次以上的容量为级单元进行二次或二次

33、以上的容量为 的简单随机抽样。的简单随机抽样。41高级材料 显然,对第显然,对第 i 个初级单元的总和个初级单元的总和 可自然地找到无偏估可自然地找到无偏估计计 ,以这些,以这些 代替代替 的话,那么整群抽样中的的话,那么整群抽样中的HansenHurwitz型估计无疑为型估计无疑为 提供了无偏估计:提供了无偏估计:(6.30)其方差为:其方差为:(6.31)其中其中42高级材料(2)初级单元按简单随机抽取方式抽取)初级单元按简单随机抽取方式抽取 由于二阶抽样都是采用简单随机抽样形式,于是可对由于二阶抽样都是采用简单随机抽样形式,于是可对总体总和采用一个最为简单的估计形式:总体总和采用一个最为

34、简单的估计形式:(6.32)由于由于 与与 是是 与与 的无偏估计,因此的无偏估计,因此 也是也是 的的无偏估计。无偏估计。其方差为:其方差为:(6.33)43高级材料方差方差 的无偏估计为:的无偏估计为:(6.34)其中其中 这类简单估计虽然形式简单,而且结构也容易为人们接这类简单估计虽然形式简单,而且结构也容易为人们接受,同时又是总体的无偏估计,但是它的效果并不理想,方受,同时又是总体的无偏估计,但是它的效果并不理想,方差显得较大。差显得较大。44高级材料(3)按不放回不等概率抽取初级单元)按不放回不等概率抽取初级单元 如果抽取到的第如果抽取到的第 i 个初级单元的总和估计为个初级单元的总

35、和估计为 (简单简单随机抽样下的无偏估计随机抽样下的无偏估计),那么由第六章第二节易知,总体,那么由第六章第二节易知,总体总和的二阶估计可采用如下形式的总和的二阶估计可采用如下形式的HorvitzThompson估计估计量。量。 现在考虑初级单元是按不放回不等概率抽取,而第二阶现在考虑初级单元是按不放回不等概率抽取,而第二阶抽取仍为在抽取的初级单元中实行简单随机抽样。那么在第抽取仍为在抽取的初级单元中实行简单随机抽样。那么在第一阶抽样中就存在包含概率一阶抽样中就存在包含概率 。(6.35)由于由于 或或 是是 的无偏估计,又的无偏估计,又 是是 的无偏估的无偏估计,所以计,所以 是是 的无偏估

36、计。的无偏估计。45高级材料其方差为:其方差为:(6.36)其中其中方差方差 的无偏估计为:的无偏估计为:(6.37)其中其中46高级材料6.4 6.4 三阶及多阶抽样三阶及多阶抽样 将有关二阶抽样的一些公式与估计推广到三阶乃至更高将有关二阶抽样的一些公式与估计推广到三阶乃至更高阶的情况是很现实的,其实基本上是依样画葫芦,只不过在阶的情况是很现实的,其实基本上是依样画葫芦,只不过在符号与计算方面更为复杂些,尤其是对于各级单元大小都相符号与计算方面更为复杂些,尤其是对于各级单元大小都相等时更是如此,下面以三阶为例。等时更是如此,下面以三阶为例。1、各级单元大小均相等时的三阶抽样、各级单元大小均相

37、等时的三阶抽样 设总体中含有设总体中含有N个初级单元,每个初级单元包含个初级单元,每个初级单元包含M个次个次级单元,而每一个次级单元均包含级单元,而每一个次级单元均包含K个三级单元。各阶的抽个三级单元。各阶的抽样容量分别为样容量分别为 n、m、k,引进一些必要的记号:,引进一些必要的记号:表示第表示第 初级单元中第初级单元中第 个次级单元里第个次级单元里第 个三级单元个三级单元47高级材料第第 初级单元中第初级单元中第 次级单元总体平均数次级单元总体平均数第第 初级单元中第初级单元中第 次级单元样本平均数次级单元样本平均数第第 初级单元总体平均数初级单元总体平均数第第 初级单元样本平均数初级单

38、元样本平均数总体平均数总体平均数样本平均数样本平均数48高级材料49高级材料如果三阶抽样均为简单随机抽样,则有以下结论:如果三阶抽样均为简单随机抽样,则有以下结论:即即 是总体平均数是总体平均数 的无偏估计。的无偏估计。其中其中(3)的无偏估计为的无偏估计为(1)(6.38)(2)(6.39)(6.40)50高级材料2、多阶抽样中不等概率抽样的应用、多阶抽样中不等概率抽样的应用 一般地,各级单元大小常常并不相等,因此普遍采用不一般地,各级单元大小常常并不相等,因此普遍采用不等概率抽样,这样不仅合理,能被接受,而且自然提高效率等概率抽样,这样不仅合理,能被接受,而且自然提高效率比如,三阶抽样均采

39、用多项抽样形式,各阶样本量仍分别为比如,三阶抽样均采用多项抽样形式,各阶样本量仍分别为n、m、k,而抽样概率分别为:,而抽样概率分别为:且且那么总体总和那么总体总和 的无偏估计为:的无偏估计为:(6.41)51高级材料其方差为:其方差为:(6.42)方差的无偏估计为:方差的无偏估计为:(6.43)其中其中(6.44)52高级材料 高阶抽样是复杂抽样,不但每一阶抽样可以高阶抽样是复杂抽样,不但每一阶抽样可以采用不同的概率抽样形式,即使在同一阶的抽样采用不同的概率抽样形式,即使在同一阶的抽样中,各单元内进行的抽样形式也将视该单元的情中,各单元内进行的抽样形式也将视该单元的情况而采用不同的概率抽样形式。因此,在构造一况而采用不同的概率抽样形式。因此,在构造一个好的合理的估计量时,必须相当小心谨慎,在个好的合理的估计量时,必须相当小心谨慎,在计算和作出估计量方差估计的过程中尤其要注意计算和作出估计量方差估计的过程中尤其要注意,通常大规模的抽样调查就是这种复杂的多阶抽样通常大规模的抽样调查就是这种复杂的多阶抽样.53高级材料

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号