第七章整群抽样

上传人:桔**** 文档编号:587643226 上传时间:2024-09-06 格式:PPT 页数:40 大小:890.50KB
返回 下载 相关 举报
第七章整群抽样_第1页
第1页 / 共40页
第七章整群抽样_第2页
第2页 / 共40页
第七章整群抽样_第3页
第3页 / 共40页
第七章整群抽样_第4页
第4页 / 共40页
第七章整群抽样_第5页
第5页 / 共40页
点击查看更多>>
资源描述

《第七章整群抽样》由会员分享,可在线阅读,更多相关《第七章整群抽样(40页珍藏版)》请在金锄头文库上搜索。

1、第七章第七章 整群抽样整群抽样1本章要点本章要点 本章给出整群抽样的定义,讨论了群大小相等和本章给出整群抽样的定义,讨论了群大小相等和群大小不等的整群抽样方法及与之匹配的估计量、估群大小不等的整群抽样方法及与之匹配的估计量、估计量的方差及方差的估计量。具体要求:计量的方差及方差的估计量。具体要求: 掌握群大小相等情形对群进行简单随机抽样简掌握群大小相等情形对群进行简单随机抽样简单估计量的无偏性、方差及方差的无偏估计,了解单估计量的无偏性、方差及方差的无偏估计,了解群内方差、群间方差概念及其对整群抽样精度的影群内方差、群间方差概念及其对整群抽样精度的影响,掌握群的划分原则。响,掌握群的划分原则。

2、 掌握群大小不等情形与简单随机抽样相匹配的掌握群大小不等情形与简单随机抽样相匹配的简单估计量、比率估计量及与抽样相匹配的汉森简单估计量、比率估计量及与抽样相匹配的汉森赫维茨估计量及其性质。赫维茨估计量及其性质。 掌握估计总体比例的整群抽样方法及简单估计量掌握估计总体比例的整群抽样方法及简单估计量、比率估计量。、比率估计量。2第一节第一节 抽样方法抽样方法一、整群抽样及其实施理由一、整群抽样及其实施理由 定义:设总体由定义:设总体由A个初级抽样单元组成,在总体中按某种个初级抽样单元组成,在总体中按某种方法抽取方法抽取a个初级抽样单元,如果对被抽中初级抽样单元的次级个初级抽样单元,如果对被抽中初级

3、抽样单元的次级单元不再进行抽样观测而是全部进行调查,则称此抽样方法为单元不再进行抽样观测而是全部进行调查,则称此抽样方法为整群抽样初级抽样单元称为群整群抽样初级抽样单元称为群 。 实施理由:一是当缺少调查单元的必要信息无法对其直接实施理由:一是当缺少调查单元的必要信息无法对其直接编制抽样框实施概率抽样,而由调查单元组成的群是现成的或编制抽样框实施概率抽样,而由调查单元组成的群是现成的或者群很容易划分从而编制群抽样框非常容易时,常采用整群抽者群很容易划分从而编制群抽样框非常容易时,常采用整群抽样。二是为了使调查实施便利、节省费用而采用整群抽样。样。二是为了使调查实施便利、节省费用而采用整群抽样。

4、三是对某些由特殊结构的群组成的总体实施整群抽样能使精度三是对某些由特殊结构的群组成的总体实施整群抽样能使精度有较大提高。有较大提高。3第一节第一节 抽样方法抽样方法二、整群抽样的特点二、整群抽样的特点 整群抽样估计量的精度(估计量方差)与群的划分有直接关系。在大多整群抽样估计量的精度(估计量方差)与群的划分有直接关系。在大多数场合,由于群内的调查单元指标值或多或少具有一定的正相关性,因此在数场合,由于群内的调查单元指标值或多或少具有一定的正相关性,因此在调查单元样本量相同的条件下,整群抽样的精度不如直接对调查单元进行的调查单元样本量相同的条件下,整群抽样的精度不如直接对调查单元进行的简单随机抽

5、样高。但由于整群抽样调查单元相对集中,平均单位调查费用较简单随机抽样高。但由于整群抽样调查单元相对集中,平均单位调查费用较少,因此可以通过适当扩大群样本量以提高整群抽样的精度,同时使调查费少,因此可以通过适当扩大群样本量以提高整群抽样的精度,同时使调查费用仍比较省。用仍比较省。三、群的划分原则三、群的划分原则 当群需通过划分确定时则需考虑两个问题,一是如何定义群的组成,二当群需通过划分确定时则需考虑两个问题,一是如何定义群的组成,二是如何确定群的规模。是如何确定群的规模。 对于第一个问题,基本出发点是群的组成应有利于整群样本估计量精度对于第一个问题,基本出发点是群的组成应有利于整群样本估计量精

6、度尽可能高。尽可能高。 对于第二个问题,群的规模的选择取决于精度与费用之间的平衡,群的对于第二个问题,群的规模的选择取决于精度与费用之间的平衡,群的规模大,调查费用比较节省但精度较低,群的规模小,精度较高但费用较规模大,调查费用比较节省但精度较低,群的规模小,精度较高但费用较多,所以应在两者间权衡。多,所以应在两者间权衡。 除此之外还要考虑抽样实施的组织管理等因素。除此之外还要考虑抽样实施的组织管理等因素。4 第二节第二节 群大小相等的整群抽样群大小相等的整群抽样一、记号及目标量一、记号及目标量以以 记第群第调查单元调查指标值记第群第调查单元调查指标值 i1,2,A,j1,2,M,则,则分别为

7、总体第分别为总体第 i群总值及均值群总值及均值,分别为总体总值及按群平均的总体均值,分别为总体总值及按群平均的总体均值,为按调查单元平均的总体均值。记为按调查单元平均的总体均值。记分别称分别称 , , 为总体方差,总体群间方差和总体群内方差。为总体方差,总体群间方差和总体群内方差。 5 第二节第二节 群大小相等的整群抽样群大小相等的整群抽样n对于对于a个群样本,以个群样本,以 记第记第i群样本观测值,群样本观测值,ni=1,2,a,记,记 (7.1)在实际问题中调查的目标量通常是在实际问题中调查的目标量通常是 及及 。6 第二节第二节 群大小相等的整群抽样群大小相等的整群抽样 二、估计量及其性

8、质二、估计量及其性质 由于由于 及及 仅相差一个常数仅相差一个常数AM,故仅需讨论,故仅需讨论 的估计的估计量及其性质即可,量及其性质即可, 的估计量及其性质很容易由的估计量及其性质很容易由 的结果的结果得到。得到。 以以 作为作为 的无偏估计,其方差的无偏估计,其方差 (7.2) 的无偏估计为的无偏估计为 (7.3)则则 的无偏估计量、估计量的方差及其无偏估计分别为:的无偏估计量、估计量的方差及其无偏估计分别为: 7 第二节第二节 群大小相等的整群抽样群大小相等的整群抽样n【例【例71】 某居民小区共有某居民小区共有600个单元,每个单元均居住个单元,每个单元均居住10户。现以单元为群进行整

9、群户。现以单元为群进行整群抽样,随机抽取抽样,随机抽取15个单元,调查每户每周食品支出费用,调查结果及各单元样本均值和个单元,调查每户每周食品支出费用,调查结果及各单元样本均值和标准差如表标准差如表71所示所示n 表表 71 15个单元每户每周食品消费支出资料个单元每户每周食品消费支出资料 n试求该居民小区平均每户每周食品支出费用并给出其置信水平为试求该居民小区平均每户每周食品支出费用并给出其置信水平为95的置信的置信区间。区间。 8 第二节第二节 群大小相等的整群抽样群大小相等的整群抽样解:解:A=600 a=15 =0.25 M10 210.41 62.247 622.47 4.046 2

10、.011 的置信水平为的置信水平为95的置信区间为的置信区间为 210.411.962.011,210.411.962.011 206.47,214.35。9 第二节第二节 群大小相等的整群抽样群大小相等的整群抽样三、整群抽样效率分析及群的划分原则三、整群抽样效率分析及群的划分原则 由(由(7.27.2)知整群抽样估计量的方差只与群间方差)知整群抽样估计量的方差只与群间方差 有关。有关。与群内方差与群内方差 无关。当直接对调查单元进行简单随机抽样时,无关。当直接对调查单元进行简单随机抽样时, 从而从而 (7.47.4)(7.47.4)表明,在相同的调查单元样本量)表明,在相同的调查单元样本量a

11、MaM下,只有当群间方差下,只有当群间方差 比总体方差比总体方差 小时整群抽样才优于简单随机抽样。小时整群抽样才优于简单随机抽样。 10 第二节第二节 群大小相等的整群抽样群大小相等的整群抽样事实上总体方差与群内方差、群间方差之间有如下关系:事实上总体方差与群内方差、群间方差之间有如下关系: (7.5) 对于固定的总体,对于固定的总体, 是常数,故当群内方差是常数,故当群内方差 增大(或减小)时增大(或减小)时群间方差群间方差 必然减小(或增大)。整群抽样是对群的随机抽样,必然减小(或增大)。整群抽样是对群的随机抽样,在被抽中的群内对调查单元全面调查,因此群内全面在被抽中的群内对调查单元全面调

12、查,因此群内全面 调查不存调查不存在抽样误差,只有对群的抽样才产生抽样误差。由此可知,整群在抽样误差,只有对群的抽样才产生抽样误差。由此可知,整群抽样估计量的方差只与群间差异有关,与群内差异无关,而且当抽样估计量的方差只与群间差异有关,与群内差异无关,而且当群内差异扩大时群间差异必然缩小,整群抽样的效率提高。因此群内差异扩大时群间差异必然缩小,整群抽样的效率提高。因此群的划分原则应是使群内差异尽可能大,群间差异尽可能小。群的划分原则应是使群内差异尽可能大,群间差异尽可能小。11 第二节第二节 群大小相等的整群抽样群大小相等的整群抽样n对于例对于例7 71 1,如果我们在居民小区内直接对住户采用

13、简单随机,如果我们在居民小区内直接对住户采用简单随机抽样抽取抽样抽取150150户进行调查,将表户进行调查,将表7 71 1的数据视为样本量为的数据视为样本量为150150的的简单随机样本,则简单随机样本,则 、 的估计分别为的估计分别为 的方差和标准差的估计分别为的方差和标准差的估计分别为 可见整群抽样精度比简单随机抽样要高,原因在于单元内住户食可见整群抽样精度比简单随机抽样要高,原因在于单元内住户食品消费支出差异总体上比较大,其标准差最小者为品消费支出差异总体上比较大,其标准差最小者为22.8422.84,最大,最大者达者达43.6943.69,但单元平均消费支出,但单元平均消费支出 之间

14、差异相对较小,其标之间差异相对较小,其标准差为准差为12 第二节第二节 群大小相等的整群抽样群大小相等的整群抽样群间方差估计为群间方差估计为 ,总体方差估计为,总体方差估计为 ,群,群间方差比总体方差小,故对单元的整群抽样比直接对住户的简间方差比总体方差小,故对单元的整群抽样比直接对住户的简单随机抽样精度高。单随机抽样精度高。四、群内相关系数与设计效应四、群内相关系数与设计效应 为研究整群抽样估计量方差与群内调查单元相似性之间的关为研究整群抽样估计量方差与群内调查单元相似性之间的关系我们引入群内相关系数的概念。群内相关系数被定义为系我们引入群内相关系数的概念。群内相关系数被定义为 (7.6)经

15、计算得经计算得 (7.7) (7.8) 13 第二节第二节 群大小相等的整群抽样群大小相等的整群抽样当当A A大时上式可写成大时上式可写成 (7.9)(7.9)利用利用(7.5)将将 用用 和和 代替,代入代替,代入(7.8)、(7.9)得得 (7.10)(7.10)由由(7.8)(7.8)及及(7.9)(7.9)可知可知 取值于取值于 。因为因为 是固定常数,所是固定常数,所以以(7.10)表明)表明 越大即群内调查单元之间差异性越大,群内相越大即群内调查单元之间差异性越大,群内相关系数就越小。关系数就越小。 为由样本估计为由样本估计 由由(7.5)(7.5)当当A A大时大时 的估计为的估

16、计为14 第二节第二节 群大小相等的整群抽样群大小相等的整群抽样再由再由(7.9)(7.9)得得 的估计为的估计为 (7.11) (7.11) 为考察整群抽样估计量的方差与群内相关系数的关系为考察整群抽样估计量的方差与群内相关系数的关系, ,由由(7.8)7.8)将将 解出代入(解出代入(7.27.2)得)得 (7.12) (7.12) (7.137.13)(7.13)(7.13)表明整群抽样估计量精度与群内相关系数表明整群抽样估计量精度与群内相关系数 有密切关系,有密切关系, 越大即群内调查单元之间相似程度越大,群内差异越小,估计越大即群内调查单元之间相似程度越大,群内差异越小,估计量方差就

17、越大。量方差就越大。 如果按简单随机抽样直接从总体中抽取如果按简单随机抽样直接从总体中抽取aMaM个调查单元,则样个调查单元,则样本均值本均值 的方差为的方差为 15 第二节第二节 群大小相等的整群抽样群大小相等的整群抽样因此整群抽样的设计效应为因此整群抽样的设计效应为 (7.14) (7.14)(7.147.14)表明按调查单元的相同样本量,整群抽样的方差为简单)表明按调查单元的相同样本量,整群抽样的方差为简单随机抽样的方差的随机抽样的方差的 倍。倍。 对于例对于例7 71 1,由表,由表7 71 1数据计算得数据计算得由(由(7.117.11)计算得)计算得 设计效应的估计值意味着在居民食

18、品消费支出调查中,为达到相设计效应的估计值意味着在居民食品消费支出调查中,为达到相同的精度整群抽样的样本量约为简单随机抽样的样本量的同的精度整群抽样的样本量约为简单随机抽样的样本量的0.6090.609倍。例倍。例7 71 1中整群抽样实际调查了中整群抽样实际调查了1515个单元共计个单元共计150150户,因此为达户,因此为达到相同的精度,简单随机抽样应调查到相同的精度,简单随机抽样应调查1500.6091500.609246246户。户。16第三节第三节 群大小不等的整群抽样群大小不等的整群抽样本节我们研究群大小不等的整群抽样,并对各种抽样和估计方法本节我们研究群大小不等的整群抽样,并对各

19、种抽样和估计方法的特点进行研究。的特点进行研究。一、记号及目标量一、记号及目标量为便于讨论,我们将上一节的记号作相应改变。为便于讨论,我们将上一节的记号作相应改变。设总体由设总体由A A个群组成,第个群组成,第 群含群含 个调查单元,记个调查单元,记 ,则,则 即总体包含调查单元总数,记即总体包含调查单元总数,记 为第为第 群,第群,第 调查单元指标调查单元指标值。值。 =1 =1,2 2,,A; =1,2, ,A; =1,2, ,则,则 分别为总体第分别为总体第 群总值及均值,群总值及均值,分别为总体总值及按群平均的总体均值,分别为总体总值及按群平均的总体均值,17第三节第三节 群大小不等的

20、整群抽样群大小不等的整群抽样为按调查单元平均的总体均值。为按调查单元平均的总体均值。 设按某种方法从设按某种方法从A A个群中抽取个群中抽取a a个群为样本,以个群为样本,以 记记第第 群样本观测值,群样本观测值,=1=1,2 2,,a,a,记记 在实际问题中有意义的是在实际问题中有意义的是 对对 及进行估计。由于及进行估计。由于 与与 仅相仅相差一个数差一个数 ,故为方便起见有时讨论故为方便起见有时讨论 的估计问题,有时讨论的估计问题,有时讨论 的估计问题,由此不难得到另一个的有关结果。的估计问题,由此不难得到另一个的有关结果。18第三节第三节 群大小不等的整群抽样群大小不等的整群抽样二、按

21、简单随机抽样抽群,采用简单估计量二、按简单随机抽样抽群,采用简单估计量 设设a a个群是按简单随机抽样抽取的个群是按简单随机抽样抽取的, ,以以 表示第表示第 群的样本群的样本和,根据简单随机抽样简单估计量的定义及性质,总体总值和,根据简单随机抽样简单估计量的定义及性质,总体总值 的简单估计量为的简单估计量为 (7.157.15) 是无偏估计,其方差为是无偏估计,其方差为 (7.16) (7.16)其中其中 。 的一个无偏估计为的一个无偏估计为 (7.17) (7.17)19第三节第三节 群大小不等的整群抽样群大小不等的整群抽样由此不难得到由此不难得到 的无偏估计量、估计量的方差及其无偏估计:

22、的无偏估计量、估计量的方差及其无偏估计: (7.18) (7.18) 其中其中 是总体群的平均大小,是总体群的平均大小, (7.19) (7.19) (7.20) (7.20) (7.15)(7.18)(7.15)(7.18)表明表明, ,在简单随机抽样下用简单估计量估计在简单随机抽样下用简单估计量估计 时不需时不需知道知道 , ,但估计但估计 时必须知道时必须知道 。(7.16)(7.16)(7.197.19)表明,)表明, 及及 的的简单估计量的方差主要取决于群总值简单估计量的方差主要取决于群总值 之间的差异。在实际之间的差异。在实际问题中常有各个群规模差异很大即问题中常有各个群规模差异很

23、大即 之间差异很大之间差异很大, ,而群而群的均值之间差异很小即的均值之间差异很小即 之间差异较小之间差异较小, ,则群总值则群总值 之之间必然差异较大,此时简单估计量的精度很低。间必然差异较大,此时简单估计量的精度很低。 20第三节第三节 群大小不等的整群抽样群大小不等的整群抽样三、按简单随机抽样抽群,采用比率估计量三、按简单随机抽样抽群,采用比率估计量 当对群采用简单随机抽样时,如果各个群当对群采用简单随机抽样时,如果各个群 大小差异很大,大小差异很大,为提高估计精度可以群的大小为提高估计精度可以群的大小 为辅助变量构造比率估计量。由为辅助变量构造比率估计量。由于于具有总体比率具有总体比率

24、 的形式,根据(的形式,根据(5.25.2)取)取 的比率估计量为的比率估计量为 (7.21) (7.21) 是有偏估计,根据(是有偏估计,根据(5.55.5)其方差为)其方差为 (7.22) (7.22)由(由(5.155.15) 可用可用 (7.23) (7.23) 21第三节第三节 群大小不等的整群抽样群大小不等的整群抽样估计,其中估计,其中 。由此不难得由此不难得 到的比率估计量、估计量的方差及其估计为到的比率估计量、估计量的方差及其估计为 (7.24) (7.24) (7.25) (7.25) (7.26) (7.26)(7.217.21)()(7.247.24)表明,在简单随机抽样

25、下用比率估计量)表明,在简单随机抽样下用比率估计量 估计估计 时不需知道时不需知道 ,但估计,但估计 时必须知道时必须知道 。(。(7.227.22)表明,及)表明,及 的的比率估计量的方差主要取决于群均值比率估计量的方差主要取决于群均值 之间的差异。之间的差异。 22第三节第三节 群大小不等的整群抽样群大小不等的整群抽样在多数实际问题中在多数实际问题中 之间的差异不是很大,即之间的差异不是很大,即 与与 之间之间有大致正比例关系,此时比率估计量的精度较高。有大致正比例关系,此时比率估计量的精度较高。四、按四、按PPSPPS抽样抽群,采用汉森赫维茨估计量抽样抽群,采用汉森赫维茨估计量 在群大小

26、不等的整群抽样中,为提高精度可采用按与群大在群大小不等的整群抽样中,为提高精度可采用按与群大小小 成比例的概率的放回抽样即成比例的概率的放回抽样即PPSPPS抽样,采用汉森赫维茨估抽样,采用汉森赫维茨估计量对目标量进行估计。记计量对目标量进行估计。记 =1 =1,2 2,,A ,A 在个在个A A群中进行群中进行a a次放回独立抽样,每次抽取时第次放回独立抽样,每次抽取时第 群被抽到的概群被抽到的概率为率为 ,则总体总值,则总体总值 的汉森赫维茨估计量为的汉森赫维茨估计量为 (7.277.27)23第三节第三节 群大小不等的整群抽样群大小不等的整群抽样 是有偏估计,其方差为是有偏估计,其方差为

27、 (7.28) 的一个无偏估计为的一个无偏估计为 (7.29)由此不难得到由此不难得到 的无偏估计量、估计量的方差及其无偏估计为的无偏估计量、估计量的方差及其无偏估计为 (7.30)(7.30) (7.31)(7.31) (7.32)(7.32) 24第三节第三节 群大小不等的整群抽样群大小不等的整群抽样(7.27)(7.30)(7.27)(7.30)表明在表明在PPSPPS抽样下用汉森赫维茨估计量估计抽样下用汉森赫维茨估计量估计 时时不需道不需道 , ,但估计但估计 时必须知道时必须知道 。(7.28)(7.31)(7.28)(7.31)表明,及表明,及 的汉的汉森赫维茨估计量的方差主要取决

28、于群均值森赫维茨估计量的方差主要取决于群均值 之间的差之间的差异。在多数实际问题中异。在多数实际问题中 之间的差异不是很大,因此采用之间的差异不是很大,因此采用PPSPPS抽样汉森赫维茨估计量能有比较高的精度。抽样汉森赫维茨估计量能有比较高的精度。 例例7 722某县共有某县共有614614个村,全县小麦播种面积个村,全县小麦播种面积408256408256亩。现采亩。现采用抽样调查估计全县小麦平均亩产。为调查方便决定以村为群进用抽样调查估计全县小麦平均亩产。为调查方便决定以村为群进行整群抽样,表行整群抽样,表7 72 2给出随机抽出的给出随机抽出的1515个村的资料。个村的资料。25第三节第

29、三节 群大小不等的整群抽样群大小不等的整群抽样表表72 样本村调查数据样本村调查数据26第三节第三节 群大小不等的整群抽样群大小不等的整群抽样1.1.设设1515个村是按简单随机抽样抽取的,采用简单估计量个村是按简单随机抽样抽取的,采用简单估计量 =406542.67 =664.91=406542.67 =664.91 =0.024=0.024由(由(7.187.18)()(7.207.20) 2.2.设设1515个村是按简单随机抽样抽取的,采用比率估计量个村是按简单随机抽样抽取的,采用比率估计量 由(由(7.21)()(7.23 27第三节第三节 群大小不等的整群抽样群大小不等的整群抽样3.

30、设设15个村是按与播种面积成比例的概率抽样抽取的,采用汉森个村是按与播种面积成比例的概率抽样抽取的,采用汉森赫维茨估计量。由(赫维茨估计量。由(7.30)()(7.32) 以上计算结果表明,采用比率估计量和汉森赫维茨估计量以上计算结果表明,采用比率估计量和汉森赫维茨估计量有较高的精度,而简单估计量精度较低。这是因为各村小麦播种有较高的精度,而简单估计量精度较低。这是因为各村小麦播种面积差异较大而平均亩产差异不大,因而各村产量差异必然较面积差异较大而平均亩产差异不大,因而各村产量差异必然较大,因此采用比率估计量和汉森赫维茨估计量比简单估计量有大,因此采用比率估计量和汉森赫维茨估计量比简单估计量有

31、较高的精度。较高的精度。28第四节第四节 估计总体比例的整群抽样估计总体比例的整群抽样一、问题的提出一、问题的提出 当需要估计总体中具有某种特征的调查单元比例时采用整群抽样是当需要估计总体中具有某种特征的调查单元比例时采用整群抽样是适宜的。因为在这类调查中判断一个调查单元是否具有所论特征一般是很容适宜的。因为在这类调查中判断一个调查单元是否具有所论特征一般是很容易的,所需调查费用很低,而调查工作的组织、差旅费用相对调查本身费用易的,所需调查费用很低,而调查工作的组织、差旅费用相对调查本身费用而言高昂得多,所以在估计总体比例的抽样调查中采用整群抽样可以大大节而言高昂得多,所以在估计总体比例的抽样

32、调查中采用整群抽样可以大大节省组织、差旅费用从而使总费用比较节省。同时由于比例总体的方差不超过省组织、差旅费用从而使总费用比较节省。同时由于比例总体的方差不超过0.250.25,群间方差一般也比较小,因此估计总体比例时采用整群抽样能有较高,群间方差一般也比较小,因此估计总体比例时采用整群抽样能有较高的精度。对某些特殊结构的群整群抽样甚至比直接对调查单元的简单随机抽的精度。对某些特殊结构的群整群抽样甚至比直接对调查单元的简单随机抽样有高得多的精度。样有高得多的精度。 与以估计总体均值或总值为目的的整群抽样不同的是,在估计总体比例与以估计总体均值或总值为目的的整群抽样不同的是,在估计总体比例的情形

33、,无论群大小相等还是不等,对群均可采用简单随机抽样,当群大小的情形,无论群大小相等还是不等,对群均可采用简单随机抽样,当群大小相等时采用简单估计量,群大小不等时采用比率估计量。相等时采用简单估计量,群大小不等时采用比率估计量。29第四节第四节 估计总体比例的整群抽样估计总体比例的整群抽样二、群大小相等情形二、群大小相等情形设总体含设总体含A A个群,每个群均含个群,每个群均含M M个调查单元,定义个调查单元,定义 1 1,第,第i i群第群第j j调查单元具征,调查单元具征, = = 0 0,否则,否则, i=1,2,A j=1,2,M i=1,2,A j=1,2,M则总体第则总体第i i群具

34、所论特征调查单元的总数及比例为群具所论特征调查单元的总数及比例为从而总体中具所论特征调查单元的总数及比例为从而总体中具所论特征调查单元的总数及比例为30第四节第四节 估计总体比例的整群抽样估计总体比例的整群抽样因此直接利用第二节有关因此直接利用第二节有关 的(的(7.17.1)()(7.27.2)()(7.37.3)即可给出)即可给出计计 的有关结果。以的有关结果。以 表示随机抽取的表示随机抽取的 个群具有所论特征个群具有所论特征的调查单元数,记的调查单元数,记 则则 的无偏估计为的无偏估计为 (7.33) (7.33) 的方差为的方差为 (7.34) (7.34) 的一个无偏估计为的一个无偏

35、估计为 (7.35) (7.35)31第四节第四节 估计总体比例的整群抽样估计总体比例的整群抽样 例例7 733在例在例7 71 1中除对居民小区住户进行食品支出费用调查外,同时也中除对居民小区住户进行食品支出费用调查外,同时也进行了家庭电脑拥有率调查,表进行了家庭电脑拥有率调查,表7 73 3是是1515个单元拥有家庭电脑的户数个单元拥有家庭电脑的户数 及在及在本单元本单元1010个住户中所占比例个住户中所占比例 。试对该小区的家庭电脑拥有进行估计并给出。试对该小区的家庭电脑拥有进行估计并给出其标准差的估计。其标准差的估计。 表表7 73 3 家庭电脑拥有情况家庭电脑拥有情况 解:解:32

36、三、群大小不等情形三、群大小不等情形当群大小不等时,设第当群大小不等时,设第 群具所论特征调查单元数为群具所论特征调查单元数为 ,第,第 群群包含的调查单元数为包含的调查单元数为 ,则总体,则总体 个群具所论特征调查单元比个群具所论特征调查单元比例为例为 它具有总体比率的形式。由(它具有总体比率的形式。由(5.25.2)可用)可用 (7.367.36)作为作为 的比率估计,当的比率估计,当 大时它是大时它是 的近似无偏估计。由的近似无偏估计。由(5.55.5)其方差)其方差 (7.37) (7.37) 33第四节第四节 估计总体比例的整群抽样估计总体比例的整群抽样其中其中 为总体第为总体第 群

37、比例,群比例, 。由(。由(5.155.15) 的估计为。的估计为。 (7.387.38)其中其中 。 例例7 744某地为估计居民中男、女性别比例,以户为群进行简单某地为估计居民中男、女性别比例,以户为群进行简单随机抽样,随机抽取随机抽样,随机抽取6868户,分别以户,分别以 记第记第 户的人口数、户的人口数、男性人口数、女性人口数,显然男性人口数、女性人口数,显然 。经过对调查数据整。经过对调查数据整理计算得理计算得34第四节第四节 估计总体比例的整群抽样估计总体比例的整群抽样 试估计男、女性别比例并估计试估计男、女性别比例并估计 值。值。 解解: :由(由(7.367.36)得)得 因为

38、因为 ,故,故 。 由(由(7.387.38)为估计为估计 ,计算样本量为,计算样本量为238238的简单随机样本估计量的方差。的简单随机样本估计量的方差。 35第四节第四节 估计总体比例的整群抽样估计总体比例的整群抽样因为因为 值在值在0.50.5附近,且附近,且 0.250.25在在 0.50.5时达到,故取时达到,故取 0.250.25,则则 由此可见整群抽样的效率显著高于简单随机抽样。原因在于一个家庭本由此可见整群抽样的效率显著高于简单随机抽样。原因在于一个家庭本身就具有比较均衡的性别结构,家庭内性别差异大,家庭间差异小,因此对身就具有比较均衡的性别结构,家庭内性别差异大,家庭间差异小

39、,因此对家庭这样的群实施整群抽样估计性别比例可以具有很高的精度。家庭这样的群实施整群抽样估计性别比例可以具有很高的精度。 36编号为奇数的习题答案编号为奇数的习题答案n7.1(略)(略)n7.3解: 不是 的无偏估计,此因类似于 有 因为对群进行简单随机抽样,故 , ,从而 ,若取 则 37 7.5 解:由于农户是调查单位,故以村为抽样单位的抽样解:由于农户是调查单位,故以村为抽样单位的抽样是整群抽样,村即是群。对于村既有生猪存栏数,也有户数,是整群抽样,村即是群。对于村既有生猪存栏数,也有户数,因此在村大小不等的整群抽样下,既可使用简单估计量估计生因此在村大小不等的整群抽样下,既可使用简单估

40、计量估计生猪存栏数,也可以户数为辅助指标构造比率估计和回归估计来猪存栏数,也可以户数为辅助指标构造比率估计和回归估计来估计生猪存栏数估计生猪存栏数。(1 1)简单估计量)简单估计量 (2 2)以户数为辅助变量的比率估计量)以户数为辅助变量的比率估计量 314.452, 98880, 365.718, 1337500.934 38n(3 3)以户数为辅助变量的回归估计量)以户数为辅助变量的回归估计量 1080000.803(100000200475)112015显然以户数为辅助变量构造回归估计量效果最好。此因各村生猪存显然以户数为辅助变量构造回归估计量效果最好。此因各村生猪存栏数与村的规模(户数)有高度相关性,栏数与村的规模(户数)有高度相关性, 0.9340.934,故采用回归估,故采用回归估计量精度最高。计量精度最高。 39n7.7证明证明分别以分别以 记整群抽样、简单随机抽样的估计量:记整群抽样、简单随机抽样的估计量:40

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号