第十章 其它抽样方法技术课件

上传人:我*** 文档编号:139324904 上传时间:2020-07-21 格式:PPT 页数:61 大小:608.50KB
返回 下载 相关 举报
第十章 其它抽样方法技术课件_第1页
第1页 / 共61页
第十章 其它抽样方法技术课件_第2页
第2页 / 共61页
第十章 其它抽样方法技术课件_第3页
第3页 / 共61页
第十章 其它抽样方法技术课件_第4页
第4页 / 共61页
第十章 其它抽样方法技术课件_第5页
第5页 / 共61页
点击查看更多>>
资源描述

《第十章 其它抽样方法技术课件》由会员分享,可在线阅读,更多相关《第十章 其它抽样方法技术课件(61页珍藏版)》请在金锄头文库上搜索。

1、第十章 其它抽样方法技术,本章要点,本章主要对样本轮换、双重抽样、随机化装置、交叉子样本等抽样技术原理、方法、特点及应用条件进行了较为全面的介绍。具体要求: 掌握本章所介绍的几种抽样技术的特点及应用条件,在抽样实际工作中能够正确运用该种技术,提高估计的精度与效果。,第一节 样本轮换第二节 双重抽样第三节 随机化装置 第四节 交叉子样本,抽样调查除了对总体的一次性抽样以外,很多重要的调查是隔一段时间重复进行的,对于这种经常性的抽样问题,就必须重视其样本轮换问题的研究。 对于样本轮换问题,我们至少应考虑以下问题:每次调查的样本如何组成?是采用固定样本还是采用全新的样本,或者是部分保留部分替换,即样

2、本轮换;在估计后期的总量或均值时,是否需要利用前期的信息来改进现期的估计,以及如何利用;如果采用样本轮换的方法,如何确定最优的保留比例或替换比例。,第一节 样本轮换,一、样本轮换的原因 如果是单纯地估计现值的情况,当然最好每次重新抽取新样本,这样必然会增加费用;如果要逐期地与上期比较,则采用固定样本的方法为好,固定样本可以消除样本的因素而只观察动态的变化。然而,样本长期不变,随着时间的推移,固定样本会显露它的弊端,既难以反映总体的变化,而且受访者也会产生厌烦心理,出现不合作或回答质量下降等问题,从而影响调查质量。另外,无论是采用固定样本还是全新样本都难以正确地反映总体在各个不同时间上的水平及变

3、化,因此,一种广泛采用的方法是样本轮换,即每隔一定时间(一个月、一季或一年)更换一定比例的单元,保留其余单元。,第一节 样本轮换,二、样本轮换的最优比例 第一个时期采用有放回简单随机抽样方式抽出样本量为n的样本;在第二个时期采用有放回简单随机抽样方式选出样本量为nq的旧有样本点以便替换掉,即保留的样本量为np,保留样本的比例为p,同时独立地依有放回简单随机样本方式补充新的nq个新样本点,这里p+q=1,这样第二个时期的样本量仍旧为n。设:,第一节 样本轮换,为第一个时期与第二个时期相同的np个单元在第一个时期的均值。 为第一个时期nq个单元在第一个时期的均值。 为np个单元在第二个时期的样本均

4、值。 为nq个补充单元在第二个时期的样本均值。 为 和 之间的相关系数。 如果希望估计第二个时期的样本均值并充分利用第一个时期的信息,令该估计量为 ,那么它应该是充分利用前后期中保留样本、不保留样本和后期新补充样本的加权平均数。,第一节 样本轮换,设我们希望得到的估计量 是两期估计量的线性函数,即 = a +b +c + d (10.1) 要求估计其参数a,b,c,d。 因为E( )=E( )= ,E( )=E( )= , 所以E( )=(a+b) +(c+d) 。要使 成为 的无偏估计量,需a+b=0,c+d=1,也即b=-a,d=1-c。代入(10.1),有 =a( - )+c +(1-c

5、),第一节 样本轮换,第一节 样本轮换,该估计量的方差可以求得为:,其中 是第一个时期的方差, 是第二个时期的方差。我们要求出a和c,使得 达到最小,就要以上公式分别对a和c求偏微分并使之等于0,即可求出a和c的最优值分别为:,第一节 样本轮换,该估计量的方差可以求得为:,第一节 样本轮换,将其代入公式(10.1),就得到,该估计量的方差为 :,第一节 样本轮换,如果不利用前期信息,只根据第二期的结果来估计均值,那么 :,其方差为 :,第一节 样本轮换,故利用前期信息后的设计效果为 :,从上式可以看出,当的值比较大时,利用上期信息可以较大地提高 的效率。表10.1给出了不同的q,值时 的值。,

6、第一节 样本轮换,表10.1 不同的q,值时 的值,第一节 样本轮换,三、样本轮换方法 (一) 随机轮换法 在进行轮换时按确定的轮换单位数目或比例,从原有样本中随机抽出若干单位不再调查,而从其余未包括在样本中的总体单位中抽取同样数目的单位来代替。,第一节 样本轮换,(二) 等距轮换法 在总体抽样框中确定出各个等距抽样的样本,在各次的调查中,按相应位置的等距样本单位进行轮换。我国农村住户调查就是采用这种轮换方式。 (三) 子样本轮换法 从总体中抽出若干套子样本,每次调查一定数量的子样本,逐次轮换其中的部分子样本。,第一节 样本轮换,子样本轮换实际上就是每次采用交叉子样本,而交叉子样本不仅能有效地

7、减少和控制估计偏差,而且由于每个交叉子样本都能代表总体,即使有的子样本资料搜集不到,我们也可以用其他的子样本甚至一个子样本来观察和推断总体。此外,用交叉子样本还可以考察非抽样误差发生的程度。因此,一般来说,子样本轮换方法是以上三种样本轮换方法中最好的。,第一节 样本轮换,四、样本轮换应遵循的原则 (一)代表性。一是指轮换后的新样本必须具有代表性,二是指新选取的样本原则上必须满足与轮换掉的原样本同类型,有代表性。 (二)连续性。指样本轮换后进行抽样调查取得的资料应与样本轮换前进行调查所取得的资料连续并可比。,第一节 样本轮换,(三)保证必选样本点。所谓必选样本点,就是指进行抽样调查时必须作为样本

8、点的总体单元。保证必选样本点,就是指必选样本点不参加轮换,仅对非必选样本点进行轮换。 (四)遵循抽样原理。指进行样本轮换时,要按照抽样调查的原理来选取轮换掉的样本点和补入的新样本点。,第一节 样本轮换,五、案例介绍 美国人口现状调查(current population survey,CPS)是国际上最著名的抽样调查项目之一,已经成为美国以及许多国家进行居民调查的参考模型,其实施是在每个月包含19号的那一周进行,调查的问题涉及受访者此前一周内的活动。调查氛围覆盖全美50个州和哥伦比亚地区。CPS采用的就是样本轮换的方法,即每位受访者连续4个月接受访问,然后退出样本,8个月后再进入样本,连续4个

9、月接受访问,最后永久地退出样本。,第一节 样本轮换,CPS 在1995年7月的抽样设计方案中样本轮换的特征: 1 在任意一个月内,都有1/8 的住户单元第一次接受调查,1/8的住户单元第二次接受调查,依次类推。 2每个月都由新的样本组代替从样本中永久退出的老样本组。 3 每个月都有一个样本组在闲置8个月后重新接受调查,以此代替刚刚进入闲置期的样本组。 4通过轮换设计,保证每个样本单元在2个年份的4个相同 月份里接受调查。 5. 在连续的2个月内,有3/4/的样本点是相同的;在连续的2年内,有1/2的样本点是相同的。,第二节 双重抽样,我们可以先从总体中抽取一个大的初始样本,从而获得总体的辅助信

10、息,然后再从初始样本或从总体中再抽一个子样本,这种方法就是双重抽样。,第二节 双重抽样,一、定义 双重抽样,也称二相抽样或二重抽样(two-phase sampling),是指在抽样时分两步抽取样本。一般情况下,先从总体N中抽取一个较大的样本,称为第一重(相)样本(the first phase sample),对之进行调查以获取总体的某些辅助信息,为下一步的抽样估计提供条件;然后进行第二重抽样(the second phase sampling)。第二重抽样所抽的样本n相对较小,但是第二重抽样调查才是主调查。,第二节 双重抽样,二、双重抽样与两阶段抽样的区别 (一)两阶段抽样(two-sta

11、ge sampling)是先从总体N个单元(初级单元)中抽出n个样本单元,却并不对这n个样本单元中的所有小单元(二级单元)都进行调查,而是在其中再抽出若干个二级单元进行调查;双重抽样则不同,要对第一重(相)样本进行调查以获取总体的某些辅助信息,并且要利用这些辅助信息进行排序、分层、抽样或估计等。,第二节 双重抽样,(二)两阶段抽样的第二阶段抽样单元和第一阶段抽样单元往往是不同的;双重抽样要有一份最终单元的完整名册(总体所有单元的抽样框),而两阶段抽样只是需要第一阶段单元(初级单元)名册,然后在中选的初级单元中构造第二阶段抽样的抽样框。,第二节 双重抽样,三、双重抽样的作用 (一)有助于筛选主调

12、查对象 (二)节约调查费用 (三)提高抽样效率 (四)可用于研究样本轮换中的某些问题 (五)降低无回答偏倚,第二节 双重抽样,四、双重抽样的应用 (一)为分层的双重抽样 分层抽样如果事先无法知道总体的层权,可以采用双重抽样。具体实施过程如下: 第一步:利用简单随机抽样,从总体的N个单元中随机抽取第一重样本,样本单元数为 ;根据已知的分层标志将第一重样本分层,令 ,则 是总体层权 的无偏估计。,第二节 双重抽样,第二步:利用分层随机抽样,从第一重样本中抽取出第二重样本,样本单元数为n,第h层样本单元数为 , 。,采用双重分层抽样,对总体均值 的估计量为:,的方差为:,第二节 双重抽样,上式可简化

13、为 :,的样本估计量为:,第二节 双重抽样,第一步:从总体的N个单元中随机抽取第一重样本,样本单元数为 ;对于第一重样本,仅观测辅助变量信息,用辅助变量的样本均值 估计总体均值 。,(二)为比率估计的双重抽样 在实际工作中,如果辅助变量的信息未知,可以利用双重抽样进行比例估计。具体实施过程如下:,第二节 双重抽样,双重抽样对总体均值 的比率估计:,第二步:从第一重样本中随机抽取出第二重样本,样本单元数为n;对于第二重样本,观测目标变量与辅助变量,并用获得的 和 ,计算 ,构造比率估计。,双重抽样比率估计的方差为:,第二节 双重抽样,双重抽样比率估计方差的样本估计:,第二节 双重抽样,(三)为回

14、归估计的二重抽样 与比率估计相似,在辅助信息未知时可以采用二重抽样进行回归估计。具体实施过程如下: 第一步:从总体的N个单元中随机抽取第一重样本,样本单元数为 ;对于第一重样本,仅观测辅助变量信息 ,用辅助变量的样本均值 估计其总体均值 。,第二节 双重抽样,第二步:从第一重样本中随机抽取出第二重样本,样本单元数为n;对于第二重样本,观测目标变量 与辅助变量 ,并计算 、 和回归系数b,构造回归估计。,双重抽样对总体均值的回归估计:,双重抽样回归估计的方差为:,第二节 双重抽样,式中 :,为第一重样本残差方差,其均值近似等于总体残差方差 :,因此双重抽样回归估计方差的样本估计:,第三节 随机化

15、装置,一、敏感性问题调查 所谓敏感性问题(sensitive question)是指所调查的内容涉及私人机密,受访者不愿或不便于向外界透露的问题。 对于这类敏感性问题,必须采取经过特别设计的装置与方法,以消除受访者的顾虑,能够如实回答问题,避免调查出现严重偏误。这种为敏感性问题调查特别设计的技术,称随机化回答技术(Randomized Response Technique)。,第三节 随机化装置,敏感性问题按总体的特征可分为属性特征和数量特征问题两类。属性特征的敏感性问题是指受访者是否具有敏感性问题的特征,一般是估计具有敏感性特征的单位在总体中所占的比例,因此又可称作敏感性比例问题。数量特征的

16、敏感性问题是指受访者具有敏感性问题数额的多少的特征,一般是估计敏感性数额的均值或总和,也可称作敏感性均值问题。,二、沃纳随机化回答模型 使用随机化回答技术的第一个模型是由沃纳(S.L. Warner)首先提出的 。 例如,某大学欲调查学生考试的作弊问题,随机抽取n个学生进行调查,对每位学生显示两个相反的问题,问题可以写在外形完全相同的m张卡片上,其中m1个卡片写上“我曾在考试中作过弊”,另外m-m1个卡片写上“我不曾在考试中作过弊”。然后把这m个卡片折叠好,放在一个盒子里。其中: A问题:我曾在考试中作过弊。 B问题:我不曾在考试中作过弊。,第三节 随机化装置,调查时将m种外形完全一致的卡片像洗牌一样充分混合后,由受访者依简单随机抽样中的抽签方式随机抽取一张卡片,对照自己的情况回答“是”或“否”,然后放回盒子中。 设卡片A的比例是P,则卡片B的比例就是1-P。由古典概率可知,在大规模的调查中,抽中卡片的概率为P(A)=P,抽中卡片的概率为P(B)=1-P 。若样

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号