调查中的复杂样本

上传人:壹****1 文档编号:544487550 上传时间:2022-07-27 格式:DOCX 页数:4 大小:15.94KB
返回 下载 相关 举报
调查中的复杂样本_第1页
第1页 / 共4页
调查中的复杂样本_第2页
第2页 / 共4页
调查中的复杂样本_第3页
第3页 / 共4页
调查中的复杂样本_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《调查中的复杂样本》由会员分享,可在线阅读,更多相关《调查中的复杂样本(4页珍藏版)》请在金锄头文库上搜索。

1、调查中的复杂样本一、辅助信息的种类1、内部辅助信息来自于本次调查之中。一般有三种情况:(1)目标变量之外的其他变量。(2)为改进估计而专门设计的变量。(3)访问员反馈的信息。2、外部辅助信息。主要有如下类型:(1)普查资料。(2)前期调查资料。(3)各级政府部门的统计数据。(4)各企事业单位的工作记录。二、辅助信息的利用1、抽样设计任何抽样设计都需要辅助信息,抽样框是辅助信息的集中体现,辅助信息内 容越多、质量越高,就为进行良好的抽样设计提供了更多更好的素材,具有充分 的辅助信息也是良好抽样框的重要标志。例如,分层抽样需要利用辅助信息进行 分层,把总体各单元按相应的规则分到各个层中。好的分层应

2、该做到确定合理的 层数量,即要解决把总体分为几个层,层和层之间的分界点确定在哪里,总体中 的单元应该分别归属于哪个层,每个层的样本量应该是多少等问题。2、目标量估计可以利用辅助信息改进估计方法,提高估计精度,这一点在比率估计和回归 估计中表现明显。例如,在一些大型调查中,在设计阶段利用辅助信息进行多阶 段分层抽样设计,在估计阶段采用比率或回归估计方法,选择与目标变量相关的 辅助变量X。3、数据调整在调查数据调整中辅助信息有许多重要的应用。一个是对入样单元进行权数 的计算和调整;二是对利用辅助信息减小调查中无回答的偏差。例如,调查的主要研究变量为受访者的年收入,用y表示。将收集到的34478 个

3、样本单位看作一个新的总体,则该总体规模为N=34478,其中男性17062人,女 性17416人。已知男性群体和女性群体在研究变量y上的均值分别为196592和 135689,且男性回答概率为0.5,女性回答概率为0.9。收入总体总量值 Y=571712328假定目标估计量为总体总量Y,为了估计Y,采用简单随机抽样从总体抽取 规模为400的样本,其中281个单位有回答。由于不同性别人群回答概率有差别, 因此在最终得到的281个回答单位中,女性比例可能高于其总体真实比例。也就 是说,与理想的简单随机样本相比,该样本中女性比例偏高。此时如果采用最简 、.一八 N, . 单的估计量K = NZ y

4、(r表示样本的回答单位集,m表示回答单位数)对Y m r k进行估计显然会夸大女性群体的影响力,造成总收入的估计结果偏低。针对这种情形,引入辅助信息。由于总体中男女人数已知,且回答单位性别 已知,因此可以根据性别变量进行分层,并采用事后分层估计量。亍=Y N yPSTh rh h=1 进行估计。式中,r表示样本中回答单位集;H表示划分的事后层数;Nh表示第 h层的总体单位数。此时事后层数H=2,分别为男性和女性。利用相关辅助信息 进行分层,使得原来有偏的估计得到了改善。辅助信息的引入减小了无回答造成 的偏差,提高了估计质量,辅助信息的无回答处理中起到了重要的作用。三、样本的权数用样本的调查结果

5、对总体的目标量今夕估计是基于这样的原理:每个样本单 元不仅代表自己,而且代表研究总体中那些没有被选入样本的单元。抽样推断就 是把调查的原始结果放大,得到总体参数的估计。1、设计权数设计权数是由抽样设计所规定的每个样本单元所代表研究总体的单元数,也 就是样本单元入样概率的倒数。例如,在简单随机 抽样中,用 吧 表示设计 权数,总体总 值的估计为Y = lWdyi,因为在简单随机抽样条件下每个单元入样概率的-,则屿=-, i=1所以总体总值的估计又可以写为Y = lWy = N Ey。因为每个单元入样概率 d n ii=1i=1相等,又称为等概率抽样。在采用等概率抽样设计时,每个单元的设计权数是相

6、 同的。系统抽样也是等概率抽样。在系统抽样中抽样间隔就是设计权数,每隔一 定间隔抽取一个单元,用抽中的单元代表该间隔所有单元的情况。对于分层抽样, 如果按照各层规模等比率分配样本,也是等概率抽样;如果不是按各层规模等比 例分配样本,如内曼分配,则是不等概率抽样。在不等概率抽样条件下,每个单 元的设计权数是不同的。在多阶段抽样条件下,设计权数由每个单元在不同阶段 的入样概率相乘而得。例如,对于两阶段的抽样设计,令七代表第i个单位在 第一个阶段的入样概率。令P代表第i个单位在第二个阶段的入样概率,则i 单元的设计权数为W = p p。1i 2i2、权数结构调整权数的结构调整主要指调查现场出现与抽样

7、设计不同的情况,为了保证抽样 设计方案的落实而进行的某些权数调整。例如,我国劳动力抽样调查是多阶段分 层整群抽样,最后阶段抽取群,群由30个家庭户组成,对抽中群的家庭户全部 进行调查。在调查实施中,不可能保证所有的群都正好为30户,如在农村有自 然村,对于规模很小的自然村(远少于30户)可以合并为群,对于规模差不多 的自然村(30户左右),该自然村就是一个群。在城市通常取某栋住宅楼或其某 个单元为一个群。有些群的规模与抽样设计相同(正好30户)或相仿(30户左 右),有些群的规模则与抽样设计要求相差较大,这时就需要对入样单元的设计 权数进行调整。在这个例子中,设群的规模为M,如果M。30,则给

8、该群的每一个家庭户都赋予一个结构调整权数W*= 30M。例如,一个群包含45户,则该 群的每个住户的结构调整系数W* = 3045。3、权数的无回答调整存在无回答情况时,如果不对原有的设计权数进行调整,那些无回答单位的 权数就会丧失,总体的规模就会被低估,从而导致对总值进行估计的出现严重偏 差。权数的无回答调整可以计算无回答调整系数,令W,为回答调整系数,w,为 调查中回答单元权数和,巳为调查中无回答单元的权数和,则无回答调整系数为:w = wwnr W,4、最终权数最终权数是对目标量进行估计所适用的权数,是设计权数,结构权数,无回 答调整系数的结合体。最终权数二设计权数X结构权数X无回答调整

9、系数二Wd X W * X W四、自加权设计自加权是指调查中每个样本单元的设计权数是相同的,也就是说每个单元最 终入样的概率是相等的。在单阶段抽样条件下进行自加权设计比较容易,例如简单随机抽样,系统抽 样,按层规模等比例分配样本的分层抽样等都属于自加权设计,因为实施这些抽 样方法都能使总体中每个单元的入样概率相等。在多阶段抽样设计下情况有些复 杂,要得到自加权样本需要有意识地去设计,已达到每个单元最终入样概率相同 的目标。既然在大规模调查中自加权设计不是一件容易的事,为什么还要努力实 现自加权呢?首先,自加权设计不一定就绝对完美,所有的调查也不一定都要以 自加权设计为模式,自加权设计只是所有抽

10、样设计中的一种类型,况且进行自加 权设计需要一些条件。但是如果条件允许,把自加权设计当作一个优先的选择是 有道理的。因为在大规模调查中,样本量通常都比较大,每个单位的权数不等时, 计算权数的工作量较大,而且调查中会有多个参数,对每个参数进行估计都要加 权,使数据处理变得比较复杂。如果进行自加权设计,每个单元都有相同的权数, 数据处理就得到简化。1、分层PPS抽样分层PPS抽样指对总体进行分层,然后在各层采用PPS抽样这种方法,PPS 抽样是与样本规模大小成比例的概率抽样。若将总体划分为L层,J为第h层 hi中第i个样本单元的调查值,七为第h层中第i个样本单元作为PPS抽样的规模,xh为第h层的

11、总规模,则第h层第i个单元的入样概率为了,第h层的样本量 h为,由抽样理论可知,该抽样方法的总体总值估计量为:。i=1 h i=1 hi如果是自加权设计,则要求第层的样本了为,也就是各层样本量与层规模大 小成比例,于是估计量可以简化为:Y = X* nh rx i=1 i=12、两阶段抽样从总体的N个初级单元中采用简单随机抽样抽取n个初级单元,用M,表示 第i个初级单元的规模,在入样的第i个初级单元中采用简单随机抽样抽取个m i 单元最终接受调查。依据抽样理论,总体总值的估计量为:Y = - 1LM ly , i=1 i j=1 式中,yj为第i个初级单元中第j个最终单元的调查值。要使这种抽样

12、方法成为自加权设计,就必须使性成为常数,也就是说第二阶段的抽样中,无论在那 m i个初级单元中都采用等比例抽样。3、两阶段PPS抽样如果第一阶段采用与初级单元规模M,成比例的概率抽样,即PPS方法抽取初 级单元,第二阶段采用等概率方法(简单随机抽样或系统抽样)抽取最终单元, 则总体总值的估计量为:Y =上工、性因y = -20Uyn . 1 M m . 1 ij n . 1 m j 1 ij式中,M=丈心,为初级单元规模之和,即总体规模。由于M0是一个常数,要 i=1使该设计成为自加权设计,就需要使M0为一常数,也就是在每个入样的初级单 m i元中抽取相同数量的最终单元mo在多阶段抽样中,由于前面阶段通常采用PPS抽样方式,所以可以把这种抽 样模式的规律总结如下:如果要实现自加权设计,在两阶段抽样中,第一阶段 采用PPS抽取初级样本单元,在每个人选得初级单元中采用等概率方法抽取相 同数量的最终单元;如果是三阶段抽样,在前面两个阶段,均采用PPS抽取初 级、二级样本单元,在入选的二级样本中采用等概率方法抽取相同数量的最终 单元;对于更多阶段的抽样可以类推。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号