抽样调查-第6章 整群抽样PPT课件

上传人:资****亨 文档编号:128146461 上传时间:2020-04-08 格式:PPT 页数:84 大小:888KB
返回 下载 相关 举报
抽样调查-第6章 整群抽样PPT课件_第1页
第1页 / 共84页
抽样调查-第6章 整群抽样PPT课件_第2页
第2页 / 共84页
抽样调查-第6章 整群抽样PPT课件_第3页
第3页 / 共84页
抽样调查-第6章 整群抽样PPT课件_第4页
第4页 / 共84页
抽样调查-第6章 整群抽样PPT课件_第5页
第5页 / 共84页
点击查看更多>>
资源描述

《抽样调查-第6章 整群抽样PPT课件》由会员分享,可在线阅读,更多相关《抽样调查-第6章 整群抽样PPT课件(84页珍藏版)》请在金锄头文库上搜索。

1、 4 1整群抽样 一 整群抽样的定义与特点 1 整群抽样的定义整群抽样是将整体划分为若干群 然后以群为抽样单元 从总体中随机抽取一部分群 对抽中的群中的所有基本单元进行调查的一种抽样技术 2 整群抽样的优点 1 抽样框编制得以简化 2 实施调查便利 节约费用3 整群抽样的缺点 抽样误差较大 二 群的划分 整群抽样中的群大致可分为两类 一类是根据行政或地域形成的群体 如学校企业和街道 对此采用整群调查是为了方便调查 节约费用 另一类群则是调查人员人为确定的 如将一大块面积划分若干块较小面积的群 这时就需要考虑如何划分群 以使在相同调查费用下调查误差最小 群划分的一般原则为了提高精度 划分群时应力

2、争使同一群内各单元之间的差异尽可能大 以避免同一群内各单元提供重复信息 这个原则与分层抽样中划分层的原则恰好相反 由此看来 整群抽样和分层抽样是针对不同总体结构而提出的两种不同抽样方法 三 群的规模 群的规模是指组成群的单元的数量 群的规模大 估计的精度差 但费用省 群的规模小 估计的精度可以提高但费用增大 实践中 确定群的规模涉及多种因数 如群的具体结构 精度 费用 调查实施的组织管理等 群的规模又有两种情况 一种是总体中的各个群规模相等 另一种是总体中各个群的规模不相等 四 附号说明 总体第i群中第j个单元的指标值 样本第i群中第j个单元的观测值 总体群 PSU 数 N样本群数 n第i个群

3、中的单元 SSU 数量 总体中单元总数 总体中第i群的群总值 样本中第i群的群总值 总体中第i群的个体均值 样本中第i群的群均值 总体中的群均值 样本中的群均值 总体中的个体均值 总体方差 样本方差 总体群间方差 样本群间方差 总体中第i个群群内方差 样本第i个群群内方差 群规模相等时整群抽样样本群内方差 群规模相等时整群抽样总体群内方差 4 2等概率整群抽样 在N个初级抽样单元中 第i个初级单元含个二级抽样单元 对于整群抽样而言 被抽中的群中所有二级单元全部入样 我们先考虑最简单的情形 每个群所包含的单元数M相等 称为群规模相等 实际问题中只要群规模接近 也可视为群规模相等 在群规模相等的情

4、况下 整群抽样一般采用简单随机抽样方法抽取群 这时对总体均值的估计十分简单 一 群规模相等时的估计 1 均值估计量及其方差若按简单随机抽样 且群的大小相等 都等于M 则对总体均值的估计为 定理4 1是的无偏估计 即 这样的结果是显然的 因为是按简单随机方法抽取群 所以样本群均值是总体群均值的无偏估计 因而 证明 因为 所以 定理4 2的方差为 下面我们看一个整群抽样的例题 例4 11 在一次对某中学在校生零花钱的调查中 以宿舍作为群进行整群抽样 每个宿舍都有M 6名学生 用简单随机抽样在全部N 315间宿舍中抽取n 8间宿舍 全部48个学生上周每人的零花钱及相关计算数据如下表 试估计该学校学生

5、平均每周的零花钱 并给出其95 置信区间 8个宿舍48名学生每周零花钱支出额 解 已知故 下面计算估计量方差的估计值 于是置信度为95 的置信区间为98 17 1 96 4 34 也即 89 66元 106 68元 2 整群抽样效率分析 在整群抽样中 由于估计量的方差主要依赖群间的变异性 因此整群抽样中较大 则整群抽样就会损失精度 下面我们用方差分析表来讨论这一问题 群规模相等时的整群抽样总体方差分析表 我们将整群抽样与简单随机抽样的效率进行比较 假设直接从总体中抽取一个样本容量为nM的简单随机样本 则样本均值的方差为 但如果该整体被等分为N个规模为M的群 定义为群内相关系数 描述同一群内成对

6、个体单元之间的相关程度 其表达式为 根据组合及平均值的计算 又可表示为 事实上 前面提到的可以用群内相关系数近似表示 由此 可以计算等群抽样的设计效应 这表明 整群抽样的方差约为简单随机抽样方差的倍 整群抽样估计效应与群内相关系数关系密切 若群内各单元的值都相等 则群内方差 量方差是简单随机抽样估计量方差的倍 因此 要提高整群抽样的效率 就要通过分群 间的差异实现的 对于自然形成的群而言 无法通过调整群内单元而控制的取值 这时 要想减少抽样误差 就只能增大样本容量 另外 群内相关系数也可以用群内方差和群间方差表示 并由样本统计量估计 例4 2 估计例4 1中以宿舍为群的群内相关系数与设计效应

7、解 由例4 1已计算出样本群间方差而样本群内方差为 由相关系数的估计式有 设计效应2 741表明 在这项调查中 为达到同样的估计精度 整群随机抽样的样本量大约为简单随机抽样样本量的2 74倍 而此时简单随机抽样的样本量为 1 等概抽样 简单估计 此时 不考虑群规模不等的影响 抽样方法与 前节群规模相等时相同 估计方法也相同 即采用简单 随机抽样 对总体均值的估计为 二 群规模不等时的估计 的方差估计为 2 等概抽样 加权估计 基本思路 以群规模为权数 乘以各群 将样本中n个群的群总和平均 估计公式为 如果总体群平均规模未知 可以用样本群 个体单元总数 总体总值估计量的方差 它的无偏估计为 对均

8、值估计而言 与简单估计相比 加权估计的方法考虑了群规模 所以估计量分别是的无偏估计 3 等概抽样 比率估计 总体均值采用比率估计的形式为 与第三章比率估计的区别在于 这里的辅助变量 可知 它是一个有偏的 当样本群数n很大时 其 不是 而是群的规模 从比率估计量的性质可 偏倚很小 可以忽略 总体总值Y的比率估计为 的样本估计为 的样本估计为 4 例题和方法比较 例4 3 某县有33个乡 共726个村 某一年度某作物总种植面积为30525亩 现采用等概抽样随机抽取十个乡进行该种作物的产量调查 调查数据如下表 要求利用无偏估计量和比率估计量分别估计全县总产量 并计算估计量的标准差 10个乡调查数据

9、1 无偏估计 等概抽样 简单估计 计算平均每个村的产量为 因此 966 19 评价 此种方法的估计过程虽不复杂 但却是有偏估计 2 无偏估计 等概抽样 加权估计 评价 此种方法虽可获得无偏估计 但与前种方法相比 估计量的估计方差没有改观 反而有所增大 这种方法适合于之间差异不大的整群抽样 3 以群规模为辅助变量的比率估计 评价 比率估计将群规模作为辅助变量引入估计 其估计方差取决于群均值的差异 的差异比的差异要稳定 所以比率估计比前两种方法获得更好的估计效果 4 种植面积为辅助变量的比率估计 已知全县该作物的种植面积总共有X 30525亩 采用种植面积为辅助变量的估计结果为 评价 与前面几种方

10、法相比 估计量的估计误差最小 估计效果最好 究其原因 作物的乡产量不仅与该乡规模有关 更与该乡的种植面积有关 补充 总体比例的估计 一 群规模相等的估计 与群规模相等时均值估计的方法相同 因为比例也是均值 即 由P118的 6 1 式 用 表示第群中具有某种特征的单元数 是总体比例P的无偏估计 为样本中第i群具有某特征单元数的比例 M为每群中的单元数 估计量的方差为 的无偏估计为 二 群规模不等的估计 若群规模不等 仍采用简单随机抽样抽取群 则总体比例的估计量为 根据比例估计的性质 其估计量的方差为 的估计式为 例6 5 某居民小区有415个居民小组 现采用整群等概抽样 随机抽取25个小组为样

11、本 调查中的一项内容为估计男 女性别比例 下表资料为样本中女性的分布 试用95 的置信度估计该小区女性比例的致信区间 并用简单随机抽样方法进行比较 总体比例估计例题 25个居民小组人数及女性人口数 解 这是群规模不等的比例估计总体比例的估计为 由于总体的未知 用样本替代得 故置信区间为 如果采用简单随机抽样方法 从该小区中抽取151人 假定调查结果与上表相同 即其中女性人数为72人 抽样比f也假定相同 则估计量的估计方差为 于是可以计算设计效应 这表明 在次项内容的调查中 整群抽样的估计效果明显地好于简单随机抽样 4 3等概率两阶段抽样 一 多阶段抽样前面提到的整群抽样虽然有很多优点 但是由于

12、群内单元通常具有相似性 表现为群内相关系数大于零 尤其是当群比较大时 人们自然会想到没有必要对群内所有单元都进行调查 而只要对群内单元进行再抽样 对被抽中的单元进行调查 这就是两阶段抽样 同样的道理 还可以有三阶段抽样 四阶段抽样等 我们统称为多阶段抽样 多阶段抽样的优点 1 多阶段抽样保持了整群抽样的样本比较集中 便于调查 节约费用等优点 同时又避免了对小单元过多调查造成的浪费 2 多阶段抽样不需要编制所有小单元的样本框 抽取初级单元时 只需要编制初级单元的抽样框 对被抽中的初级单元 再去编制二级单元的抽样框 依此类推 二 抽样方法与推断原理多阶段抽样时 每一个阶段的抽样可以相同 也可以不同

13、 它通常与分层抽样 整群抽样 系统抽样结合使用 多阶段抽样时 抽样是分步进行的 因此 讨论估计量的均值及其方差时 需要分阶段进行 这要用到下面的性质 对于两阶段抽样 有 式中 为在固定初级单元时对第二阶抽样求均值和方差 为对第一阶抽样求均值和方差 证明见教材P148 上述性质可以推广到多阶段抽样的情形 例如对于三阶段抽样 有 三 等概率两阶段抽样的符号说明 初级单元和初级单元拥有的二级单元个数 N M第一阶段和第二阶段抽样的样本量 n m第i个初级单元中的第j个二级单元的观测值 样本中第i个初级单元中的第j个二级单元的观测值 第一阶段和第二阶段的抽样比 第i个初级单元按二级单元的平均值 按二级

14、单元的平均值 初级单元间的方差 初级单元内的方差 由的表达式可知 若记 则有 即是的平均值 同理有 四 初级单元大小相等的二阶抽样 第一阶段在总体N个初级单元中 以简单随机抽样抽取n个初级单元 第二阶段在被抽中的初级单元包含的M个二级单元中 以简单随机抽样抽取m个二级单元 即最终接受调查的单元 例如 某个新开发的小区拥有相同户型的15个单元的楼盘 居民已经陆续搬入新居 每个单元住有12户居民 为调查居民家庭装修情况 准备从180户居民户中抽取20户进行调查 如下表 表中红字为抽中的房号 在这里 初级单元 楼盘 有15个 每个初级单元拥有二级单元 居民户 12个 首先将初级单元从1到15编号 在

15、15初级单元中随机抽取5个单元 分别是1 6 9 12 13号 然后在被抽中的初级单元中 进行第二次抽样 即分别在抽取的5个楼盘中随机抽取4户 这就是初级单元规模相等的两阶段抽样 规模相等两阶段抽样的估计量及其性质 1 总体均值的估计定理4 5对于初级单元大小相等的二阶抽样 如果两个阶段都是简单随机抽样 且对每个初级单元 第二阶抽样是相互独立进行的 则对总体均值的无偏估计为 总体均值估计量方差为 的无偏估计为 式中 例4 4 欲调查4月份100家企业的某项指标 首先从100家企业中抽取了一个有板有5家样本企业的简单随机样本 调查人员对5家企业分别在调查月内随机抽取3天作为调查日 要求样本企业只

16、填写这3天的流水帐 调查的结果如下 要求根据这些数据推算不100家企业该指标的总量 并给出估计的95 置信区间 解将企业作为初级单元 将每一天看着二级单元 调查月内拥有30天 即拥有30个二级单元 首先在初级单元中抽取一个n 5的简单随机样本再对每个样本的二级单元分别独立抽取一个m 3的简单随机样本 由题意 N 100 M 30 n 5 m 3 首先计算样本初级单元的均值 方差 于是得到 置信度为95 的置信区间为 160800 1 96 9216在上面的方差估计式中 第一项是主要的 第二项要小得多 五 初级单元规模不等的二阶抽样 一般而言 初级单元的大小是不相等的 如果按初级单元的大小分层后 层内初级单元的大小差别仍很大 则需用本节介绍的方法来处理二阶抽样的问题 当初级单元大小不等时 一般采用不等概抽样 1 符号说明 总体中初级单元个数及第一阶抽取的样本量 N n 第i个初级单元中二级单元数 第i个初级单元中第二阶抽样的样本量 第i个初级单元中第j个二级单元的观测值 样本中第i个初级单元中第j个二级单元的观测值 第一阶和第二阶的抽样比 二级单元个数 指标总和 第i个初级单元指标总和

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号