第五章(不等概抽样)

上传人:资****亨 文档编号:128139893 上传时间:2020-04-08 格式:PPT 页数:43 大小:450KB
返回 下载 相关 举报
第五章(不等概抽样)_第1页
第1页 / 共43页
第五章(不等概抽样)_第2页
第2页 / 共43页
第五章(不等概抽样)_第3页
第3页 / 共43页
第五章(不等概抽样)_第4页
第4页 / 共43页
第五章(不等概抽样)_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《第五章(不等概抽样)》由会员分享,可在线阅读,更多相关《第五章(不等概抽样)(43页珍藏版)》请在金锄头文库上搜索。

1、抽样调查课 不等概抽样 单位 浙江财经学院数统学院课程 抽样调查课教师 张锐 一 不等概抽样简介二 放回不等概抽样三 不放回不等概抽样 目录 一 不等概抽样简介 1 等概率抽样回顾2 不等概率抽样介绍3 不等概抽样的应用4 不等概率抽样的优点和条件5 放回抽样和不放回抽样 迄今为止 我们所讨论的两种抽样方法 简单随机抽样和分层抽样具有一个共同的特点 总体或层中每个单元入样的可能性 概率 相等 等概率抽样 samplingwithequalprobabilities 等概率抽样的基本出发点是 将总体或层中每一个单元看作是平等的 不 偏向 也不 疏远 某些特定的单元如果总体单元的差异不大 这种处理

2、方法既公正又方便 但在许多社会经济活动中并非所有单元的地位都相同或相近 即总体单元相差较大 也即总体方差大 这时等概率抽样的效果就不一定好 1 等概率抽样回顾 例如 为了估计一个城市的商业销售总额 对各商业网点进行调查 由于商业网点的规模差异极大 个别超大型商场年销售额可以超过亿元 甚至达到十几亿 它们是否景气对这个城市的商业销售总额起着至关重要的作用 而为数较多的大中型商场与商店年销售额是在几十万到几千万之间 至于数量更多的小型商店与摊位的年销售额仅数万元甚至不到一万元 在这种情况下 将特大型 大型商场与一般中小型市场或商店平等对待既不公允 又使抽样推断结果有较大可能发生大的偏倚 因此 在调

3、查中 对大型商场应该处于更重要的位置 这个例子启示我们 当总体单元相差较大 用等概率抽样的方法不合理时 可在抽样中将总体中每个单元的入样概率与其规模大小联系起来 大 单元入样的概率大 小 单元入样的概率小 这就是不等概率抽样 samplingwithunequalprobabilities 出现总体单元差异特别大时 往往是牺牲 简单 来提高抽样效率 一种做法是将总体按规模分层 然后 对较大单元的层取的抽样比高些 抽样比可以是100 而较小单元的层抽样比定的小些 另一种就是赋予每个单元与其规模 或辅助变量 成比例的入样概率 这样 大单元入样概率大 小概率入样概率小 2 不等概率抽样介绍 不等概抽

4、样中 总体中某类单元比其他单元出现在样本的机会大 这给人感觉这部分单元对推算影响大 使得推算偏向某一方 例如 大商场抽的多了 会不会造成推算的销售额偏大呢 实际上 某些单元的入样概率大 推算时 则赋予它较小的权 反之 入样概率小 推算时 就赋予它较大的权 这样就可以使推算结果仍然是公平的 3 不等概抽样的应用 1 抽样单元在总体中所占的地位不一致 如商场等调查等 2 调查的总体单元和抽样总体的单元不一致 比如调查者希望等概率的调查一单位职工的家庭情况 但由于有双职工的情况 因此 将双职工家庭的一个成员从调查框中拿掉或按每个职工的家庭成员在该单位的工作人数 然后对每名职工按与人数成反比的概率进行

5、抽样 3 改善估计量 4 不等概抽样的优点和条件 优点 主要是大大提高估计精度 减少抽样误差 条件 必须要有说明每个单元的规模大小的辅助变量来确定每个单元的入样规模 这在抽样及推算中是必须的 有时比较容易获得 比如 管理部门在车船登记时 车船名和载重吨位是同时登记的 因此 载重吨位作为辅助变量 计算入样概率 不等概率抽样分为放回与不放回两种情况 我们最关心也是最重要的情形是抽样容量n固定时 单元的入样概率 不放回抽样 或每次抽样的概率 放回抽样 与单元的 大小 严格成比例情形 这种情形下的放回抽样称为pps抽样 不放回抽样称为抽样 放回不等概抽样 每次抽样过程都是从同一个总体中独立进行的 因此

6、实施及推算过程相对简单一些 不放回不等概抽样 在抽取时效率要高些 5 放回抽样和不放回抽样 二 放回的不等概率抽样 1 多项抽样2 pps抽样及实施方法代码法拉希里法3 Hansen Hurwitz估计量及其性质 1 多项抽样 既然是不等概率抽样 那么在抽取之前就应当给总体中每一单元赋予一定的抽取概率 设总体包含N个单元 对其进行放回抽样 在每次抽样中 抽到第i个单元的概率为且按此规定 独立地抽取n次 共抽到n个单元 有可能重复 则称这种不等概率抽样为多项抽样 multinomialsampling 若记为总体中第i单元在n次抽样中被抽中的次数 显然对每个i都有 且则是一个随机向量 r v 其

7、联合分布为 6 1 这正是我们熟悉的多项分布 多项抽样 其名正出于此 6 3 2 pps抽样及实施方法 倘若每个单元有一个数值度量其大小或规模 诸如职工人数 工厂产值 商店销售额等 我们记Mi为第i个单元的 大小 并记是总体中所有单元的 大小 之和 则可取 此时 每个单元在每次抽样中的入样概率与单元的大小成正比例 称这种特殊的多项抽样为 放回的 与大小成比例的概率抽样 samplingwithprobabilityproportionaltosize 简称pps抽样 多项抽样是最简单的不等概率抽样 它的实施方法通常有两种 以pps抽样为例 注意 抽样是放回的 因此某个单元出现在样本的次数有可能

8、多次 在调查时 只需要调查一次 这样节省经费 但在计算的时候 按抽中几次计算几次的原则 1 代码法 也称汉森 赫维茨 Hansen Hurwitz 法 它适合于N不太大的情形 假定所有Mi为整数 若不然也可以乘以一个倍数M0 使一切Mi M0Zi成为整数 对于具有整数Mi的第i个单元赋予一个与Mi相等的代码数 每次抽样前 先在整数1 2 M0里面随机等可能地选取一个整数 设为m 若代码m属于第j个单元拥有的代码数 则第j个单元入样 这个过程重复n次 得到n个单元入样 当然存在重复的可能 构成了pps样本 表5 1 1pps抽样时各单元的代码数 设Mi皆为整数 例1设某个总体有N 10个单元 欲

9、用多项抽样从中抽取n 5个单元 给定的入样概 Zi 如下表所示 在 1 100 范围内产生5个随机数 设分别为04 73 25 49 82 则第1 第6 第3 第5及第8个单元入样 如再增加一个样本单元 产生的随机数为58 则又对应第5个单元 这个单元即为抽中两次 由于单元愈大 被赋予的代码数就愈多 因此每个单元入样的概率与其大小Mi成正比 2 拉希里 Lahiri 法 也称为二次抽取法 当N相当大时 累计的将很大 给代码法的实施带来不便 Lahiri提出下列方法 对上述的Mi 令即所有Mi中的最大值 每次抽取一个 1 N 范围内的随机数i及 1 M 范围内的随机数m 若则第i个单元入样 否则

10、重抽一组 i m 例如 在例1中 N 10 M 24 设 1 10 中的一个随机数为4 1 24 中的一个随机数为9 由于M4 68 故第二个单元入样 如此重复 直到抽到n个单元 允许重复 为止 拉希里法适用于N很大的情况 因为它不需要列出如上表这样的表 3 汉森 赫维茨 Hansen Hurwitz 估计量 若y1 y2 yn是按Zi为入样概率的多项抽样而得的样本数据 它们相应的Zi值自然地记为小写的z1 z2 zn 则对总体总和 Hansen Hurwitz给出了如下估计量 以盒子模型来描述 我们的盒子里有N张签 分别标上但如何去实施每个单元的不同概率抽取呢 我们适当地将盒子进行扩充 具体

11、方法如下 不失一般性 设Zi Mi M0 i 1 2 N 其中且各Mi均为整数 扩充了的盒子使原盒内标有Yi Zi的一张签增加到Mi张签 不等概率抽样 简单随机抽样 因此 恰为的无偏估计 这样从新盒中随机地抽取Yi Zi就相当于原盒中Yi Zi以Zi Mi M0的概率被抽取 因此样本均值的期望就相当于新盒子的均值 由于n次抽取是独立进行的 放回抽样的特点 根据概率论的基本知识 的方差就等于新盒子的方差的1 n倍 即 因为为新盒子的方差 利用数理统计基本知识 样本方差为该方差的无偏估计 于是我们得到了的无偏估计 汉森 赫维茨 Hansen Hurwitz 估计量 总量估计 例子 某部门要了解所属

12、8500家生产企业当月完成的利润 该部门手头已有一份上年各企业完成产量的报告 将其汇总得到所属企业上年完成的产量为3676万吨 考虑时间紧 准备采用抽样调查来推算当月完成的利润 根据经验 企业的产量和利润相关性很强 且企业的特点是规模和管理水平的差异比较大 通常大企业的管理水平较高 因此采用与上年产量成比例的pps抽样 从所属企业中抽出一个样本量为30的样本 调查结果如下表 请根据以上调查结果估计该部门所属企业的当月完成利润 并给出95 的置信度下的相对误差 如果相同条件下相对误差达到20 所需的样本容量应该是多少 解 补充 在实际工作中 可以依照过去对同类问题的经验调查来估计 比如 对同类问

13、题已经获得过一个样本量为n o的简单样本 并且已知在一定置信度下 该调查对总体均值或总量的估计的相对误差为r o 在同样置信度下 如果希望本次调查的相对误差达到r 则在抽样比可以忽略的的情况下 可以近似的计算本次调查所需的样本量 三 不放回的不等概率抽样 1 包含概率与抽样2 统计量3 几种常用的不等概率抽样方法 总体中每个单位被包含到样本的概率 即入样概率起着关键的作用 总体中任意两个单位被包含到样本中的概率 一阶包含概率二阶包含概率 1 包含概率与抽样 如果抽样设计有固定的样本量 则包含概率有如下性质 1 2 3 如果我们事先对总体中的每一个单位都有一个度量其规模大小的指标值 记对于固定的样本量 若总体中每个单位的入样概率即一阶包含概率与其规模大小严格成比例 即若有成立 我们称这种不放回的与单位规模大小成比例的概率抽样为严格的抽样 霍维茨 汤普森估计量对于不放回不等概率抽样 霍维茨 Horvitz 和汤普森 Thompson 1952 提出如下关于总体总值的估计量 2 统计量 3 几种常用的不等概率抽样 Brewer方法水野法Yates Grundy逐个抽取法Poisson抽样 感谢亲观看此幻灯片 此课件部分内容来源于网络 如有侵权请及时联系我们删除 谢谢配合

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号