第八章 抽样调查

上传人:今*** 文档编号:106856796 上传时间:2019-10-16 格式:PPT 页数:86 大小:961.01KB
返回 下载 相关 举报
第八章 抽样调查_第1页
第1页 / 共86页
第八章 抽样调查_第2页
第2页 / 共86页
第八章 抽样调查_第3页
第3页 / 共86页
第八章 抽样调查_第4页
第4页 / 共86页
第八章 抽样调查_第5页
第5页 / 共86页
点击查看更多>>
资源描述

《第八章 抽样调查》由会员分享,可在线阅读,更多相关《第八章 抽样调查(86页珍藏版)》请在金锄头文库上搜索。

1、第八章 抽样调查,抽样调查是应用统计的一个重要分支, 并在社会经济领域中有着极其广泛的应用。我国的统计调查方法体系改革目标是建立以周期性普查为基础,以经常性的抽样调查为主体,以必要的统计报表、重点调查、综合分析为补充, 收集、整理基本调查统计资料的统计调查方法体系。,抽样调查的优点,(1)节约费用:抽样调查能节约人力、物力和财力。特别是总体很 大时,由于抽样调查只调查总体中很小部分,从而能大大地节约费用。 (2)时效性强:由于抽样调查只调查总体中很小部分, 从而能在较 短的时间内完成调查并作出科学决策。 (3)有助于提高调查数据的质量:全面调查由于参与的人员多, 涉 及范围大, 使收集数据和整

2、理数据过程中产生差错的可能性较大。而 抽样调查需要的人员少,调查人员的素质相对较高,使数据质量更好。 (4)适用范围广:有些总体由于太大而无法采用全面调查。例如全 国森林资源调查, 只能采用抽样调查。当观察或测试具有破坏性, 例 如显像管的使用寿命或种子的发芽率等, 这时也只能采用抽样调查。 本章首先介绍抽样调查的一些基本概念, 然后介绍常用的简单随 机抽样调查、分层抽样和整群抽样等方法。,8.1 抽样调查的概念及注意事项,8.1.1 概率抽样与非概率抽样 概率抽样是指按一定的概率抽样样本, 即使总体中的每个单位 都有一定的机会被抽中, 因而概率抽样又称随机抽样。概率抽样可以避免各种主观因素的

3、影响,从而保证样本的代表性。概率抽样不仅可以根据样本对总体目标量作出估计, 同时还可以给出这种估计的精度。 采用概率抽样时,若总体中的每个单位被抽中的概率相等, 称 为等概率抽样。而当总体中的每个单位被抽中的概率不相等时, 则 称为不等概率抽样。采用不等概率抽样时, 需要有关总体单位的某 些辅助资料。在一些实际问题中,应采用不等概率抽样。,例 8.1.1,采用以乡为单位的随机抽样估计某省某年度的出生人数。令 第 i 个单位的出生人数( ) 则该省的出生人数的估计为,其中 N 为该省乡的总数。 当各乡人口数 的差异较大时,会使各乡出生人数 的差异也较大, 从而使抽样估计精度较低。若各乡人口数 已

4、知, 从而全省总人口数 已知, 则可采用每个乡被抽中概率与乡人口数的大小成比例的不等概率抽样。即第 i 乡被抽中概率为 。,例,即把样本平均出生率乘以全省人口数作为全省出生人数的估计。不等概率抽样可以提高估计的精度。,于是, 该省的出生人数的估计为,非随机抽样,非随机抽样是按一定要求选择一些单位组成样本,这种抽样调查有许多不同的抽取样本方法。例如重点调查和典型调查就属于非随机抽样。采用非随机抽样时不能作统计推断。则不能由样本估计总体,或只能对总体目标给出一个估计, 而不能给出估计的精度。,8.1.2 抽样单位和抽样框,为了便于抽样调查, 按抽样调查的目的和要求, 通常把总体划分为若干个部分,

5、每个部分作为抽样调查的基本单位, 每个部分称为一个抽样单位(简称单位)。抽样单位可以是自然单位, 也可以是人为划分的。抽样单位可以包含一个个体, 也可以包含若干个个体, 即抽样单位还可以分级。例如, 对某地小学生的视力状况进行抽样调查时, 可以把每个小学生作为抽样单位, 或把每个班作为抽样单位。也可以把班作为一级单位, 而把学生作为二级单元, 抽取样本时先抽班, 然后再抽学生。,抽样框,通常, 抽样框是一份包含所有抽样单位的名单。给每个抽样单位编一个号码, 就可以按一定的方法抽取单位组成样本。抽样框中应该有抽样单位的名称和地理位置等信息, 从而在某个抽样单位被抽取后, 根据抽样框,能够找到这个

6、抽样单位。 由于抽样单位可以分级, 于是有相对应的不同级的抽样框。在抽样调查中, 抽取哪一级单位, 有同级的抽样框即可。 当抽样框存在重复或遗漏时, 使抽样总体与实际总体不一致, 从而会造成非抽样误差。,8.1.3 调查表的设计及注意事项,根据抽样调查目的和要求, 把调研问题逐步细化为一份调查表,即问卷。设计问卷, 使调查表内容标准化和规范化, 并便于计算机处理。 问卷由以下几部分组成: (1)被调查者的基本情况 根据需要, 可以包括性别、年龄、民族、文化程度、职业、家庭人口等, 以便对资料进行分类。但不应包含一些被考察者不太愿意回答的内容, 例如:单位、姓名、家庭地址等。 (2)调查内容 也

7、就是问题, 这是问卷的主题。 因此, 问题的设立是问卷设计中的关键。问卷设计的原则:,调查表的设计及注意事项,(a)长度适当 一份问卷包含的问题不应过多。 实践证明, 如果问卷的问题过多, 被调查者往往会产生厌烦情绪, 从而敷衍了事, 影响调查质量。 (b)问题的次序合理 前面安排轻松或容易回答的问题, 比较敏感或难度较大的问题可放在问题的最后。 (3)问卷填写说明 为了使答卷规范, 问卷中必须有填写说明, 对填写问卷的要求和方法作出说明。 (4)编号 问卷的问题应编号, 为便于计算机录入处理, 应设立编码栏。编码最好与问题的序号相一致。 在正式调查前, 应按正式调查的程序进行试调查, 以便发

8、现问题从而加以改进。,8.1.4 调查数据的审核,为保证数据的质量, 在取得调查数据后, 应对原始数据进行检 查、核对, 对验收合格的调查问卷进行编码和录入。 1.调查数据的审核 应从完整性和准确性两个方面去审核。 (1)完整性审核 检查调查表是否填写齐全。 (2)准确性审核 检查数据是否有错误,是否符合要求。 2.计算机录入与编辑 抽样调查的数据通常都由计算机进行处理分析, 因而对验收合 格的调查表进行编码和录入, 为统计分析作准备。,8.2 简单随机抽样 8.2.1 定义,设总体包括 N 个单位, 用 表示第 i 个单位的标 志值, 从总体不放回地抽取 n 个单位组成的样本, 则有 个不同

9、样本。若每个样本都有相同的机会被抽中, 即每一个样本被抽中的概率为 , 则称这种抽样方法为简单随机抽样。具体抽样时,通常是逐个等概率抽取单位。对于一个由任指定的 n 个单位组成的样本,在第一次抽取时,这 n 个单位中的某一个被抽中的概率为 。 在第二次抽取时, 其余的 n -1 个单位中的某一个被抽中的概率为 。 最后, 在第 n 次抽取时, 剩下的一个单位被抽中的概率为 。 因而在 n 次不放回抽取时, 这n 个指定单位被抽中的概率为,简单随机抽样示意图,8.2.2 简单随机抽样的实施,采用简单随机抽样方法抽取样本时, 可先把总体的 N 个抽样单位从1到 N 编号。然后利用随机数表产生随机数

10、来抽取 n 个不同的数, 这 n 个数所对应的单位就组成了简单随机样本。 例如总体有N =35 个抽样单位, 要抽取 n =7 的一个简单随机样本。若以随机数表(见附表12)第 1 页的第 10 行及第 8 列作为起始点,则从第 10 行的第 8、9 列开始, 自上而下(也可从左到右)选出头 7 个在0135之间不同的数。而 00 及 3699 都舍弃。当这 2 列随机数不够时, 则转到右边相邻的 2 列。 由于是不放回抽样, 遇到相同的数应放弃。这7个数为 03,20,12,16,33,22,19,例,设某班有 N =35 名学生, 他们的学号为 97104589710492。 现要随机抽取

11、 n =7 名学生的高等数学课程成绩, 用简单随机抽样抽取样本。首先对全部名学生从1到35编号, 即 9710458 1, 9710459 2, ,9710492 35 则由已取得的7个随机数据, 应抽取高等数学课程成绩的7名学生的学号为 9710460,9710477, ,9710476 也可以从76开始自左向右选出头7个在 0135 之间的数(同样,3699应舍弃), 这7个数为 05,13,33,30,24,11,34,N 较小时的方法,对于N =35, 由于第一位数字小于5, 上述方法的效率较低。这时可采用如下的方法: (1) 当随机数在3670之间时减35。 (2) 00 及 719

12、9 舍弃。 仍从76开始,自上而下选出头 7 个为 05,03,20,08,13,12,17 另外,还可以用计算机产生的随机数抽取样本。当 N 不大时, 也 可以用抽签的方法抽取样本。,8.2.3 目标量的估计量,总体单位标志值用 表示 , 而样本单位标志值用 表示。 抽样调查目的通常是要了解某个总体特征数, 也称为总体目标量。主要有如下几种:,()总体总和(总量),例如全省粮食总产量, 全省总人口数等。,()总体平均值,例如全省粮食平均亩产量, 全省户平均人口数等.,()总体比例,其中 为总体中具有某种属性的单位数。例如某企业产品的合格率,某校在校生的男生比例等。 对总体的每个抽样单位, 可

13、以定义如下的标志值,1, 若第 i 个抽样单位具有该属性 0, 否则,则,从而总体比例可视为总体平均值的特例。,(8.2.1),估计量,8.2.4 估计量的性质与误差,推论,推论8.2.1 是 X 的无偏估计量。 当用 估计 时, 称 为 的均方误差。 显然, 若 , 则 。,定理,定理,推论,定理,其中,证明:,由于,于是,定理 8.2.3,推论 8.2.3,(1) (2),其中,(8.2.5),推论 8.2.3,8.2.5 区间估计,例 8.2.1,某科研单位对中国人的面部自然肤色,测定从新生婴儿直到老年人的色度特征。用简单随机抽样抽取1668人进行测定,测得数据如下。,表8.2.1 肤色

14、色度抽样数据,例,(1)求中国人男性和女性的肤色反射率平均值的估计值。 (2)求中国人男性肤色反射率平均值的估计值的标准差。 (3)求中国人男性肤色反射率平均值的0.95置信区间。 解 按反射率样本数据, 则,(1)男、女肤色反射率平均值的估计值分别为,例,例8.2.2,例,例,从而吸烟职工总数的0.95置信区间为,8.2.6 样本容量的确定,在抽样调查后, 根据样本数据估计总体目标量时, 不仅可以给出总体目标量的估计值, 同时还可以给出这种估计的精度(或误差限)以及相应的置信度。同时, 在抽样调查前,可以根据对总体目标量的规定估计精度和置信度确定所需的样本量。 1.估计时规定均方误差2. 若

15、要求,即,则 n 应满足,(8.2.7),(8.2.8),2. 估计时规定绝对误差限和置信度,规定绝对误差限和置信度,3.,估计 时规定,4.,估计 时规定 d 和置信度,例8.2.3,8.3 分层抽样法,分层抽样示意图,8.3.1分层抽样的定义及适用范围,但当总体各单位间差异很大时, 则可依据与 X 有关的一个或几个标志对总体进行分组(或层), 使各组内的单位差异较小, 而各组间的差异较大。这样, 对各组分别作抽样调查时的估计精度较高, 各组样本合并后估计总体时的精度同样也较高。这就是分层抽样法(例8.3.1和例8.3.2)。若抽样调查除估计总体外, 还要估计总体的各组成部分(例8.3.3), 或为便于抽样调查的组织管理工作(例8.3. 4), 同样也可采用分层抽样。,8.3.2 分层抽样的样本抽取,先把总体的 N 个抽样单位划分成 K 个互不重复的子总体, 每个 子总体称为层, 各层包含的单位数分别为 。 然后,在每个层中独立地抽取一个子样本, 各层的样本的容量分别为 。本章仅讨论每层都采用简单随机抽样的分层抽样, 这种分层抽样又称为分层随机抽样。,8.3.3 目标量的估计量,估计量,估计量的方差,方差的估计,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号