抽样课件讲稿1_2

上传人:F****n 文档编号:108108800 上传时间:2019-10-22 格式:PPT 页数:35 大小:92KB
返回 下载 相关 举报
抽样课件讲稿1_2_第1页
第1页 / 共35页
抽样课件讲稿1_2_第2页
第2页 / 共35页
抽样课件讲稿1_2_第3页
第3页 / 共35页
抽样课件讲稿1_2_第4页
第4页 / 共35页
抽样课件讲稿1_2_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《抽样课件讲稿1_2》由会员分享,可在线阅读,更多相关《抽样课件讲稿1_2(35页珍藏版)》请在金锄头文库上搜索。

1、抽样调查,中国人民大学统计学院,第1 章 绪论,1.1 调查与抽样调查,调查(survey):通过使用明确的概念、方法和程序,依据专门设计的调查方案指导的方式,从一个总体全部或部分单元中搜集感兴趣的指标信息,并将这些信息综合整理成数据系列的有关活动。 例:调查北京市民对出租车行业的满意度调查,全面调查与非全面调查,根据“调查是否针对总体的所有单元”划分: 全面调查: 普查 非全面调查,非全面调查相对于全面调查的优点: (1)时间短速度快; (2)费用少成本低; (3)调查结果比较准确; (4)应用范围广泛。,应用前提,抽样调查的基本概念,抽样调查(sampling survey)是一种非全面的

2、调查,指从研究对象的全体(总体)中抽取一部分单元作为样本,根据对所抽取的样本进行调查,获得有关总体目标量的了解。 抽样调查的作用 1节约费用 2时效性强 3可以承担全面调查无法胜任的项目 4有助于提高调查数据的质量,根据“单元是否按照一定的概率入样”划分: 概率抽样和 非概率抽样,随机抽样是指按照概率原则,从总体中抽取一定数目的单位作为样本进行观察,随机抽样使总体中每个单位都有一定的概率被选入样本,从而使根据样本所做出的结论对总体具有充分的代表性。 非随机抽样是以方便为出发点或根据研究者主观的判断来抽取样本。非随机抽样主要依赖研究者个人的经验和判断,它无法估计和控制抽样误差,无法用样本的量化数

3、据来推断总体。,概率抽样调查 非概率抽样调查,优点: 能够保证样本的代表性,避免人为因素的干扰; 用概率抽样取得的样本去估计总体特征时,可以对由抽样产生的抽样误差进行估计。,缺点: 难以评价样本的代表性 无法估计抽样误差 偏倚往往较大,概率(随机)抽样(probability sampling ) 非概率(非随机)抽样(non- probability sampling ),抽样调查应用领域,社会经济现象的调查 社会性的民意调查 市场调查,1.2 基本概念,目标总体与抽样总体 抽样框与抽样单元 总体参数与统计量 估计量方差、偏差、均方误差 抽样误差与非抽样误差 精度与费用,目标总体与抽样总体,

4、总体 目标总体也可简称为总体,是指所要研究对象的全体,或者说是希望从中获取信息的总体,它是由研究对象中所有性质相同的个体所组成 组成总体的各个个体称作总体单元或单位。 抽样总体是指从中抽取样本的总体。,抽样框与抽样单元,抽样总体的具体表现是抽样框。通常抽样框是一份包含所有抽样单元的名单。 抽样框的形式:名单、手册、地图、数据包等等。 抽样框的要求: (1)抽样框必须是有序的,即抽样单元必须编号,且根据某种顺序进行了排列。 (2)抽样框中包含的抽样单元务必要“不重不漏”,否则将出现抽样框误差。 抽样单元分级: 初级单元次级单元三级单元四级单元基本抽样单元。,总体参数和(样本)统计量,总体参数:总

5、体是调查的客体,而总体参数是总体某个特征或属性的数量表现。 常见的总体参数有4种:(1)总体总值;(2)总体均值;(3)总体比例;(4)总体比率。 总体总值、总体均值、总体比例三者是统一的,它们都可以用总体均值来表示。,why,统计量和估计方法,统计量是根据样本的n个单元的变量值计算出的一个量,也叫估计量,用于对总体参数的估计。 估计量是随机变量,比如样本均值 估计方法:最常见的估计方法是简单线性估计,除此之外,还可以借助于辅助变量。 辅助变量必须满足的两个条件:(1)与要估计的变量高度相关;(2)其总体信息已知。,估计量方差、偏差、均方误差,估计量分布的方差称为估计量方差,它是从平均的意义上

6、说明估计值与待估参数的差异状况,也是我们对抽样方案进行评价的标准之一。 估计量方差表达式:,偏差是指按照某一抽样方案反复进行抽样,估计值的数学期望与待估参数之间的离差。 偏差的表达式 : 对于无偏估计量 ,偏差为零 。,均方误差(Mean Square Error, MSE )指所有可能的估计值与待估参数之间离差平方的均值,它等于估计量方差加偏差的平方。,抽样误差与非抽样误差,抽样误差:抽样误差是由于抽取样本的随机性造成的样本值与总体值之间的差异,只要采用抽样调查,抽样误差就不可避免。 抽样误差是一个一般的概念,它可以用不同的量值来表示。例如:估计量方差或估计量标准差。 非抽样误差:是相对于抽

7、样误差而言的,它不是由于抽样的随机性,而是由于其它多种原因引起的估计值与总体参数之间的差异。 包括:抽样框误差、计量误差、无回答误差等,精度与费用,调查的费用是一个与样本量有关的函数,最简单的是线性费用函数。 最优抽样设计:指以最小的费用达到要求的精度或者在给定费用的情况下达到最大的精度,精度由误差来表现。 抽样误差与样本量有关,样本量越大,在其它条件相同情况下,抽样误差就越小,抽样调查的精度就越高。,几种基本的抽样方式,概率抽样调查 非概率抽样调查,简单随机抽样 分层抽样 系统抽样 整群抽样 多阶段抽样,判断抽样(包括典型调查和重点调查) 便利抽样 自愿样本 滚雪球抽样 配额抽样等,简单随机

8、抽样,简单随机抽样(simple random sampling)又称纯随机抽样,考虑一个包含N个单位的母体,从中抽取n个单位作为样本。如果抽样是不放回的,即同一个单位不能在样本中重复出现,那么总共有C(N,n) 种不同的取法,也就是说共有C(N,n)个可能的不同样本。如果每个样本被抽中的概率都相等,则称这种抽样方法为简单随机抽样,所得到的样本叫做简单随机样本(SRS)。,例题: 某大学欲了解该校研究生中打算报考托福人数的比例,全校研究生共有570人,随机抽取了100人,其中有14人准备参加托福考试,试以95%的把握程度对研究生中欲报考托福人数的比例作出估计。,分层抽样,分层抽样(strati

9、fied sampling)又称类别抽样,它是先将总体所有单位按某些重要标志进行分类(层),然后在各类(层)中采用简单随机抽样或系统抽样方式抽取样本单位的一种抽样方式。例如,对员工收入状况进行调查,就可将员工按职业不同,分为生产人员、商业人员、服务性工作人员等各层,再从各层中抽取员工。,等比例抽样 不等比例抽样 优点 更为精确 对每层的推论,系统抽样,系统抽样是将N个总体单位按一定顺序排列,先随机抽取一个单位作为样本的第一个单位,然后按某种确定的规则抽取样本的其它单位。 其中最简单也是最常用的规则是等间隔抽取。所以系统抽样又称等距抽样。,系统抽样,排列顺序与调查项目无关 排列顺序与调查项目有关

10、 例如,从600名大学生中抽选50名大学生 利用学校现有名册按顺序编号排序,从第001号编至600号。 抽选距离=N/n=600/50=12(人) 如从第一个12人中用简单随机抽样方式,抽取第一个样本单位,如抽到的是8号,依次抽出的是20号,32号,44号等。 ,系统抽样,优点 均匀地分布 简单易行 缺点 抽样误差计算较为复杂 周期性重合时会影响调查的精确度 需要较为详细、具体的相关资料,整群抽样,整群抽样是先将总体划分成许多不相重合的子总体或群,然后以群为抽样单位,按某种随机方式从中抽取若干个群,形成一个“群”的随机样本,对抽中的群内所有单位都进行调查。 例如,某大学要调查学生的视力,可以将

11、班做为一个群,随机抽取几个班,对这些班的全部学生进行调查。,整群抽样,一是没有总体最终单位的抽样框 实施便利、节省费用 影响整群抽样误差的主要是群间方差。分群时使群内方差尽可能大,使群间方差尽可能小。 整群抽样的估计精度一般低于简单随机抽样,多阶段抽样(multi stage sampling),多阶段抽样是指抽取样本单位时分几个阶段进行: 首先在总体中按随机原则抽取若干初级(一级)单位, 然后再从被抽中的初级单位中抽取若干次级(二级)单位,这种抽样称为二阶段抽样。 如果每个次级单位又可以进一步分为更小的三级单位,那么在每个被抽中的二级单位中再抽取三级单位,这称为三阶段抽样, 以此类推,可以定

12、义更多阶段的抽样。,多阶段抽样,例如,全国性调查,省;市或县;街道、镇、或乡,等等。 在大规模的抽样调查中,特别是当抽样单位为各级行政单位时,通常都采用多阶段抽样。 优点: 样本单位相对集中,实施调查比较方便,可以节省调查费用。 抽样时并不需要全部低级单位的抽样框,非随机抽样技术,原因: 1受客观条件限制,无法进行严格的随机抽样; 2为了快速获得调查结果; 3在调查对象不确定,或无法确定的情况下采用,例如,对某一突发(偶然)事件进行现场调查等; 4总体各单位间离散程度不大,且调查员具有丰富的调查经验时。,非随机抽样技术,方便抽样 根据调查者的方便与否来抽取样本,“街头拦人法” 判断抽样 凭研究

13、人员的主观意愿、经验和知识,从总体中选择具有典型代表性样本作为调查对象 平均型”或“多数型” 按照一定标准,主观选取样本,非随机抽样技术,配额抽样 事先要对总体中所有单位按其属性、特征分为若干类型,这些属性、特征称为“控制特征”。如被调查者的姓名、年龄、收入、职业、教育程度等; 然后,按照各个控制特征分配样本数额。 简单易行,样本具有较高的代表性 雪球抽样 前提:是总体单位之间具有一定的联系,,1.4 抽样调查步骤,(1) 确定调研问题 (2) 抽样方案设计 (3) 问卷设计 (4) 实施调查过程 (5) 数据处理分析 (6) 撰写调查报告,抽样方案设计内容,第一、确定抽样调查的目的、任务和要求; 第二、确定调查对象的范围和抽样单位; 第三、确定抽取样本方法; 第四、确定必要的样本数; 第五、对主要抽样指针的精度提出要求; 第六、确定总体目标量的估算方法; 第七、制订实施总体方案的办法和步骤。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 幼儿/小学教育 > 小学教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号