第二章(第一部分)数据的收集

上传人:小** 文档编号:55055809 上传时间:2018-09-24 格式:PPT 页数:115 大小:2.14MB
返回 下载 相关 举报
第二章(第一部分)数据的收集_第1页
第1页 / 共115页
第二章(第一部分)数据的收集_第2页
第2页 / 共115页
第二章(第一部分)数据的收集_第3页
第3页 / 共115页
第二章(第一部分)数据的收集_第4页
第4页 / 共115页
第二章(第一部分)数据的收集_第5页
第5页 / 共115页
点击查看更多>>
资源描述

《第二章(第一部分)数据的收集》由会员分享,可在线阅读,更多相关《第二章(第一部分)数据的收集(115页珍藏版)》请在金锄头文库上搜索。

1、第二章 统计数据的搜集,第二章 统计数据的搜集,第一节 数据的计量与类型 第二节 统计调查 第三节 数据整理 第四节 数据的显示,第一节 数据的计量与类型,一. 数据的计量尺度 二. 数据的类型和分析方法,四种计量尺度,数据的计量尺度,定类尺度 (Nominal scale ),计量层次最低 对事物进行平行的分类 各类别可以指定数字代码表示 使用时必须符合类别穷尽和互斥的要求 数据表现为“类别” 具有=或的数学特性,定序尺度 (Ordinal scale ),对事物分类的同时给出各类别的顺序 比定类尺度精确 未测量出类别之间的准确差值 数据表现为“类别”,但有序 具有或的数学特性,定距尺度 (

2、Interval scale ),1. 对事物的准确测度 2. 比定序尺度精确 3. 数据表现为“数值” 4. 没有绝对零点 5. 具有 + 或 - 的数学特性,定比尺度 (Ratio scale ),1. 对事物的准确测度 2. 与定距尺度处于同一层次 3. 数据表现为“数值” 4. 有绝对零点 5. 具有 或 的数学特性,四种计量尺度的比较,计量尺度,数学特性,“”表示该尺度所具有的特性,第二节 统计调查,一. 统计调查的要求 二. 统计调查的种类 三. 统计调查方案设计 四. 统计调查组织形式 五. 统计调查的具体方法 六. 统计调查误差,2.1 统计调查的要求,1.定义 根据统计研究的

3、目的,运用科学的手段向调查单位取得原始资料和次级资料的过程。 2.统计调查的要求 准确性 及时性 全面性,统计调查组织形式,2.2 统计调查组织形式,统计报表 (statistical report forms),1. 统计调查方式之一 2. 过去曾经是我国主要的数据收集方式 按照国家有关法规的规定、自上而下地统一布置、自下而上地逐级提供基本统计数据 统一的表式、统一的指标、统一的报送时间和报送程序 调查范围比较全面、项目比较系统、指标内容相对稳定 4. 有各种各样的类型,统计报表 (statistical report forms),优点和特点 可以事先布置到基层填报单位,使统计报表的资料来

4、源有可靠的基础 采用逐级上报、汇总的形式 它是经常性调查,内容又相对稳定,有利于积累资料和进行历史对比,从而系统分析社会经济现象发展变化的规律,统计报表分类 (statistical report forms),按调查范围不同 全面统计报表和非全面统计报表 按报送时间不同 日报、旬报、月报、季报、半年报和年报统计报表 凡年报能满足需要的,就不用季报、月报;凡月报能满足的,就不用日报、旬报,统计报表分类 (statistical report forms),按报送范围不同 国家报表 根据有关的国家统计调查项目和统计调查计划制定的统计报表,也叫国民经济基本统计报表。 从整个国民经济的角度出发制定,

5、并按照国民经济的部门来划分 搜集整个国民经济和社会发展情况的基本统计资料 部门报表 根据有关部门的统计调查项目和统计调查计划制定的统计报表 地方报表 根据有关地方统计调查项目和统计调查计划制定的统计报表,统计报表分类 (statistical report forms),按填报单位不同 基层报表 基层报表主要由基层企、事业单位填报 综合报表 综合报表是由主管部门根据基层报表逐级汇总填报的统计报表,普查 (census),为特定目的专门组织的非经常性全面调查 人口普查、工业普查、农业普查、物资库存普查、耕地面积普查等 通常是一次性或周期性的 “0”的年份进行人口普查,“3”的年份进行第三产业普查

6、,“5”的年份进行工业普查,“7”的年份进行农业普查,“1”或“6”年份进行基本单位普查。,普查特点 (census),普查是一次性的定期调查 普查一般要规定统一的标准时间 数据一般比较准确,规范化程度也较高 普查的适用对象比较窄,只能调查最基本、最一般的现象 普查,顾名思义,是将所要研究的对象作普遍性的调查,它比其他任何一种调查形式更能掌握大量、详细、全面的统计资料。,普查的组织 (census),普查的组织方式按其搜集资料的具体方法不同,可以分为两种 通过专门组织的普查机构,配备一定数量的普查人员,对调查单位直接进行登记 利用调查单位的原始记录和核算资料,下发一定的调查表格,由被调查单位进

7、行核实填报来进行 普查按其资料汇总特点的不同,又可分为一般普查和快速普查,抽样调查,概率抽样 (probability sampling),也称随机抽样 定义 按照随机原则从调查对象中抽取一部分单位作为样本进行观察,并根据所获得的样本数据,对调查对象总体的数量特征作出具有一定可靠程度的估计和推算。 抽取样本时使每个单位都有一定的机会被抽中 3. 特点 样本单位是按随机原则抽取的,从而排除了主观因素对选样的影响 根据部分调查的实际资料对调查对象总体的数量特征作出估计 抽样误差可以事先计算并加以控制 概率抽样最能满足于统计调查的要求,概率抽样 (probability sampling),4.适用

8、范围 对一些不可能或不必要进行全面调查的客观现象,只能采用抽样调查 破坏性的产品质量检查、对居民手存现金情况的调查 对普查资料进行必要的修正 抽样调查可以用于工业生产过程的质量控制 利用抽样调查还可以对总体的某种假设进行检验,从而明辨是非,以决定行动的取舍,简单随机抽样 (simple random sampling),从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的 最基本的抽样方法,是其它抽样方法的基础 重复抽样、不重复抽样 特点 简单、直观,在抽样框完整时,可直接从中抽取样本 用样本统计量对目标量进行估计及计算估计量误差都比较方便 局限性 当N很大时,不易构造抽

9、样框 抽出的单位很分散,给实施调查增加了困难 没有利用其它辅助信息以提高估计的效率,分层抽样 (stratified sampling),先对总体各单位按主要标志加以分组,然后再从各组中按随机原则抽取一定单位构成样本,它是统计分组和简单随机抽样的结合应用 优点 保证样本的结构与总体的结构比较相近,从而提高估计的精度 组织实施调查方便 既可以对总体参数进行估计,也可以对各层的目标量进行估计,整群抽样 (cluster sampling),将总体各单位分成若干群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查 特点 抽样时只需群的抽样框,可简化工作量 调查的地点相对集中,节省调查费用,方便

10、调查的实施 缺点是估计的精度较差,系统抽样 (systematic sampling),将总体中的所有单位(抽样单位)按某一标志排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位 先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k等单位 分为无关标志排队和有关标志排队 优点:操作简便,能提高样本单位分布的均匀性,样本代表性强,可提高估计的精度 缺点:对估计量方差的估计比较困难,多阶段抽样 (multi-stage sampling),例 在一个省的范围内,要从100多万农户中抽取1000户进行农户家计调查。 第一阶段,在全省所有

11、县中随机抽取若干个县; 第二阶段,在抽中的县中随机抽取若干个乡; 第三阶段,在抽中的乡中随机抽取若干个村;在所有被抽中的村中再随机抽取农户,并使这些农户总数达到预定的样本单位数。,多阶段抽样 (multi-stage sampling),先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查 多阶段抽样中每个阶段的抽样方式可用简单随机抽样或等距抽样 ,最后阶段抽取样本单位时还可采取分层随机抽样 ,多阶段抽样实际上也是多种方式的组合抽样 具有整群抽样的优点,保证样本相对集中,节约调查费用 不需要包含所有低阶段抽样单位的抽样框;同时由于实行了再抽样,使调查单

12、位在更广泛的范围内展开 在大规模的抽样调查中,经常被采用的方法,实例分析,中国城市(镇)生活与价格年鉴是一部比较全面地反映中国城市(镇)人民生活水平和各类价格指数的综合年鉴,主要内容包括城镇居民家庭收支调查资料、城市发展基本情况资料和价格调查资料。,具体步骤,调查户的抽选工作分两步进行: 进行一次性的大规模城镇住户基本情况抽样调查,采取分层、二阶段与大小成比例(PPS)的随机等距方法抽样,也称一相样本。 首先按照城镇规模将全国所有的城镇划为三层:大中城市(地级和地级以上的城市)、县级市和县城(镇) 按各层人口占全国人口的比例来分配每层的样本量 按城镇就业者年人均工资从高到低排队,依次计算各城镇

13、人口累计数,然后根据样本量的大小随机起点等距抽取所需的调查城镇。 根据第一步抽样调查取得的家庭人口、就业人口、收入等资料进行分组,从中按比例抽出一个小样本也称二相样本,作为经常性调查户,开展家庭日记记帐工作。,概率抽样 (probability survey),1. 从总体中随机抽取一部分单位(样本)进行调查,4. 具有经济性、时效性强、适应面广、准确性高等特点,2. 目的是推断总体的未知数字特征,3. 最常用的调查方式,一 次 失 败 的 抽 样 调 查,一次失败的统计调查,在1936年的美国总统选举前,一份名为 Literary Digest 杂 志进行了一次民意调查。调查的焦点是谁将成为

14、下一届总 统是挑战者,堪萨斯州州长Alf Landon,还是现任总统 Franklin Delano Roosevelt。为了解选民意向,民意调查专 家们根据电话簿和车辆登记簿上的名单给一大批人发了简单 的调查表(电话和汽车在1936年并不像现在那样普及,但 是这些名单比较容易得到)。尽管发出的调查表大约有一千 万张,但收回的比例并不高。在收回的调查表中, Alf Landon非常受欢迎。于是该杂志预测 Landon 将赢得选举 。但事实上是Franklin Roosevelt赢得了这次选举 在经济大萧条时期调查有电话和汽车的人们,并不能够反映 全体选民的观点。此外,只有少数的问卷被收回。这些

15、都是 值得怀疑的,非概率抽样 (non-probability sampling),相对于概率抽样而言 抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查 有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等方式,方便抽样 (convenient sampling),调查过程中由调查员依据方便的原则,自行确定入抽样本的单位 调查员在街头、公园、商店等公共场所进行拦截调查 厂家在出售产品柜台前对路过顾客进行的调查 优点:容易实施,调查的成本低 缺点:样本单位的确定带有随意性,样本无法代表有明确定义的总体,调查结果不宜推断总体,判断抽样 (ju

16、dgment sampling),研究人员根据经验、判断和对研究对象的了解,有目的选择一些单位作为样本 有重点调查,典型调查等方式 判断抽样是主观的,样本选择的好坏取决于调研者的判断、经验、专业程度和创造性 抽样成本比较低,容易操作 样本是人为确定的,没有依据随机的原则,调查结果不能用于对推断总体,重点调查和典型调查 (概念要点),典型调查(model survey) 从调查对象的全部单位中选择少数典型单位进行调查 典型可以是单个的,也可以是整群的;可以是临时的,也可以是固定的 “解剖麻雀式” 、“划类选典式”的典型调查,重点调查(key-point investigation) 从调查对象的全部单位中选择少数重点单位进行调查 重点单位是指在总体中举足轻重的那些单位,这些单位在总体中虽然数目不多,所占比重不大,但就调查的标志值来说却在总体标志总量中占有很大的比重 调查任务和调查对象的特点决定着是否适宜进行重点调查,自愿样本,被调查者自愿参加,成为样本中的一分子,向调查人员提供有关信息 例如,参与报刊上和互联网上刊登的调查问卷活动,向某类节目拨打热线电话等,都属于自愿样本 自愿样本与抽样的随机性无关 样本是有偏的,往往集中于某类特定人群 不能依据样本的信息推断总体,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 经营企划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号