目录第二章 数据的收集与整理 2第一节 数据的收集 3一、数据的来源 3二、统计调查方案设计 3三、统计调查方法 5四、统计调查的组织方式 5第二节 数据的整理 8一、数据的审定 8二、数据的分组 8第三节 次数分布 9一、次数分布数列及其种类 9二、变量数列的编制 9英文摘要与关键词 13习 题 14第二章 数据的收集与整理通过本章的学习,我们应该知道1. 数据的来源2. 数据是如何收集的3. 数据是如何整理的4. 如何做次数分布表数据的收集与整理是依据统计分析的目的和要求,有组织有计划地搜集数据资料并对其进行去伪存 真、去粗取精的分类整理、浓缩简化的工作过程它是进行统计分析的必要前提,是保证统计数据客观、 真实、准确、可靠的关键由于我们所研究的现象复杂多变,特别是在市场经济条件下,利益主体的多元 化以及同行之间保守商业秘密,要取得令人满意的数据成为一个相当艰巨的过程这就使得数据的收集与 整理,成为人们所关注和研究的重要问题第一节 数据的收集数据收集,就是根据统计研究的目的要求,采用一定组织形式与科学方法,进行采集与研究问题有关 的各类数据信息的工作过程。
数据收集是一种广义的统计调查,其收集的总体范围可大可小,收集的内容 可简单亦可复杂,可以是原始资料也可以是次级资料,收集的方式灵活多样一、数据的来源 按照获取途径不同,数据可分为原始数据和次级数据资料原始数据也称为第一手资料,是反映被调 查对象原始状况的资料如原始记录、统计台帐、调查问卷答案、实验结果等次级数据也称为第二手资 料,是已经存在的经他人整理分析过的资料如期刊、报纸、广播、电视以及因特网上的资料,各级政府 机构公布的资料,企业内部记录和报告等一般在可能的情况下尽量使用第一手资料,它比第二手资料更 加丰富、更加准确使用第二手资料是因为其收集成本和所花费时间比较节省数据集01 的数据来自《中国统计年鉴》,数据集02 是世界银行根据各国国家所报送的资料整理的, 所以它们是次级数据;数据集03 是直接对公司职工情况的记录;数据集04 是直接从流水线上采集的,所 以它们都是原始数据一般而言,统计调查是获取数据的主要形式,收集到的主要是第一手资料;查阅文献、年鉴,上因特 网等是获取统计资料的辅助形式,收集到的主要是第二手资料在信息化时代,数据成为海洋如何在数据海洋中汲取丰富的营养而不被大海的波涛吞没?首先应该 对自己的事业投入更多的精力,对它有更清晰的理解;其次是掌握信息渠道,即知道自己所需要的数据如 何获得;再者就是对获得的数据进行深度加工,成为指导我们决策的依据。
如数据集02是1995年的资料,十年过去了,现在的情况怎么样了?你知道如何去收集现在的资料吗? 网络链接: 世界银行的数据库 http://devdata.worldbank.org/data-query/除了著名的国际组织、各国的官方统计机构免费提供宏观数据外,许多行业组织和咨询机构也以免费 或收费的方式提供行业数据、企业数据库以支持企业决策网络链接:数据中华一情报分析 index.asp二、统计调查方案设计数据收集的主要形式是统计调查,它是一项复杂的工作要搞好统计调查必须按照统计任务的要求, 运用科学的方法,有组织、有计划地进行为使统计调查得以顺利进行,在组织调查之前,必须首先设计 一个周密、可行的调查方案统计调查方案的设计包括以下内容:1. 明确调查目的 明确调查目的,就是要明确统计调查要解决什么问题,为什么要进行统计调查只有明确了调查目的, 才能有的放矢,才能根据调查目的收集与之相关的资料这样,既可以降低调查成本,又可以保证调查资 料的时效性例如,我国进行了五次人口普查,其目的均不一样1953年人口普查,是为了准备全国人民 代表大会及地方人民代表大会的选举做好选民登记工作,并为国家的经济、文化建设提供确实的人口数字。
1964 年人口普查,是为了给编制国民经济建设第三个五年计划和长远规划提供依据 1982 年人口普查是 为了进行社会主义现代化建设,统筹安排人民的物质和文化生活,制订人口政策和规划,提供人口资料1990 年人口普查是为了查清中国人口在数量、地区分布、结构和素质方面的变化,为科学地制定国民经济 和社会发展战略与规划,安排人民的物质和文化生活,检查人口政策执行情况,提供可靠的资料2000 年 人口普查,是为了准确查清人口在数量、地域分布、结构素质和居民环境等方面的变化情况,获得社会经 济、人口等方面大量而丰富的信息调查目的一定要表述清楚,调查项目的设定取决于调查目标2. 确定调查对象和调查单位调查对象和调查单位是根据调查目的而确定的所谓调查对象是指需要调查和研究的由许多性质相同 的调查单位所组成的现象总体所谓调查单位,是指所要研究的个体,也就是我们所要调查的具体单位, 它是进行调查登记的标志承担者例如,调查目的是为了获取国有企业的改制状况,那么,所有的国有企 业就是调查对象,而具体的每一个国有企业就是调查单位确定调查对象是一个比较复杂的问题,因此,必须明确总体界限,划清调查的范围,区别应调查和不 应调查的现象。
例如调查城镇居民家庭收入状况,必须把城镇居民家庭与农村居民家庭的收入区分开来; 调查城镇家庭中工人收入状况,除了明确城镇家庭的范围外,还必须区分工人的界限确定调查单位,既 是一个理论问题,又是一个实际问题,从理论角度出发,就是要赋予调查单位以科学的定义从实际工作 出发,还要区分调查单位与报告单位调查单位是调查项目的承担者,而报告单位则是负责上报调查资料 的单位两者有时一致,有时不一致上面例子中,当收集城镇居民家庭收入状况资料时,每一个城镇家 庭既是调查单位,也是报告单位;当收集居民家庭中工人收入状况资料时,城镇居民家庭中的工人则是调 查单位,而城镇居民家庭则是报告单位3. 确定调查项目调查项目就是调查中所要登记的调查单位的特征,即调查单位所承担的基本标志,它由一系列品质标 志和数量标志所构成调查项目所要解决的问题是,向被调查者调查什么,即需要被调查者回答什么问题 在拟定调查项目时应注意如下四个问题:(1)调查少而精;(2)需要和可能相结合;(3)调查项目之间应 具有联系性;(4)有的项目可拟定“选择式”列入计划的调查项目是依据调查目的而确定的,仍以历年的人口普查为例,1953 年人口的项目为: 与户主关系、姓名、性别、年龄、民族以及本户住址 6 项;1964 年人口普查增加了本人成分、文化程度 和职业 3 个项目;1982 年人口普查项目增加为19项,增加了常住人口的户口登记状况、在业人口的行业、 职业和不在业人口状况,生育子女总数、存活子女总数和生育胎次等;1990 年人口普查项目增加到21 项, 增加了“五年前居住地及其城乡类型”和“迁移原因”两个项目。
4. 调查表与问卷的设计调查表,就是把若干调查项目按照一定的顺序排列在表格上,就形成了调查表调查表一般有两种: 一种是一览表,另一种是单一表一览表是在调查项目不多时采用,它是将许多调查单位填写在一张表上; 单一表一般用于项目较多的调查,该表可容纳较多的标志,每个调查单位填写一份调查时应采用哪种表 式,则需根据调查的目的和任务而定利用调查表,能够有条理地收集到所需要的资料,便于资料汇总整 理问卷调查是一种特殊的调查形式,根据调查目的,在调查对象中随机选择或有意识地确定调查单位 问卷是以书面文字或表格的形式了解被调查者的意见,被调查者可自愿、自由地回答问卷中所提出的问题在设计调查表和问卷时,应尽可能地简明扼要,便于被调查者回答,以保证所收集资料的准确性5. 确定调查时间和调查期限调查时间是指调查资料所属的时间在统计调查中,有的资料所反映的现象是在某一时点上的状态, 这时必须规定统一的时点;有的资料所反映的现象是在某一时期内发展过程的结果,这时则必须明确所要 收集的资料所属时期的起止时间;即所登记的资料应是该时期第一天到最后一天的累计数字如,我国第 五次人口普查的调查标准时点是2000年11月 1日零点;例如,调查某年第二季度全国钢铁产量,则调查 时间应从 4 月 1 日起至 6 月 30 日止。
调查期限是指进行调查工作的时限,即调查工作的起止时间,它包 括收集资料和报送资料的工作所需要的时间为保证资料的时效性,调查时限应尽可能地缩短例如,我 国第五次人口普查规定的时限为:2000年 11月 1日至 11月 10 日登记完毕,则调查时限为10 天6. 制定调查的组织实施计划 制定严密细致的实施计划,是统计调查得以顺利进行的必要保证调查工作的组织计划包括的内容是: 建立调查机构,组织与培训调查人员,确定调查步骤,明确调查方式、方法及调查地点,落实调查经费的 来源与经费使用计划,确定调查资料的报送方法和公布调查结果的时间等三、统计调查方法1. 现场观察法 现场观察法是观察者带有明确目的到观察现场,借助人的视觉、听觉或者录音录像设备,对调查对象 进行直接观察而获得信息资料的一种收集方法,又称为直接观察法其优点,能够保证所收集资料的准确 性;其缺点,观察成本较大(耗用人力、物力、财力、时间等较大),由于观察者认识事物的能力不同, 并带有主观见解,其结果往往因人而异采用该种方法则应遵循:客观性、全方位性、深入性、持久性以 及遵守纪律与道德等原则2. 报告法 报告法亦称通讯法这种方法是被调查者根据统计报表的格式要求,按照隶属关系,逐级向有关部门 上报统计资料的一种调查方法。
这种方法是根据《统计法》的规定,要求各地区、各部门、各单位必须对 国家履行的一种义务现行统计报表制度就是采用的这种方法3. 问卷法 问卷法,是指资料收集者运用统一设计的问卷向被调查者了解情况、征询意见的资料收集方法问卷 法的优点是:省时、省钱、省力,所得资料便于定量处理与分析,可以避免主观偏见、减少误差,具有很 好的匿名性;问卷也有缺点,即:回收率以及资料的质量均难以保证运用此法在设计问卷时,应注意: 所提问题要简短、准确,避免复重提问,提问应避免带有倾向性和诱导性,更不要直接提出具有敏感性或 威胁性的问题4. 访谈法 访谈法是有目的、有计划、有方向的运用口头交谈方式向被调查者了解问题的一种统计资料收集方法 它的基本性质是具有显著的目的性、计划性与方向性该种方法的优点是:被调查对象的回答率大大高于 问卷法,适应性强,调查内容机动性大,访谈者对资料收集过程可进行有效控制其缺点是:访谈成本大, 匿名性差,访谈结果与访谈人员的素质、能力及其现场表现直接相关5. 实验采集法 实验采集法,是指资料收集者,通过实验对比获取统计资料的一种方法一般作法是,从影响问题的 诸多因素中选出一至若干个因素,在一定的实验条件下观察其反映,然后对实验结果进行对比分析,并确 定是否大规模推广。
实验收集法的应用范围较广如对某一商品在改变其品种、价格、包装、广告等任何因素时,均可采 用此方法一般是先作小规模的试验性改变,以观察顾客的各种反映具体的试验方法有试用、试穿、试 听、现场表演等等利用该种方法可以取得较为正确的原始资料,但其成本高、研究时间长四、统计调查的组织方式1. 统计报表统计报表(statistical report forms)是指依照国家统计局或国家各行政管理部门的规定,自上而下地统 一布置,以一定的原始记录为依据,按照统一的表式,统一的指标项目,统一的报送时间与报送程序,自 下而上地逐级定期提供基本统计资料的一种调查方式2. 普查普查(census)是对调查对象。