统计学原理:第2章_数据的搜集与整理

上传人:人*** 文档编号:569721292 上传时间:2024-07-30 格式:PPT 页数:28 大小:173.50KB
返回 下载 相关 举报
统计学原理:第2章_数据的搜集与整理_第1页
第1页 / 共28页
统计学原理:第2章_数据的搜集与整理_第2页
第2页 / 共28页
统计学原理:第2章_数据的搜集与整理_第3页
第3页 / 共28页
统计学原理:第2章_数据的搜集与整理_第4页
第4页 / 共28页
统计学原理:第2章_数据的搜集与整理_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《统计学原理:第2章_数据的搜集与整理》由会员分享,可在线阅读,更多相关《统计学原理:第2章_数据的搜集与整理(28页珍藏版)》请在金锄头文库上搜索。

1、第二章 数据的搜集与整理本章内容2.1 数据的计量与类型2.2 统计数据的搜集2.3 统计数据的整理1第2章数据的搜集与整理2.1数据的计量与类型2.1.1数据的计量尺度2.1.2数据的类型2.1.3统计数据的表现形式上一页下一页返回本章首页2第2章数据的搜集与整理2.1.1数据的计量尺度一、定类尺度也称名义(nominal)尺度,是按照事物的属性对其进行平行的分类或分组,计量结果表现为某种类别,虽然有时为了统计处理而用数字和编码表示,但并不能区分优劣大小和数学运算。如人口的性别,企业的类型等。计量层次(精确程度)最低。3第2章数据的搜集与整理二、定序尺度 又称顺序(ordinal)尺度,是对

2、事物之间的类别差或次序差的一种尺度,计量结果虽然也表现为类别,但它们可以比较顺序。如产品的等级,态度,考查的成绩等。 定序尺度比定类尺度精确一些,但结果只能比较顺序大小,不能进行数学计算。4第2章数据的搜集与整理三、定距尺度也称间隔(interval)尺度,是对事物类别或次序之间间距的测度,通常使用自然或物理单位作为计量的尺度,计量结果表现为数值。可以比较大小和计算差值。如收入用人民币度量,考试成绩用百分数度量,温度用摄氏“度”来度量等。5第2章数据的搜集与整理四、定比尺度 也称比率(ratio)尺度,是在定距尺度的基础上,所形成的尺度。这类数据的突出特点是0点具有明确的含义。 而且,任何计量

3、单位都可以通过一个比例常数换算成另一种相应的单位。 这种简单的比例关系在间隔数据中是不存在的。6第2章数据的搜集与整理2.1.2数据的类型一、根据统计数据反映现象的信息特点的不同,统计数据有两种基本的类型:v属性数据(attributeorqualitativedata):反映现象的品质方面的信息。如:汽车的颜色、品牌;工人的性别、工资等级。v变量数据(variableorquantitativedata):反映现象的数量方面的信息。如产品的价格、数量;人的年龄、身高。7第2章数据的搜集与整理属性数据是由定类或定序尺度计量形成的;结果通常表现为文字。如颜色:红、黄、蓝等;性别:男、女;工资级别

4、:一级、二级等。变量数据是由定距或定比尺度计量形成;结果表现为数值。变量数据:离散型(discrete),采用计数方式得到;连续型(continuous),采用测量方式得到。8第2章数据的搜集与整理二、统计数据按照来源可以分为:v原始数据(primary):来源于直接的调查或科学实验。能直接满足统计目的的需要,是最新的数据。可靠,费时,代价高。v第二手数据(secondary):来源于已经存在的资料,是由他人调查、试验或处理的结果。便利、省时、经济但可靠性差。9第2章数据的搜集与整理2.1.3变量数据的表现形式根据统计数据反映事物的信息内容不同,变量数据有两种不同的表现形式:绝对数和相对数。v

5、绝对数(有名数):反映事物的绝对规模或水平的数据。v相对数(无名数):反映事物的相对规模或水平的数据。10第2章数据的搜集与整理2.2统计数据的搜集这里讲的数据的搜集是指第一手资料的取得。由于科学试验主要是取得自然科学数据的渠道,我们只介绍统计调查方式方法。2.2.1数据搜集的基本方法2.2.2统计调查的组织方式2.3.3统计调查方案的设计11第2章数据的搜集与整理2.2.1数据搜集的基本方法原始数据的搜集方法有时也称为调查方法。常用的基本方法有:v访问(访谈)调查:通过面对面地询问和观察取得信息。个人访谈和小组访谈。v邮寄调查:被调查者将填好的调查问卷寄回到指定的资料收集点。邮寄、传真。v电

6、话调查:通过电话交流取得必要的信息。经济、省时。12第2章数据的搜集与整理2.2.2统计调查的组织方式统计调查的组织方式是指组织统计调查、搜集信息资源的方式方法。主要有:v普查(generalinvestigation,census)v抽样调查(samplesurvey)v统计报表(systemofreportingstatistics)13第2章数据的搜集与整理一、普查专门组织的一次性的全面调查。主要用于搜集处于一定时点状态上的重要的社会经济现象的总量数据。通常是一次性的或周期性的;需要规定统一的标准调查时间;费时费力,数据准确可靠、详细全面;在不宜或不能用全面统计报表时使用。14第2章数据

7、的搜集与整理二、抽样调查是一种非全面调查,选取部分单位(作为样本)时遵循随机原则。目的是为了推断总体的特征。特点:经济性,时效性高,准确性高,适应面广。适用范围:不可能或不必要进行全面调查的现象;对普查资料进行必要的修正。15第2章数据的搜集与整理三、统计报表(制度)自上而下布置,自下而上按照统一的表式、统一的指标、统一的报送时间和报送程序逐级提供统计基本数据。资料来源:基层单位的原始记录和统计台账。由全面和非全面之分。以制度为保证。调查项目相对稳定,有利于积累资料。16第2章数据的搜集与整理四、重点调查和典型调查1)重点调查:选择部分在所要研究的总体数量特征上占较大比重的个体,了解总体数量的

8、基本情况。2)典型调查:由一是选择部分代表性的个体,认识事物发展变化的原因和规律。主要用于定性研究。17第2章数据的搜集与整理2.2.3统计调查方案的设计调查方案是对整个调查工作的通盘考虑和安排,是指导调查工作的纲领性文献。v调查方案一般包括以下内容:调查目的:调查对象和调查单位:调查项目和调查表:调查时间:调查方法:调查的组织和实施计划 18第2章数据的搜集与整理2.3统计数据的整理数据整理是指对统计调查阶段所取得的各种统计资料进行一定的加工,使其条理化、系统化符合统计分析要求的过程。2.3.1数据整理的基本内容2.3.2 数据的分组和频数分布2.3.3 频数分布的图示和类型2.3.4 案例

9、与Excel工具19第2章数据的搜集与整理2.3.1数据整理的基本内容1. 数据清单结构的建立与数据录入 数据清单是指包含相关数据的一系列工作表的数据行。 数据清单可以作为数据库使用,其中行表示记录,列表示字段。 数据清单的第一行中包含列标,通常称列的名称为变量或标志,或字段 行的名称为观察值,每一个单格中包含了一个变量所发生的数值。数据的审核与筛选 上一页下一页返回本节首页20第2章数据的搜集与整理2.数据的审核与筛选 为了保证数据的质量,为整理和分析打下基础,通常要对调查阶段取得的数据进行审核和筛选。对原始数据主要进行完整性和准确性两方面的审核。对第二手数据还要进行实用性和实效性的审核。对

10、审核发现的错误应进行纠正,当不能纠正,或存在不符合要求的数据时,就需要对数据进行筛选。21第2章数据的搜集与整理3. 数据排序与分组 一般来说,录入数据清单的数据是无序的,不能反映现象之本质与规律性。为了使用的方便,要将其进行排序、分组。v将数据按要求排列,便于浏览数据发现一些明显的特征或趋势;v将数据分组,可以研究数据的内部构成,体现数据内部的差异,便于进一步研究现象之间的数量关系。上一页下一页返回本节首页22第2章数据的搜集与整理 4. 编制频数分布表与累计频数分布表频数分布表可以表明各组间的单位数在总体中所出现的次数或所占比重,从而描述总体的内部结构,揭示总体中的关键因素与本质特征。累计

11、频数分布则能够表明各标志值以上或以下所出现的次数或比重。 5. 统计图 各种各样的统计图可以形象、直观地表明数据的分布形态与发展变化的趋势。上一页下一页返回本节首页23第2章数据的搜集与整理2.3.2数据的分组与频数分布一、 数据的分组(classification) 数据的统计分组是数据整理的一项主要内容,是根据统计研究的需要,按照某种标准将统计数据分成不同的组别。通过统计分组,有利于解释数据的信息,描述数据的统计分布,体现数据的结构和进行进一步的统计分析。数据的统计分组也是对总体的一种分类。 数据分组的方法与数据的类型有关,由于属性数据本身就是事物的分类或排序的结果,因此有关属性数据的分组

12、比较方便,就是根据数据的不同结果分为若干组,每组数据表现为该种属性特征的同一种结果。如人口的性别数据只能分为两组:男、女。 24第2章数据的搜集与整理v属性数据的分组也称为品质标志分组。v变量数据的分组称为变量分组,变量分组根据数据的不同类型有两种分组方法:单变量值分组,组距分组。单变量值分组:变量值相同的归为一组。使用数据较少且为离散型的情形。组距分组:每个组别包含一个区间范围的数据。适合于数据较多或者连续变量的情形。 组距分组需要解决组数、组距、组限(或组边界)、组中值等问题。为了研究数据的分布,大部分情况下,采用等距分组。25第2章数据的搜集与整理二、频数分布v确定分组方法形成组别后,就

13、要进行各组内包含的数据个数进行汇总,汇总的结果就是得到各组包含的数据观察的个数,称为频数(或次数)。v把各组次数与相应的组别按照顺序排列而成的数列称为频数分布(数列),相应的表格称为频数分布表。v由频数分布表,还可以求出频率分布,累计频数分布和累计频率分布。上一页下一页返回本节首页26第2章数据的搜集与整理建立频数分布的步骤如下:先对数据进行排序,以了解全部数据的变动范围;选择全部数据的分组组数;确定分组的组限,最后对各组数值所出现的频数进行计数。上一页下一页返回本节首页27第2章数据的搜集与整理2.3.3数据分布的图示与类型一、频数分布的图示方法v直方图(histogram)v折线图(polygon)v曲线图(ogive)v饼形图(piechart)二、频数分布的类型对称钟型(正态分布)、矩形(均匀分布)偏态(左偏、右偏、J型)、双峰上一页下一页返回本节首页28第2章数据的搜集与整理

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号