应用统计学统计资料整理

上传人:jiups****uk12 文档编号:38452360 上传时间:2018-05-02 格式:PPT 页数:53 大小:199KB
返回 下载 相关 举报
应用统计学统计资料整理_第1页
第1页 / 共53页
应用统计学统计资料整理_第2页
第2页 / 共53页
应用统计学统计资料整理_第3页
第3页 / 共53页
应用统计学统计资料整理_第4页
第4页 / 共53页
应用统计学统计资料整理_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《应用统计学统计资料整理》由会员分享,可在线阅读,更多相关《应用统计学统计资料整理(53页珍藏版)》请在金锄头文库上搜索。

1、2 130011 0010 1010 1101 0001 0100 1011 第4章 统计资料整理 本章主要阐述统计资料加工整理的基本理论和基本方 法,包括分类、汇总、列表、绘图等统计资料整理的技术 性知识。 41 统计资料整理程序 42 品质数列 43 变量数列 44 空间数列 45 时间数列 46 相关数列 47 平衡数列 48 统计表的设计 湖南商学院信息系 龚曙明2 130011 0010 1010 1101 0001 0100 1011 应用统计学41 统计资料整理程序 统计整理是根据统计研究的需要,对统计调查获得 的原始资料进行分类、汇总列表,或对次级资料进行再 加工的工作过程。统

2、计资料整理的任务在于使统计资料系统化、综合 化和系列化,为揭示和推断总体的数量特征提供初步加 工的统计信息。统计资料整理的一般程序如下:2 22 130011 0010 1010 1101 0001 0100 1011 应用统计学411 设计整理方案 统计资料整理方案的主要内容包括:分组方法、统计 指标、整理表式、汇总方式和方法的设计与选择,整理的 时间和质量要求等等。412 审核统计资料 主要是审核原始资料或次级资料的完整性、准确性和 时效性,以便发现问题进行纠正、补充或删除。审核的方法主要有复计审核、逻辑审核、表表审核、 表实审核、对比审核等,其中复计审核主要有平衡审核、 加总审核。 3

3、32 130011 0010 1010 1101 0001 0100 1011 应用统计学413 统计分组v 1.统计分组是根据统计研究的需要,按一定的标志或 标准将总体各单位区分为若干组(类)的一种统计方法。 统计分组对总体而言,是将总体区分为性质不同的若干部 分;对个体而言,是将性质相同或相近者归为一类,从而 体现组间的差异性和组内的同质性。v 2.统计分组的作用在于划分现象的类型,揭示现象的 内部结构及分布特征,显示现象之间的依存关系。v 3.统计分组的标志有品质标志(属性水准)和数量标 志(数量水准)两大类。v 4.统计分组的关键在于分组标志的选择和各组界限的4 42 130011 0

4、010 1010 1101 0001 0100 1011 应用统计学划分。应根据统计研究的目的、现象所处的具体历史条件 ,选择具有本质性的标志作为分组标志。v 5.统计分组的结果通常表现为统计数列,归纳起来,有以下六类:1品质数列。指同一时间总体各单位按某一品质标志(属性水准)分类而形成的数列,又称属性数列。2变量数列。指同一时间总体各单位按某一数量标志(数量水准)分类而形成的数列3时间数列。指同一统计总体的某一变量或统计指标依时间顺序排列而成的数列。4空间数列。指同一时间、同一变量或统计指标而5 52 130011 0010 1010 1101 0001 0100 1011 应用统计学不同地

5、区、部门、单位的统计数据依特定次序排列而成 的数列。5相关数列。指具有一定联系的不同变量或统计指标在不同时间或不同空间条件下的数值按照一定顺序 排列而成的数列。6平衡数列。指根据总体内部有关变量或统计指数之间的数量平衡关系而编制的统计数列。6 62 130011 0010 1010 1101 0001 0100 1011 应用统计学414 统计汇总 v1.统计汇总是在统计分组的基础上,采用手工汇总或 计算机汇总技术求出各组的单位数、总体单位数、各组指 标、总体综合指标等。1.手工汇总技术主要有划线法、过录法、折叠法、 卡片法、单据分类汇总法等;2.电子计算机汇总一般包括编程、编码、数据录入 、

6、逻辑检索、自动汇总计算、制表打印等工作程序。它具 有速度快、精度高和存贮数据等特点,特别适合于大批量 数据处理。v2.统计汇总的组织方式有逐级汇总、集中汇总、逐级 与集中汇总相结合三种。 7 72 130011 0010 1010 1101 0001 0100 1011 应用统计学415 表现统计资料 统计资料表现或陈示的形式有以下五种:v 1统计表。统计表是以纵横交叉的线条所绘制的 表格来表现统计资料的形式,它能有条理、有系统地排 列和组织统计资料。v 2统计图。统计图是以圆点多少、直线长短、曲 线起伏、条段长短、柱状高低、面积或体积大小、实物 形象大小或多少、地图等图形来表现统计资料。v

7、3统计报告。统计报告是采用文字与数据相结合 的方式表现统计资料。其特点是文数结合,数为基础。 统计报告是表现统计资料的高级形式。8 82 130011 0010 1010 1101 0001 0100 1011 应用统计学v 4. 统计模型。统计模型是采用数学模型来描述变量 或统计指标之间的数量关系。v 5统计数据库。统计数据库是利用计算机技术,以 一定的组织方式存储在一起的相关统计数据的集合,它能 以最佳的方式和最少的数据冗余为多种统计应用服务。 9 92 130011 0010 1010 1101 0001 0100 1011 应用统计学4 42 2 品质数列品质数列 421 品质数列编制

8、v 1. 品质数列是指同一时间、空间条件下,某种品质属性的统计资料,按照特定的分组次序排列而成的一种分布数列。具有各组名称和各组次数两个基本要素,又称性质数列或属性分布数列。在此基础上,可进一步计算各组的比率(频率),则属性的不同表现及其相应的频率构成属性数列的频率分布。v 2. 编制品质数列的关键在于正确选择品质分组标志和划分各组的界限。其步骤: 10102 130011 0010 1010 1101 0001 0100 1011 应用统计学 1选择分组标志。应根据统计研究目的,选择能够 反映现象本质特征的、主要的品质标志作为分组的依据。 特别是对某些重大问题的统计研究,需要选择多个品质标

9、志作为分类依据,这种由一系列的相互联系和相互补充的 品质标志对现象进行多种分组的体系,称为品质标志分组 体系。 2划分各组的界限。编制品质数列时,各组名称 确定后,而各组的界限或范围更需要作出明确的规定。 3. 决定品质数列的形式。应根据统计研究的目的和 要求而决定。 简单分组品质数列。即对统计总体只按一个品质标志 分组而形成列。11112 130011 0010 1010 1101 0001 0100 1011 应用统计学 平行分组品质数列。即对统计总体同时采用两个或两 个以上的品质标志进行平行排列的分组(面分类)而形 成的品质数列。 复合分组品质数列。即对统计总体同时采用二个或二 个以上的

10、品质标志层叠起来进行分组(线分类)而形成 的品质数列。 4统计汇总。即求出品质数列中各组的单位数和 总体单位数,以及各组的比率或频率。某些品质数列还 应汇总求出各组的标志总量和总体的标志总量,以及有 关的综合指标。 5编制统计表。即把按品质标志分组整理好的统 计资料,用统计表的形式陈示出来,最终形成品质数列 。12122 130011 0010 1010 1101 0001 0100 1011 应用统计学423 品质数列图示用统计图表现品质数列能使人们获得明确和深刻的印 象。常用的品质数列图有直线图、长条图、圆面图三种。v1.直线图:是以直线的长短来表示属性统计指标数量 大小的图形。常以横轴代

11、不同组别,纵横代表各组的组数 或频率。v2.长条图。是以若干等宽平行长条的长短来表示属性 统计指标数量大小的图形。也是以横轴代表不同的组别, 纵轴代表各组的次数或频率。v3.长条图中的长条亦可改用长条柱和圆柱体代替,转 化为立体图,以增加图形的美观性和感染力。13132 130011 0010 1010 1101 0001 0100 1011 应用统计学v 4圆面图。是以圆形的面积代表总体指标数值,圆 形的各扇形面积代表各组指标数值,或将圆形面积分为若 干角度不同的扇形,分别代表各组的频率。(在实际应用 时,亦可将圆面改为圆饼或圆台,变成圆形立体图)。14142 130011 0010 101

12、0 1101 0001 0100 1011 应用统计学4 43 3 变量数列变量数列 431 变量数列编制变量数列是指同一时间、空间条件下,某种数量属 性不同的统计数据按数量大小排列而成的分布数列。变 量数列是由变量的不同取值及其相应的次数或频数两个 要素构成,在变量数列的基础上,计算出各组的频率, 可形成变量数列频率分布,它是由变量的不同取值及其 实际上相应的频率构成。变量数列编制方法和步骤如下:v 1. 决定变量数列的形式。有两类:离散型变量数列 和连续型变量数列; 15152 130011 0010 1010 1101 0001 0100 1011 应用统计学离散型变量数列按变量取值个数

13、的多少和变量值变动 的程度大小、又分为单项数列和组距数列;连续型变量数 列因变量取值连续宜编制组距数列。组距数列按组距是否 相等又分为等距数列和异距数列。一般按下列原则决定变量数列的形式。(1)离散型变量的取值个数少,且变量变动程度小,可 编制单项数列,即采用列举式的分组方式,按变量值大小 先后顺序排列;(2)离散型变量的取值个数较多;且变量值变动的程度 较大,宜编制组距数列。(3)连续变量的取值范围较大,且取值无极端偏斜分布 状态时,宜编制等距数列。 16162 130011 0010 1010 1101 0001 0100 1011 应用统计学(4)连续型变量或离散变量的取值若按一定的比例

14、 关系变化,或变量的取值呈极端偏斜分布状态时,宜编制 异距数列。 异距数列中,各组次数的多少受组距不同的影响,在 研究各组次数或频率的实际分布时,宜计算次数密度(次 数/组距)或频率密度(频率/组距),以消除因组距不同 各组次数和频率不可比的影响。而分布图的编制应按次数 密度或频率密率绘制。因此,从明确地反映总体分布的特 征考虑,编制组距数列时,应尽量采用等距分组的方法。 v 2. 求全距R。全距是变量值中的最大值与最小值之差 ,又称极差。求全距的目的是为了考察变量值的变动范围 ,为决定变量数列的组数和组距提供依据。 17172 130011 0010 1010 1101 0001 0100

15、1011 应用统计学v 3. 确定组数和组距。确定组数和组距是编制变量数 列的关键,组数的确定应考虑组距数列的各组之间应充分 反映事物的不同性质的差异及其分布特征。组距是每组的 大小距离,常用全距(R)除以组数(i)求得。v 4. 确定组限。组距决定之后,应进一步确定每组的 界限(上限和下限),每组的最小值为下限,最大值为上 限。离散型变量组距数列,相邻两个组的上限和下限应间 断。连续型变量组距数列,相邻两个组的上限和下限一般 应重叠。若变量的取值中有特大、特小值时,为使分组符合穷 举和互斥的原则,可设置开口组:最前组定为“以下 ”,最高组定为“以上”。 18182 130011 0010 1010 1101 0001 0100 1011 应用统计学组中值的计算有三种情形:(1)组中值=(上限+下限)/2(2)缺下限开口组的组中值=上限相邻组组距/2(3)缺上限开口组的组中值=下限+相邻组组距/2v5.列表计算各组频数和频率。将原始数据分别归人所 属各组(连续型变量组距数列的上限不在本组内,列入上 一组),即可得到各组的频数。为了满足统计研究的需要 ,亦可计算累计频数和累计频率。 有两种:1较小制,由变量值低的组向变量值高的组累计, 较小制表明各组上限以下的累计频

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号