统计数据整理与显示

上传人:飞*** 文档编号:49118131 上传时间:2018-07-23 格式:PPT 页数:60 大小:490.50KB
返回 下载 相关 举报
统计数据整理与显示_第1页
第1页 / 共60页
统计数据整理与显示_第2页
第2页 / 共60页
统计数据整理与显示_第3页
第3页 / 共60页
统计数据整理与显示_第4页
第4页 / 共60页
统计数据整理与显示_第5页
第5页 / 共60页
点击查看更多>>
资源描述

《统计数据整理与显示》由会员分享,可在线阅读,更多相关《统计数据整理与显示(60页珍藏版)》请在金锄头文库上搜索。

1、统计数据整理与 显示学习目标n理解数据整理的意义及一般步骤n深刻理解统计分组在数据整理中所 起的重要作用n掌握次数分布表的编制方法n了解统计表的设计要求n了解统计图的种类及适用场合 第一节 统计数据整理的意义及步骤 一、统计数据整理的意义 n统计数据整理即统计整理,就是根据统 计研究的任务,对搜集得到的原始数据 进行审核、分组、汇总,使之条理化,系统 化,变成能反映各组及总体特征的综合数 据的工作过程。对已整理过的资料(包括 历史资料)进行再加工也属于统计整理。统计整理的意义表现在以下三 个方面:n统计整理是我们对客观事物从感性认识 上升到理性认识的连接点。通过调查取 得的资料只是我们对事物的

2、一种感性认 识,只是事物的表象。 n统计整理是进行统计分析的前提。 n数据整理在整个统计研究中占有重要地 位。 二、统计数据整理的步骤 统计数据整理是将搜集到的原始数据条理化、系 统化,使之符合统计分析与推断的要求。通过 整理可以大大简化数据,更有效地显示和提供 所包含的统计信息。根据统计研究的目的和内 容,统计整理一般分为以下几个步骤:u1.拟定整理方案u2.数据预处理u3.统计分组或分类u4.统计汇总u5.编制统计表、绘制统计图1.拟定整理方案整理方案是数据整理工作的指导性文件,体现了 整理工作的具体规划和要求,主要内容是确定 数据预处理方法、分组或分类汇总的方式方法 、人员及工作进程安排

3、等。在实际工作中,整 理方案就是一系列汇总表式的总称,包括一套 综合汇总表、填表说明、统一的分类标准或目 录等。整理方案的正确性和合理性是保证数据 整理工作有计划并顺利进行的基础,方案设计 应力求科学、周密。2.数据预处理 数据预处理是在数据分组或分类之前所做 的必要处理,包括数据的审核和筛选。n数据的审核n数据的筛选 3.统计分组或分类 统计分组或分类是数据整理的关键环节, 也是一切统计研究的基础,在统计研究中 占有重要地位。有关统计分组或分类的详 细内容在下一节再做详细论述。4.统计汇总 n在统计分组基础上,将所有数据分别归纳到各 组中去,计算各组单位数和总体单位数,计算 出各组指标和总体

4、指标的数值,使反映总体单 位的资料转化为反映总体综合数量特征的过程 称为统计汇总或数据汇总。 n数据汇总技术主要有手工汇总和计算机汇总两 种。手工汇总是借助算盘和小型计算器等手工 操作方式进行的汇总。 5.编制统计表、绘制统计图 数据分组和汇总后,将汇总得到的各项 资料编制成各种统计表,再将表中的数 据绘制成不同形状的统计图。统计表和 统计图是数据整理结果的基本表现形 式,可以更加直观、简明地反映客观现 象数量方面的具体表现和有关联系,便 于进一步的数据分析。第二节 统计分组或分类 n一、统计分组的概念 根据统计研究目的和现象的内在特点,将现象总 体按照某一(或某些)标志划分为性质不同的组 成

5、部分,称为统计分组或分类。通过分组,将现 象总体区分为性质不同的几个部分,使性质不同 的单位分开,性质相同的单位合在一个组内,这 样有助于从数量方面揭示总体内部各部分的关 系,更深入地研究总体的特征和规律性。 二、统计分组的作用 统计分组的作用主要表现在以下几个方面: 1、划分社会经济类型。n统计分组是确定社会经济现象各种类型 的基础,例如将国民经济按三个产业划 分,将工业企业按所有制的不同划分、 按轻重工业划分,居民按城镇、农村划 分,从而说明不同的经济类型的特点。 一般来说,社会经济类型的分组多采用 品质标志来划分。 2.研究总体内部的结构n通过统计分组可以反映总体内部各部分 之间的差别和

6、相互关系,表明总体的内 部结构n同时在各组的基础上计算各组所占总体 的比重,从总体的构成上认识总体各部 分的作用,并对总体作出正确的评价。 3、分析现象之间的依存关系n社会经济现象之间存在着相互制约、相 互联系的关系,通过统计分组可以根据 现象间的影响因素和结果因素的对应更 好地揭示现象之间的这种依存关系。 三、统计分组的方法n1.正确选择分组标志n分组标志的选择是统计分组的关键。分组标志 ,即将同质总体区分为不同组的标准或依据。 分组标志一旦选定,就必然突出了总体在该标 志下的性质差别,其他的差别看不见了。分组 标志选择不当,不但无法显示现象的根本特征 ,甚至会混淆事物的性质,歪曲社会经济的

7、真 实情况。 2.按品质标志或按数量标志分组n统计分组根据分组标志的性质不同可分 为按品质标志分组和按数量标志分组。n按品质标志分组即定性数据的分组;按 数量标志分组即定量数据的分组。 按品质标志分组 n按品质标志分组就是用反映事物的属性、性质 的标志分组,它可以将总体单位划分为若干性 质不同的类型。例按职工性别、民族、文化程 度的分类。n品质标志分组一般较简单,分组标志一旦确定 ,组数、组名、组与组之间的界限也就随之确 定。有些复杂的品质标志分组可根据统一规定 的划分标准和分类目录进行。 按数量标志分组 按数量标志分组的目的并不是单纯确定各组在数量上的 差别,而是要通过数量上的差别来区分各组

8、的性质,反 映总体本质的特征。因此,在按数量标志进行分组时, 应当根据研究目的,首先确定总体在已选定的数量标志 的特征下有多少种性质不同的组成部分,然后再研究确 定各组成部分的数量界限,使分组的数量界限能够区分 现象性质上的差别。数量标志分组方法从以下几个方面 来说明: n单项式分组和组距式分组 n等距分组和不等距分组n组限重叠和组限不重叠 1)单项式分组和组距式分组 n n对于离散型变量,如果变量值的变动幅对于离散型变量,如果变量值的变动幅 度小,变化又很均匀,就可以一个变量度小,变化又很均匀,就可以一个变量 值对应一组,称单项式分组。值对应一组,称单项式分组。如居民家 庭按儿童数或人口数分

9、组、纺织工人按 看管机器台数分组等均可采用单项式分 组。n离散型变量如果变量值的变动幅度很大 ,变量值的个数很多,这时若采用单项 式分组,很可能出现组数过多,各组又 没有几个单位的情况,不能很好地反映 总体各单位在各组的分布状况,从而失 去分组的意义。比如,按职工人数对工 业企业进行分组,由于各企业职工人数 差别很大,采用单项式分组就很不现实 ,这就需要采用组距式分组。n对于连续型变量,由于其变量值是连续不断的 ,不能一一列举,故不能采用单项式分组,只 能采用组距式分组。n把全部变量值依次划分为几个区间,各个变量 值则按其大小确定所归并的区间,区间的距离 称为组距,这样的分组称为组距式分组。在

10、组 距式分组中,被分成的各个组不是一个具体的 数值,而是一个数值区间。用于表示各组数量 界限的变量值称为组限,其中组内的最小值为 该组的下限,最大值为该组的上线。n进行组距式分组,组距和组数的确定是很重要 的。确定组距和组数时,应以能够显示数据分 布特征和规律为目的,还应考虑到组内的同质 性。如果组距过大,组数过少,分组虽然简单 ,但可能将性质不同的单位分在同一组内,数 据分布特征的真实性将受到影响。如果组距过 小,组数过多,则数据的分布又过于分散,不 便于了解数据分布的集中趋势。总之,分组时 应根据统计研究目的和数据本身的特点,确定 适当的组距与组数。2)等距分组和不等距分组n组距式分组有等

11、距分组和不等距分组之 分。各组的组距都相等的分组,称为等 距分组。各组组距不都相等的分组,称 为不等距分组,也叫异距分组。如果变 量值变动比较均匀,则可以采用等距分 组;如果变量值变动很不均匀,变动幅 度较大,则需要采用不等距分组。n比如,对人口总体按年龄分组,可根据 人口成长的生理特点分成06岁(婴幼 儿组)、717岁(少儿组)、1859岁 (中青年组)、60岁以上(老年组)等 四组。具体分组时采用那一种组距,要 根据总体性质和研究目的而定。一般情 况下尽量采用等距分组,以便于比较分 析数据的频数分布特征。3)组限重叠和组限不重叠的分 组n划分组距式分组的分组界限是统计分组的又一关键问 题。

12、采用组距式分组时,各组组限的划分应遵循“不重 不漏”的原则。“不重”,是指一项数据只能分在其中的 某一组,不能在其他组中重复出现;“不漏”,是指组 别必须穷尽,即所分的全部组别要包含所有数据,不 能遗漏任何一项。为解决“不重”问题,对于离散型变 量,可以采用相邻组限间断(不重叠)的办法。比如 ,企业按工人人数分组可表示为:199人以下、200 499人、500999人、10001999人、2000人以上等 。n而对于连续型变量,则必须采用相邻组 限重叠的方法,通常根据“上组限不在本 组内”的规定解决不重的问题,即在分组 时,采用某一组的上限同时也是下一组 的下限这样的重叠组限,刚好等于某一 组

13、上限的变量值不计算在本组内,而计 算在下一组内。n比如,学生按考试成绩分组,分为:60分以下 、6070分、7080分、8090分、90分以上 五组,70分这个变量值既是6070分这一组的 上限也是7080分这一组的下限,在分组时, 70分不计算在6070分这一组内,而是把它归 到7080分这一组。为便于计算分析,对于离 散型变量也可以采用相邻两组组限重叠的方法 ,一般遵循“上组限不在本组内”的规定解决“不 重”问题n在组距式分组中,如果数值中有极大值或极小值存在 ,为避免出现空白组或个别极端值被漏掉,第一组和 最后一组可以采用“xx以下”及“xx以上”这样的开口组。n组距式分组掩盖了组内数据

14、分布的状况,为反映各组 数据的一般水平,通常用组中值作为该组数据的一个 代表值。每组上下限之间的中点数值称为组中值,即 组中值=(上限+下限)/2.开口组的组中值一般是参考 相邻组的组距计算,公式为:n缺下限的开口组的组中值=上限-相邻组组距/2n缺上限的开口组的组中值=下限+相邻组组距/2n使用组中值代表数据的一般水平时,通常假定 各组数据在本组内呈均匀分布,若不满足假定 条件,用组中值作为一组数据的代表值就会有 一定的误差。n综上所述,离散型变量根据实际情况既可采用 单项式分组,也可采用组距式分组,组限既可 重叠,也可不重叠;连续型变量只能采用组距 式分组,并且组限必须重叠。3.简单分组和

15、复合分组 根据数据分析的需要,可以对调查数据进行简单 分组或复合分组。所谓简单分组,是指对总体只 按一个标志进行的分组。比如,人口总体只按性 别分组,学生总体只按考试成绩分组等。 所谓复合分组,是指对研究总体按两个或两个以 上标志进行的多层次分组,比如,职工总体先按 技术级别分组,在此基础上再按性别分组,形成 如下复合分组:职工初级中级高级女性男性女性女性男性男性4 统计分组体系n1).平行分组体系平行分组体系就是对同一总体同时选择两 个或两个以上的标志分别进行简单分组,然后 并列在一起就形成了平行分组体系。n 2).复合分组体系复合分组体系就是将总体按两个或两个以 上的标志结合起来进行层叠分

16、组,形成复合分 组体系。 第三节 次数分布 一、次数分布的概念 n次数分布是指将总体中的所有单位按某个标志分组后 ,所形成的总体单位数在各组之间的分布。分布在各 组的总体单位数叫做次数或频数。各组次数与总次数 之比叫做比重、比率或频率。次数分布是统计分组的 必然结果。是反映统计总体中所有单位在各组间的分 布状态和分布特征的一个数列,因此也可以称为次数 分布数列、频数分布数列,简称分布数列,或分配数 列。例如,人口按性别分组后形成的人口数在各组分 布情况的数列;学生按年龄分组后形成的学生人数在 各组分布情况的数列等,都是次数分布数列。n次数分布数列主要由各组名称(或各组变量值)与 各组单位数(次数或频数)两部分构成。有时也可 把比重(频率)列入分布数列中。(比重也叫频率 ,是各组频数与总频数之比,它的数值永远大于0而 小于100%)分布数列的形式很简单,但它是统计整 理的重要表现形式,在统计研究中具有重要的意义 。分布数列直观地表明了总体单位的分布特征和结 构状况,在此基础上还可进一步研究其构成、平均 水平及其变动规律,它是进行统计分析的一

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 其它文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号