《二章节统计数据整理和展示》由会员分享,可在线阅读,更多相关《二章节统计数据整理和展示(11页珍藏版)》请在金锄头文库上搜索。
1、第二章第二章 统计数据的整理和展示统计数据的整理和展示统计数据统计数据的整理的整理 统计数据统计数据的展示的展示排序排序统计分组统计分组频数分布编制频数分布编制统计表统计表统计图统计图一、一、 统计数据的整理统计数据的整理排序排序统计搜集到的大量资料是分散的,不系统的,只能说统计搜集到的大量资料是分散的,不系统的,只能说明各个单位的特征和属性,必须按照科学的原则加以明各个单位的特征和属性,必须按照科学的原则加以整理整理,使之条,使之条理化和系统化,理化和系统化,成为便于储存和传递的、成为便于储存和传递的、反映总体特征的数据。反映总体特征的数据。 就是把定量数据按从大到小或从小到大的顺序排列,就
2、是把定量数据按从大到小或从小到大的顺序排列,把定性数据按习惯的文字顺序排列,便于我们研究其把定性数据按习惯的文字顺序排列,便于我们研究其条理。条理。 统计分组统计分组对于定性数据就是依据属性的不同将数据划分成若干对于定性数据就是依据属性的不同将数据划分成若干组,对于定量数据就是依据属性数值的不同将数据划组,对于定量数据就是依据属性数值的不同将数据划分成若干组。分成若干组。 组内同质性,组间差异性。组内同质性,组间差异性。频数分布编制频数分布编制分组的关键分组的关键变量的选择,选择与变量的选择,选择与研究的问题有关研究的问题有关的的 变量变量 。组限的确定。应遵循组限的确定。应遵循穷尽穷尽和和互
3、斥互斥原则原则 。定性数列定性数列编制:编制:组限的确定一般比较简单组限的确定一般比较简单 。如人口按性别分组、企业按所有制分组等如人口按性别分组、企业按所有制分组等 定量定量变量量编制:编制: 分为分为单项数列和组距数列两种形式。单项数列和组距数列两种形式。 单项数列:单项数列:即变量的一个取值为一组,适用于即变量的一个取值为一组,适用于离散离散型变量型变量,并,并且变量的且变量的取值较少。取值较少。 组距数列:组距数列:即每一组有一个上限值和一个下限值所即每一组有一个上限值和一个下限值所形成的区间,适用于形成的区间,适用于连续性变量,或离散型变量且连续性变量,或离散型变量且变量的变量的取值
4、较多的情况。取值较多的情况。 注意以下三个方面的问题注意以下三个方面的问题 1.确定组数确定组数 2.确定组距:确定组距:组距为上限与下限之差。组距为上限与下限之差。等距数列数据分布均匀。等距数列数据分布均匀。异距数列数据分布不均匀。异距数列数据分布不均匀。 3.确定确定组限限 应能把现象的不同类型划分出来应能把现象的不同类型划分出来 。要考虑到数据是要考虑到数据是连续性变量连续性变量还是还是离散型离散型变量。变量。 无法确定无法确定实际实际数据的取值范围,或者数数据的取值范围,或者数据中存在极端数值,可采用开口据中存在极端数值,可采用开口组的的形形式式。4.确定确定组中值组中值 :( (上限
5、下限)上限下限)2 2 ,开口组,开口组 二、统计数据的展示二、统计数据的展示当统计数据比较多时,就应该制作表格或者图形进行来当统计数据比较多时,就应该制作表格或者图形进行来展示,使数据的重要特性能从表格或者图形中展示,使数据的重要特性能从表格或者图形中直观地直观地反反映出来,这样可提高分析数据和解释数据的映出来,这样可提高分析数据和解释数据的效率效率。 统计表统计表是把统计数据用表格的形式展示出来。是把统计数据用表格的形式展示出来。 类型:类型: 按作用分按作用分调查表表按数据按数据所属所属的的时间分分截面数据表截面数据表时间序列表时间序列表 汇总整理表整理表计算分析表算分析表 按按分分组变
6、量量的多少的多少分分单变量分组表单变量分组表多变量分组表多变量分组表 有平行形式有平行形式交叉形式交叉形式 统计图统计图统计图形通常可比统计表格更生动地描述数据。统计图形通常可比统计表格更生动地描述数据。 类型:类型: 饼图饼图是以整个圆的是以整个圆的360360度代表全部数据的总和,度代表全部数据的总和,按照各类组所占的百分比(频率),把一个按照各类组所占的百分比(频率),把一个“饼饼”切割为各个扇形。切割为各个扇形。适用于定性数据适用于定性数据。 50家门店家门店按区域分按区域分组的饼图组的饼图 条形条形图中,每一分中,每一分类组表示成一个条,条的表示成一个条,条的长度代度代表了表了这个个
7、组中所含数据的中所含数据的频数或数或频率。适用于定性率。适用于定性数据数据。 50家家门门店店数数按按区区域分组的条形图域分组的条形图家家门门店店按按区区域域并并按按人人数分组的分段比例条形图数分组的分段比例条形图直方直方图与条形与条形图相似,是在每个分相似,是在每个分组区区间上上绘制一个制一个长条形而条形而产生的生的图形,它可以用来描述已表示成形,它可以用来描述已表示成频数数或或频率的数据。适用于定率的数据。适用于定量量数据数据。根据表根据表2-5的等距数列的等距数列 对于异距数列,以组对于异距数列,以组距为宽距为宽,以频数密度以频数密度为高来为高来绘制制直方图。直方图。 折线图折线图可以在
8、直方图基础上,将每个长方形的顶端中可以在直方图基础上,将每个长方形的顶端中点用折线连接而成,或用组中值与频数(或频率)求点用折线连接而成,或用组中值与频数(或频率)求坐标点连接而成坐标点连接而成 。根据图根据图2-6的直方图绘制的折线图的直方图绘制的折线图曲线图曲线图当变量的取值非常多,变量数列的组数无限增当变量的取值非常多,变量数列的组数无限增多时,折线便趋于一条平滑的曲线,这是一种概括描多时,折线便趋于一条平滑的曲线,这是一种概括描述变量数列分布特征的理论曲线。述变量数列分布特征的理论曲线。 枝叶图枝叶图是探索性数据分析中的一种方法,也是是探索性数据分析中的一种方法,也是对一批一批数据数据进行行组织整理的很有价整理的很有价值的一个工具,可用以了的一个工具,可用以了解一批数据中由所有解一批数据中由所有观测值构成的数据的取构成的数据的取值范范围是是如何分布的。如何分布的。