统计学数据的图表展示

上传人:汽*** 文档编号:588486223 上传时间:2024-09-08 格式:PPT 页数:41 大小:815KB
返回 下载 相关 举报
统计学数据的图表展示_第1页
第1页 / 共41页
统计学数据的图表展示_第2页
第2页 / 共41页
统计学数据的图表展示_第3页
第3页 / 共41页
统计学数据的图表展示_第4页
第4页 / 共41页
统计学数据的图表展示_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《统计学数据的图表展示》由会员分享,可在线阅读,更多相关《统计学数据的图表展示(41页珍藏版)》请在金锄头文库上搜索。

1、第3章 数据的图表展示数据的预处理品质数据的整理与展示数值型数据的整理与展示合理使用图表学习目的和要求学习目的和要求 通过本章学习,通过本章学习,掌握掌握统计数据的分类统计数据的分类及数据的整理。及数据的整理。重点掌握统计分组重点掌握统计分组的方法和次数分布表的编制。能的方法和次数分布表的编制。能熟练运用统计软件对数据进行整熟练运用统计软件对数据进行整理。理。3.1 数据的预处理3.1.1 数据审核检查数据中是否有错误。原始原始数据数据二手二手数据数据适用性适用性时效性时效性完整性完整性审核审核准确性准确性审核审核应调查的单位是否有遗漏所有的调查项目是否填写齐全数据是否有错误是否存在异常值应尽

2、可能使用最新的统计数据来源、口径以及有关的背景材料是否符合自己分析研究的需要3.1.2 数据筛选3.1.3 数据排序:发现数据的基本特征数据的基本特征把定量数据按从大到小或从小到大的把定量数据按从大到小或从小到大的顺序序排列,排列,把定性数据按把定性数据按习惯的文字的文字顺序排列,便于序排列,便于我我们研究其条理研究其条理方法:升序和降序方法:升序和降序例3.1.4 数据透视表例统计数据类型统计数据类型定类定类定序定序定距定距定比品质数据数量数据1234量量量量化化化化等等等等级级级级功功功功能能能能包包包包容容容容1234四个测定层次的比较四个测定层次的比较 3.2 品质数据的整理与展示3.

3、2.1 分类数据的整理与展示1.频数与频数分布频数:落在各类别中的数据个数。 频数分布:将各类别及落在其中的相应频数列出,用表格形式表现出来。例2.分类数据的图示(1)条形图是用宽度相同的条形的高度或长短来表示数据变动的图形条形图有单式、复式等形式在表示定类数据的分布时,是用条形图的高度来表示各类别数据的频数或频率例(2)帕累托图不同类别的数据根据其频率降序排列的,并在同一张图中画出累积百分比图用双直角坐标系表示,左边纵坐标表示频数,右边纵坐标表示频率(3)饼图用圆形及园内扇形的面积来表示数值大小的图形主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用例(4)环形图环形图是由两

4、个及两个以上大小不一的饼图叠在一起,挖去中间的部分所构成的图形3.2.2 顺序数据的整理与图示1.累积频数和累积频率累积频数:将各有序类别或组的频数逐级累加所得到的频数。分:向上累积和向下累积。 累积频率:将各有序类别或组的百分比逐级累加。分:向上累积和向下累积。例3.3 数值型数据的整理与展示3.3.1 数据分组将原始数据按照某种标准分成不同的组别,用于观察数据的分布特征等距分组等距分组异距分组异距分组组距分距分组与不等距分与不等距分组(在表现频数分布上的差异)1.等距分等距分组各各组频数的分布不受数的分布不受组距大小的影响距大小的影响可直接根据可直接根据绝对频数来数来观察察频数分布的特征和

5、数分布的特征和规律律2.不等距分不等距分组各各组频数的分布受数的分布受组距大小不同的影响距大小不同的影响各各组绝对频数的多少不能反映数的多少不能反映频数分布的数分布的实际状况状况需需要要用用频数数密密度度(频数数密密度度频数数/组距距)反反映映频数数分布的分布的实际状况状况统计分组基本原基本原则:组内同内同质性,性,组间差异性差异性 作用:作用:(1)划分)划分现象的象的类型型(2)表明表明总体内部的体内部的结构及整个构及整个结构的构的类型和特征型和特征(3)揭示揭示现象象间的依存关系的依存关系1.1.按按分组标志个数分组标志个数不同不同1 1)简单分组)简单分组: :把总体只按一个标志分组

6、2)2)复合分组复合分组: :对同一总体选择两个或两个以上标志层叠起来进行分组。例如,可以 同时选择学科、学制、 性别三个标志对某学院全体在校学生这个总体 进行分组。 2.2.按分组标志按分组标志种类种类不同不同1) 1) 品质标志分组品质标志分组2) 2) 数量标志分组数量标志分组 统计分组的形式A.单项式分组:即变量的一个取值为一即变量的一个取值为一组,适用于离散型变量,并且变量的取值较少。组,适用于离散型变量,并且变量的取值较少。 如家庭人如家庭人口数分组口数分组 1 1人人 2 2人人 3 3人人 4 4人人 5 5人人 6 6人人2) 2) 数量标志分组数量标志分组 B组距式分组:即

7、每一组有一个即每一组有一个上限值和一个下限值所形成的区间,上限值和一个下限值所形成的区间,适用于连续性变量,或离散型变量适用于连续性变量,或离散型变量且变量的取值较多不便一一列举的且变量的取值较多不便一一列举的情况。情况。 按按销售额分组销售额分组( (万元万元) )5050以下以下5020050200200400200400400600400600600800600800800800以上以上例:对商店按销售额进行分组例:对商店按销售额进行分组组距分距分组(要点)(要点)1.将将变量量值的一个区的一个区间作作为一一组2.适合于适合于连续变量量3.适合于适合于变量量值较多的情况多的情况4.必必须

8、遵循遵循“不重不漏不重不漏”的原的原则5.可可采采用用等等距距分分组,也也可可采采用用不不等等距距分分组 组距分距分组(步骤)(步骤)1.确确定定组数数:组数数的的确确定定应以以能能够显示示数数据据的的分分布布特特征征和和规律律为目目的的。在在实际分分组时,可以按,可以按Sturges提出的提出的经验公式来确定公式来确定组数数K 确确确确定定定定各各各各组组的的的的组组距距距距:组组距距距距( (Class Class Width)Width)是是是是一一一一个个个个组组的的的的上上上上限限限限与与与与下下下下限限限限之之之之差差差差,可可可可根根根根据据据据全全全全部部部部数数数数据据据据的

9、的的的最最最最大大大大值值和和和和最最最最小小小小值值及及及及所所所所分分分分的的的的组组数数数数来来来来确确确确定,即定,即定,即定,即 组组距距距距( ( 最大最大最大最大值值 - - 最小最小最小最小值值) 组组数数数数 3. 3.根据分根据分根据分根据分组组整理成整理成整理成整理成频频数分布表数分布表数分布表数分布表 分组中要注意的关键分组中要注意的关键 1.选择分组标志 选择分组标志时,一般应考虑原则: 根据研究问题的目的和任务选择分组标志 在若干标志中,选择能反映问题本质的标志 结合现象所处的历史条件具体情况具体分析 2.划分各组的界限:在分组标志的变异范围内,划定各相邻组之间的性

10、质界限和数量界限组距分距分组(几个概念)下下限:限:一个一个组的最小的最小值上上限:限:一个一个组的最大的最大值组距:距:上限与下限之差上限与下限之差组中中值:下限与上限之下限与上限之间的中点的中点值下限值下限值+上限值上限值2组中值组中值= ( (闭口组闭口组) ) (缺上限的开口组)(缺上限的开口组) (缺下限的开口组)(缺下限的开口组) 实例某生产车间50名工人日加工零件数如下(单位:个)。试采用单变量值对数据进行分组117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 11

11、8 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121单变量值分组表某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表零件数零件数(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)1071081101121131141151171181212111331191201211221231241251261271214432231281291301311331341351

12、37139211122112等距分组表(上下组限重叠)某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)105110110115115120120125125130130135135140358141064610162820128合计合计50100等距分组表(上下组限间断)某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)105109110114115119120124125129130134135139358141064610162820128合

13、计合计50100等距分组表(使用开口组)某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)110以下以下110114115119120124125129130134135以上以上358141064610162820128合计合计501003.3.2 数值型数据的图示1.分组数据:直方图用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图(Histogram)频频频频频频数数数数数数( (人人人人人人

14、) )151512129 96 63 3105105110110115115120120125125130130135135140140日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数( (个个个个个个) )2.未分组数据:茎叶图和箱线图(1)茎叶图用于显示未分组的原始数据的分布,由“茎”和“叶”两部分构成,其图形是由数字组成的,以该组数据的高位数值作树茎,低位数字作树叶(2)箱线图将一组数据从大到小排列,分别计算出他的上边缘,上四分位数,中位数,下四分位数,下边缘,还有一个异常值。4 46 68 810101212图3-9 简单箱线图中位数中位数Q QU UX X最大

15、值最大值X X最小值最小值Q QL L对称分布对称分布对称分布对称分布对称分布对称分布Q QQL LL中位数中位数中位数中位数中位数中位数 Q QQU UU左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布Q QQL LL中位数中位数中位数中位数中位数中位数 Q QQU UU右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布Q QQL LL 中位数中位数中位数中位数中位数中位数 Q QQU UU不同分布的箱线图不同分布的箱线图分布的形状与箱线图分布的形状与箱线图未分组数据多批数据箱线图8门课程考试成绩的箱线图门课程考试成绩的箱线图11名学生名学生8门课程考试成绩的箱线图门课程考试成绩的箱线图Min

16、-Max25%-75%Median value455565758595105学生1学生2学生3学生4学生5学生6学生7学生8学生9学生10学生113.时间序列数据:线图时间一般绘在横轴,指标数据绘在纵轴图形的长宽比例要适当,其长宽比例大致为10:7一般情况下,纵轴数据下端应从“0”开始,以便于比较。数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断例4.多变量数据的图示(1)散点图用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式例(2)气泡图展示三个变量之间的关系例(3)雷达图数据类型与显示数据类型与显示数值型数据数值型数据品质数据品质数

17、据分组数据分组数据总计表总计表茎茎叶叶图图条条形形图图圆圆形形图图环环形形图图直直方方图图箱箱线线图图折折线线图图原始数据原始数据时序数据时序数据线线图图雷雷达达图图多元数据多元数据数据类型及图示数据类型及图示3.4 合理使用图表3.4.1 鉴别图形优劣的准则强调数据间的比较强调数据间的比较有对图形的统有对图形的统计描述和文字计描述和文字说明说明服务于一个明确服务于一个明确的目的的目的让读者的注意力集让读者的注意力集中在图形内容上中在图形内容上避免歪曲避免歪曲显示数据显示数据好图好图3.4.2 统计表的设计项目单位1997年 1998年 一、调查户数 二、平均每户家庭人口数 三、平均每户就业人

18、口数 四、平均每人全部收入 五、平均每人实际支出 消费性支出 非消费性支出 六、平均每人居住面积户人人元元元元平方米 37890 3.19 1.83 5188.54 4945.87 4185.64 755.94 11.90 39080 3.16 1.80 5458.34 5322.95 4331.61 987.17 12.40资料来源:中国统计摘要1999,中国统计出版社,1999,第79页。注:1本表为城市和县城的城镇居民家庭抽样调查材料。 2消费性支出项目包括:食品、衣着、家庭设备用品及服务、医疗 保健、交通和通讯、娱乐教育文化服务、居住、杂项商品和服务。行行行行标标标标题题题题列列列列标标标标题题题题数数数数字字字字资资资资料料料料附附附附加加加加表头表头表头表头19971998年城镇居民家庭抽样调查资料

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号