统计数据的整理与显示

上传人:壹****1 文档编号:568027983 上传时间:2024-07-23 格式:PPT 页数:106 大小:1.34MB
返回 下载 相关 举报
统计数据的整理与显示_第1页
第1页 / 共106页
统计数据的整理与显示_第2页
第2页 / 共106页
统计数据的整理与显示_第3页
第3页 / 共106页
统计数据的整理与显示_第4页
第4页 / 共106页
统计数据的整理与显示_第5页
第5页 / 共106页
点击查看更多>>
资源描述

《统计数据的整理与显示》由会员分享,可在线阅读,更多相关《统计数据的整理与显示(106页珍藏版)》请在金锄头文库上搜索。

1、第3章 统计数据的整理与显示统计整理统计整理是根据统计研究的目的,将统计调查所得到的原始是根据统计研究的目的,将统计调查所得到的原始资料(也称初级资料)进行科学的分类和汇总,或对已经经资料(也称初级资料)进行科学的分类和汇总,或对已经经过加工的综合资料(也称次级资料)进行再加工,为统计分过加工的综合资料(也称次级资料)进行再加工,为统计分析准备系统化的、条理化的、能够反映总体特征的综合资料析准备系统化的、条理化的、能够反映总体特征的综合资料的工作过程。的工作过程。例如,某班例如,某班5050名学生,调查其考分资料如下:名学生,调查其考分资料如下:77 65 83 56 68 70 99 65

2、73 72 88 66 74 63 71 84 62 77 65 83 56 68 70 99 65 73 72 88 66 74 63 71 84 62 52 80 78 84 79 81 64 58 82 76 62 73 75 89 79 61 65 52 80 78 84 79 81 64 58 82 76 62 73 75 89 79 61 65 54 92 86 73 68 51 69 64 78 63 76 68 72 77 81 7654 92 86 73 68 51 69 64 78 63 76 68 72 77 81 76 上述这些考分(原始资料)的特点是零星分散、上述这些

3、考分(原始资料)的特点是零星分散、不系统、无规律,不系统、无规律,不能反映学生总体的不能反映学生总体的学习情况。学习情况。按考分分组按考分分组(分)(分)学生人数学生人数(人)(人) 6060以下以下60 60 707070 70 808080 80 909090 90 100100 5 5 15 15 18 18 10 10 2 2合合 计计 50 50 由由表表3-13-1可见,整理后的学生考分可见,整理后的学生考分资料,较整理前的考分资料明显要资料,较整理前的考分资料明显要条条理、系统。理、系统。由上表可见,在学生总体由上表可见,在学生总体中,中,6060分以下和分以下和9090分以上的

4、学生人数分以上的学生人数都较少,绝大多数都较少,绝大多数学生学生的考分分布在的考分分布在60896089分之间。分之间。表表3-13-1 所以,统计整理是统计调查的继续,是统计分析的前提,所以,统计整理是统计调查的继续,是统计分析的前提,它实它实现了从个别单位的标志表现(标志值)向总体综合指标的过渡现了从个别单位的标志表现(标志值)向总体综合指标的过渡,在统计研究中起着承前启后重要的作用。在统计研究中起着承前启后重要的作用。统计数据的整理与显示3.1 3.1 统计数据的整理程序统计数据的整理程序 3.2 3.2 品质数据的整理与显示品质数据的整理与显示 3.3 3.3 数值型数据的整理与显示数

5、值型数据的整理与显示3.4 3.4 次数分布及其类型次数分布及其类型3.5 3.5 统计表与统计图统计表与统计图学习目标u充分认识统计整理在统计研究中的承前启后的地位;u掌握统计数据的整理和显示方法,特别是分组与变量数列的编制;u了解统计表和统计图的构成和展示,能实际设计统计表和统计图。统计数据整理的程序1.1.制定整理方案(汇总方案)制定整理方案(汇总方案);2.对调查资料进行审核和纠正等(对调查资料进行审核和纠正等(预处理预处理预处理预处理);3.进行进行统计分组统计分组统计分组统计分组(关键关键);4.进行统计汇总进行统计汇总;5. 汇总后审核汇总后审核;6.编制编制统计表统计表统计表统

6、计表,绘制,绘制统计图统计图统计图统计图,显示整理结果。,显示整理结果。 根据统计调查目的,获得统计资料的整理流程根据统计调查目的,获得统计资料的整理流程计划:计划: 一是对总体资料的处理方法,如如何分组;一是对总体资料的处理方法,如如何分组; 二是确定用哪些具体的统计指标来说明总体二是确定用哪些具体的统计指标来说明总体。一、制定统计整理方案一、制定统计整理方案1.数据的审核数据的审核发现数据中的错误发现数据中的错误2.数据的筛选数据的筛选找出符合条件的数据找出符合条件的数据3.数据排序数据排序发现数据的基本特征发现数据的基本特征升序和降序升序和降序二、数据的预处理二、数据的预处理(1 1)统

7、计资料的)统计资料的审核审核资料的审核资料的审核 原始资料原始资料完整性完整性准确性准确性逻辑检查逻辑检查计算检查计算检查二手资料二手资料适用适用 时效时效审核对第一手数据:对第一手数据:(1)完整性审核:)完整性审核:q检查应调查的单位或个体是否有遗漏q所有的调查项目或指标是否填写齐全(2)准确性审核:)准确性审核: 真实性:真实性:检查数据是否真实反映客观实际情况,内容是否符合实际逻辑检查逻辑检查 正确性:正确性:检查数据是否有错误,计算是否正确等计算检查计算检查 (定量数据)(定量数据) 审核对第二手数据:对第二手数据:完整性:完整性:准确性:准确性:适用性:适用性:数据的来源、口径以及

8、数据的来源、口径以及 有关背景资料;有关背景资料;时效性:时效性:尽可能使用最新的数据。尽可能使用最新的数据。(2)数据筛选u当当数数据据中中的的错错误误不不能能予予以以纠纠正正,或或者者有有些些数数据据不不符符合合调调查查的的要要求求而而又又无无法法弥弥补补时时,需需要要对对数数据进行筛选。据进行筛选。u数据筛选的内容:数据筛选的内容:将将某某些些不不符符合合要要求求的的数数据据或或有有明明显显错错误误的的数数据予以剔除;据予以剔除;将将符符合合某某种种特特定定条条件件的的数数据据筛筛选选出出来来,而而不不符合特定条件的数据予以剔除。符合特定条件的数据予以剔除。(3 3)数据的排序)数据的排

9、序数据的排序数据的排序1.按按一一定定顺顺序序将将数数据据排排列列,以以发发现现一一些些明明显显的的特特征或趋势,找到解决问题的线索征或趋势,找到解决问题的线索2.排排序序有有助助于于对对数数据据检检查查纠纠错错,以以及及为为重重新新归归类类或分组等提供依据或分组等提供依据3.在某些场合,排序本身就是分析的目的之一在某些场合,排序本身就是分析的目的之一4.排序可借助于计算机完成排序可借助于计算机完成。1.1.定类数据的排序定类数据的排序字字母母型型数数据据,排排序序有有升升序序降降序序之之分分,但但习习惯惯上用升序上用升序汉汉字字型型数数据据,可可按按汉汉字字的的首首位位拼拼音音字字母母排排列

10、列,也也可可按按笔笔画画排排序序,其其中中也也有有笔笔画画多多少少的的升升序序降序之分降序之分2.2.定距和定比数据的排序定距和定比数据的排序q递递增增排排序序:设设一一组组数数据据为为X X1 1,X X2 2,X XN N,递增排序后可表示为:递增排序后可表示为:X X(1)(1) X X(2)(2) X X(2)(2) X X(N)(N) (五)(五). .汇总后审核:汇总后审核: 审核汇总工作质量,汇总过程有无差错。主要审核汇总工作质量,汇总过程有无差错。主要四种方法:四种方法: 一是复计审核;一是复计审核; 二是表表审核;二是表表审核; 三是表实审核;三是表实审核; 四是对照审核四是

11、对照审核。三三. .统计分组统计分组分组前分组前分组前分组前分组后分组后分组后分组后统计分组就是根据统计统计分组就是根据统计研究的目的和被研究现象的本质特征研究的目的和被研究现象的本质特征研究的目的和被研究现象的本质特征研究的目的和被研究现象的本质特征,将统计总体按照一定的标志划分为若干性质不同的部分或组。将统计总体按照一定的标志划分为若干性质不同的部分或组。. . 统计分组统计分组是在总体内部进行的是在总体内部进行的一种定性分类一种定性分类,它客观上,它客观上把总体划分为把总体划分为一个个性质不同,范围更小的总体一个个性质不同,范围更小的总体。统计分统计分组组有两个方面的含义,即:有两个方面

12、的含义,即:统计统计分组分组对总体而言对总体而言即将总体区分即将总体区分为为性质不同性质不同性质不同性质不同的的若干组成部分若干组成部分是是“合合”即将即将性质相同性质相同性质相同性质相同的总体单位合的总体单位合为一组为一组是是“分分”对单位而言对单位而言. 1、统计分组的作用、统计分组的作用u划分现象的类型(区分事物的类型);划分现象的类型(区分事物的类型);u研究总体的结构(构成)或比例关系;研究总体的结构(构成)或比例关系;u分析(探讨)现象之间的依存关系。分析(探讨)现象之间的依存关系。 注意:统计分组注意:统计分组注意:统计分组注意:统计分组是对总体认识深化的手段,它是一切统计研究是

13、对总体认识深化的手段,它是一切统计研究的基础,应用于统计工作的全过程,是统计研究的基本方法。的基础,应用于统计工作的全过程,是统计研究的基本方法。2、统计分组的原则、统计分组的原则u穷尽原则穷尽原则u互斥原则互斥原则揭露社会经济现象的类型,反映各类型的特点。揭露社会经济现象的类型,反映各类型的特点。揭露社会经济现象的类型,反映各类型的特点。揭露社会经济现象的类型,反映各类型的特点。 类型分组类型分组 类型1999年2000年2001年2002年农业14 106.213 873.6 14 462.814 931.5林业886.3936.5938.81 033.5牧业6 997.6 7 393.1

14、7 963.18 454.6渔业2 539.0 2 712.62 815.02 971.1合计24 519.124 915.826 179.627 390.8例例单位:亿元说明社会经济现象的内部结构。说明社会经济现象的内部结构。说明社会经济现象的内部结构。说明社会经济现象的内部结构。 结构分组结构分组 例例年份 19961997199819992000第一产业 20.4 19.1 18.6 17.6 15.9第二产业 49.5 50.0 49.3 49.4 50.9第三产业 30.1 30.9 32.1 33.0 33.2合计 100.0 100.0 100.0 100.0 100.0“九五”

15、期间我国国内生产总值构成(%)研究经济现象之间的依存关系。研究经济现象之间的依存关系。研究经济现象之间的依存关系。研究经济现象之间的依存关系。 分析分组分析分组 例例耕作深度分组(cm)地块数平均收获率(斤/亩)10-12 740012-141046014-161654016-1818-2012 5620680某乡某种农作物的耕作深度与收获率的关系. . 3 3、统计分组的种类、统计分组的种类 (一)(一)按分组标志按分组标志的多少不同的多少不同 (二)按分组标志(二)按分组标志的性质不同的性质不同 简单分组简单分组品质分组品质分组数量(变量)分组数量(变量)分组复合分组复合分组. 4 4、统

16、计分组的方法、统计分组的方法 n分组标志的选择:选择分组标志是统计分组的分组标志的选择:选择分组标志是统计分组的核心核心问题问题,必须根据统计研究的,必须根据统计研究的目的目的目的目的选择分组标志。选择分组标志。n品质分组:是按品质标志进行的分组。品质分组:是按品质标志进行的分组。国民经济按产业分组:国民经济按产业分组: 第一产业第一产业 第二产业第二产业 第三产业第三产业人口按性别分组:人口按性别分组: 男性男性 女性女性用文字用文字来表示来表示各组性各组性质上的质上的差别差别 . . u数量分组数量分组n数量分组的概念数量分组的概念n单项式分组与组距式分组单项式分组与组距式分组 n进行组距

17、式分组时应注意的问题进行组距式分组时应注意的问题. . 数量分组数量分组是按数量标志进行的分组。是按数量标志进行的分组。数量分组的概念数量分组的概念例如,例如,学生按考分分组(分)学生按考分分组(分)用数量来用数量来表示各组表示各组性质上的性质上的差别差别 6060以下以下 60 60 70 70 70 70 80 80 80 80 90 90 90 90 以上以上. . (1 1)单项式分组:)单项式分组: 即在变量分组中,一个组即在变量分组中,一个组只有一个变量值。只有一个变量值。单项式分组与组距式分组单项式分组与组距式分组 适用条件:适用条件: 它适用于当变量值变化范围不大、它适用于当变

18、量值变化范围不大、不同变量值个数较少的不同变量值个数较少的离散型变量离散型变量的场合。的场合。例如:例如:居民家庭按子女数分组:居民家庭按子女数分组:0 0 1 1 2 2 3 3 (离散型变量)(离散型变量)(2 2)组距式分组:组距式分组:就是将变量依次划分为几段区间,一段就是将变量依次划分为几段区间,一段区间表现为从区间表现为从“到到”距离,把一段区间内的所有变距离,把一段区间内的所有变量值归为一组量值归为一组 。区间的距离就是组距。区间的距离就是组距。 例如:例如:企业按人数分组企业按人数分组 499499及以下及以下 500 500 999999 1000 1000 29992999

19、 3000 3000及以上及以上 工人按工资分组工人按工资分组 600 600 700700 700 700 800800 800 800 12001200 1200 1200 1500 1500 适用条件:适用条件:适用条件:适用条件: 它适用于变量值变化范围较大、不同变量它适用于变量值变化范围较大、不同变量值个数较多的值个数较多的离散型变量离散型变量及及连续型变量连续型变量的场合的场合。(离离散散型型变变量量)(连连续续型型变变量量)注意:注意:注意:注意:连续型变量的数值不能一一列举,连续型变量的数值不能一一列举,故其只能采用组距式分组。故其只能采用组距式分组。 进行组距式分组时应注意的

20、问题进行组距式分组时应注意的问题(1)(1)组限及划分方法组限及划分方法 (2)(2)等距分组与不等距分组等距分组与不等距分组(3)(3)组中值组中值 499499及以下及以下 500 500 999999 1000 1000 29992999 3000 3000及以上及以上 600 600 700700 700 700 800800 800 800 12001200 1200 1200 1500 1500 (1 1)组限及划分方法)组限及划分方法 组限:组限: 确立每组界限的两个数字。确立每组界限的两个数字。其中,每组最大变量值称为其中,每组最大变量值称为上限上限, 每组最小变量值称为每组最

21、小变量值称为下限下限。工人按工资分组:工人按工资分组:(连连续续变变量量)企业按人数分组:企业按人数分组:(离离散散变变量量)(重叠组限)(重叠组限)(不重叠组限)(不重叠组限) 组限的划分方法:组限的划分方法:组限的划组限的划分方法分方法 不重叠组限不重叠组限重叠组限重叠组限(只适用于(只适用于离散型变量)离散型变量)(适用于(适用于连续型变量和连续型变量和 离散型变量离散型变量. .) 重叠组限:重叠组限: 不重叠组限:不重叠组限: 即相邻两组的上下限为同一个数值。即相邻两组的上下限为同一个数值。即相邻两组的上下限为两个不同即相邻两组的上下限为两个不同的确定数值。的确定数值。 故当某单位的

22、变量值刚好等于故当某单位的变量值刚好等于相邻两组的上下限相邻两组的上下限时时,一般把此值归到作为下限的那一组中,即遵循,一般把此值归到作为下限的那一组中,即遵循“上限不在其内上限不在其内”的原则。的原则。. . 企业按人数分组:企业按人数分组: 499499及以下及以下 500 500 999 999 1000 1000 2999 2999 30003000及以上及以上 (不重叠组限)(不重叠组限)企业按人数分组:企业按人数分组: 500500以下以下 500 500 1000 1000 1000 1000 3000 3000 30003000及以上及以上 (重叠组限)(重叠组限). . (2

23、 2)等距分组与不等距分组)等距分组与不等距分组 组距组距分组分组等距分组等距分组 不等距分组不等距分组 例如:例如:按身高、考分分组等,应采用等距分组。它按身高、考分分组等,应采用等距分组。它便于各组间单位数与变量值的直接对比和各项指标计便于各组间单位数与变量值的直接对比和各项指标计算。算。适用场合:适用场合: 等距分组:即各组组距相同的分组。等距分组:即各组组距相同的分组。凡是在变量值分布比较均匀时采用。凡是在变量值分布比较均匀时采用。组距:每组变量值的变动范组距:每组变量值的变动范围,即组距围,即组距 = = 上限上限 下限下限 不等距分组:不等距分组:即各组组距不都相等的分组。即各组组

24、距不都相等的分组。适用场合:适用场合:当变量值分布很不均匀时采用。当变量值分布很不均匀时采用。 不等距分组多数是根据事物性质变化的数量不等距分组多数是根据事物性质变化的数量界限来确定组距,如人口按年龄分组。界限来确定组距,如人口按年龄分组。 要注意不同年龄生理变化的特点,可分为:要注意不同年龄生理变化的特点,可分为: 1 1岁以下;岁以下; 1 16 6 岁;岁;7 712 12 岁;岁;131318 18 岁;岁; 191959 59 岁;岁;60 60 岁以上。岁以上。 年龄段年龄段工人按工资分组工人按工资分组(元)(元) 600 600 700 700 700 700 800 800 8

25、00 800 1200 1200 1200 1200 15001500. (3 3)组中值)组中值 组中值组中值是指组距数列中各组上限和下限是指组距数列中各组上限和下限之间的之间的中点数值中点数值。 注意:注意:组中值经常用组中值经常用来代表各组标志值的平来代表各组标志值的平均水平,但要均水平,但要假定假定各组各组内标志值呈均匀分布内标志值呈均匀分布。按考分分组按考分分组 50 50 60 60 60 60 70 70 70 70 80 80 80 80 90 90 90 90 100100 5555 7575 656585859595组中值组中值人数人数5 51515181810102 2.

26、 . 若若第一组出现第一组出现“以下以下”或或最末最末组出现组出现“以上以上”字样的组叫做字样的组叫做开口组开口组。首组组中值首组组中值= 首组上限首组上限 相邻组组距的一半相邻组组距的一半= 末组下限末组下限 + 相邻组组距的一半相邻组组距的一半末组组中值末组组中值50 50 10102 2100 100 + 10 102 2例如:例如:. .首组:首组:末组:末组:按考分分组按考分分组 组中值组中值 50 50 60 55 60 55 60 60 70 65 70 65 70 70 80 75 80 75 80 80 90 85 90 85 90 90 100 95100 955050以下

27、以下100100以上以上4545105105年均收入(元)频数(村)6004000114000500035500060001460001000016100002500012合计88年均收入(元) 频数(村)1000012合计88或例:某地区农户收入分布编制:编制:1 1、单变量数列还是组距式数列:变量的性质及变异程度、单变量数列还是组距式数列:变量的性质及变异程度 离散型变量且变异小:单变量数列离散型变量且变异小:单变量数列 离散型变量但变异大或连续型变量:组距式数列离散型变量但变异大或连续型变量:组距式数列例如:按以五分制计分的成绩对全班例如:按以五分制计分的成绩对全班100100名学生进行

28、分组,名学生进行分组,宜单变量数列;按以百分制计分的成绩对全班宜单变量数列;按以百分制计分的成绩对全班100100名学名学生进行分组,宜组距式数列;生进行分组,宜组距式数列;例如:按身高对全班例如:按身高对全班100100名学生分组,只能组距式数列。名学生分组,只能组距式数列。2 2、等距数列还是异距数列:变量分布的特征、等距数列还是异距数列:变量分布的特征 当分布值很不均匀时,一般采用异距数列。如学生成绩当分布值很不均匀时,一般采用异距数列。如学生成绩一般密集于某一区间,低于这一区间的学生为少数,高于这一般密集于某一区间,低于这一区间的学生为少数,高于这一区间的学生也为少数。合理的做法是在密

29、集区间内使用较一区间的学生也为少数。合理的做法是在密集区间内使用较短的组距,在稀少区间内使用较长的组距。短的组距,在稀少区间内使用较长的组距。 当等量的标志值不具有相同的意义时,一般采用异距数列。当等量的标志值不具有相同的意义时,一般采用异距数列。如:对新生儿和成人的年龄,同样的一年或一月,其意义是如:对新生儿和成人的年龄,同样的一年或一月,其意义是不同的。进行人口疾病研究的年龄分组时,一般不同的。进行人口疾病研究的年龄分组时,一般1 1岁以下按岁以下按月分组,月分组,1-101-10岁按年分组,岁按年分组,11-2011-20岁按岁按5 5年分组年分组 当标志值按一定比例发展变化:某些时候采

30、用公比为当标志值按一定比例发展变化:某些时候采用公比为1010的不等距分组。如商场按营业额分组为:的不等距分组。如商场按营业额分组为:5 5万元以下、万元以下、5 55050万元、万元、5050500500万元、万元、50050050005000万元万元3 3、开口数列还是闭口数列:极端变量值偏离分布中心的程度。、开口数列还是闭口数列:极端变量值偏离分布中心的程度。 极端变量值(极大值或极小值)远离分布中心:开口数列极端变量值(极大值或极小值)远离分布中心:开口数列 极端变量值(极大值或极小值)接近分布中心:闭口数列极端变量值(极大值或极小值)接近分布中心:闭口数列例如:成绩:例如:成绩:20

31、20分分1 1人、人、5555分分1 1人、人、5858分分3 3人、人、60607070分分1010人人80809090分分3030人、人、9191分分3 3人、人、9292分分2 2人、人、9595分分1 1人人最小组:最小组:“609090分分”(实际平均分(实际平均分9292分)分)同时兼顾习惯同时兼顾习惯。四、统计汇总四、统计汇总q频数:各组内的总体单位数频数:各组内的总体单位数q频率:各组内总体单位数占总体全部单位数的比率频率:各组内总体单位数占总体全部单位数的比率q累计频数(率):各组的频数(率)累计加和累计频数(率):各组的频数(率)累计加和 向上累计制:由标志值较小组向较大组

32、累计。每一向上累计制:由标志值较小组向较大组累计。每一组的累计次数表示小于该组下限(变量)值的次数组的累计次数表示小于该组下限(变量)值的次数共有多少。共有多少。 向下累计制:由标志值较大组向较小组累计。每一向下累计制:由标志值较大组向较小组累计。每一组的累计次数表示大于该组下限(变量)值的次数组的累计次数表示大于该组下限(变量)值的次数共有多少。共有多少。例例考分考分次次 数数向上累计向上累计向下累计向下累计人数人数(人人)比率比率(%)人数人数(人人)比率比率(%) 人数人数(人人)比率比率(%)50-60 2 5.0 2 5.040100.060-70 7 17.5 9 22.538 9

33、5.070-8011 27.520 50.031 77.580-9012 30.032 80.020 50.090-100 8 20.0 40100.0 8 20.0合计合计40100.04010040100某班统计学考试成绩次数分配某班统计学考试成绩次数分配 审核汇总工作质量,汇总过程有无差错。主要审核汇总工作质量,汇总过程有无差错。主要四种方法:四种方法: 一是复计审核;一是复计审核; 二是表表审核;二是表表审核; 三是表实审核;三是表实审核; 四是对照审核四是对照审核。五、汇总后审核五、汇总后审核3.2 3.2 品质数据的整理与显示品质数据的整理与显示数据的整理与显示的基本问题1.要弄清

34、所面对的数据类型;要弄清所面对的数据类型;q不同类型的数据,处理方式和方法不同。不同类型的数据,处理方式和方法不同。2.适适合合于于低低层层次次数数据据的的整整理理和和显显示示方方法法也也适适合合于于高高层层次次的的数数据据;但但适适合合于于高高层层次次数数据据的的整整理理和和显显示示方方法法并并不不适适合合于于低低层层次次的的数数据。据。品质数据的整理与显示3.2.1 定类数据的整理与显示定类数据的整理与显示3.2.2 定序数据的整理与显示定序数据的整理与显示定类数据的整理的基本过程2. 2. 计算各类别的频数;计算各类别的频数;3. 3. 制作制作频数分布表频数分布表频数分布表频数分布表;

35、 分类分类频数频数频数频数比例比例百分比百分比百分比百分比比率比率ABCDE1.1.列出各类别;列出各类别;4. 4. 用用图形图形图形图形显示数据;显示数据;定类数据的整理(可计算的统计量)1. 1.频数频数频数频数( (frequency)frequency) :落在各类别中的数据个数。落在各类别中的数据个数。2.比例比例(proportion) :某一类别数据占全部数据的比某一类别数据占全部数据的比值。值。3. 3.百分比百分比百分比百分比(percentage)(percentage) :将对比的基数作为将对比的基数作为100而计而计算的比值。算的比值。4.比率比率(ratio) :不

36、同类别数值的比值。不同类别数值的比值。5. 5.频数分布频数分布频数分布频数分布:也叫次数分布,就是把各个类别及落在也叫次数分布,就是把各个类别及落在其中的相应频数全部列出,并用表格的形式表现出其中的相应频数全部列出,并用表格的形式表现出来。来。 按品质标志分组形成的频数分布按品质标志分组形成的频数分布某厂职工人数统计表某厂职工人数统计表按性别分组按性别分组男男 职职 工工女女 职职 工工合合 计计人数(人)人数(人)(频数)频数)比例()比例()(频率)(频率)25311536868.7531.25100.00定类数据整理定类数据整理频数分布表频数分布表【例例例例1 1】一一一一家家家家市市

37、市市场场场场调调调调查查查查公公公公司司司司为为为为研研研研究究究究不不不不同同同同品品品品牌牌牌牌饮饮饮饮料料料料的的的的市市市市场场场场占占占占有有有有率率率率,对对对对随随随随机机机机抽抽抽抽取取取取的的的的一一一一家家家家超超超超市市市市进进进进行行行行了了了了调调调调查查查查。调调调调查查查查员员员员在在在在某某某某天天天天对对对对5050名名名名顾顾顾顾客客客客购购购购买买买买饮饮饮饮料料料料的的的的品品品品牌牌牌牌进进进进行行行行了了了了记记记记录录录录,如如如如果果果果一一一一个个个个顾顾顾顾客客客客购购购购买买买买某某某某一一一一品品品品牌牌牌牌的的的的饮饮饮饮料料料料,就就

38、就就将将将将这这这这一一一一饮饮饮饮料料料料的的的的品品品品牌牌牌牌名名名名字字字字记记记记录录录录一一一一次次次次 。右右右右边边就就就就是是是是记记录录的的的的原原原原始始始始数数数数据。据。据。据。绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品一、定类数据整理一、定类数据整理频数分布表频数分布表【例例例例3.13.1】为为为为研研研研究究究究广广广广告告告告市市市市场场场场的的的的状状状状况况况况,一一一一家家家家广广广广告告告告公公公公司司司司在在在在某某某某城城城城市市市市随随随随机机机机抽抽抽抽取取取取200200人人人人就就就就广广广广告告告告问问问问题题题题做做做做了了了了邮

39、邮邮邮寄寄寄寄问问问问卷卷卷卷调调调调查查查查,其其其其中中中中的的的的一一一一个个个个问问问问题题题题是是是是“ “您您您您比比比比较较较较关关关关心心心心下下下下列哪一类广告?列哪一类广告?列哪一类广告?列哪一类广告?” ” 1 1商商商商品品品品广广广广告告告告;2 2服服服服务务务务广广广广告告告告;3 3金金金金融融融融广广广广告告告告;4 4房房房房地地地地产产产产广广广广告告告告;5 5招招招招生生生生招招招招聘聘聘聘广广广广告告告告;6 6其其其其他他他他广广广广告。告。告。告。表表3-1 3-1 某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布 广告类型广告类

40、型人数人数( (人人) )比例比例频率频率(%)(%) 商品广告商品广告 服务广告服务广告 金融广告金融广告 房地产广告房地产广告 招生招聘广告招生招聘广告 其他广告其他广告11211251519 9161610102 20.5600.5600.2550.2550.0450.0450.0800.0800.0500.0500.0100.01056.056.025.525.54.54.58.08.05.05.01.01.0合计合计2002001 1100100定类数据的图形显示1 1、条形图条形图( (bar chartbar chart) )u通通过过宽宽度度相相同同的的条条形形的的高高度度或或

41、长长短短来来比比比比较较较较各各类类别数据的图形别数据的图形u有单式条形图、复式条形图等形式有单式条形图、复式条形图等形式u主要用于反映分类数据的频数或频率主要用于反映分类数据的频数或频率u绘绘制制时时,各各类类别别可可以以放放在在纵纵轴轴,称称为为条条形形图图,也可以放在横轴,称为柱形图也可以放在横轴,称为柱形图(column chart) 定类数据的图示条形图人数(人)人数(人)5191610211204080120 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告广广告告类类型型 图图3-1 3-1 某城市居民关注不同类型广告的人数分布某城市居民关注不同类型广告的人数分布

42、定类数据的图示定类数据的图示2、饼图(、饼图(pie chart)u也也称称圆圆形形图图,是是用用圆圆形形及及圆圆内内扇扇形形的的角角度度来来表表示示数值大小的图形;数值大小的图形;u主主要要用用于于表表示示样样本本或或总总体体中中各各组组成成部部分分所所占占的的比比例,用于研究例,用于研究结构性问题结构性问题结构性问题结构性问题;u绘绘制制圆圆形形图图时时,样样本本或或总总体体中中各各部部分分所所占占的的百百分分比比用用圆圆内内的的各各个个扇扇形形角角度度表表示示,这这些些扇扇形形的的中中心心角角度度,按按各各部部分分数数据据百百分分比比占占3600的的相相应应比比例例确确定。定。定类数据的

43、图示定类数据的图示圆形图圆形图 其他广告其他广告1.0% 房地产广告房地产广告8.0% 商品广告商品广告56.0% 金融广告金融广告4.5% 服务广告服务广告25.5% 招生招聘广告招生招聘广告5.8%图图3-2 3-2 某城市居民关注不同类型广告的人数构成某城市居民关注不同类型广告的人数构成3.2.2 定序数据的整理可计算的统计量:可计算的统计量: 对对于于定定序序数数据据,除除了了可可用用定定类类数数据据整整理理和和显显示示的的方方法之外,还可以计算法之外,还可以计算:1. 累累积积频频数数(cumulative frequencies):各类别频数的逐级累加。2. 累累积积频频率率(cu

44、mulative percentages):各类别频率(百分比)的逐级累加。 . . 在研究次数和频率的分布时,常需要编制次数在研究次数和频率的分布时,常需要编制次数或频率的累计分布数列。或频率的累计分布数列。1.1.向上累计:向上累计: 是指将各组次数或频率由是指将各组次数或频率由变量值低的变量值低的组组向向变量高的组变量高的组累计累计。2.2.向下累计:向下累计: 是指将各组次数或频率,由是指将各组次数或频率,由变量值高变量值高的组的组向向变量值低的组变量值低的组逐组逐组累计累计。 如:如:表表3-23-2 . .累计分布有累计分布有向上累计向上累计和和向下累计向下累计两种:两种:如:如:

45、表表3-23-2 . .二、定序数据频数分布表【例例例例3.23.2】在在在在一一一一项项项项城城城城市市市市住住住住房房房房问问问问题题题题的的的的研研研研究究究究中中中中,研研研研究究究究人人人人员员员员在在在在甲甲甲甲乙乙乙乙两两两两个个个个城城城城市市市市各各各各抽抽抽抽样样样样调调调调查查查查300300户户户户,其其其其中中中中的的的的一一一一个个个个问问问问题题题题是是是是:“ “您您您您对对对对您您您您家家家家庭庭庭庭目目目目前前前前的的的的住住住住房房房房状状状状况况况况是是是是否否否否满满满满意意意意?1 1非非非非常常常常不不不不满满满满意意意意;2 2不不不不满满满满意

46、意意意;3 3一一一一般般般般;4 4满满满满意意意意;5 5非常满意。非常满意。非常满意。非常满意。 表表3-2 3-2 甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲甲城市城市户数户数( (户户) )百分比百分比(%)(%)向上累积向上累积 向下累积向下累积 户数户数( (户户) )百分比百分比(%)(%)户数户数( (户户) )百分比百分比(%)(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意24241081089393454530308 8363631311515101024241321322252252702703

47、003008.08.044.044.075.075.090.090.0100.0100.030030027627616816875753030100.0100.09292565625251010合计合计300300100.0100.0表表3-3 3-3 乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布回答类别回答类别乙城市乙城市户数户数( (户户) )百分比百分比(%)(%)向上累积向上累积 向下累积向下累积 户数户数( (户户) )百分比百分比(%)(%)户数户数( (户户) )百分比百分比(%)(%) 非非 常常 不不 满满意意 不满意不满意 一般一般 满意满意 非常满

48、意非常满意212199997878646438387.07.033.033.026.026.021.321.312.712.721211201201981982622623003007.07.040.040.066.066.087.387.3100.0100.03003002792791801801021023838100.0100.093.093.060.060.034.034.012.712.7合计合计300300100.0100.0顺序数据的图示累计频数分布图243001322252700100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(a)向上累积向上累

49、积27616830300750100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(b)向下累积向下累积甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布环形图环形图1.1.环环形形图图中中间间有有一一个个“空空洞洞”,样样本本或或总总体体中中的的每一部分数据用环中的一段表示;每一部分数据用环中的一段表示;2.2.与饼图类似,但又有区别:与饼图类似,但又有区别:q饼图只能显示一个总体各部分所占的比例饼图只能显示一个总体各部分所占的比例q环环形形图图则则可可以以同同时

50、时绘绘制制多多个个样样本本或或总总体体的的数数据据系系列,每一个样本或总体的数据系列为一个环列,每一个样本或总体的数据系列为一个环3.3.用于结构比较研究;用于结构比较研究; 4.4.用于展示分类和顺序数据。用于展示分类和顺序数据。8%36%31%15%7%33%26%21%13%10% 非常不满意 不满意 一般 满意 非常满意 甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价环形图环形图3.3 3.3 数值型数据的整理与展示数值型数据的整理与展示3.3.1 3.3.1 数据分组与频数分析数据分组与频数分析3.3.2 3.3.2 数值型数据的图示数值型数据的图示3.3.1 数据分组

51、与频数分布数据分组与频数分布1、排序,求全距(全距最大值最小值);排序,求全距(全距最大值最小值);2、确定变量的数据形式(单变量分组、组距分组);、确定变量的数据形式(单变量分组、组距分组);3、确定组数:、确定组数: 斯特格斯(斯特格斯(Sturges)经验公式经验公式:4、确定各组组距:、确定各组组距: 组距组距=全距全距/组数组数=(最大值最小值最大值最小值) /组数组数 5、根据分组整理成频数分布表、根据分组整理成频数分布表(确定各组组限,计算频数)(确定各组组限,计算频数)数据分组的步骤数据分组的步骤数据分组的步骤数据分组的步骤频数分布表的编制实例117 122 124 129 1

52、39 107 117 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121【例例例例2 2】某某某某生生生生产产产产车车车车间间间间 5050名名名名 工工工工 人人人人 日日日日 加加加加工工工工 零零零零 件件件件 数数数数 如如如如 下下下下(单单单单位位位位:个个个个)。对数据进行分组。对数据进行分组。对数据

53、进行分组。对数据进行分组。 1、排序,求全距:、排序,求全距:107 108 108 110 112 112 112 114 115 117117 117 118 118 118 119 120 120 121 122122 122 122 123 123 123 123 124 124 124125 125 126 126 127 127 127 128 128 129130 131 133 133 134 134 135 137 139 139全距最大值最小值全距最大值最小值139107322、确定变量的数据形式表表3-3 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表(

54、*单变量值分组)单变量值分组)单变量值分组)单变量值分组)零件数零件数(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)1071081101121131141151171181212111331191201211221231241251261271214432231281291301311331341351371392111221123 3、确定组数、确定组数K=1log10N/log102 =1+3.322lgN 13.322lg50 74 4、确定各组组距、确定各组组距组距=全距/组数 =(最大值最小值) /组数 =32 /7 =4.6 55

55、5、根据分组整理成频数分布表、根据分组整理成频数分布表表表3-4 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表(*组距分组:等距分组)组距分组:等距分组)按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)105110110115115120120125125130130135135140358141064610162820128合计合计50100等距分组表等距分组表(使用开口组)(使用开口组)表表2-5 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)110以下以下110115115120

56、120125125130130135135以上以上358141064610162820128合计合计50100频数分布表的编制【例例例例3 3】表表中中是是 某某 电电 脑脑 公公司司 20052005年年 前前四四 个个 月月 各各 天天的的 销销 售售 量量 数数据据( (单单位位:台台) )。试试对对数数据据进行分组进行分组3.3.2 3.3.2 数据值型数据的图形显示数据值型数据的图形显示ExcelExcel1 1、分组数据、分组数据直方图和折线图直方图和折线图2 2、未、未分组数据分组数据茎叶图和箱线图茎叶图和箱线图分组数据直方图(histogram)u用于展示分组用于展示分组数据分

57、布数据分布数据分布数据分布的一种图形。的一种图形。u用矩形的宽度和高度来表示频数分布。用矩形的宽度和高度来表示频数分布。n本质上是用矩形的本质上是用矩形的面积面积面积面积来表示频数分布来表示频数分布u在在直直角角坐坐标标系系中中,用用横横轴轴表表示示数数据据分分组组,纵纵轴轴表表示示频频数数或或频频率率,各各组组与与相相应应的的频频数数就就形形成成了了一一个个矩形,即直方图。矩形,即直方图。u直方图下的总面积等于直方图下的总面积等于1 1。直方图的绘制直方图的绘制140140 150150210210直方图下的面直方图下的面直方图下的面直方图下的面积之和等于积之和等于积之和等于积之和等于1 1

58、某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图我我一一眼眼就就看看出出来来了了,销销售售量量在在 170170 180180之之间间的的天天数数最最多多! !190190 200200180180160160 170170频频频频频频数数数数数数( (天天天天天天) )25252020151510105 53030220220 230230 240240销售量(台)销售量(台)直方图与条形图的区别1.1.条条形形图图是是用用条条形形的的长长度度( (横横置置时时) )表表示示各各类类别别频频数数的多少,其宽度的多少,其宽度( (

59、表示表示类别类别类别类别) )则是则是固定固定固定固定的;的;2.2.直直方方图图是是用用面面面面积积积积表表示示各各组组频频数数的的多多少少,矩矩形形的的高高度度表表示示每每一一组组的的频频数数或或百百分分比比,宽宽度度则则表表示示各各组组的组距,其高度与宽度均有意义;的组距,其高度与宽度均有意义;3.3.直直方方图图的的各各矩矩形形通通常常是是连连续续排排列列,条条形形图图则则是是分分开排列;开排列;4.4.条条形形图图主主要要用用于于展展示示分分类类数数据据,直直方方图图则则主主要要用用于展示数值型数据。于展示数值型数据。分组数据折线图1.折线图也称频数多边形图;折线图也称频数多边形图;

60、2.是是在在直直方方图图的的基基础础上上,把把直直方方图图顶顶部部的的中中点点(组组中中值值)用直线连接起来,再把原来的直方图抹掉;用直线连接起来,再把原来的直方图抹掉;3.折线图的两个终点要与横轴相交,具体的做法是折线图的两个终点要与横轴相交,具体的做法是q第第一一个个矩矩形形的的顶顶部部中中点点通通过过竖竖边边中中点点(即即该该组组频频数数一一半半的的位位置置)连连接接到到横横轴轴,最最后后一一个个矩矩形形顶顶部部中中点点与与其其竖竖边边中点连接到横轴;中点连接到横轴;q折折线线图图下下所所围围成成的的面面积积与与直直方方图图的的面面积积相相等等,二二者者所所表示的频数分布一致。表示的频数

61、分布一致。折线图的绘制折线图的绘制折线图与直方图折线图与直方图折线图与直方图折线图与直方图折线图与直方图折线图与直方图下的面积相等!下的面积相等!下的面积相等!下的面积相等!下的面积相等!下的面积相等!140140 150150210210某电脑公司销售量分布的折线图某电脑公司销售量分布的折线图某电脑公司销售量分布的折线图某电脑公司销售量分布的折线图190190 200200180180160160 170170220220 230230240240频频频频频频数数数数数数( (天天天天天天) )25252020151510105 53030销售量(台)销售量(台)未分组数据茎叶图(stem-

62、and-leaf)u用于显示未分组的原始数据的分布用于显示未分组的原始数据的分布u由由“茎茎”和和“叶叶”两两部部分分构构成成,其其图图形形是是由由数数字字组组成成的的以以该该组组数数据据的的高高位位数数值值作作树树茎茎,低低位位数数字字作作树树叶,树叶上只保留最后一位数字叶,树叶上只保留最后一位数字u对于对于n(20 n 300)个数据,茎叶图最大行数不超过个数据,茎叶图最大行数不超过 L = 10 lg n u茎叶图类似于横置的直方图,但又有区别:茎叶图类似于横置的直方图,但又有区别:n直直方方图图可可观观察察一一组组数数据据的的分分布布状状况况,但但没没有有给给出出具具体体的的数值数值n

63、茎茎叶叶图图既既能能给给出出数数据据的的分分布布状状况况,又又能能给给出出每每一一个个原原始始数值,保留了原始数据的信息数值,保留了原始数据的信息n直方图适用于大批量数据,茎叶图适用于直方图适用于大批量数据,茎叶图适用于小批量数据小批量数据小批量数据小批量数据树茎树茎树茎树茎 树叶树叶树叶树叶78878802234777888902234777888900122223333444667778890012222333344466777889013344579901334457991010111112121313数据个数数据个数数据个数数据个数3 3131324241010茎叶图类似横置茎叶图类似

64、横置茎叶图类似横置茎叶图类似横置的直方图的直方图的直方图的直方图茎叶图的制作茎叶图的制作某车间工人日加工零件数的茎叶图某车间工人日加工零件数的茎叶图某车间工人日加工零件数的茎叶图某车间工人日加工零件数的茎叶图未分组数据箱线图(box plot)1.用于显示未分组的原始数据的分布;用于显示未分组的原始数据的分布;2.由由一一组组数数据据的的5个个特特征征值值绘绘制制而而成成,它它由由一一个个箱箱子子和两条线段组成;和两条线段组成;3.绘制方法:绘制方法:q首首先先找找出出一一组组数数据据的的5个个特特征征值值,即即最最最最大大大大值值值值、最最最最小小小小值值值值、中中中中位位位位数数数数MMe

65、 e和和两两个个四四四四分分分分位位位位数数数数(下下四四分分位位数数QL和和上上四四分分位位数数QU);q连连接接两两个个四四分分位位数数画画出出箱箱子子,再再将将两两个个极极值值点点与与箱箱子子相相连接;连接;q该箱线图也称为该箱线图也称为Median/Quart./Range箱线图箱线图 。箱线图的构成中位数中位数4 46 68 810101212QQU UUQQL LLX X最大值最大值最大值X X最小值最小值最小值Median/Quart./RangeMedian/Quart./Range箱线图箱线图箱线图箱线图箱线图的构成:单批数据箱线图单批数据箱线图最小值最小值最小值141141

66、141最大值最大值最大值237237237中位数中位数中位数182182182下四分位数下四分位数下四分位数170.25170.25170.25上四分位数上四分位数上四分位数197197197140 150 160 170 180 190 200 210 220 230 240140 150 160 170 180 190 200 210 220 230 240140 150 160 170 180 190 200 210 220 230 240某电脑公司销售量数据的某电脑公司销售量数据的某电脑公司销售量数据的某电脑公司销售量数据的Median/Quart./RangeMedian/Quart

67、./Range箱线图箱线图箱线图箱线图分布的形状与箱线图分布的形状与箱线图 对称分布对称分布对称分布对称分布对称分布对称分布Q QQL LL中位数中位数中位数中位数中位数中位数 Q QQU UU左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布Q QQL LL中位数中位数中位数中位数中位数中位数 Q QQU UU右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布Q QQL LL 中位数中位数中位数中位数中位数中位数 Q QQU UU不同分布的箱线图不同分布的箱线图不同分布的箱线图不同分布的箱线图3.4 3.4 次数分布及其类型次数分布及其类型 次数分布及其类型3.4.1 3.4.1 分配数列的概念

68、和构成要素分配数列的概念和构成要素3.4.2 3.4.2 分配数列的种类及编制方法分配数列的种类及编制方法3.4.3 3.4.3 次数分布的主要类型次数分布的主要类型. . 3.4.1 3.4.1 分配数列的概念和构成要素分配数列的概念和构成要素 分配数列分配数列是指在是指在统计分组统计分组的基础的基础上,将总体所有单位按组归类排队,形成总体中各上,将总体所有单位按组归类排队,形成总体中各单位在各组间的分布,又称单位在各组间的分布,又称分布数列分布数列或或统计分布统计分布。 分配数列的概念。分配数列的概念。按性别按性别 分分 组组男男 生生 女女 生生合合 计计表表3-63-6表表3-73-7

69、按考分按考分 分分 组组 505060 60 606070 70 707080 80 808090 90 9090100100合合 计计 人数人数 (人)(人) 频率频率 ()()202030306060404050501001005 5人数人数(人)(人) 频率频率()()1010303010101515181850502 236364 42020100100. . 分配数列的构成要素分配数列的构成要素分配数列的分配数列的构成要素构成要素总体按某标志所分的各个组总体按某标志所分的各个组各组次数各组次数或或频率频率次数(频数):次数(频数):频率:频率:所以,所以,次数或频率分布形成的数列叫分

70、配数列。次数或频率分布形成的数列叫分配数列。即分布在各组的单位数。即分布在各组的单位数。即各组次数与总次数之比。即各组次数与总次数之比。. . 3.4.2 3.4.2 分配数列的种类及编制方法分配数列的种类及编制方法 (一)品质数列(一)品质数列 分配数列分配数列的种类的种类1.1.单项式变单项式变 量数列量数列 2.2.组距式变组距式变 量数列量数列 (二)变量数列(二)变量数列 . . (一)品质分配数列(一)品质分配数列 按按品质标志分组品质标志分组所形成的分配数列称为所形成的分配数列称为品质分配品质分配数列(品质数列)数列(品质数列)。 按性别分组按性别分组人数人数(人)(人) 频率频

71、率()()男男 生生 女女 生生30 30 2020 60 60 40 40合合 计计5050100100 一般来说品质数列较容易编制,它通常能准确地反映总体的分一般来说品质数列较容易编制,它通常能准确地反映总体的分配特征,一旦分组标志确定以后,配特征,一旦分组标志确定以后,其分布数列的形式是唯一的。其分布数列的形式是唯一的。例如:例如:表表3-83-8. . (二)变量数列(二)变量数列 按按数量标志分组数量标志分组所形成的分布数列称为所形成的分布数列称为变量变量分配数列(变量数列)分配数列(变量数列)。 按顺序列出的各组变量值及相应的频率,即成按顺序列出的各组变量值及相应的频率,即成为为变

72、量的频率分布。变量的频率分布。 按考分分组按考分分组 人数人数(人)(人)频率频率()()505060 60 606070 70 707080 80 808090 90 9090100100 5 5 15 15 18 18 10 10 2 210 10 30 30 36 36 20 20 4 4合合 计计5050100100例如例如:表表3-93-9 注意:注意:任何一个任何一个频率分布频率分布都必须都必须满足两个条件:满足两个条件:一一是各组频率是各组频率0 0;二是各组频率之和等于;二是各组频率之和等于100100。1.1.单项式变量数列单项式变量数列2.2.组距式变量数列组距式变量数列(

73、由单项式分组形成)(由单项式分组形成)居民家庭按子居民家庭按子女数分组女数分组(个)(个)户数户数 (户)(户)0 01 12 23 34 4 20 20 60 60150150 90 90 40 40合合 计计360360按考分按考分分组分组人数人数(人)(人)频率频率()()505060606060707070708080808090909090100100 5 5151518181010 2 21010303036362020 4 4合合 计计5050100100表表3-103-10(单项式变量数列)单项式变量数列)(组距式变量数列)组距式变量数列)表表3-113-11变量变量数列数列(

74、由组距式分组形成)(由组距式分组形成). . 3.4.3 3.4.3 次数分布的主要类型次数分布的主要类型 次数分布类型主要有三种:次数分布类型主要有三种:钟型分布、钟型分布、型分布型分布和和J型分布型分布 。 其其分布特征分布特征是是“两头两头小,中间大小,中间大”,即靠近中间的变即靠近中间的变量值分布分布的次数多,靠近两量值分布分布的次数多,靠近两端的变量值分布分布的次数少。端的变量值分布分布的次数少。1.1.钟型分布:钟型分布:fx正态分布正态分布 即其分布曲线形如一口古钟,故称钟型分布例如,即其分布曲线形如一口古钟,故称钟型分布例如,如如人的身高、体重、职工工资、农作物亩产量、市场价格

75、、人的身高、体重、职工工资、农作物亩产量、市场价格、学生的考分等现象都属于学生的考分等现象都属于钟型分布钟型分布。其分布又可分为以下两种:其分布又可分为以下两种:正态分布正态分布和和偏态分布。偏态分布。 图图 3-13-1 . . . 正态分布:正态分布: 中间变量值分布的次数最多,两侧变量值分布的次中间变量值分布的次数最多,两侧变量值分布的次数随着与中间变量值距离的增大而渐次减少,并且围绕中心变数随着与中间变量值距离的增大而渐次减少,并且围绕中心变量值两侧呈对称分布。量值两侧呈对称分布。见见图图3-13-1 。. . 偏态分布:偏态分布: 当变量值存在极大值时,当变量值存在极大值时,次数分布

76、曲线会较正态分布向右延次数分布曲线会较正态分布向右延伸,这种分布称为伸,这种分布称为右偏分布右偏分布,见见图图3-23-2。右偏分布右偏分布 当变量值存在极小值时,当变量值存在极小值时,次数分布次数分布曲线就会较正态分布向左延伸,这种曲线就会较正态分布向左延伸,这种分布称为分布称为左偏分布左偏分布。图图 3- -2图图 3- -3左偏分布左偏分布见见图图3-33-3。 xffx 其其分布的特征是分布的特征是一边小一一边小一边大的单调分布边大的单调分布,即形如字母,即形如字母J字。字。 它是与钟型分布图形相反它是与钟型分布图形相反的分布,其特点是:越的分布,其特点是:越靠近中间变量靠近中间变量值

77、分布次数较少;越靠近两端变量值值分布次数较少;越靠近两端变量值分布的次数较多,形成分布的次数较多,形成“两头大、中两头大、中间小间小”的分布特征。的分布特征。. . 2.2.型分布:型分布:见见图图3-43-4。3.3.J型分布:型分布:U型分布型分布xf图图3-43-4 J型分布有两种类型,即:型分布有两种类型,即:正正J型分型分布布与与反反J分布分布。 见见图图3-53-5和和图图3-63-6。图图3-53-5xf正正J型分布型分布反反J型分布型分布图图3-63-6xf频数分布的类型频数分布的类型对称分布对称分布对称分布右偏分布右偏分布右偏分布左偏分布左偏分布左偏分布正正正J J J型分布

78、型分布型分布反反反J J J型分布型分布型分布U UU型分布型分布型分布几种常见的频数分布几种常见的频数分布几种常见的频数分布几种常见的频数分布3.5 3.5 统计图和统计表的使用统计图和统计表的使用统计图和统计表 3.5.1 3.5.1 统计图统计图 3.5.2 3.5.2 统计表统计表3.5.1 统计表20022003年我国城镇居民家庭抽样调查资料年我国城镇居民家庭抽样调查资料项目项目单位单位2002年年 2003年年 调查户数调查户数 平均每户家庭人口平均每户家庭人口 平均每户就业人口平均每户就业人口 平均每户就业面平均每户就业面 平均一名就业者负担人数平均一名就业者负担人数 平均每人全

79、部年收入平均每人全部年收入 可支配收入可支配收入 平均每人消费性支出平均每人消费性支出户户人人人人%元元元元元元元元453173.041.5851.971.928177.407702.806029.88480283.011.5852.491.919061.228472.206510.94资料来源:资料来源:中国统计年鉴中国统计年鉴2004,中国统计出版社,中国统计出版社,2004,第,第359页。页。注:本表为城市和县城的城镇居民家庭抽样调查资料。注:本表为城市和县城的城镇居民家庭抽样调查资料。 行行行行标标标标题题题题列列列列标标标标题题题题数数数数字字字字资资资资料料料料表头表头表头表头附

80、附附附加加加加主词栏主词栏宾词栏宾词栏统计表的结构(分别从形式和内容来看)1.总总标标题题要要简简明明确确切切地地概概括括统统计计表表内内容容,一一般般需需满满足足3W (统计数据的时间、地点及何种数据)(统计数据的时间、地点及何种数据)要求;要求;2.数数据据计计量量单单位位相相同同时时,可可放放在在表表的的右右上上角角标标明明,不不同同时时应放在每个变量后或单列出一列标明;应放在每个变量后或单列出一列标明;3.表中的上下两条横线一般用粗线,其他用细线;表中的上下两条横线一般用粗线,其他用细线;4.通常情况下,统计表的左右两边不封口;通常情况下,统计表的左右两边不封口;5.表表中中的的数数据

81、据一一般般是是右右对对齐齐,有有小小数数点点时时应应以以小小数数点点对对齐齐,而且小数点的位数应统一;而且小数点的位数应统一;6.对于没有数字的表格单元,一般用对于没有数字的表格单元,一般用“”表示;表示;7.必要时可在表的下方加上注释。必要时可在表的下方加上注释。统计表的设计 统统计计图图是是用用点点、线线、面面或或立立体体图图形形等等形形式式直直直直观观观观地地表表达达统统计计资资料料的的数数数数值值值值大大大大小小小小、分分分分布布布布情情情情况况况况、发发发发展展展展变变变变化化化化趋趋趋趋势势势势或或相相相相互互互互关关关关系系系系 等。统统计计图图所所表表示示的的数数量量关关系系,

82、比比统统计计表表更更加加明明白白具具体体,使使人人一一目目了然,印象深刻了然,印象深刻 。5.5.2 统计图u标题:图的标题应简明扼要,切合图的内容,标题:图的标题应简明扼要,切合图的内容,必要时可注明时间、地点。必要时可注明时间、地点。u图号:文章中若有几幅画,则需按其出现的图号:文章中若有几幅画,则需按其出现的先后次序编上序号,写在图题的左前方。先后次序编上序号,写在图题的左前方。u标目:对于有纵横轴的统计图,应在纵横轴标目:对于有纵横轴的统计图,应在纵横轴上分别标明统计项目及其尺度。上分别标明统计项目及其尺度。u图形:图形线在图中为最粗,而且要清晰。图形:图形线在图中为最粗,而且要清晰。 统计图的结构u 条形图与柱状图(大小的比较)条形图与柱状图(大小的比较)u 饼图(总体的结构)饼图(总体的结构)u直方图、茎叶图和箱式图(数据分布)直方图、茎叶图和箱式图(数据分布)u 时序图(发展变化趋势)时序图(发展变化趋势)u 散点图(两变量之间的关系)散点图(两变量之间的关系)常用统计图

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 试题/考题 > 初中试题/考题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号