365编号统计学基础课件(第三章统计数据的整理与展示)

上传人:玩*** 文档编号:145843560 上传时间:2020-09-23 格式:PPT 页数:104 大小:2.83MB
返回 下载 相关 举报
365编号统计学基础课件(第三章统计数据的整理与展示)_第1页
第1页 / 共104页
365编号统计学基础课件(第三章统计数据的整理与展示)_第2页
第2页 / 共104页
365编号统计学基础课件(第三章统计数据的整理与展示)_第3页
第3页 / 共104页
365编号统计学基础课件(第三章统计数据的整理与展示)_第4页
第4页 / 共104页
365编号统计学基础课件(第三章统计数据的整理与展示)_第5页
第5页 / 共104页
点击查看更多>>
资源描述

《365编号统计学基础课件(第三章统计数据的整理与展示)》由会员分享,可在线阅读,更多相关《365编号统计学基础课件(第三章统计数据的整理与展示)(104页珍藏版)》请在金锄头文库上搜索。

1、,第三章 统计数据 的整理与展示,教学目的与要求: 本章阐述统计整理的理论与方法,包括统计分组、汇总和统计表的设计。 学习本章,要求: 1.明确统计整理在统计研究中承前启后的地位。 2.掌握分组方法和汇总技术。 3.认识统计分布是统计整理的重要表现形式。 4.学会统计表的编制并能熟练运用,统计学原理(第三讲),第一节 统计的整理整理,一、统计数据整理的概念,根据统计研究的任务与要求,对统计调查阶段所搜集到的原始资料进行加工与汇总,使其条理化、系统化的工作过程称统计整理。统计整理包括对原始资料和次级资料的整理。,统计整理是统计调查的继续,统计分析的前提和基础。,(二)统计数据整理的程序,制定统计

2、整理方案,统计资料的审核,进行统计分组,进行加工汇总编制分配数列,编制统计表和绘制统计图,统计数据资料的积累保管和公布,二、统计分组,根据统计研究任务的要求和研究现象总体的内在特点,把现象总体按某一标志划分为若干性质不同但又有联系的几个部分称统计分组。,(一)统计分组的概念,例如,将某一班级的全体同学按照性别划分为男、女两个组;对某市100家大型零售商店按照零售额、职工人数进行分组等。,统计分组具有两个方面的含义: 对总体而言,是“分”,即将同质总体区分为性质有别的不同组成部分; 对总体单位而言,它是“组”,即将性质相同或相近的不同总体单位组合在一起,构成一个组。,例如,要了解我国人口状况,只

3、知道总人口数量是不够的,而应将人口总体按照年龄、性别、民族、城乡、文化程度等分组,才能进一步地深入地了解我国人口总体的年龄结构、性别比例、民族构成等。,(二)统计分组的分类,按分组标志的多少,简单分组,只按照一个标志进行分组,复杂分组,按照两个或两个以上的标志进行分组,并且层叠在一起。,如企业按经济类型,隶属关系、规模、轻重工业分组均属于简单分组:,按经济类型分组 国有经济 集体经济 私营经济 个体经济 联营经济 股份制经济 外商投资经济 港澳台投资经济,按隶属关系分类 中央企业 地方企业,按轻重工业分类 轻工业 重工业,按企业规模分类 大型工业企业 中型工业企业 小型工业企业,复合分组是先按

4、一个标志分组,在此基础上再按第二个标志分组,又再此基础上按照第三个标志分组,依次类推。,如工业企业先按轻重工业分组,在此基础上又按企业规模分类,轻工业 大型企业 中型企业 小型企业,重工业 大型企业 中型企业 小型企业,复合分组的特点是可以从不同的角度了解总体内部的差别和关系,比简单分组更全面更深入的研究问题,注意两点,1、分组的标志不宜过多,2、只有在总体包含的单位数很多的情况下,适当采取分组才有意义,按分组标志的性质,品质分组,按品质标志进行分组。主要反映被研究现象的质的属性或特征,变量分组,按照数量标志进行的分组。主要反映的是总体单位的数量特征。,二、统计分组的原则,统计分组必须遵循穷尽

5、和互斥两条原则。穷尽原则就是总体中的每一个单位都有组可归,无一遗漏。互斥原则就是在特定的分组标志下,总体中的任何一个单位只能归属于某一组,而不能同时归属几个组。,(三)、分组标志的选择,分组标志是将现象总体划分为不同类型的组的标准或依据。,统计分组的关键是分组标志的选择,因为选择什么样的分组标志就有什么样的分组,什么样的分组体系。分组标志选择的是否正确,关系到能否正确地反映总体的性质特征,能否实现统计研究的目的和任务。,分组标志一旦选定,就必然突出了总体在该标志下性质差异掩盖了总体在其他标志下的差异。分组标志选择不当,就无法显示现象的根本特征,歪曲社会经济的真实情况。正确选择分组标志是保证实现

6、统计分组任务的关键,是统计研究获得正确结论的前提。,恰当得选择分组标志,须注意一下问题:,1、根据统计研究的目的进行选择,2、若干个标志,要选择最能反映事物本质特征的标志作为分组标志,另:同一标志在某以历史条件下最能反映事物的本质特征,而在另一历史条件下不一定能反映事物的本质特征。,(三)、关于分组标志的选择问题,1为什么说统计分组的关键是分组标志 的选择?,2怎样正确选择分组标志?,四、统计分组的方法,1、品质分组的方法,按品质标志分组就是选择反映事物属性差异性的品质标志作分组标志,并在品质标志的变异范围内划分各组界限,将总体划分为若干性质不同而又有联系的几个部分。,例如,人口按性别、文化程

7、度、民族、籍贯等标志分组;企业按经济类型、轻重工业、隶属关系,企业规模等标志分组等。,2、变量分组的方法,变量分组就是选择反映事物数量差异的数量标志作为分组标志,并在数量标志的变动范围内划分各界限,将总体划分为若干性质不同而又有联系的组成部分。,例如,地区经济按国内生产总值分组、企业按销售收入分组等,(1)单项分组与组距分组 单项式分组 一个变量作为一组 组距式分组 一个区间作为一组,如果变量值的变动幅度较小,就可采用单项式分组。如果变量值的变动幅度较大,采用组距式分组。,单项式分组 组距式分组 家庭按儿童数分组 职工按月工资分组 0 700-800 1 800-900 2 900-1000,

8、2等距分组与不等距分组 区间的距离叫组距。在组距式分组中,如果每组的组距相等,则称为等距分组;不相等则称为不等距分组 应用条件:标志值变动比较均匀的情况下,采用等距分组。如产品合格率、企业按职工人数分组、职工按月工资分组等。 标志值变动不均匀,变动幅度较大时,采用不等距分组。如人口普查,将人口按年龄分组为:0-14岁、 15-64岁和65岁以上三个组。,3组限与组中值,在进行组距式分组时,组距两边的数据称为组限。每组的起点值称为下限,每组的终点值称为上限。,组距就是上限与下限之差。,组中值是上限与下限的中点数值,它是各组上下限数值的简单平均,用来代表组标志值的一般水平。计算方法是(上限+下限)

9、/2或(下限+组距/2).,统计学原理(第三讲),按学生人数分组 按工资分组 50-59 400-500 60-69 500-600 70-79 600-700 80-90 700-800,按工资分组 组中值 人数 300元以下 250 10 300400 350 20 400600 500 25 600元以上 700 12,组中值的计算,离散变量相邻两组的上下限既可以间断,也可以重叠;连续变量相邻两组的上下限只能重叠。,在确定组限时应该注意: 第一,最下组的下限应低于最小变量值,最大组的上限应高于最大变量值 第二,组限的确定应该有利于反映总体分布的规律性 第三,如果组距为5,10,-、100

10、,则每组的下限最好是他们的倍数。,(一)分配数列的概念、构成要素 在统计分组的基础上,总体中的所有单位按其所属的组别归类整理,并且按照一定的顺序排列,形成总体单位数在各组分布的一系列数字,称为分配数列,又称次数分配或次数分布。 分配数列中,分布在各个组的总体单位数叫次数,又称频数。 如果将分组标志序列与各组相对应的频率按照一定的顺序排列,就形成频率分布数列。 分配数列有两个组成要求:一是分组;另一个是次数或比率。它可根据分组标志的性质不同,可以分为品质数列与变量数列。,五、分配数列,2000年我国人口性别构成情况,分组名称,次数(频数),比率(频率),(二) 品质数列与变量数列,它是按品质标志

11、分组的数列,用来观察总体单位中不同属性的单位分布情况。如上表就是品质数列。,品质数列的编制比较简单,但要注意分组时,应包括分组标志的所有表现,不能有遗漏,各种表现相互独立,不得相融。,变量数列是将总体按数量标志分组,将分组后形成的各组变量值与该组中所分配的单位次数或频数,按照一定的顺序相对应排列所形成的分配数列。,某班级统计学成绩分布表,(各组变量值) (次数)或(频数) 比率,(变量分组),第一步,将原始资料按数值大小依次进行排列 第二部 确定变量的类型和分组的方法(如单项式分组或组距式分组 第三步,确定组数和组距:组距=全距/组数 全距=最大值-最小值 第四步,确定组限以及表示方法 第五步

12、,汇总各组出现的次数,并计算频率,(三)变量数列的编制方法,例对某企业30个工人完成劳动定额的情况进行调查,某原始资料如下(%) 98 81 95 84 93 86 91 102 100 103 105 100 104 108 107 108 106 109 112 114 117 125 115 120 119 118 116 129 113 可以通过编制变量数列来反映工人的完成情况,步骤如下,第一步:计算全距 将各变量值由小到大排序,确定某最大值,最小值,并计算全距。 变量的最大值是129最小值是81,全距 = 最大值 - 最小值=129 - 81= 48 第二步:确定组数和组距 在等距分

13、组时,组距与组数的关系是:,本例中根据一般将成绩分成优、良、中、及格和不及格的五档评分习惯,可以先确定组数为5。 在等距分组时,计算组距如下:,组距=48/5=9.6,为了符合习惯和计算方便,组距近似地取 10,第三步:确定组限 关于组限的确定,应注意如下几点: 第一,最小组的下限(起点值)应低于最小变量值,最大组的上限 (终点值)应高于最大变量值。 第二,组限的确定应有利于表现出总体分布的特点,应反映出事物质的变化。 第三,为了方便计算组限应尽可能取整数,最好是5或10的整倍数。 第四,由于变量有连续型变量和离散型变量两种,其组限的确定方法是不同的。,某企业30个工人劳动定额完成情况分布图表

14、,第四步:编制频数(频率)分布表,第五步:计算累计频数和累计频率 为了更详细的认识变量的分布特征,还可以计算累计频数和累计频率, 编制累计频数和累计频率数列。累计频数和累计频率有向上累计频数(频率) 和向下累计频数(频率)两种。 以变量值大小为依据,由变量值小的组向变量值大的组累计频数和频率, 成为向上累计频数和向上累计频率。 向上累计数的意义是:小于各组的该组上限的各组的频数或频率之和;相反, 由变量值大的组向变量值小的组累计各组的频数或频率,称为向下累计频数或向 下累计频数。 向下累计数的意义是:大于及等于该组下限的各组的频数或频数 或频率之和。 根据某企业工人完成劳动定额的资料编制的向上

15、累计频数(频率) 和向下累计频数(频率)分布如表38。 表38 某企业工人完成劳动定额累计分布表,表38 某企业工人完成劳动定额累计分布表,(四)次数分布的主要类型,(一)钟形分布 钟形分布的特征是“两头小、中间大”,即靠近中间的变量值分布的次数多,靠近两端的变量值分布的次数少,如果将变量值与其对应的频数在直角坐标系中对应的点连接起来绘制成曲线图,宛如一口钟,所以又称钟形分布。,在自然或社会经济现象中,有许多次数分布是属于钟形分布的。例如,人体体重、身高,学生的成绩,居民货币收入,单位面积的农产品产量,市场价格等现象都属于钟形分布。,(二)U形分布 U形分布的特征是:靠近中间的变量值分布的次数

16、少,靠近两端的变量值分布的次数多,形成“两头大,中间小”的分布特征。将这种分布绘成曲线,像英文字母“U”的形状,故称U形分布 例如,人口死亡率的分布,一般是婴幼儿死亡率和老年人死亡率均较高,而中年人死亡率最低,所以人口年龄分组的死亡率是呈U形分布的。另外,失业人口按年龄的分布等均呈U形分布。,(三)J形分布 J形分布的特征是“一边小,一边大”,即大部分变量值集中在某一端分布,有两种类型。 1、正J形分布 正J形分布是次数随着变量值的增大而增多。如投资额按利润率大小分布,一般是正J形分布。 2、反J形分布 反J形分布是次数随着变量值的增大而减小。如成年人数量按年龄大小分组,表现出年龄越高,人数越少。,第二节 统计数据的展示 一、统计表 1.统计表的概念 统计表是表现统计资料的一种形式。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 总结/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号