统计学统计数据的整理和显示

上传人:壹****1 文档编号:593234352 上传时间:2024-09-24 格式:PPT 页数:85 大小:1.48MB
返回 下载 相关 举报
统计学统计数据的整理和显示_第1页
第1页 / 共85页
统计学统计数据的整理和显示_第2页
第2页 / 共85页
统计学统计数据的整理和显示_第3页
第3页 / 共85页
统计学统计数据的整理和显示_第4页
第4页 / 共85页
统计学统计数据的整理和显示_第5页
第5页 / 共85页
点击查看更多>>
资源描述

《统计学统计数据的整理和显示》由会员分享,可在线阅读,更多相关《统计学统计数据的整理和显示(85页珍藏版)》请在金锄头文库上搜索。

1、第三章第三章 统计数据的整理和显示统计数据的整理和显示第一节 统计数据整理概述第二节 统计数据分组第三节 频数分布第四节 数据的显示本章主要内容第一节第一节 统计数据整理概述统计数据整理概述一、统计整理及其类型一、统计整理及其类型 统计整理:就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程。包括(1)对统计调查所搜集到的各种数据进行分类和汇总;(2)对现成的综合统计资料的整理。本章指的是第一种整理。 统计整理的意义: 1、统计整理是整个统计工作和研究过程的中间环节,起着承前启后的作用。统计整理是统计调查的继续,又是统计分析的基础。 2、统

2、计整理还是积累历史资料的必要手段。二、统计整理的内容二、统计整理的内容审核分组汇总编制统计图表统计资料整理的步骤统计资料整理的步骤统计资料整理的步骤统计资料整理的步骤 第一步,设计和制定统计整理方案。它是对资料整理工第一步,设计和制定统计整理方案。它是对资料整理工第一步,设计和制定统计整理方案。它是对资料整理工第一步,设计和制定统计整理方案。它是对资料整理工作的各个方面各步骤做出具体的安排与规定。作的各个方面各步骤做出具体的安排与规定。作的各个方面各步骤做出具体的安排与规定。作的各个方面各步骤做出具体的安排与规定。 第二步,对原始资料进行审核。审核被调查单位的资料第二步,对原始资料进行审核。审

3、核被调查单位的资料第二步,对原始资料进行审核。审核被调查单位的资料第二步,对原始资料进行审核。审核被调查单位的资料是否全部收齐,填报是否缺漏与差错,发现问题,及时是否全部收齐,填报是否缺漏与差错,发现问题,及时是否全部收齐,填报是否缺漏与差错,发现问题,及时是否全部收齐,填报是否缺漏与差错,发现问题,及时解决,以保证资料汇总计算能顺利进行。解决,以保证资料汇总计算能顺利进行。解决,以保证资料汇总计算能顺利进行。解决,以保证资料汇总计算能顺利进行。 第三步,对经过审核的资料进行分组、并结合汇总,计第三步,对经过审核的资料进行分组、并结合汇总,计第三步,对经过审核的资料进行分组、并结合汇总,计第三

4、步,对经过审核的资料进行分组、并结合汇总,计算出总体总量指标。算出总体总量指标。算出总体总量指标。算出总体总量指标。 第四步,将汇总计算的结果,以统计表或统计图的形式第四步,将汇总计算的结果,以统计表或统计图的形式第四步,将汇总计算的结果,以统计表或统计图的形式第四步,将汇总计算的结果,以统计表或统计图的形式表现出来。表现出来。表现出来。表现出来。 第五步,对统计资料妥善保存,系统积累。第五步,对统计资料妥善保存,系统积累。第五步,对统计资料妥善保存,系统积累。第五步,对统计资料妥善保存,系统积累。 三、统计整理的步骤四、数据的预处理四、数据的预处理(一)数据的审核1.审核资料的完整性和及时性

5、 审核资料的完整性,就是看调查单位或填报单位是否齐全;规定的项目是否都有答案,应报资料的份数是否符合规定。 审核资料的及时性,是看填报单位是否按时报送了有关资料。对不报、漏报或迟报的现象都要及时查清。2.审核资料的正确性: 审核资料的正确性,是检查所填报的资料是否准确可靠。常用的审核方法有两种:(1)逻辑检查 首先,从理论上或常识上检查资料是否有悖常理、有无不切实际或不符合逻辑的地方。 其次,是检查各项目之间有无相互矛盾的地方。(2)计算检查 即检查各项指标的计算口径、计量单位是否符合规定,并通过各种计算方法来检查各指标间的数字是否相互衔接。3.历史资料的审核:在利用历史资料(或其他间接资料)

6、时,应审核资料的可靠程度、指标含义、所属时间与空间范围、计算方法和分组条件与规定的要求是否一致。一般可以从调查资料的历史背景、调查者搜集资料的目的以及资料来源等,来判断资料的可靠程度,也可以从指标间的相互关系以及指标的变动趋势来检查它的正确性。(二)资料审核后的订正通过上述审核,如发现有缺报、缺份和缺项等情况,应及时催报、补报;如有不正确之处,则应分别不同情况作如下处理:(1)对于可以肯定的一般错误,应及时代为更正,并通知原报单位。(2)对于可疑之数或无法代为更正的错误,应要求原单位复查更正。(3)如果所发现的差错在其他单位也可能发生时,应将错误情况通报所有单位,以免发生类似错误。(4)对于严

7、重的错误,应发还重新填报,并查明发生错误的原因,若属于违法行为,则应依法严肃处理。第二节第二节 统计数据的分组统计数据的分组一、统计分组的概念一、统计分组的概念 统计分组就是根据统计研究的需要,将统计统计分组就是根据统计研究的需要,将统计统计分组就是根据统计研究的需要,将统计统计分组就是根据统计研究的需要,将统计总体按照一定的标志分为若干个组成部分的总体按照一定的标志分为若干个组成部分的总体按照一定的标志分为若干个组成部分的总体按照一定的标志分为若干个组成部分的一种统计方法。一种统计方法。一种统计方法。一种统计方法。 统计分组具有两个方面的含义:对总体而言,统计分组具有两个方面的含义:对总体而

8、言,统计分组具有两个方面的含义:对总体而言,统计分组具有两个方面的含义:对总体而言,是是是是“ “分分分分” ”,即将同质总体区分为性质有别的,即将同质总体区分为性质有别的,即将同质总体区分为性质有别的,即将同质总体区分为性质有别的不同组成部分;对总体单位而言,它是不同组成部分;对总体单位而言,它是不同组成部分;对总体单位而言,它是不同组成部分;对总体单位而言,它是“ “组组组组” ”,即将性质相同或相近的不同总体单位组,即将性质相同或相近的不同总体单位组,即将性质相同或相近的不同总体单位组,即将性质相同或相近的不同总体单位组合在一起,构成一个组。合在一起,构成一个组。合在一起,构成一个组。合

9、在一起,构成一个组。 二、统计分组的原则二、统计分组的原则(1)穷尽性原则(2)互斥性原则。三、统计分组的作用三、统计分组的作用 统计分组的主要作用具体表现在以下几个方面。统计分组的主要作用具体表现在以下几个方面。统计分组的主要作用具体表现在以下几个方面。统计分组的主要作用具体表现在以下几个方面。(一)区分现象的不同类型(一)区分现象的不同类型(一)区分现象的不同类型(一)区分现象的不同类型 各种现象千差万别,多种多样,并在其发展中表各种现象千差万别,多种多样,并在其发展中表各种现象千差万别,多种多样,并在其发展中表各种现象千差万别,多种多样,并在其发展中表现出不同的性质和特征。通过统计分组,

10、就可以现出不同的性质和特征。通过统计分组,就可以现出不同的性质和特征。通过统计分组,就可以现出不同的性质和特征。通过统计分组,就可以将不同类型现象的性质和特征区分开来,并且经将不同类型现象的性质和特征区分开来,并且经将不同类型现象的性质和特征区分开来,并且经将不同类型现象的性质和特征区分开来,并且经过比较和研究,揭示其发展变化的规律,达到深过比较和研究,揭示其发展变化的规律,达到深过比较和研究,揭示其发展变化的规律,达到深过比较和研究,揭示其发展变化的规律,达到深刻认识总体的目的。刻认识总体的目的。刻认识总体的目的。刻认识总体的目的。 19971997年社会固定资产投资分布情况年社会固定资产投

11、资分布情况年社会固定资产投资分布情况年社会固定资产投资分布情况 资料来源:资料来源:资料来源:资料来源:19971997年国民经济和社会发展统计公报年国民经济和社会发展统计公报年国民经济和社会发展统计公报年国民经济和社会发展统计公报,国家统计局国家统计局国家统计局国家统计局按投资主体性质分组按投资主体性质分组 投资额(亿元)投资额(亿元) 比重(比重(%) 国有经济国有经济集体经济集体经济城乡居民个人城乡居民个人其他其他 13 41913 4193 8733 8733 4273 4274 581 4 581 53.053.015.315.313.613.618.1 18.1 合计合计 25 3

12、00 25 300 100.0 100.0 (二)研究总体的内部结构(二)研究总体的内部结构(二)研究总体的内部结构(二)研究总体的内部结构 按照某种标志将总体划分为若干个不同的组,可按照某种标志将总体划分为若干个不同的组,可按照某种标志将总体划分为若干个不同的组,可按照某种标志将总体划分为若干个不同的组,可以计算出各组数值在总体中所占的比重,或各组以计算出各组数值在总体中所占的比重,或各组以计算出各组数值在总体中所占的比重,或各组以计算出各组数值在总体中所占的比重,或各组之间的比例关系,从而反映出总体的结构状况,之间的比例关系,从而反映出总体的结构状况,之间的比例关系,从而反映出总体的结构状

13、况,之间的比例关系,从而反映出总体的结构状况,加深对现象总体的认识。加深对现象总体的认识。加深对现象总体的认识。加深对现象总体的认识。 例如例如例如例如 按照地理位置不同将我国划分为东部、中按照地理位置不同将我国划分为东部、中按照地理位置不同将我国划分为东部、中按照地理位置不同将我国划分为东部、中部和西部三个地区,可以观察东、中、西三个部和西部三个地区,可以观察东、中、西三个部和西部三个地区,可以观察东、中、西三个部和西部三个地区,可以观察东、中、西三个不同地区经济发展水平和经济资源的差异,以不同地区经济发展水平和经济资源的差异,以不同地区经济发展水平和经济资源的差异,以不同地区经济发展水平和

14、经济资源的差异,以及它们在整个国民经济中所处的不同地位;对及它们在整个国民经济中所处的不同地位;对及它们在整个国民经济中所处的不同地位;对及它们在整个国民经济中所处的不同地位;对人口按照文化程度分组,计算大学及大学以上、人口按照文化程度分组,计算大学及大学以上、人口按照文化程度分组,计算大学及大学以上、人口按照文化程度分组,计算大学及大学以上、大学肄业及在校、高中、初中、小学、不识字大学肄业及在校、高中、初中、小学、不识字大学肄业及在校、高中、初中、小学、不识字大学肄业及在校、高中、初中、小学、不识字或识字很少各组人口所占的比重,就能反映社或识字很少各组人口所占的比重,就能反映社或识字很少各组

15、人口所占的比重,就能反映社或识字很少各组人口所占的比重,就能反映社会人口的文化素质构成情况。如果将不同时期会人口的文化素质构成情况。如果将不同时期会人口的文化素质构成情况。如果将不同时期会人口的文化素质构成情况。如果将不同时期的同一总体的结构相互比较,还可以揭示出总的同一总体的结构相互比较,还可以揭示出总的同一总体的结构相互比较,还可以揭示出总的同一总体的结构相互比较,还可以揭示出总体现象的发展变化规律。体现象的发展变化规律。体现象的发展变化规律。体现象的发展变化规律。 表表表表3 32 2 三次产业增加值结构变化三次产业增加值结构变化三次产业增加值结构变化三次产业增加值结构变化 资料来源:资

16、料来源:资料来源:资料来源:中国统计年鉴中国统计年鉴中国统计年鉴中国统计年鉴20032003年中国发展报告年中国发展报告年中国发展报告年中国发展报告,国家统计局,国家统计局,国家统计局,国家统计局20032003年版,中国统计出版社。年版,中国统计出版社。年版,中国统计出版社。年版,中国统计出版社。 从表中可以看出,我国从表中可以看出,我国从表中可以看出,我国从表中可以看出,我国1998199820022002年,年,年,年,GDPGDP年年年年均增长均增长均增长均增长7.7%7.7%,其中第一产业增加之年均增加,其中第一产业增加之年均增加,其中第一产业增加之年均增加,其中第一产业增加之年均增

17、加2.9%2.9%,第二产业、第三产业增加值分别增长,第二产业、第三产业增加值分别增长,第二产业、第三产业增加值分别增长,第二产业、第三产业增加值分别增长8.9%8.9%和和和和8.0%8.0%。反映在结构中,第一产业比重下。反映在结构中,第一产业比重下。反映在结构中,第一产业比重下。反映在结构中,第一产业比重下降,二、三产业比重上升。其中第一产业比重从降,二、三产业比重上升。其中第一产业比重从降,二、三产业比重上升。其中第一产业比重从降,二、三产业比重上升。其中第一产业比重从19971997年的年的年的年的19.1%19.1%下降到下降到下降到下降到20022002年的年的年的年的14.5%

18、14.5%,下降了,下降了,下降了,下降了4.64.6个百分点;第二产业从个百分点;第二产业从个百分点;第二产业从个百分点;第二产业从50%50%提高到提高到提高到提高到51.8%51.8%,上,上,上,上升了升了升了升了1.81.8个百分点;第三产业从个百分点;第三产业从个百分点;第三产业从个百分点;第三产业从30.9%30.9%提高到提高到提高到提高到33.7%33.7%,上升了,上升了,上升了,上升了2.82.8个百分点。它反映着我国产业个百分点。它反映着我国产业个百分点。它反映着我国产业个百分点。它反映着我国产业结构的变化发展过程。结构的变化发展过程。结构的变化发展过程。结构的变化发展

19、过程。(三)分析现象间的依存关系(三)分析现象间的依存关系(三)分析现象间的依存关系(三)分析现象间的依存关系 一切事物都是普遍联系、相互依存的。一种现一切事物都是普遍联系、相互依存的。一种现一切事物都是普遍联系、相互依存的。一种现一切事物都是普遍联系、相互依存的。一种现象的表现,既是它与其他现象相互作用的结果,象的表现,既是它与其他现象相互作用的结果,象的表现,既是它与其他现象相互作用的结果,象的表现,既是它与其他现象相互作用的结果,也会对其他现象的表现产生一定的影响。通过也会对其他现象的表现产生一定的影响。通过也会对其他现象的表现产生一定的影响。通过也会对其他现象的表现产生一定的影响。通过

20、统计分组,可以反映出现象之间的这种依存关统计分组,可以反映出现象之间的这种依存关统计分组,可以反映出现象之间的这种依存关统计分组,可以反映出现象之间的这种依存关系。系。系。系。 例如例如例如例如 将商品流通企业按照流转额分组,可以观将商品流通企业按照流转额分组,可以观将商品流通企业按照流转额分组,可以观将商品流通企业按照流转额分组,可以观察商品流通企业的规模与商品流转费用率之间察商品流通企业的规模与商品流转费用率之间察商品流通企业的规模与商品流转费用率之间察商品流通企业的规模与商品流转费用率之间的关系;将农作物播种面积按施肥量分组,用的关系;将农作物播种面积按施肥量分组,用的关系;将农作物播种

21、面积按施肥量分组,用的关系;将农作物播种面积按施肥量分组,用以观察农作物单产与施肥量之间的关系;将人以观察农作物单产与施肥量之间的关系;将人以观察农作物单产与施肥量之间的关系;将人以观察农作物单产与施肥量之间的关系;将人口按人均收入分组,以观察收入与储蓄之间的口按人均收入分组,以观察收入与储蓄之间的口按人均收入分组,以观察收入与储蓄之间的口按人均收入分组,以观察收入与储蓄之间的关系等等。表关系等等。表关系等等。表关系等等。表3 33 3就反映了我国电力增长与国就反映了我国电力增长与国就反映了我国电力增长与国就反映了我国电力增长与国内生产总值(内生产总值(内生产总值(内生产总值(GDPGDP)增

22、长之间的依存关系。)增长之间的依存关系。)增长之间的依存关系。)增长之间的依存关系。 表表表表3 33 3 我国与部分发达国家高技术产业增加值率的比较我国与部分发达国家高技术产业增加值率的比较我国与部分发达国家高技术产业增加值率的比较我国与部分发达国家高技术产业增加值率的比较单位:单位:%中国中国2001 2001 美国美国1999 1999 日本日本1997 1997 英国英国1998 1998 法国法国1998 1998 加拿大加拿大1997 1997 韩国韩国1999 1999 全部制造业全部制造业 26264 436365 536366 637377 732323 331316 628

23、285 5高技术产业高技术产业 25252 243430 036361 136364 430301 133338 827272 2航空航天制造航空航天制造业业 26264 437371 139398 833334 422221 144449 9计算机与办公计算机与办公设备制造业设备制造业 19196 656561 149490 042420 032328 830308 835359 9电子与通信设电子与通信设备制造业备制造业 23235 532328 824245 526260 029299 914142 221212 2医药制造业医药制造业 35354 449495 536366 63737

24、6 628285 534346 628282 2医疗设备及仪医疗设备及仪器仪表制造业器仪表制造业 29296 636367 744444 446466 639393 329299 9四、分组的种类简单分组:对研究现象按一个标志进行分组。职工工资额分组职工工资额分组月工资职工人数各组职工所占比重(%)1000200026132000300046223000400084414000以上4924复合分组:用两个或两个以上标志对研究现象进行分组。进行复合分组时,要先按照最重要的标志进行第一次分组,进行复合分组时,要先按照最重要的标志进行第一次分组,然后依次按照重要程度进行以下各级的分组。选择的标志然后

25、依次按照重要程度进行以下各级的分组。选择的标志越多,组数就成倍增加,而各组内的单位数则递减。复合越多,组数就成倍增加,而各组内的单位数则递减。复合分组时,选择标志的数目不宜过多。分组时,选择标志的数目不宜过多。2009年中国年中国6岁及以上按性别和受教育程度分组的人口数统计表岁及以上按性别和受教育程度分组的人口数统计表复合分组人数性别比重(%)教育程度比重(%)6岁及以上人口男55151250.51100.00女54035649.49未上小学男女小学按分组标志的性质划分 品质分组:按照品质标志进行的分组,反映总体内不同性质个按照品质标志进行的分组,反映总体内不同性质个体所组成的各部分的分组情况

26、。各分组标志都用文字来表述,而不能体所组成的各部分的分组情况。各分组标志都用文字来表述,而不能数量化。如人口性别,居住区数量化。如人口性别,居住区 数量分组:按照数量标志进行的分组,反映各单位在某一数量按照数量标志进行的分组,反映各单位在某一数量特征上的不同等级,这些数量特征都是可以量化的,都能进行数量的特征上的不同等级,这些数量特征都是可以量化的,都能进行数量的比较或运算,这些特征要用数字来表示。如年龄,销售额。比较或运算,这些特征要用数字来表示。如年龄,销售额。按分组组距类型划分 等距分组:变量值在各组保持相等的组距。变量值在各组保持相等的组距。 异距分组:变量值在各组采用了不同的组距。变

27、量值在各组采用了不同的组距。前者常用于数值变化比较均匀的情况,后者常用于数量变化前者常用于数值变化比较均匀的情况,后者常用于数量变化比较剧烈的情况。比较剧烈的情况。五、统计分组的方法五、统计分组的方法 统计分组的关键问题是正确地选择分组标志与划统计分组的关键问题是正确地选择分组标志与划统计分组的关键问题是正确地选择分组标志与划统计分组的关键问题是正确地选择分组标志与划分各组界限。前者主要是指品质标志分组,后者分各组界限。前者主要是指品质标志分组,后者分各组界限。前者主要是指品质标志分组,后者分各组界限。前者主要是指品质标志分组,后者主要是指数量标志分组。主要是指数量标志分组。主要是指数量标志分

28、组。主要是指数量标志分组。(一)分组标志选择的原则(一)分组标志选择的原则(一)分组标志选择的原则(一)分组标志选择的原则 要选择能够反映事物本质或主要特征的标志要选择能够反映事物本质或主要特征的标志要选择能够反映事物本质或主要特征的标志要选择能够反映事物本质或主要特征的标志 应根据研究的目的与任务选择分组标志应根据研究的目的与任务选择分组标志应根据研究的目的与任务选择分组标志应根据研究的目的与任务选择分组标志 根据现象所处的历史条件的变化选择分组标志根据现象所处的历史条件的变化选择分组标志根据现象所处的历史条件的变化选择分组标志根据现象所处的历史条件的变化选择分组标志(二)统计分组的方法(二

29、)统计分组的方法(二)统计分组的方法(二)统计分组的方法 按品质标志分组按品质标志分组按品质标志分组按品质标志分组 按数量标志分组按数量标志分组按数量标志分组按数量标志分组 1、品质分组的方法例如,人口按性别分为男女两组; 高校学生按学科分为文理科两类。2、数量分组的方法分组需要注意的问题:(1)分组时各组数量界限的确定必须能反映事物质的差别;(2)应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限。单项式分组与组距式分组单项式分组与组距式分组单项式分组就是用一个变量值作为一组,形成单项式变量单项式分组就是用一个变量值作为一组,形成单项式变量数列。数列。例如,育龄妇女按

30、其生育子女存活数分组,可分为例如,育龄妇女按其生育子女存活数分组,可分为0 0个、个、1 1个、个、2 2个、个、3 3个、个、4 4个、个、5 5个等个等6 6组。组。一般适用于离散型变量且变量变动范围不大的场合。一般适用于离散型变量且变量变动范围不大的场合。组距式分组就是将变量依次划分为几段区间,一段区间表组距式分组就是将变量依次划分为几段区间,一段区间表现为现为” ”从从 到到 “ “距离,把一段区间内的所有变量距离,把一段区间内的所有变量值归为一组,形成组距式变量数列。值归为一组,形成组距式变量数列。例如,反映居民居住水平情况按人均居住面积分组分为:例如,反映居民居住水平情况按人均居住

31、面积分组分为:4 4平方米以下,平方米以下,4 46 6平方米,平方米, 6 68 8平方米平方米, 8, 8平方米以上平方米以上等等4 4组。组。适用于连续型变量或者变动范围较大的离散型变量。适用于连续型变量或者变动范围较大的离散型变量。间断组距式分组和连续组距式分组间断组距式分组和连续组距式分组凡是组限不相连的分组,称为间断组距式分组。凡是组限不相连的分组,称为间断组距式分组。凡是组限不相连的分组,称为间断组距式分组。凡是组限不相连的分组,称为间断组距式分组。例如,儿童按年龄分组分为:未满例如,儿童按年龄分组分为:未满例如,儿童按年龄分组分为:未满例如,儿童按年龄分组分为:未满1 1岁,岁

32、,岁,岁,1 12 2岁,岁,岁,岁,3 3 4 4岁,岁,岁,岁,5 5 9 9岁,岁,岁,岁,10 10 1414岁。岁。岁。岁。凡是组限相连(或称相重叠的),即以同一数值作为相邻凡是组限相连(或称相重叠的),即以同一数值作为相邻凡是组限相连(或称相重叠的),即以同一数值作为相邻凡是组限相连(或称相重叠的),即以同一数值作为相邻两组的共同界限,称为连续组距式分组。两组的共同界限,称为连续组距式分组。两组的共同界限,称为连续组距式分组。两组的共同界限,称为连续组距式分组。例如,工人按工时定额完成程度分组为例如,工人按工时定额完成程度分组为例如,工人按工时定额完成程度分组为例如,工人按工时定额

33、完成程度分组为90 90 100100,100 100 110110,110 110 120120等组。等组。等组。等组。介绍上限、下限、组距、组限。介绍上限、下限、组距、组限。介绍上限、下限、组距、组限。介绍上限、下限、组距、组限。组距式变量数列中,每组区间两端的极值称组限。组距式变量数列中,每组区间两端的极值称组限。组距式变量数列中,每组区间两端的极值称组限。组距式变量数列中,每组区间两端的极值称组限。每一组的两个组限中,较大者叫上限,较小者叫下限。每一组的两个组限中,较大者叫上限,较小者叫下限。每一组的两个组限中,较大者叫上限,较小者叫下限。每一组的两个组限中,较大者叫上限,较小者叫下限

34、。如果各组的组限都齐全,成为闭口组;组限不齐全,即最如果各组的组限都齐全,成为闭口组;组限不齐全,即最如果各组的组限都齐全,成为闭口组;组限不齐全,即最如果各组的组限都齐全,成为闭口组;组限不齐全,即最小组缺下限或最大组缺上限,称为开口组。小组缺下限或最大组缺上限,称为开口组。小组缺下限或最大组缺上限,称为开口组。小组缺下限或最大组缺上限,称为开口组。“ “上限不在内上限不在内上限不在内上限不在内” ”原则原则原则原则变量值只是在整数之间变动的离散型变量,可采变量值只是在整数之间变动的离散型变量,可采变量值只是在整数之间变动的离散型变量,可采变量值只是在整数之间变动的离散型变量,可采用间断式组

35、距分组,也可采用连续组距式分组。用间断式组距分组,也可采用连续组距式分组。用间断式组距分组,也可采用连续组距式分组。用间断式组距分组,也可采用连续组距式分组。如果变量值在一定范围内的表现即可以是整数,如果变量值在一定范围内的表现即可以是整数,如果变量值在一定范围内的表现即可以是整数,如果变量值在一定范围内的表现即可以是整数,也可以是小数等连续型变量,只能采用连续组距也可以是小数等连续型变量,只能采用连续组距也可以是小数等连续型变量,只能采用连续组距也可以是小数等连续型变量,只能采用连续组距式分组。式分组。式分组。式分组。等距分组与异距分组等距分组与异距分组等距分组就是标志值在各组保持相等的组距

36、,即各组的标志值变等距分组就是标志值在各组保持相等的组距,即各组的标志值变等距分组就是标志值在各组保持相等的组距,即各组的标志值变等距分组就是标志值在各组保持相等的组距,即各组的标志值变动都限于相同的范围。动都限于相同的范围。动都限于相同的范围。动都限于相同的范围。凡是标志值变动比较均匀的情况下,都可采用等距分组。凡是标志值变动比较均匀的情况下,都可采用等距分组。凡是标志值变动比较均匀的情况下,都可采用等距分组。凡是标志值变动比较均匀的情况下,都可采用等距分组。例如,工人的年龄,工龄、工资的分组等。例如,工人的年龄,工龄、工资的分组等。例如,工人的年龄,工龄、工资的分组等。例如,工人的年龄,工

37、龄、工资的分组等。凡是标志值在各组的组距不相等的,称为异距分组。凡是标志值在各组的组距不相等的,称为异距分组。凡是标志值在各组的组距不相等的,称为异距分组。凡是标志值在各组的组距不相等的,称为异距分组。适用范围:适用范围:适用范围:适用范围:标志值分布很不均匀的场合;标志值分布很不均匀的场合;标志值分布很不均匀的场合;标志值分布很不均匀的场合;标志值相等的量具有不同意义的场合;标志值相等的量具有不同意义的场合;标志值相等的量具有不同意义的场合;标志值相等的量具有不同意义的场合;例如,生命的每一个月对于新生婴儿和对于成年人是大不一样的。例如,生命的每一个月对于新生婴儿和对于成年人是大不一样的。例

38、如,生命的每一个月对于新生婴儿和对于成年人是大不一样的。例如,生命的每一个月对于新生婴儿和对于成年人是大不一样的。年龄分组:年龄分组:年龄分组:年龄分组:1 1岁以下按月分组,岁以下按月分组,岁以下按月分组,岁以下按月分组,1 11010岁按年分组,岁按年分组,岁按年分组,岁按年分组,11112020岁按岁按岁按岁按5 5年分组,年分组,年分组,年分组,2121岁以上按岁以上按岁以上按岁以上按1010年或年或年或年或2020年分组等。年分组等。年分组等。年分组等。标志值按一定比例发展变化的场合。标志值按一定比例发展变化的场合。标志值按一定比例发展变化的场合。标志值按一定比例发展变化的场合。例如

39、,大城市的百货商店营业额差别:从例如,大城市的百货商店营业额差别:从例如,大城市的百货商店营业额差别:从例如,大城市的百货商店营业额差别:从5 5万到万到万到万到5 5千万,可采取公千万,可采取公千万,可采取公千万,可采取公比为比为比为比为1010的不等距分组:的不等距分组:的不等距分组:的不等距分组:5 5 5050万,万,万,万,50 50 500500万,万,万,万,500 500 50005000万。万。万。万。六、统计分组体系六、统计分组体系六、统计分组体系六、统计分组体系 简单分组与平行分组体系简单分组与平行分组体系简单分组与平行分组体系简单分组与平行分组体系 将社会经济总体只选择

40、一个标志分组称为简单分组。将社会经济总体只选择一个标志分组称为简单分组。将社会经济总体只选择一个标志分组称为简单分组。将社会经济总体只选择一个标志分组称为简单分组。对同一总体选择两个或两个以上的标志分别进行简对同一总体选择两个或两个以上的标志分别进行简对同一总体选择两个或两个以上的标志分别进行简对同一总体选择两个或两个以上的标志分别进行简单分组,排列起来,即成为平行分组体系。单分组,排列起来,即成为平行分组体系。单分组,排列起来,即成为平行分组体系。单分组,排列起来,即成为平行分组体系。 按年龄分组按年龄分组按文化程度分组按文化程度分组2020及及2020岁以下岁以下大专及大专以上大专及大专以

41、上21213535岁岁中专、技工中专、技工36365050岁岁高中高中51515555岁岁初中初中56566060岁岁小学、识字不多、文盲小学、识字不多、文盲 复合分组与复合分组体系复合分组与复合分组体系复合分组与复合分组体系复合分组与复合分组体系 复合分组是用两个或两个以上分组标志重叠起复合分组是用两个或两个以上分组标志重叠起复合分组是用两个或两个以上分组标志重叠起复合分组是用两个或两个以上分组标志重叠起来对总体进行的分组。例如来对总体进行的分组。例如来对总体进行的分组。例如来对总体进行的分组。例如 如果多个复合分组组成的体系就形成了复合分组体系。如果多个复合分组组成的体系就形成了复合分组体

42、系。如果多个复合分组组成的体系就形成了复合分组体系。如果多个复合分组组成的体系就形成了复合分组体系。例如同时选择学科、本科或专科、性别三个标志进行复例如同时选择学科、本科或专科、性别三个标志进行复例如同时选择学科、本科或专科、性别三个标志进行复例如同时选择学科、本科或专科、性别三个标志进行复合分组合分组合分组合分组 . .理科学生理科学生 本科学生本科学生 男学生男学生 女学生女学生 专科学生专科学生 男学生男学生 女学生女学生 文科学生文科学生 本科学生本科学生 男学生男学生 女学生女学生 专科学生专科学生 男学生男学生 女学生女学生 (一)组距(一)组距 组距是各组上下限之间的距离,即各组

43、最大标志值组距是各组上下限之间的距离,即各组最大标志值组距是各组上下限之间的距离,即各组最大标志值组距是各组上下限之间的距离,即各组最大标志值与最小标志值之差。与最小标志值之差。与最小标志值之差。与最小标志值之差。在连续组距分组中:在连续组距分组中:在连续组距分组中:在连续组距分组中:组距上限下限组距上限下限组距上限下限组距上限下限在间断组距式分组中:在间断组距式分组中:在间断组距式分组中:在间断组距式分组中:组距本组上限前组上限(或组距本组上限前组上限(或组距本组上限前组上限(或组距本组上限前组上限(或= = = =本组下限前组下限本组下限前组下限本组下限前组下限本组下限前组下限 或本组上限

44、本组下限或本组上限本组下限或本组上限本组下限或本组上限本组下限1 1 1 1)例如,商店规模按职工人数分组,分为:例如,商店规模按职工人数分组,分为:例如,商店规模按职工人数分组,分为:例如,商店规模按职工人数分组,分为:1 1 1 15 5人,人,人,人,6 6 1010人,人,人,人,11 11 1515人,等等。人,等等。人,等等。人,等等。七、组距、组数与组中值的计算七、组距、组数与组中值的计算(二)组数 全距是总体中最大的标志值与最小的标志值之差。全距是总体中最大的标志值与最小的标志值之差。全距是总体中最大的标志值与最小的标志值之差。全距是总体中最大的标志值与最小的标志值之差。 组数

45、的多少直接取决于两个因素,一个是总体的全距,另组数的多少直接取决于两个因素,一个是总体的全距,另组数的多少直接取决于两个因素,一个是总体的全距,另组数的多少直接取决于两个因素,一个是总体的全距,另一个是组距。在等距分组的条件下,组数等于全距除以一个是组距。在等距分组的条件下,组数等于全距除以一个是组距。在等距分组的条件下,组数等于全距除以一个是组距。在等距分组的条件下,组数等于全距除以组距。在组距既定的条件下,全距大则组数多,全距小组距。在组距既定的条件下,全距大则组数多,全距小组距。在组距既定的条件下,全距大则组数多,全距小组距。在组距既定的条件下,全距大则组数多,全距小则组数少;在全距既定

46、的条件下,组距大则组数少,组则组数少;在全距既定的条件下,组距大则组数少,组则组数少;在全距既定的条件下,组距大则组数少,组则组数少;在全距既定的条件下,组距大则组数少,组距小则组数多。距小则组数多。距小则组数多。距小则组数多。 美国学者斯特杰斯创造了斯特杰斯经验公式:美国学者斯特杰斯创造了斯特杰斯经验公式:美国学者斯特杰斯创造了斯特杰斯经验公式:美国学者斯特杰斯创造了斯特杰斯经验公式:(三)组中值组中值:各组中点位置所对应的变量值。其计算公组中值:各组中点位置所对应的变量值。其计算公式为:式为:组中值组中值= = (适用所有闭口组)(适用所有闭口组) 或或= = (适用上开口组)(适用上开口

47、组) 或或= = (适用下开口组)(适用下开口组)第三节第三节 分配数列分配数列一、分配数列的概念与种类一、分配数列的概念与种类 二、分配数列的编制方法二、分配数列的编制方法三、次数分布的类型三、次数分布的类型一、频数分布一、频数分布(一)频数分布 在统计分组的基础上,将总体所有的单位按某一标志进行归类排列,并计算各组的单位数称为频数分布,或次数分布。(二)频数分布的两个要素1.组别:组别:总体按某标志所分的组 2.频数频数(次数次数)和频率:和频率:各组的单位数叫频数,各组的单位数与总体单位总数之比叫频率。频率具有如下两个性质:(1)各组频率都是界于0和1之间的一个分数。即:(2)各组频率之

48、和等于1 。即(三)频数分布的种类1.品质频数分布:简称为品质数列,它是经过属性分组后形成的频数分布,其组别表现为一系列的概念或范畴。2.变量频数分布:简称为变量数列,它是经过变量分组后形成的分布数列,其组别表现为不同的数值或数域。单项数列:是以一个变量值为一组编制的变量频数分布。组距数列:是以表示一定变动范围的两个变量值构成的组所编制的变量频数分布。二、变量数列的编制方法二、变量数列的编制方法举例说明:举例说明:某工厂生产车间人工人日产量原始数某工厂生产车间人工人日产量原始数据如下:据如下:20 21 21 24 23 22 20 21 22 2324 20 24 21 22 22 23 2

49、4 22 2122 23 22 21 21 22 22 23 22 23 单项式变量数列,可以直接将每一变量值作为一组,汇单项式变量数列,可以直接将每一变量值作为一组,汇单项式变量数列,可以直接将每一变量值作为一组,汇单项式变量数列,可以直接将每一变量值作为一组,汇总计算各组相应的单位数(次数),并采用表格形式列示即总计算各组相应的单位数(次数),并采用表格形式列示即总计算各组相应的单位数(次数),并采用表格形式列示即总计算各组相应的单位数(次数),并采用表格形式列示即可,例如表可,例如表可,例如表可,例如表3 36 6 表表表表3 36 6 某工厂生产车间工人按日产量分布某工厂生产车间工人按

50、日产量分布某工厂生产车间工人按日产量分布某工厂生产车间工人按日产量分布(各组变量值)(各组变量值)(各组变量值)(各组变量值) (次数)(次数)(次数)(次数) (频率)(频率)(频率)(频率)日产量日产量 工人数工人数 比率(比率(%) 202021212222232324 24 3 37 710106 64 4 10.010.023.323.333.333.320.120.113.3 13.3 合计合计 30 30 100.0 100.0 组距变量数列的编制组距变量数列的编制组距变量数列的编制组距变量数列的编制例例例例1 1对某企业对某企业对某企业对某企业3030个工人完成劳动定额的情况进

51、行调个工人完成劳动定额的情况进行调个工人完成劳动定额的情况进行调个工人完成劳动定额的情况进行调查,某原始资料如下(查,某原始资料如下(查,某原始资料如下(查,某原始资料如下(%) 98 81 95 84 93 86 91 102 100 10398 81 95 84 93 86 91 102 100 103105 100 104 108 107 108 106 109 112 114105 100 104 108 107 108 106 109 112 114109 117 125 115 120 119 118 116 129 113 109 117 125 115 120 119 118

52、116 129 113 第一步:计算全距。(将各变量值由小到大排序,确定第一步:计算全距。(将各变量值由小到大排序,确定第一步:计算全距。(将各变量值由小到大排序,确定第一步:计算全距。(将各变量值由小到大排序,确定某最大值,最小值,并计算全距。)某最大值,最小值,并计算全距。)某最大值,最小值,并计算全距。)某最大值,最小值,并计算全距。) 81 84 86 91 93 95 98 100 10081 84 86 91 93 95 98 100 100 102 102103 104 105 106 107 108 108 109 109103 104 105 106 107 108 108

53、109 109 112 112113 114 115 116 117 118 119 120 125 129113 114 115 116 117 118 119 120 125 129变量的最大值是变量的最大值是变量的最大值是变量的最大值是129%129%最小值是最小值是最小值是最小值是81%81%全距全距全距全距 = = 最大值最大值最大值最大值 - - 最小值最小值最小值最小值=129% - 81%= 48%=129% - 81%= 48%第二步:确定组数和组距第二步:确定组数和组距第二步:确定组数和组距第二步:确定组数和组距组距和组数的确定没有顺序规定,即可以先根据数据的变化组距和组数

54、的确定没有顺序规定,即可以先根据数据的变化组距和组数的确定没有顺序规定,即可以先根据数据的变化组距和组数的确定没有顺序规定,即可以先根据数据的变化特征确定组数,也可以在事先对研究对象的性质比较了解的特征确定组数,也可以在事先对研究对象的性质比较了解的特征确定组数,也可以在事先对研究对象的性质比较了解的特征确定组数,也可以在事先对研究对象的性质比较了解的情况下,先确定组数,然后确定组距,但组数必须是整数。情况下,先确定组数,然后确定组距,但组数必须是整数。情况下,先确定组数,然后确定组距,但组数必须是整数。情况下,先确定组数,然后确定组距,但组数必须是整数。在等距分组时,组距与组数的关系是:在等

55、距分组时,组距与组数的关系是:在等距分组时,组距与组数的关系是:在等距分组时,组距与组数的关系是: 本例中的数据为劳动定额的完成情况,属于工作成绩的评定。根据本例中的数据为劳动定额的完成情况,属于工作成绩的评定。根据本例中的数据为劳动定额的完成情况,属于工作成绩的评定。根据本例中的数据为劳动定额的完成情况,属于工作成绩的评定。根据一般将成绩分成优、良、中、及格和不及格的五档评分习惯,可以一般将成绩分成优、良、中、及格和不及格的五档评分习惯,可以一般将成绩分成优、良、中、及格和不及格的五档评分习惯,可以一般将成绩分成优、良、中、及格和不及格的五档评分习惯,可以先确定组数为先确定组数为先确定组数为

56、先确定组数为5 5。在等距分组时,计算组距如下:。在等距分组时,计算组距如下:。在等距分组时,计算组距如下:。在等距分组时,计算组距如下: 为了符合习惯和计算方便,组距近似地取为了符合习惯和计算方便,组距近似地取为了符合习惯和计算方便,组距近似地取为了符合习惯和计算方便,组距近似地取10%10%。第三步:确定组限第三步:确定组限第三步:确定组限第三步:确定组限 第一,最小组的下限(起点值)应低于最小变量值,最大组的上限第一,最小组的下限(起点值)应低于最小变量值,最大组的上限第一,最小组的下限(起点值)应低于最小变量值,最大组的上限第一,最小组的下限(起点值)应低于最小变量值,最大组的上限(终

57、点值)应高于最大变量值。(终点值)应高于最大变量值。(终点值)应高于最大变量值。(终点值)应高于最大变量值。 第二,组限的确定应有利于表现出总体分布的特点,应反映出事物第二,组限的确定应有利于表现出总体分布的特点,应反映出事物第二,组限的确定应有利于表现出总体分布的特点,应反映出事物第二,组限的确定应有利于表现出总体分布的特点,应反映出事物质的变化。质的变化。质的变化。质的变化。 第三,为了方便计算组限应尽可能取整数,最好是第三,为了方便计算组限应尽可能取整数,最好是第三,为了方便计算组限应尽可能取整数,最好是第三,为了方便计算组限应尽可能取整数,最好是5 5或或或或1010的整倍数。的整倍数

58、。的整倍数。的整倍数。 第四,由于变量有连续型变量和离散型变量两种,其组限的确定方第四,由于变量有连续型变量和离散型变量两种,其组限的确定方第四,由于变量有连续型变量和离散型变量两种,其组限的确定方第四,由于变量有连续型变量和离散型变量两种,其组限的确定方法是不同的。法是不同的。法是不同的。法是不同的。 第四步:编制频数(频率)分布表。第四步:编制频数(频率)分布表。第四步:编制频数(频率)分布表。第四步:编制频数(频率)分布表。计算本例中各组的频数(工人数)和频率,编制某企业计算本例中各组的频数(工人数)和频率,编制某企业计算本例中各组的频数(工人数)和频率,编制某企业计算本例中各组的频数(

59、工人数)和频率,编制某企业3030个个个个工人劳动定额完成情况的分布表工人劳动定额完成情况的分布表工人劳动定额完成情况的分布表工人劳动定额完成情况的分布表3 37 7表表表表3 37 7 某企业某企业某企业某企业3030个工人劳动定额完成情况分布图表个工人劳动定额完成情况分布图表个工人劳动定额完成情况分布图表个工人劳动定额完成情况分布图表劳动定额完成程度(劳动定额完成程度(%) 频数(人)频数(人) 频数(频数(%) 808090909090100100100100110110110110120120120120130 130 3 34 412128 83 3 10.010.013.313.3

60、40.040.026.726.710.0 10.0 合计合计 30 30 100.0 100.0 从此表可以看到,从此表可以看到,从此表可以看到,从此表可以看到,30303030名工人中,劳动定额完成主要名工人中,劳动定额完成主要名工人中,劳动定额完成主要名工人中,劳动定额完成主要集中在集中在集中在集中在100%100%100%100%120%120%120%120%之间,占之间,占之间,占之间,占66.7%66.7%66.7%66.7%,在变量数列中标,在变量数列中标,在变量数列中标,在变量数列中标志值构成的数列表示标志值的变动幅度,而频数构志值构成的数列表示标志值的变动幅度,而频数构志值构

61、成的数列表示标志值的变动幅度,而频数构志值构成的数列表示标志值的变动幅度,而频数构成的数列则表示相对的作用程度。频数愈大则组的成的数列则表示相对的作用程度。频数愈大则组的成的数列则表示相对的作用程度。频数愈大则组的成的数列则表示相对的作用程度。频数愈大则组的标志值对于全体标志水平所起的作用也愈大;反之,标志值对于全体标志水平所起的作用也愈大;反之,标志值对于全体标志水平所起的作用也愈大;反之,标志值对于全体标志水平所起的作用也愈大;反之,频数愈小则各组标志值所起的作用也愈小。因此,频数愈小则各组标志值所起的作用也愈小。因此,频数愈小则各组标志值所起的作用也愈小。因此,频数愈小则各组标志值所起的

62、作用也愈小。因此,在整理和分析的时候,我们不但要注意各组标志值在整理和分析的时候,我们不但要注意各组标志值在整理和分析的时候,我们不但要注意各组标志值在整理和分析的时候,我们不但要注意各组标志值的变动范围,而且,也要注意各组标志的作用大小,的变动范围,而且,也要注意各组标志的作用大小,的变动范围,而且,也要注意各组标志的作用大小,的变动范围,而且,也要注意各组标志的作用大小,即频数的大小。将各组单位数和总体单位数相比既即频数的大小。将各组单位数和总体单位数相比既即频数的大小。将各组单位数和总体单位数相比既即频数的大小。将各组单位数和总体单位数相比既可以表明各组标志值对总体的相对作用程度,也可可

63、以表明各组标志值对总体的相对作用程度,也可可以表明各组标志值对总体的相对作用程度,也可可以表明各组标志值对总体的相对作用程度,也可以表明各组标志,也可以表明各组标志值出现的频以表明各组标志,也可以表明各组标志值出现的频以表明各组标志,也可以表明各组标志值出现的频以表明各组标志,也可以表明各组标志值出现的频率的大小。率的大小。率的大小。率的大小。第五步:计算累计频数和累计频率第五步:计算累计频数和累计频率第五步:计算累计频数和累计频率第五步:计算累计频数和累计频率 为了更详细的认识变量的分布特征,还可以计算为了更详细的认识变量的分布特征,还可以计算为了更详细的认识变量的分布特征,还可以计算为了更

64、详细的认识变量的分布特征,还可以计算累计频数和累计频率,编制累计频数和累计频率累计频数和累计频率,编制累计频数和累计频率累计频数和累计频率,编制累计频数和累计频率累计频数和累计频率,编制累计频数和累计频率数列。累计频数和累计频率有向上累计频数(频数列。累计频数和累计频率有向上累计频数(频数列。累计频数和累计频率有向上累计频数(频数列。累计频数和累计频率有向上累计频数(频率)和向下累计频数(频率)两种。率)和向下累计频数(频率)两种。率)和向下累计频数(频率)两种。率)和向下累计频数(频率)两种。 向上累计数的意义是:小于各组的该组上限的各向上累计数的意义是:小于各组的该组上限的各向上累计数的意

65、义是:小于各组的该组上限的各向上累计数的意义是:小于各组的该组上限的各组的频数或频率之和组的频数或频率之和组的频数或频率之和组的频数或频率之和; ;相反相反相反相反, ,由变量值大的组向变由变量值大的组向变由变量值大的组向变由变量值大的组向变量值小的组累计各组的频数或频率量值小的组累计各组的频数或频率量值小的组累计各组的频数或频率量值小的组累计各组的频数或频率, ,称为向下累计称为向下累计称为向下累计称为向下累计频数或向下累计频数。频数或向下累计频数。频数或向下累计频数。频数或向下累计频数。 向下累计数的意义是:大于及等于该组下限的各向下累计数的意义是:大于及等于该组下限的各向下累计数的意义是

66、:大于及等于该组下限的各向下累计数的意义是:大于及等于该组下限的各组的频数或频数或频率之和。组的频数或频数或频率之和。组的频数或频数或频率之和。组的频数或频数或频率之和。 根据某企业工人完成劳动定额的资料编制的向上累计频数(频率)和向根据某企业工人完成劳动定额的资料编制的向上累计频数(频率)和向根据某企业工人完成劳动定额的资料编制的向上累计频数(频率)和向根据某企业工人完成劳动定额的资料编制的向上累计频数(频率)和向下累计频数(频率)分布如表下累计频数(频率)分布如表下累计频数(频率)分布如表下累计频数(频率)分布如表3 38 8。 劳动定额劳动定额完成情况完成情况(%) 频数频数(人)(人)

67、 频率频率(%) 向上累计向上累计 向下累计向下累计 频数频数(人)(人) 频率频率(%) 频数频数(人)(人) 频率频率(%) 809080909010090100100110100110110120110120120130 120130 3 34 412128 83 3 10.010.013.313.340.040.026.726.710.0 10.0 3 37 71919272730 30 10.010.023.323.363.363.390.090.0100.0 100.0 30302727232311113 3 100.0100.090.090.076.776.736.736.710

68、.0 10.0 合计合计 30 30 10.0 10.0 分布曲线在平面直角坐标系上,以分组标志为横轴,次数或者在平面直角坐标系上,以分组标志为横轴,次数或者频率为纵轴,可以画出次数分配的直方图。频率为纵轴,可以画出次数分配的直方图。 洛伦兹曲线考察一个社会中不同个体收入水平的差异,将考察一个社会中不同个体收入水平的差异,将个体按收入水平从低到高进行排列,并计算各个体按收入水平从低到高进行排列,并计算各收入段的累积频率,并将这一结果绘在图上,收入段的累积频率,并将这一结果绘在图上,可以获得一条严格向下凹的曲线可以获得一条严格向下凹的曲线此曲线可用于显示社会的不公平程度,称为洛此曲线可用于显示社

69、会的不公平程度,称为洛伦兹曲线伦兹曲线数据示例收入不公平情况分组分组平均收入平均收入水平水平人数人数总收入总收入累积总收累积总收入入百分比百分比1 1300300101030003000300030000.91%0.91%2 270070010107000700010000100003.03%3.03%3 3120012001010120001200022000220006.67%6.67%4 41800180010101800018000400004000012.12%12.12%5 52500250010102500025000650006500019.70%19.70%6 6330033

70、0010103300033000980009800029.70%29.70%7 7420042001010420004200014000014000042.42%42.42%8 8520052001010520005200019200019200058.18%58.18%9 9630063001010630006300025500025500077.27%77.27%10107500750010107500075000330000330000100.00%100.00%洛伦兹曲线基尼系数不公平面积与下三角形面积之商不公平面积与下三角形面积之商反映不公平程度的大小,取值区间在反映不公平程度的大小

71、,取值区间在0 01 1之间。之间。 其中:其中:P PI I:各组的人数比重:各组的人数比重 I Ii i:各组的收入比重:各组的收入比重 I Ii i:各组的收入累积比重:各组的收入累积比重 N N:组数:组数基尼系数的实践 按照国际通常标准, 基尼系数在0.3以下为最佳的平均状态, 在0.30.4之间为正常状态, 超过0.4为警戒状态, 达到0.6则属于危险状态。 来自国家统计局的数据显示,从2000年开始,我国的基尼系数已越过0.4的警戒线,2006年升至0.49。改革开放以来我国历年基尼系数改革开放以来我国历年基尼系数改革开放以来我国历年基尼系数改革开放以来我国历年基尼系数 年份年份

72、基尼系数基尼系数 年份年份 基尼系数基尼系数 年份年份基尼系数基尼系数197819780.180.18198919890.3490.349199819980.4030.403198119810.2880.288199019900.3430.343199919990.3970.397198219820.24940.2494199119910.3210.321200020000.4170.417198319830.26410.2641199219920.3760.376200120010.490.49198419840.2970.297199319930.35920.3592200220020.4

73、540.454198519850.26560.2656199419940.4360.436200320030.530.53198619860.29680.2968199519950.4450.445200420040.460.46198719870.30520.3052199619960.4580.458200520050.470.47198819880.3820.382199719970.4030.403200620060.490.49三、次数分布的主要类型三、次数分布的主要类型图图31图图32次数分布的主要类型次数分布的主要类型钟形分布 J形分布 U形分布正J形分布 反J形分布 四、频数分

74、布的类型(一)钟型分布(一)钟型分布 钟型分布的特征是钟型分布的特征是“两头小,中间大两头小,中间大”,即靠近中间的变量值分布的次数多,靠近即靠近中间的变量值分布的次数多,靠近两边的变量值分布的次数少,其曲线图宛两边的变量值分布的次数少,其曲线图宛如一口钟,如下图所示。如一口钟,如下图所示。1钟型分布钟形分布是社会经济现象中最常见的分布形式,具体表现为中钟形分布是社会经济现象中最常见的分布形式,具体表现为中间隆起,两侧逐渐降低。间隆起,两侧逐渐降低。钟形分布表明数据具有集中的趋势,大多数数据集中在中间,钟形分布表明数据具有集中的趋势,大多数数据集中在中间,越往两端,数据越少。在远离中心的位置,

75、只有极少数的数据。越往两端,数据越少。在远离中心的位置,只有极少数的数据。钟形分布的中间隆起部分称为峰,两侧称为尾。钟形分布的中间隆起部分称为峰,两侧称为尾。 (a)正态分布(b)偏态分布正偏(右偏)负偏(左偏) 如图(a)所示,其分布特征是以标志变量中心为对称轴,左右两侧对称,两侧变量值分布的次数随着与中间变量值距离的增大而渐次减少。在统计学中,称这种分布为对称分布。 而图(b)为非对称分布,它们各有不同方向的偏态,即左偏态分布和右偏态分布。客观实际中,许多社会现象统计总体的分布都趋于对称分布中的正态分布。正态分布是描述统计中的一种主要分布,它在社会经济统计分析中具有重要的意义。(三)J型分

76、布 J型分布有两种类型,一种是次数随着变量的增大而增多,如投资按利润率大小分布。另一种 呈反J型分布,即次数随着变量增大而减少,如随着产品产量的增加,产品单位成本下降。如下图(c)(二)U型分布 U型分布的形状与钟型分布相反,靠近中间的变量值分布次数少,靠近两端的变量值分布次数多,形成“两头大,中间小”的U型分布。如人口死亡率分布,人口总体中,幼儿和老人死亡率高,而中青年死亡率低。如下图(d)。(c)J形分布正J形反J形(d)U形分布第四节第四节 统计数据的显示统计数据的显示统计表统计表 统计表的概念和结构统计表的概念和结构统计表的概念和结构统计表的概念和结构 统计表是表现统计资料的一种形式。

77、把经统计表是表现统计资料的一种形式。把经统计表是表现统计资料的一种形式。把经统计表是表现统计资料的一种形式。把经过大量调查得来的统计资料,经过汇总整过大量调查得来的统计资料,经过汇总整过大量调查得来的统计资料,经过汇总整过大量调查得来的统计资料,经过汇总整理以后,按照一定的规定和要求填列在相理以后,按照一定的规定和要求填列在相理以后,按照一定的规定和要求填列在相理以后,按照一定的规定和要求填列在相应的表格内,就形成了一定的统计表。应的表格内,就形成了一定的统计表。应的表格内,就形成了一定的统计表。应的表格内,就形成了一定的统计表。 统计表的结构,从外表形式上看,是由四部分构成统计表的结构,从外

78、表形式上看,是由四部分构成统计表的结构,从外表形式上看,是由四部分构成统计表的结构,从外表形式上看,是由四部分构成 总标题总标题 表的名称,用于概括统计表中要说明的表的名称,用于概括统计表中要说明的内容。内容。 横行标题横行标题 各组的名称,反映总体各组成部分的。各组的名称,反映总体各组成部分的。 纵栏标题纵栏标题 分组标志或指标的名称,说明纵行所列分组标志或指标的名称,说明纵行所列各项资料的内容。各项资料的内容。 指标数值指标数值 统计表的具体内容,每一项数值由相应统计表的具体内容,每一项数值由相应的横行标题和纵栏标题限定,可以是总的横行标题和纵栏标题限定,可以是总体单位数,也可以是标志总量

79、,或者平体单位数,也可以是标志总量,或者平均数、相对数等,也称数字资料。均数、相对数等,也称数字资料。 从统计表的内容来看,由主词和宾词两个部分组成。主词是统计表所说从统计表的内容来看,由主词和宾词两个部分组成。主词是统计表所说从统计表的内容来看,由主词和宾词两个部分组成。主词是统计表所说从统计表的内容来看,由主词和宾词两个部分组成。主词是统计表所说明的总体,总体的各组或各组的名称。宾词是用于说明主词的各种指标。明的总体,总体的各组或各组的名称。宾词是用于说明主词的各种指标。明的总体,总体的各组或各组的名称。宾词是用于说明主词的各种指标。明的总体,总体的各组或各组的名称。宾词是用于说明主词的各

80、种指标。表表表表3 39 9 某地区某地区某地区某地区19991999年工业总产值按轻重工业分组表年工业总产值按轻重工业分组表年工业总产值按轻重工业分组表年工业总产值按轻重工业分组表 项目项目 工业总产值工业总产值 纵栏纵栏纵栏纵栏标题标题标题标题 产值(亿元)产值(亿元) 比重(比重(%) 横横横横行行行行标标标标题题题题 轻工业轻工业重工业重工业 3059.73059.73105.7 3105.7 68.8468.8451.16 51.16 指标指标指标指标数值数值数值数值合计合计6264.46264.4100.00 100.00 主词主词主词主词 宾词宾词宾词宾词 统计表的种类统计表的种

81、类统计表的种类统计表的种类 简单表简单表 主词未经过任何分组,反映出总体各单位的名称主词未经过任何分组,反映出总体各单位的名称或按时间顺序简单排列,或同时反映以上内容的或按时间顺序简单排列,或同时反映以上内容的统计表。如表统计表。如表3-93-9、3-103-10、3-11 3-11 分组表分组表 主词按照一定标志分组的统计表,也称简单分组主词按照一定标志分组的统计表,也称简单分组表。如表表。如表3-12 3-12 复合表复合表 主词按照两个或两个以上的标志层叠分组所形成主词按照两个或两个以上的标志层叠分组所形成的统计表。如表的统计表。如表3-133-13 统计表的编制规则统计表的编制规则统计

82、表的编制规则统计表的编制规则 统计表应遵循科学、实用、简练、美观的原则进行设计。统计表应遵循科学、实用、简练、美观的原则进行设计。统计表应遵循科学、实用、简练、美观的原则进行设计。统计表应遵循科学、实用、简练、美观的原则进行设计。 1 1、统计表通常应设计成由纵横交叉线组成的长方、统计表通常应设计成由纵横交叉线组成的长方、统计表通常应设计成由纵横交叉线组成的长方、统计表通常应设计成由纵横交叉线组成的长方形表格,长宽之间应保持适当的比例。形表格,长宽之间应保持适当的比例。形表格,长宽之间应保持适当的比例。形表格,长宽之间应保持适当的比例。2 2、统计表的总标题要用概括、简练的文字说明表、统计表的

83、总标题要用概括、简练的文字说明表、统计表的总标题要用概括、简练的文字说明表、统计表的总标题要用概括、简练的文字说明表的内容,并在总标题内或在其下注明资料所属的的内容,并在总标题内或在其下注明资料所属的的内容,并在总标题内或在其下注明资料所属的的内容,并在总标题内或在其下注明资料所属的时间、地点和单位。时间、地点和单位。时间、地点和单位。时间、地点和单位。3 3、统计表的主词各行和宾词各栏,一般应按先局、统计表的主词各行和宾词各栏,一般应按先局、统计表的主词各行和宾词各栏,一般应按先局、统计表的主词各行和宾词各栏,一般应按先局部后整体的原则排列,即先列各项目,再列总计。部后整体的原则排列,即先列

84、各项目,再列总计。部后整体的原则排列,即先列各项目,再列总计。部后整体的原则排列,即先列各项目,再列总计。如果没有必要列出所有项目时,可以先列总计,如果没有必要列出所有项目时,可以先列总计,如果没有必要列出所有项目时,可以先列总计,如果没有必要列出所有项目时,可以先列总计,而后再列其中一部分重要的项目。而后再列其中一部分重要的项目。而后再列其中一部分重要的项目。而后再列其中一部分重要的项目。 4 4、统计表的上下两端用粗线或双线绘制,在有些需要明显、统计表的上下两端用粗线或双线绘制,在有些需要明显、统计表的上下两端用粗线或双线绘制,在有些需要明显、统计表的上下两端用粗线或双线绘制,在有些需要明

85、显分隔的部分也应用粗线或双线,其他则用细线。在横行分隔的部分也应用粗线或双线,其他则用细线。在横行分隔的部分也应用粗线或双线,其他则用细线。在横行分隔的部分也应用粗线或双线,其他则用细线。在横行和合计栏、横行与纵栏标题间要划线。表的左右两端应和合计栏、横行与纵栏标题间要划线。表的左右两端应和合计栏、横行与纵栏标题间要划线。表的左右两端应和合计栏、横行与纵栏标题间要划线。表的左右两端应是开口的,不得划线。是开口的,不得划线。是开口的,不得划线。是开口的,不得划线。5 5、统计表中如果栏目较多,可以加以编号:一般主词的计、统计表中如果栏目较多,可以加以编号:一般主词的计、统计表中如果栏目较多,可以

86、加以编号:一般主词的计、统计表中如果栏目较多,可以加以编号:一般主词的计量单位栏用量单位栏用量单位栏用量单位栏用( (甲甲甲甲) )、( (乙乙乙乙) )、( (丙丙丙丙) )等次序编号,宾词各栏等次序编号,宾词各栏等次序编号,宾词各栏等次序编号,宾词各栏用用用用(1)(1)、(2)(2)、(3)(3)等次序编号。若各栏中统计指标有等次序编号。若各栏中统计指标有等次序编号。若各栏中统计指标有等次序编号。若各栏中统计指标有一定的计算关系,还可以用算式表示之。如表一定的计算关系,还可以用算式表示之。如表一定的计算关系,还可以用算式表示之。如表一定的计算关系,还可以用算式表示之。如表4 41919。

87、6 6、统计表中的数字要注明计量单位。如果表中的数字属同、统计表中的数字要注明计量单位。如果表中的数字属同、统计表中的数字要注明计量单位。如果表中的数字属同、统计表中的数字要注明计量单位。如果表中的数字属同一计量单位,可将计量单位标在表的右上方,如表一计量单位,可将计量单位标在表的右上方,如表一计量单位,可将计量单位标在表的右上方,如表一计量单位,可将计量单位标在表的右上方,如表3 31313;如果宾词的计量单位不同,可直接标注在指标名称的;如果宾词的计量单位不同,可直接标注在指标名称的;如果宾词的计量单位不同,可直接标注在指标名称的;如果宾词的计量单位不同,可直接标注在指标名称的旁边或下方;

88、如果主词的计量单位不同,可在横行标题旁边或下方;如果主词的计量单位不同,可在横行标题旁边或下方;如果主词的计量单位不同,可在横行标题旁边或下方;如果主词的计量单位不同,可在横行标题后设计量单位专栏,如表后设计量单位专栏,如表后设计量单位专栏,如表后设计量单位专栏,如表3 31212。7 7、统计表中数字应填写整齐,对准位数。当数字、统计表中数字应填写整齐,对准位数。当数字、统计表中数字应填写整齐,对准位数。当数字、统计表中数字应填写整齐,对准位数。当数字为为为为0 0或遇数小可略而不计时,要写上或遇数小可略而不计时,要写上或遇数小可略而不计时,要写上或遇数小可略而不计时,要写上0 0,不得留空

89、;,不得留空;,不得留空;,不得留空;当缺少某项资料时,用当缺少某项资料时,用当缺少某项资料时,用当缺少某项资料时,用“ “” ”表示;不应有数字表示;不应有数字表示;不应有数字表示;不应有数字时用符号时用符号时用符号时用符号“ “” ”表示;上、下、左、右数字相同,表示;上、下、左、右数字相同,表示;上、下、左、右数字相同,表示;上、下、左、右数字相同,必须如实写出,不得用必须如实写出,不得用必须如实写出,不得用必须如实写出,不得用“ “同上同上同上同上” ”、“ “同左同左同左同左” ”或或或或“ “” ”等符号。等符号。等符号。等符号。8 8、必要时,应在统计表的下端加注说明或注解、必要

90、时,应在统计表的下端加注说明或注解、必要时,应在统计表的下端加注说明或注解、必要时,应在统计表的下端加注说明或注解、资料来源等。资料来源等。资料来源等。资料来源等。统计图统计图 (一)统计图的概念(一)统计图的概念(一)统计图的概念(一)统计图的概念 统计图是以图形形象地表现统计资料的一种形式。统计图是以图形形象地表现统计资料的一种形式。统计图是以图形形象地表现统计资料的一种形式。统计图是以图形形象地表现统计资料的一种形式。用统计图表现统计资料,具有鲜明醒目,富于表用统计图表现统计资料,具有鲜明醒目,富于表用统计图表现统计资料,具有鲜明醒目,富于表用统计图表现统计资料,具有鲜明醒目,富于表现,

91、易于理解的特点,因而绘制统计图是统计整现,易于理解的特点,因而绘制统计图是统计整现,易于理解的特点,因而绘制统计图是统计整现,易于理解的特点,因而绘制统计图是统计整理的重要内容之一。理的重要内容之一。理的重要内容之一。理的重要内容之一。 统计图可以揭示现象的内部结构和依存关系,显统计图可以揭示现象的内部结构和依存关系,显统计图可以揭示现象的内部结构和依存关系,显统计图可以揭示现象的内部结构和依存关系,显示现象的发展趋势和分布状况,有利于进行统计示现象的发展趋势和分布状况,有利于进行统计示现象的发展趋势和分布状况,有利于进行统计示现象的发展趋势和分布状况,有利于进行统计分析与研究。分析与研究。分

92、析与研究。分析与研究。 (二)统计图的种类(二)统计图的种类(二)统计图的种类(二)统计图的种类1 1、条形图、条形图、条形图、条形图 条形图是以相同宽度条形的长短或高度来比较统条形图是以相同宽度条形的长短或高度来比较统条形图是以相同宽度条形的长短或高度来比较统条形图是以相同宽度条形的长短或高度来比较统计指标数值大小的图形。如某企业计指标数值大小的图形。如某企业计指标数值大小的图形。如某企业计指标数值大小的图形。如某企业1995 1995 2001 2001年的销售额情况年的销售额情况年的销售额情况年的销售额情况2 2、面积图、面积图、面积图、面积图 面积图是以几何图形的面积表示统计指标数值大

93、面积图是以几何图形的面积表示统计指标数值大面积图是以几何图形的面积表示统计指标数值大面积图是以几何图形的面积表示统计指标数值大小的一种图形。它可以用来比较同类指标的大小,小的一种图形。它可以用来比较同类指标的大小,小的一种图形。它可以用来比较同类指标的大小,小的一种图形。它可以用来比较同类指标的大小,说明总体结构。常用的有正方形图和圆形图两种。说明总体结构。常用的有正方形图和圆形图两种。说明总体结构。常用的有正方形图和圆形图两种。说明总体结构。常用的有正方形图和圆形图两种。 图图图图3 35 5 某企业职工人数增长情况某企业职工人数增长情况某企业职工人数增长情况某企业职工人数增长情况400人1

94、997年1600人2002年1992年100人圆形是以圆形面积或圆内各扇形面积的大小表示指标数值大圆形是以圆形面积或圆内各扇形面积的大小表示指标数值大圆形是以圆形面积或圆内各扇形面积的大小表示指标数值大圆形是以圆形面积或圆内各扇形面积的大小表示指标数值大小的图形,它用于比较指标和反映总体的内部结构。小的图形,它用于比较指标和反映总体的内部结构。小的图形,它用于比较指标和反映总体的内部结构。小的图形,它用于比较指标和反映总体的内部结构。图图图图3 36 6 职位需求按学历分布图职位需求按学历分布图职位需求按学历分布图职位需求按学历分布图3 3、曲线图、曲线图、曲线图、曲线图 曲线图是用曲线的升降

95、来表示数值大小和发展变曲线图是用曲线的升降来表示数值大小和发展变曲线图是用曲线的升降来表示数值大小和发展变曲线图是用曲线的升降来表示数值大小和发展变化的图形。化的图形。化的图形。化的图形。(1 1)动态曲线图。)动态曲线图。)动态曲线图。)动态曲线图。 (2 2)计划检查曲线图。)计划检查曲线图。)计划检查曲线图。)计划检查曲线图。某车间计划完成情况曲线图某车间计划完成情况曲线图某车间计划完成情况曲线图某车间计划完成情况曲线图 (3 3)次数分配曲线图。)次数分配曲线图。)次数分配曲线图。)次数分配曲线图。图图图图3 37 7 某企业某企业某企业某企业3030个工人完成劳动定额情况分布曲线图个

96、工人完成劳动定额情况分布曲线图个工人完成劳动定额情况分布曲线图个工人完成劳动定额情况分布曲线图频数(人)80% 90% 100% 110% 120% 130% 频率( % )402010304 4、象形图、象形图、象形图、象形图、 象形图是利用形象画来表明统计资料的图形。它给人以象形图是利用形象画来表明统计资料的图形。它给人以象形图是利用形象画来表明统计资料的图形。它给人以象形图是利用形象画来表明统计资料的图形。它给人以直观感觉。直观感觉。直观感觉。直观感觉。例如,某学校例如,某学校例如,某学校例如,某学校19981998年学生人数为年学生人数为年学生人数为年学生人数为300300人,人,人,人,20002000年为年为年为年为800800人,人,人,人,根据以上资料可绘图。根据以上资料可绘图。根据以上资料可绘图。根据以上资料可绘图。 本章小结

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号