《统计学原理统计整理》由会员分享,可在线阅读,更多相关《统计学原理统计整理(66页珍藏版)》请在金锄头文库上搜索。
1、第三章第三章 统计整理统计整理1统计学原理统计整理主要内容第一节第一节 统计数据整理的概述统计数据整理的概述第二节第二节 统计分组统计分组第三节第三节 分配数列分配数列第四节第四节 统计表和统计图统计表和统计图2统计学原理统计整理一、数据审核(一、数据审核(Data Auditing)是指在进行数据整理之前对原始数据的审查是指在进行数据整理之前对原始数据的审查与核对。与核对。数据整理是按照数据分析的要求进行的,数数据整理是按照数据分析的要求进行的,数据分析的思路和目的决定着数据整理的分类据分析的思路和目的决定着数据整理的分类或分组。基于人类认识活动的渐进性,往往或分组。基于人类认识活动的渐进性
2、,往往需要采用不同的分组方式对原始数据进行反需要采用不同的分组方式对原始数据进行反复整理,以便得出正确的认识结论。复整理,以便得出正确的认识结论。第一节第一节 统计数据整理的概述统计数据整理的概述3统计学原理统计整理二、数据审核的内容二、数据审核的内容1、时效性的审核、时效性的审核检查是否在规定的调查时间内完成数据的搜检查是否在规定的调查时间内完成数据的搜集工作,采集的数据是否为规定调查时点上集工作,采集的数据是否为规定调查时点上或规定的调查时段内的数量特征,以保证统或规定的调查时段内的数量特征,以保证统计数据在时间上的准确性和可比性。计数据在时间上的准确性和可比性。2、准确性的审核、准确性的
3、审核检查是否每一调查单位的特征都无偏差、无检查是否每一调查单位的特征都无偏差、无失真、准确无误地记录在登记资料中,抽样失真、准确无误地记录在登记资料中,抽样调查的误差是否有效地控制在规定的范围内调查的误差是否有效地控制在规定的范围内. 3、一致性的审核、一致性的审核 检查统计数据在时间和空间上的连续性和检查统计数据在时间和空间上的连续性和 可比性。可比性。4统计学原理统计整理三、数据审核的方式三、数据审核的方式1、逻辑审核、逻辑审核检查原始数据中各项数据是否合理的数据审检查原始数据中各项数据是否合理的数据审核方式。要求检查人员具备较强的逻辑推理核方式。要求检查人员具备较强的逻辑推理能力和丰富的
4、专业知识及数据审核经验。能力和丰富的专业知识及数据审核经验。2、技术审核、技术审核对调查数据原始登记表和其他原始材料进行对调查数据原始登记表和其他原始材料进行机械性核对的数据审核方式。由于技术检查机械性核对的数据审核方式。由于技术检查是一种机械性的核对,一般可采用专门的计是一种机械性的核对,一般可采用专门的计算机软件来实现。算机软件来实现。5统计学原理统计整理四、数据的排序四、数据的排序数据排序数据排序是指将一组数据按照大小、高低、是指将一组数据按照大小、高低、优劣等顺序进行依次排列的过程。优劣等顺序进行依次排列的过程。数据排序为计算取值范围、最大值、最小值数据排序为计算取值范围、最大值、最小
5、值等总体参数提供了便利,有助于人们了解数等总体参数提供了便利,有助于人们了解数据大致的分布状态。数据排序也是有效地进据大致的分布状态。数据排序也是有效地进行数据分类或分组的前期准备工作。行数据分类或分组的前期准备工作。数据排序可以使用计算机软件来实现,数据排序可以使用计算机软件来实现,Excel就具有很强的数据排序功能。就具有很强的数据排序功能。6统计学原理统计整理第二节第二节 统计分组统计分组一、统计分组的概念一、统计分组的概念统计分组就是根据统计研究的需要,将统计统计分组就是根据统计研究的需要,将统计总体按照一定的标志区分为若干个不同类型总体按照一定的标志区分为若干个不同类型或性质的部分的
6、一种统计方法。或性质的部分的一种统计方法。统计分组具有两方面含义:统计分组具有两方面含义:对对总体总体而言是而言是“分分”,即将总体分为,即将总体分为性质相性质相异异的若干部分。对的若干部分。对总体单位总体单位而言则是而言则是“合合”,即将,即将性质相同性质相同的总体单位组合起来。的总体单位组合起来。7统计学原理统计整理二、统计分组的作用与原则二、统计分组的作用与原则1 1、统计分组的作用(、统计分组的作用(P40-42P40-42)划分现象的类型;划分现象的类型;揭示现象的内部结构;揭示现象的内部结构;分析现象之间的内在关系:分析现象之间的内在关系:正依存关系:现象之间成同向变动正依存关系:
7、现象之间成同向变动负依存关系:现象之间成反向变动负依存关系:现象之间成反向变动2 2、统计分组的原则、统计分组的原则q穷尽原则穷尽原则:组数有限且不宜过多。:组数有限且不宜过多。q互斥原则互斥原则:组间的差异、界限要分明。:组间的差异、界限要分明。8统计学原理统计整理三、分组标志的选择三、分组标志的选择(一)选择分组标志的原则(一)选择分组标志的原则 P42P421.1.目的性原则目的性原则:根据研究问题的目的选择分:根据研究问题的目的选择分组标志。组标志。2.2.本质性原则本质性原则:选择最能反映现象本质特征:选择最能反映现象本质特征的标志分组。的标志分组。例如反映家庭生活水平的因素:总收入
8、?例如反映家庭生活水平的因素:总收入?平均收入?平均收入?研究学生的学习状况:成绩?性别?年龄研究学生的学习状况:成绩?性别?年龄?籍贯?籍贯?3.3.具体条件原则具体条件原则:结合现象所处的具体历史:结合现象所处的具体历史条件或经济条件选择分组标志。条件或经济条件选择分组标志。9统计学原理统计整理(二)统计分组的种类(二)统计分组的种类按按分组标志个数分组标志个数不同分为:不同分为: 简单分组简单分组与与复合分组复合分组 P44标标标标 志志志志人数(人)人数(人)人数(人)人数(人)比重比重比重比重(%)按按按按性别性别性别性别分组分组分组分组男性男性男性男性女性女性女性女性按按按按企业性
9、质企业性质企业性质企业性质分组分组分组分组国有企业国有企业国有企业国有企业独资企业独资企业独资企业独资企业其他企业其他企业其他企业其他企业按按按按规模规模规模规模分组分组分组分组大型企业大型企业大型企业大型企业中型企业中型企业中型企业中型企业小型企业小型企业小型企业小型企业简单分组简单分组10统计学原理统计整理工业企业按经营组织形式和规模大小同时进行工业企业按经营组织形式和规模大小同时进行分组分组按经营组织形式分组按经营组织形式分组: 按规模分组按规模分组: 大型企业大型企业 内资企业内资企业 中型企业中型企业 小型企业小型企业 大型企业大型企业 港澳台商投资经营企业港澳台商投资经营企业 中型
10、企业中型企业 小型企业小型企业 大型企业大型企业 外商投资经营企业外商投资经营企业 中型企业中型企业 小型企业小型企业复合分组复合分组11统计学原理统计整理 2 2按按分组标志性质分组标志性质不同可分为:不同可分为: 品质标志分组品质标志分组和和数量标志分组数量标志分组标标 志志人数(人)人数(人)比重比重(% %)按按性别性别分组分组男性男性女性女性按按产值产值分组分组大型企业大型企业中型企业中型企业小型企业小型企业品质标品质标志分组志分组数量标数量标志分组志分组12统计学原理统计整理1)品质标志分组品质标志分组:对总体:对总体按照品质标志分组,按照品质标志分组,如人口按性别分组;企业按所有
11、制、行业分如人口按性别分组;企业按所有制、行业分组等属于简单分组;复杂分组有国家制定统组等属于简单分组;复杂分组有国家制定统一的分类目录。(一的分类目录。(P44P44)2)数量标志分组数量标志分组:对总体:对总体按照数量标志分组,按照数量标志分组,具体又分为以下两种情况:具体又分为以下两种情况:单项式分组单项式分组:是以一个变量值为一组的分:是以一个变量值为一组的分组方法,只适用于离散型变量的分组。组方法,只适用于离散型变量的分组。13统计学原理统计整理组距式分组组距式分组:是按变量变动的一定区间来:是按变量变动的一定区间来分组的方法。既适用于连续型变量,也适用分组的方法。既适用于连续型变量
12、,也适用于离散型变量。具体又分为以下两种情况:于离散型变量。具体又分为以下两种情况: 等距分组与异距分组等距分组与异距分组:根据变量值变动的均:根据变量值变动的均匀性来确定。均匀变动的变量适合用等距分匀性来确定。均匀变动的变量适合用等距分组,否则应选择异距分组。组,否则应选择异距分组。说明说明:离散型变量采用单项式分组还是组距:离散型变量采用单项式分组还是组距式分组主要取决于式分组主要取决于变量值的多少变量值的多少和和变量值变变量值变动范围的大小动范围的大小,变量值少且变动范围小的用,变量值少且变动范围小的用单项式分组,反之用组距式分组。单项式分组,反之用组距式分组。14统计学原理统计整理一、
13、分配数列的概念和种类一、分配数列的概念和种类(一)分配数列的概念(一)分配数列的概念(P46P46)在数据分组的基础上,将总体的所有单位按在数据分组的基础上,将总体的所有单位按组归类整理,并按一定的顺序排列,形成总组归类整理,并按一定的顺序排列,形成总体中各个单位在各组间的分布就称为体中各个单位在各组间的分布就称为分配数分配数列列(次数分布次数分布)。分布在各组的总体单位数)。分布在各组的总体单位数叫叫次数次数或或频数频数,各组次数与总次数之比叫,各组次数与总次数之比叫比比重或频率重或频率。 第三节第三节 分配数列分配数列15统计学原理统计整理(二)(二)分配数列的种类分配数列的种类分配分配数
14、列数列 单项式数列单项式数列组距式数列组距式数列等距分组等距分组异距分组异距分组品质分配数列品质分配数列(品质数列)(品质数列)数量分配数列数量分配数列(变量数列)(变量数列)16统计学原理统计整理中国中国20052005年人口状况品质分配数列年人口状况品质分配数列按性别分组按性别分组按性别分组按性别分组绝对人数(万人)绝对人数(万人)绝对人数(万人)绝对人数(万人)比重(比重(比重(比重(%)男男男男6737567375 51.551.5女女女女6338163381 48.548.5合合合合 计计计计130756130756100.00100.00各组名称各组名称各组名称各组名称次数或频数次
15、数或频数次数或频数次数或频数比率或频率比率或频率比率或频率比率或频率(品质分组标志品质分组标志)(品质分组标志品质分组标志品质分组标志品质分组标志)17统计学原理统计整理变量数列变量数列单项式数列单项式数列某企业工人平均日产量某企业工人平均日产量(离散变量)(离散变量)按平均日产量分按平均日产量分按平均日产量分按平均日产量分组(件)组(件)组(件)组(件)( ( ( () ) ) )工工工工 人人人人 数数数数绝绝绝绝 对对对对 数数数数(f)(f)(f)(f)比重比重比重比重(%)(f(%)(f(%)(f(%)(fi i i i/ / / /f) f) f) f) 1919202021212
16、22223231515303045453535202010.3410.3420.6920.6931.0431.0424.1424.1413.7913.79合合合合 计计计计145145100.00100.00变量变量变量变量次数次数次数次数比率或频率比率或频率比率或频率比率或频率18统计学原理统计整理变量数列变量数列等距数列等距数列某厂工人生产定额完成情况表某厂工人生产定额完成情况表(连续变量)(连续变量)工人按完成生产工人按完成生产工人按完成生产工人按完成生产定额分组定额分组定额分组定额分组(%)(%)(%)(%)() ) ) )工工工工 人人人人 数数数数绝对数绝对数绝对数绝对数(f)(f
17、)(f)(f)比重比重比重比重(%)(f(%)(f(%)(f(%)(fi i i i/ / / /f)f)f)f)80-9080-9090-10090-100100-110100-110110-120110-120120-130120-1303030404060603030202016.716.722.222.233.333.316.716.711.111.1合合 计计180180100.0100.0变量变量变量变量次数次数次数次数比率或频率比率或频率比率或频率比率或频率19统计学原理统计整理二、二、单项式数列的编制单项式数列的编制1、对变量值排序、对变量值排序通常按照通常按照由小到大由小到大
18、的顺序来排列。的顺序来排列。例如,某生产车间例如,某生产车间2121名工人日加工零件数资料名工人日加工零件数资料如下如下:117 108 110 117 110 117 130 117 108 110 117 110 117 130 114 110 114 128 120 110 120114 110 114 128 120 110 120108 117 124 114 120 117 124108 117 124 114 120 117 12420统计学原理统计整理2 2、某车间、某车间2121名工人日加工零件分组表名工人日加工零件分组表日产生零件数日产生零件数日产生零件数日产生零件数次数或
19、频数(人)次数或频数(人)次数或频数(人)次数或频数(人)10821104114311751203124212811301合计合计合计合计2121统计学原理统计整理三、组距数列的编制三、组距数列的编制(一)组距与组数(一)组距与组数首先对已取得的调查数据进行排序首先对已取得的调查数据进行排序(P48)(P48)。 1 1、组组、组限组限和和组距组距的概念的概念在在组组距距数数列列中中用用变变量量变变动动的的一一定定范范围围代代表表一一个个组组。每每个个组组的的最最小小值值为为该该组组的的下下限限,最最大大值值为为该该组组的的上上限限,下下限限与与上上限限合合称称为为组组限限,每每个个组组上上限
20、限和和下下限限之之间间的的距距离离称称为为组距组距。22统计学原理统计整理 2 2、组数和组距的关系、组数和组距的关系组数组数:即整个组距数列中所包含的组的个数:即整个组距数列中所包含的组的个数组数的多少和组距的大小成反向变动关系:组数的多少和组距的大小成反向变动关系:组距大则组数少,组距小则组数多。因此,组距大则组数少,组距小则组数多。因此,组距的大小会直接影响组数的多少。组距的大小会直接影响组数的多少。确定组距的原则确定组距的原则:体现组内资料的同质性和:体现组内资料的同质性和组间资料的差异性。一般取组间资料的差异性。一般取510的倍数为的倍数为宜。学生按考试成绩分组:宜。学生按考试成绩分
21、组:23统计学原理统计整理某班学生某班学生统计学统计学考试成绩统计表考试成绩统计表考试成绩考试成绩人数(次数)人数(次数)比重(比重(%) 506025.0 6070717.5 70801127.5 80901230.0 90100820.0合合 计计40100.0不及格不及格不及格不及格及格及格及格及格中等中等中等中等良好良好良好良好优秀优秀优秀优秀体现组内资料的同质性和组间资料的差异性体现组内资料的同质性和组间资料的差异性24统计学原理统计整理(二)等距分组和异距分组(二)等距分组和异距分组按组距是否相等可将组距数列分为:按组距是否相等可将组距数列分为:1 1、等距数列等距数列:是指各组组
22、距都相等的组距:是指各组组距都相等的组距数列。数列。适用范围适用范围:适用于变量值变动比较均匀的现:适用于变量值变动比较均匀的现象,即各组间性质差异是由变量值均匀增加象,即各组间性质差异是由变量值均匀增加或减少而引起的。(或减少而引起的。(P50P50)例如,成绩、身)例如,成绩、身高、体重、计划完成程度等。高、体重、计划完成程度等。25统计学原理统计整理等距数列可绘制等距数列可绘制次数分布直方图次数分布直方图和和次数次数分布折线图分布折线图,直方图的面积与折线图所,直方图的面积与折线图所围成的面积相等。折线两端应在直方图围成的面积相等。折线两端应在直方图的左右两边各延伸一个假想组,并连接的左
23、右两边各延伸一个假想组,并连接至假想组的中点。至假想组的中点。根据分组表绘制次数分布直方图根据分组表绘制次数分布直方图次数分布折线图次数分布折线图26统计学原理统计整理某班学生统计学考试成绩表某班学生统计学考试成绩表考分考分考分考分人数(人)人数(人)人数(人)人数(人)比重(比重(比重(比重(% % % %)505060602 25.05.0606070707 717.517.570708080111127.527.580809090121230.030.090901001008 820.020.0合计合计合计合计4040100.0100.027统计学原理统计整理28统计学原理统计整理29统
24、计学原理统计整理2、异距数列异距数列:指各组组距不完全相等的组:指各组组距不完全相等的组距数列。距数列。1)适用范围适用范围:当总体的分布存在明显的偏:当总体的分布存在明显的偏斜状况时,变量不适合等距分组;总体单位斜状况时,变量不适合等距分组;总体单位的变量变动范围较大,若变量按一定比例关的变量变动范围较大,若变量按一定比例关系发展变化的话可按等比间隔分组编制异距系发展变化的话可按等比间隔分组编制异距数列数列( (P52) )。例如,炼钢高炉按容积(。例如,炼钢高炉按容积(m3)的异距分组为:的异距分组为: 30统计学原理统计整理 钢炉容积(钢炉容积(m3) 组组 距距 100以下以下 100
25、200 100 200400 200 400800 400 8001600 800 1600以上以上 组距间隔等比为组距间隔等比为231统计学原理统计整理2 2)次数密度与频率密度)次数密度与频率密度在异距数列中,由于各组组距不完全相同,因在异距数列中,由于各组组距不完全相同,因此分布在各组中的次数就不具有可比性。要使此分布在各组中的次数就不具有可比性。要使各组的次数可比,必须要消除组距不同的影响各组的次数可比,必须要消除组距不同的影响将不等组距的次数换算为标准组距次数。将不等组距的次数换算为标准组距次数。标准组距标准组距的确定:选择数列中的确定:选择数列中最小的组距最小的组距。次数密度次数密
26、度:单位组距内分布的次数。公式:单位组距内分布的次数。公式:次数密度次数密度=各组次数各组次数各组组距各组组距频率密度频率密度:单位组距内分布的频率。公式:单位组距内分布的频率。公式:32统计学原理统计整理频率密度频率密度=各组频率各组频率各组组距各组组距通过标准组距次数或次数密度将异距数列中通过标准组距次数或次数密度将异距数列中不可比的各组次数换算成可比的各组次数,不可比的各组次数换算成可比的各组次数,并可根据标准组距次数或次数密度来绘制次并可根据标准组距次数或次数密度来绘制次数分布直方图和次数分布折线图,用以反映数分布直方图和次数分布折线图,用以反映总体的数量分布特征。总体的数量分布特征。
27、现以某厂工人年龄分布情况为例,将上述两现以某厂工人年龄分布情况为例,将上述两种方法的换算结果列成表格,并绘制种方法的换算结果列成表格,并绘制次数分次数分布直方图布直方图和和次数分布折线图次数分布折线图,并与等距数列,并与等距数列进行比较。进行比较。33统计学原理统计整理某厂工人年龄分布情况表某厂工人年龄分布情况表工人按年工人按年工人按年工人按年龄分组龄分组龄分组龄分组组距组距组距组距人数人数人数人数(人)(人)(人)(人)标准组距标准组距标准组距标准组距人数人数人数人数次数密度次数密度次数密度次数密度151520205 5171717173.43.4202025255 5282828285.6
28、5.6252530305 5404040408 8303035355 5707070701414353545451010656532.532.56.56.5454550505 5101010102 2合合合合 计计计计230230标准组距为组距最小值标准组距为组距最小值534统计学原理统计整理年龄年龄年龄年龄人人人人数数数数未经处理的异距数列直方图未经处理的异距数列直方图未经处理的异距数列直方图未经处理的异距数列直方图35统计学原理统计整理次次次次数数数数密密密密度度度度某厂工人年龄次数分布某厂工人年龄次数分布某厂工人年龄次数分布某厂工人年龄次数分布直方图直方图直方图直方图异距数列异距数列异距
29、数列异距数列标标标标准准准准组组组组距距距距人人人人数数数数年龄年龄年龄年龄36统计学原理统计整理标标标标准准准准组组组组距距距距人人人人数数数数异距数列异距数列异距数列异距数列A AB BC CD D某厂工人年龄次数分布某厂工人年龄次数分布某厂工人年龄次数分布某厂工人年龄次数分布折线图折线图折线图折线图次次次次数数数数密密密密度度度度年龄年龄年龄年龄B+D B+D 与与与与 A+CA+C哪一个要大哪一个要大哪一个要大哪一个要大一些?一些?一些?一些?37统计学原理统计整理(三)组限与组中值(三)组限与组中值1、组限组限:组距两端的数值称为组限。:组距两端的数值称为组限。组限的确定也是统计分组
30、中的重要问题。组限的确定也是统计分组中的重要问题。确定组限的原则确定组限的原则: 体现组内的同质性和组间的差异性体现组内的同质性和组间的差异性 “上组限不在内上组限不在内”原则原则只要遵循只要遵循“上组限不在内上组限不在内”的原则,无论是的原则,无论是连续变量还是离散变量均可以采用相邻两组连续变量还是离散变量均可以采用相邻两组的上限和下限共用同一个数值做组限的方法。的上限和下限共用同一个数值做组限的方法。 38统计学原理统计整理2 2、组中值组中值:是各组变量范围的中间数值,可:是各组变量范围的中间数值,可以根据各组的上限与下限的简单平均数来确以根据各组的上限与下限的简单平均数来确定。定。组中
31、值组中值= =(上限(上限+ +下限)下限) 2 2为什么要计算组中值为什么要计算组中值原因原因:组距数列是按变量变动的一段区间来:组距数列是按变量变动的一段区间来分组的,它掩盖了分布在各组内的各单位的分组的,它掩盖了分布在各组内的各单位的实际变量值。为了反映每一组变量值的一般实际变量值。为了反映每一组变量值的一般水平,统计上就用组中值来代表每一组变量水平,统计上就用组中值来代表每一组变量值的一般水平。例:值的一般水平。例:39统计学原理统计整理学生按体重(公斤)进行分组学生按体重(公斤)进行分组:40以下以下 39.9以下以下 39.99以下以下4045 4044.9 4044.994550
32、 4549.9 4549.995055 5054.9 5054.995560 5559.9 5559.996065 6064.9 6064.9965以上以上 65以上以上 65以上以上40统计学原理统计整理某班学生统计学成绩分布情况表某班学生统计学成绩分布情况表考试成绩考试成绩人数(人)人数(人)组中值组中值50602556070765708011758090128590100895合合 计计40组中值组中值组中值组中值 = =(上限(上限(上限(上限+ + + +下限)下限)下限)下限) 2 2 2 2 = = 下限下限下限下限 + + + + 组距组距组距组距/2 = /2 = /2 =
33、/2 = 上限上限上限上限 - - - - 组距组距组距组距/2/2/2/241统计学原理统计整理3 3、开口组组中值的确定:、开口组组中值的确定:开口组开口组:是组限不齐全的组,可分为有上:是组限不齐全的组,可分为有上限缺下限和有下限缺上限两种。限缺下限和有下限缺上限两种。缺上限缺上限的开口组组中值的开口组组中值=缺下限缺下限的开口组组中值的开口组组中值=42统计学原理统计整理完成净产值(亿元)完成净产值(亿元)完成净产值(亿元)完成净产值(亿元)企业数(个)企业数(个)企业数(个)企业数(个)组中值组中值组中值组中值1010以下以下以下以下20205 5101020207070151520
34、2030309595252530304040210210353540407070606055557070以上以上以上以上45458585合合合合 计计计计500500 5=10 5=10 - - - -(20-1020-10)2 2 85=70 + 85=70 +(70- 4070- 40)2 2开口组开口组开口组开口组开口组开口组开口组开口组国有工业企业净产值完成情况分组表国有工业企业净产值完成情况分组表43统计学原理统计整理四、累计次数分布四、累计次数分布(一)(一)次数分布次数分布:是指总体中各单位数在各:是指总体中各单位数在各组间的分布。次数分布是统计研究的一个基组间的分布。次数分布是
35、统计研究的一个基本课题,通过次数的分布规律,可以研究大本课题,通过次数的分布规律,可以研究大量现象的统计规律性。量现象的统计规律性。P54(二)(二)累计次数分布累计次数分布:是指将变量数列各组:是指将变量数列各组的次数和频率逐组累计相加而成的。有两种的次数和频率逐组累计相加而成的。有两种累计方法:累计方法:44统计学原理统计整理1.1.向上累计(较小制累计,上限以下累计)向上累计(较小制累计,上限以下累计)是将各组次数或比率,由变量值低的组向是将各组次数或比率,由变量值低的组向变量值高的组逐组累计的方法。变量值高的组逐组累计的方法。含义含义:表明各组:表明各组上限以下上限以下总共所包含的总总
36、共所包含的总体次数或比率有多少。体次数或比率有多少。45统计学原理统计整理是将各组次数或比率,由变量值高的组向变是将各组次数或比率,由变量值高的组向变量值低的组逐组累计的方法。量值低的组逐组累计的方法。含义含义:表明各组:表明各组下限以上下限以上总共所包含的总体总共所包含的总体次数或比率有多少。次数或比率有多少。2.2.向下累计(较大制累计,下限以上累计)向下累计(较大制累计,下限以上累计)46统计学原理统计整理某班统计学考试成绩次数分配表某班统计学考试成绩次数分配表次次次次 数数数数向向向向上上上上累计累计累计累计向向向向下下下下累计累计累计累计人数人数人数人数(人)(人)(人)(人)比率比
37、率比率比率(%)人数人数人数人数(人)(人)(人)(人)比率比率比率比率(%)人数人数人数人数(人)(人)(人)(人)比率比率比率比率(%)505060602 25.05.02 25.05.04040100.0100.0606070707 717.517.59 922.522.5383895.095.070708080111127.527.5202050.050.0313177.577.580809090121230.030.0323280.080.0202050.050.090901001008 820.020.04040100.0100.08 820.020.0合合合合 计计计计40401
38、00.0100.0考考 分分47统计学原理统计整理(三)累计次数的(三)累计次数的特点特点:(:(P55)同一数值的向上累计和向下累计次数之和等同一数值的向上累计和向下累计次数之和等于总体总次数,而累计比率之和等于于总体总次数,而累计比率之和等于1或或100%。单项数列也可以计算累计次数和累计比率。单项数列也可以计算累计次数和累计比率。累计次数分布是确定各种位置平均数的依据;累计次数分布是确定各种位置平均数的依据;累计次数分布图还可以用于研究社会财富分累计次数分布图还可以用于研究社会财富分配的公平程度等问题。配的公平程度等问题。累计次数分布折线图见下表:累计次数分布折线图见下表:48统计学原理
39、统计整理考分考分考分考分累计次数分布折线图累计次数分布折线图累计次数分布折线图累计次数分布折线图40403838313120208 82 29 920203232404049统计学原理统计整理 五、次数分布的类型五、次数分布的类型(一)钟型分布(一)钟型分布特特点点:“两两头头小小中中间间大大”,即即两两头头次次数数分分布少,中间次数分布多。布少,中间次数分布多。变量变量变量变量次数次数次数次数a.a.对称分布对称分布( (正态分布正态分布) ) 中轴线两边的图形中轴线两边的图形 完全对称。完全对称。50统计学原理统计整理b. 右偏分布右偏分布:当变量值中存在极大当变量值中存在极大值时,次数分
40、布曲线值时,次数分布曲线就会向右延伸,即右就会向右延伸,即右偏。偏。次数次数次数次数变量变量变量变量051统计学原理统计整理C.C.左偏分布左偏分布:当变量值中存在极小值时,次:当变量值中存在极小值时,次数分布曲线就会向左延伸,即左偏。数分布曲线就会向左延伸,即左偏。许多社会经济现象都接近正态分布,如市场许多社会经济现象都接近正态分布,如市场价格、学生成绩、职工的工资等。价格、学生成绩、职工的工资等。次数次数次数次数变量变量变量变量52统计学原理统计整理(二)(二)U U型分布型分布特特征征:“两两头头大大,中中间间小小”,即即中中间间变变量量值值分分布布的的次次数数少少,两两端端变变量量值值
41、分分布布的的次次数数多多。其分布图形像英文字母其分布图形像英文字母“”字。字。变量变量变量变量次次次次数数数数(d d)型分布)型分布)型分布)型分布053统计学原理统计整理(三)(三)J J型分布型分布特征:特征:“一边小,一边大一边小,一边大”,即大部分变量,即大部分变量值集中在某一端分布,分布曲线图像英文字值集中在某一端分布,分布曲线图像英文字母母“”字。具体分布有两种类型:字。具体分布有两种类型:次次次次数数数数次次次次数数数数变量变量变量变量变量变量变量变量()正型分布()正型分布()正型分布()正型分布()反型分布()反型分布()反型分布()反型分布0054统计学原理统计整理第四节
42、统计表和统计图第四节统计表和统计图一、统计表的定义与作用一、统计表的定义与作用(一)统计表的定义:将通过汇总整理的系(一)统计表的定义:将通过汇总整理的系统化的统计资料,按一定顺序填列在一定统化的统计资料,按一定顺序填列在一定的表格内,这种表格称为统计表。的表格内,这种表格称为统计表。(二)作用:(二)作用:1.1.使大量统计资料系统化、条理化;使大量统计资料系统化、条理化;2.2.便于比较各项目之间的关系和计算;便于比较各项目之间的关系和计算;3.3.简明、紧凑、一目了然。简明、紧凑、一目了然。55统计学原理统计整理1.总标题总标题:是统计表的名称,简要说明全表:是统计表的名称,简要说明全表
43、的内容,位于统计表的上端正中央。的内容,位于统计表的上端正中央。2.分标题分标题(横标题、纵标题):是指总体名(横标题、纵标题):是指总体名称或分组名称以及说明总体的各种统计指标。称或分组名称以及说明总体的各种统计指标。3.数字资料数字资料:即指标数值,列示在统计表的:即指标数值,列示在统计表的右下方,也是宾词的组成部分。右下方,也是宾词的组成部分。4.资料来源说明资料来源说明(二)统计表的结构(二)统计表的结构56统计学原理统计整理20022002年全国工业增加值(年全国工业增加值(总标题总标题)工业增加值工业增加值工业增加值工业增加值产值产值产值产值( ( ( (亿元亿元亿元亿元) ) )
44、 )比率比率比率比率(%)轻工业轻工业轻工业轻工业重工业重工业重工业重工业1229412294191881918839.139.160.960.9合合合合 计计计计3148231482100.0100.0项项 目目横横横横标标标标题题题题主主词词纵纵纵纵标标标标题题题题指指指指标标标标数数数数值值值值指指指指标标标标名名名名称称称称宾宾词词资料来源资料来源资料来源资料来源:中国统计摘要中国统计摘要中国统计摘要中国统计摘要,中国统计出版社,中国统计出版社,中国统计出版社,中国统计出版社2003200320032003年,第年,第年,第年,第125125125125页。页。页。页。57统计学原理统
45、计整理(三)统计表的分类(三)统计表的分类1.按按主词主词是否分组和分组的程度分类(是否分组和分组的程度分类(P59P59) (1)(1)简单表(表简单表(表2-152-15) (2)(2)分组表(表分组表(表2-142-14) (3)(3)复合表(表复合表(表2-162-16)2.按按宾词宾词是否分组和分组的程度分类是否分组和分组的程度分类 P60-61P60-61 (1) (1)宾词简单排列(表宾词简单排列(表2-162-16) (2)(2)宾词分组平行排列(表宾词分组平行排列(表2-172-17) (3)(3)宾词分组层叠排列(表宾词分组层叠排列(表2-182-18)58统计学原理统计整
46、理二、统计图二、统计图 直方图直方图条形图条形图59统计学原理统计整理柱形图柱形图60统计学原理统计整理圆锥图圆锥图61统计学原理统计整理散点图或连线图散点图或连线图62统计学原理统计整理雷达图雷达图 63统计学原理统计整理饼形图饼形图64统计学原理统计整理作业题:作业题:针对自己感兴趣的问题,设计一份统计调查针对自己感兴趣的问题,设计一份统计调查问卷,说明调查目的、总体与总体单位以及问卷,说明调查目的、总体与总体单位以及报告单位,调查对象不少于报告单位,调查对象不少于100100个。个。对调查问卷作业的新要求:对调查问卷作业的新要求:1 1、每、每6 6个人一组,自愿组合或以宿舍为单位,个人
47、一组,自愿组合或以宿舍为单位,并做如下分工:问卷设计,问卷调查,数据并做如下分工:问卷设计,问卷调查,数据整理,统计分析和文字说明等。整理,统计分析和文字说明等。2 2、设计的调查问题不少于、设计的调查问题不少于1515个。个。65统计学原理统计整理3 3、最终整理形成的调查表不少于两张,一、最终整理形成的调查表不少于两张,一张为主词复合分组表,一张为宾词复合分组张为主词复合分组表,一张为宾词复合分组表;并用两种图形将分组结果予以展示。表;并用两种图形将分组结果予以展示。4 4、统计分析及其文字说明要全面、深入,、统计分析及其文字说明要全面、深入,最好能提出自己的见解或建议。最好能提出自己的见解或建议。5 5、作业用、作业用A4A4纸打印,并将电子版发到我的纸打印,并将电子版发到我的邮箱中:邮箱中:66统计学原理统计整理