《统计学课件第三章统计整理》由会员分享,可在线阅读,更多相关《统计学课件第三章统计整理(38页珍藏版)》请在金锄头文库上搜索。
1、统计 学高等学校应用型特色规划教材清华大学出版社9/10/20241第三章第三章 统计整理统计整理第一节 统计整理的基本理论 第二节 统计分组 第三节 次数分布 【学习目标】通过对本章的学习,重点掌握统计整理的最基本理论,在此基础上熟练掌握主要的整理操作方法,能够根据不同的统计原始数据编制相应的次数分布数列,并能根据所编制的数列编制恰当的统计表和绘制适当的统计图。第四节 统计汇总第五节 统计表 第六节 统计图9/10/20242第一节统计整理的基本理论 (一)涵义 统计整理,是指根据统计研究目的,将统计调查所得的原始资料进行科学的分类汇总,或对已经加工的次级资料进行再加工,为统计分析准备系统化
2、、条理化的综合资料的工作过程。 。 一、统计整理的意义 第三章 统计整理9/10/20243第一节 统计整理的基本理论 (二) 意义 统计整理是统计工作过程的第三阶段,是统计调查的继续,是统计分析的前提,它是从对现象的感性认识过渡到对现象理性认识的开始,是这个过程的连续点,并为这个过程提供坚实的基础,它在统计工作中起着承前启后的作用 。 第三章第三章 统计整理统计整理9/10/20244第一节 统计整理的基本理论 第三章第三章 统计整理统计整理统计数据整理的内容与程序主要包括以下几个方面: (二)、统计整理的内容与程序首先是统计数据的预处理调查资料的审核。 其次是统计数据的排序。 再次,是统计
3、数据的分组和汇总。 最后,是编制统计表和绘制统计图。 9/10/20245第二节 统计分组 一、统计分组的概念 第三章第三章 统计整理统计整理 统计分组是指根据事物内在的特点和统计研究的需要,将统计统计分组是指根据事物内在的特点和统计研究的需要,将统计总体按照一定标志区分为若干组成部分的一种统计方法。总体按照一定标志区分为若干组成部分的一种统计方法。 。二、统计分组的作用(一)反映社会经济现象的内部结构和比例关系(二)划分社会经济现象的类型(三)揭示社会经济现象之间的相互依存关系 总体经过分组,能够突出组与组之间的差异而抽象掉组内各总体经过分组,能够突出组与组之间的差异而抽象掉组内各单位之间的
4、差异,使数据变得条理化,便于进一步分析研究单位之间的差异,使数据变得条理化,便于进一步分析研究。9/10/20246 三、分组标志的选择(一)根据统计研究的目的与任务选择分组标志 在对社会经济现象进行研究时,可以根据不同的研究目的而从不同的角度进行研究,也正是研究目的的不同,才选择不同的分组标志进行分组。 (二)在若干个标志中抓住具有本质性的或主要的标志作为分组的依据 总体中的若干标志,有能反映问题本质特征的标志,也有对反映事物本质作用不大的标志,这时我们应该选择最能反映问题本质特征的标志。(三)根据现象所处的历史条件或经济条件来选择标志 对现象进行研究,要视具体时间、地点条件的不同而选择不同
5、的分组标志。 第三章第三章 统计整理统计整理9/10/20247四、统计分组的方法 (二)按数量标志分组的办法 按数量标志分组就是按反映事物数量差异的数量标志为分组标志,并在数量标志的变异范围内,将总体划分为性质不同的若干组成部分。 ( (一一) )按品质标志分组法按品质标志分组法 第三章第三章 统计整理统计整理 按品质标志分组法分组就是选择反映事物属性差异的品质标志为分组标志,并在品质标志的变异范围内划定各组界限,将总体划分成为若干个性不同的组成部分。9/10/20248五、统计分组体系 (一)平行分组体系 总体按一个标志分组称为简单分组。对同一个总体选择两个或两个以上的标志分别进行简单分组
6、,就形成平行分组体系。例如,根据工业统计的研究任务,可以对工业企业按隶属关系、重工业和轻工业、生产规模等标志进行分组,形成平行分组体系: 按隶属关系分组 按轻重工业分组 中央工业 轻工业 地方工业 重工业 按企业规模分组 大型工业企业 中型工业企业 小型工业企业。 分组体系分组体系分组体系分组体系: : 指同时使用两个以上标志分组时,分组标志的组合形式指同时使用两个以上标志分组时,分组标志的组合形式指同时使用两个以上标志分组时,分组标志的组合形式指同时使用两个以上标志分组时,分组标志的组合形式。第三章第三章 统计整理统计整理9/10/20249(二)复合分组体系 对同一总体选择两个或两个以上分
7、组标志层叠起来进行分组叫做复合分组。复合分组所形成的分组体系叫做复合分组体系。例如,对工业企业按轻重工业和企业规模重叠分组形成的复合分组体系: 按轻重工业和企业规模分组 轻工业 大型工业企业 中型工业企业 小型工业企业 重工业 大型工业企业 中型工业企业 小型工业企业 第三章第三章 统计整理统计整理9/10/202410第三节 次数分布 在统计分组的基础上,将总体中所有单位按组归类整理,形成总体中各个单位数在各组间的分布,叫做次数分布。 分布在各组中的个体单位数叫做次数或频数。 各组次数与总次数之比叫做比率或频率。 将各组别与次数按一定的次序排列所形成的数列称作次数分布数列,简称分布数列,又称
8、分配数列或频数分配。 一、次数分布的概念一、次数分布的概念 第三章第三章 统计整理统计整理9/10/202411 第三章第三章 统计整理统计整理 1987年底我国职工构成表按经济类型分组职工人数(万人)比重(%)全民所有制集体所有制其它965434887273.0926.400.54合计13214100.00 组的名称次数(频数 ) 比率(频率)9/10/202412(一)单项式数列 二、变量数列的类型 第三章第三章 统计整理统计整理第三节 次数分布 按每个变量值分别列组,依次分组编制的变量数列叫做单项式变量数列。 【例】【例】【例】【例】己知某车间有己知某车间有2424名工人,他们的日产量(
9、件)分别名工人,他们的日产量(件)分别是:是:2020,2323,2020,2424,2323,2121,2222,2525,2626,2020,2121,2121,2222,2222,2323,2222,2222,2424,2525,2121,2222,2121,2424,23.23.要求根据以上资料编制变量数列。要求根据以上资料编制变量数列。9/10/202413 编制结果如下:编制结果如下:编制结果如下:编制结果如下:第三章第三章 统计整理统计整理第三节 次数分布 日产量(件)日产量(件)日产量(件)日产量(件)X X X X工人数(人工人数(人工人数(人工人数(人) ) ) ) f f
10、 f f202020202121212122222222232323232424242425252525262626263 3 3 35 5 5 56 6 6 64 4 4 43 3 3 32 2 2 21 1 1 1合计合计合计合计242424249/10/202414 依组距分组而编制的变量数列叫做组距数列。组距数列中的每个组不是用一个具体的变量值表示,而是用变量值的一定变化范围即各组标志值变动的区间表示。每组标志值变动的区间长度称为组距。 (二)组距数列第三章第三章 统计整理统计整理第三节 次数分布 组距数列中,各组变量值变动的界限称为组限,组内最大变量值称为上限,最小变量值称为下限。组
11、距就是上限与下限之差,即:组距组上限组下限 上述公式通常在由连续型组距数列计算组距时使用。而在离散型组距数列中,考虑到离散型组距数列的特点,其组距一般为后组下限与本组下限之差。即:组距后组下限本组下限 9/10/202415 第三章第三章 统计整理统计整理第三节 次数分布 某班学生某学期统计学成绩 按成绩分组学生数60以下360-70870-801080-90590-1004合计309/10/202416 组距变量数列按各组的组距状况及变量的类型不同,可以做出如下分类:1. 组距数列按各组组距是否相等,分为等距数列和异距数列2. 组距数列按变量是否连续,分为连续型组距数列和离散型组距数列 变量
12、为连续型组距数列叫做连续型组距数列。在这种数列中前一组的上限与后一组的下限同为一个变量值,这样进行分组不会出现遗漏标志值的现象。变量为离散型的组距数列叫做离散型组距数列。由于离散型变量的取值为整数,因此,组距数列中前一组的上限与后一组的下限不为同一个变量值。 第三章第三章 统计整理统计整理第三节 次数分布 9/10/202417第三节 次数分布 (一)组数与组距 (二)组距与组中值 组距是区分组与组的数量界限,为了保证变量的分组不致发生混乱,习惯上各组一般均包括本组下限变量值的单位,而不包括本组上限变量值的单位,即“上组限不在内”。 组中值是各组变量值的中间数值,通常根据各组上限、下限进行简单
13、平均求得,公式为: 组中值三、变量数列的编制第三章第三章 统计整理统计整理 用组中值代表组内变量值的一般水平有一个前提,即组内各单位变量值在本组内均匀分布或在组中值两侧呈对称分布。 9/10/202418第三节 次数分布四、累计次数和累计频率 第三章第三章 统计整理统计整理 销售额(百销售额(百万元)万元)商店数商店数频率频率()累计次数累计次数累计频率(累计频率()向上向上累计累计向上累向上累计计5以下以下51010151520202525以上以上41016134382032268641430434750828608694100合计合计501009/10/202419第四节 统计汇总一、统计
14、汇总的组织形式第三章第三章 统计整理统计整理 统计汇总的组织形式基本有两种,一是逐级汇总,二是集中汇总。 二、统计资料的汇总技术(一)手工汇总 手工汇总中通常使用的方法有划记法、过录法、折叠法和卡片法四种。 (二)电子计算机数据处理 统计汇总的技术主要有手工汇总和电子计算机数据处理技术两种。 9/10/202420第五节 统计表第三章第三章 统计整理统计整理一、统计表的概念 统计表是以纵横交叉的线条所绘制的表格来表现统计资料的一种形式。二、统计表的构成统计表从形式上看,是由总标题、横行标题、纵栏标题和指标数值四部分组成。 统计表从其内容看,是由两部分组成,一部分是统计表所要说明的总体及其分组,
15、通常称为主词;另一部分则是说明总体的统计指标,通常称为宾词。 9/10/202421第三章第三章 统计整理统计整理(一)广义的统计表按其作用不同,分为调查表、整理表或汇总表和分析表 三、统计表的分类 (二)按统计数列的性质不同,分为空间数列表、时间数列表和时空数列结合表 (三)按分组情况不同,分为简单表、简单分组表和复合分组表 9/10/202422第三章第三章 统计整理统计整理中国体育代表团在悉尼奥运会上获金牌的项目中国体育代表团在悉尼奥运会上获金牌的项目获金牌项目获金牌项目金牌数金牌数 占总数比例占总数比例跳水枚跳水枚 举重枚举重枚 乒乓球枚乒乓球枚 羽毛球枚羽毛球枚 体操枚体操枚 射击枚
16、射击枚 柔道枚柔道枚 田径枚田径枚 跆拳道枚跆拳道枚 品质数列品质数列( (简单表简单表) )9/10/202423第三章第三章 统计整理统计整理简单分组表简单分组表简单分组表简单分组表9/10/202424第三章第三章 统计整理统计整理复合分组表复合分组表复合分组表复合分组表9/10/202425四、统计表的设计 ( (一一) )宾词指标的设计宾词指标的设计 第三章第三章 统计整理统计整理 统计表中宾词指标的设计在不要求分组的情况下,可以按照指标的主次先后排列,在需要分组时,宾词指标的设计分为简单设计和复合设计。 按月工资分按月工资分按月工资分按月工资分组组组组按级别分(人)按级别分(人)按
17、级别分(人)按级别分(人)总总总总计计计计技工技工技工技工学徒工学徒工学徒工学徒工小计小计小计小计男男男男女女女女小计小计小计小计男男男男女女女女简单设计简单设计简单设计简单设计9/10/202426 第三章第三章 统计整理统计整理 按月工资分组按月工资分组按月工资分组按月工资分组按性别分(人按性别分(人按性别分(人按性别分(人) ) 按级别分按级别分按级别分按级别分小计小计小计小计男男男男女女女女小计小计小计小计技工技工技工技工学徒工学徒工学徒工学徒工300300以下以下以下以下300300400400400400500500500500600600600600700700700700以上以
18、上以上以上4 416162222151510105 51 16 6101011118 84 43 3101012124 42 21 14 416162222151510105 50 02 24 45 58 85 54 41414181810102 20 0合计合计合计合计727240403232727224244848复合设计复合设计复合设计复合设计9/10/202427第五节 统计表第三章第三章 统计整理统计整理(二)统计表的编制规则 (1) (1) 统计表的各种标题要力求简明、确切和概括地反映出资统计表的各种标题要力求简明、确切和概括地反映出资料的主要内容,总标题还应标明资料所属的时间和地
19、点。料的主要内容,总标题还应标明资料所属的时间和地点。 (2) (2) 表的内容要简明扼要,分组层次不宜过多。表中主词各表的内容要简明扼要,分组层次不宜过多。表中主词各行和宾词各栏,一般应按先局部后整体的原则排列,即先列出行和宾词各栏,一般应按先局部后整体的原则排列,即先列出各个项目后列出总计;当不需要列出全部项目时,可先列出总各个项目后列出总计;当不需要列出全部项目时,可先列出总计,尔后列出一些必要的项目。计,尔后列出一些必要的项目。 (3) (3) 如果统计表的栏数较多,通常要加编号。主词栏和计量如果统计表的栏数较多,通常要加编号。主词栏和计量单位等栏常用甲、乙等文字标明,其它各栏常用(单
20、位等栏常用甲、乙等文字标明,其它各栏常用(1 1)、()、(2 2)、)、(3 3)等数字编号。)等数字编号。 9/10/202428第五节 统计表第三章第三章 统计整理统计整理 (4) (4) 表中数字要填写整齐,位数对准。没有数字的格内表中数字要填写整齐,位数对准。没有数字的格内用用“”表示;缺某项数字或因小可略而不计时,用表示;缺某项数字或因小可略而不计时,用“”“”标明。统计表数字部分不就留下空白。标明。统计表数字部分不就留下空白。 (5) (5) 当表内指标数值的计量单位相同时,应将计量单位标当表内指标数值的计量单位相同时,应将计量单位标写在统计表的右上角;若计量单位不统一,但横行的
21、计量单位写在统计表的右上角;若计量单位不统一,但横行的计量单位相同,可单设计量单位栏,纵栏的计量单位相同可与纵栏标题相同,可单设计量单位栏,纵栏的计量单位相同可与纵栏标题写在一起。写在一起。 (6) (6) 统计表的表式一般是开口式的,即表的左右两端不画统计表的表式一般是开口式的,即表的左右两端不画纵线,上下基线应用粗线。纵线,上下基线应用粗线。 (7) (7) 对于某些需要特殊注明的统计资料,应在统计表的下对于某些需要特殊注明的统计资料,应在统计表的下方加注说明。方加注说明。 9/10/202429第六节 统计图第三章第三章 统计整理统计整理一、统计图的意义和绘制原则 二、统计图的绘制步骤
22、1.确定绘制统计图的目的 2. 搜集统计资料 3. 决定绘制的图式 4. 绘制图形 三、几种常见的统计图 9/10/202430 第三章第三章 统计整理统计整理条形图(条形图(条形图(条形图(BarBarBarBar): : : :用于显示离散型变量的次数分布用于显示离散型变量的次数分布用于显示离散型变量的次数分布用于显示离散型变量的次数分布9/10/202431第三章第三章 统计整理统计整理第六节 统计图条形图(条形图(条形图(条形图(BarBarBarBar): : : : 用于显示离散型变量的次数分布用于显示离散型变量的次数分布用于显示离散型变量的次数分布用于显示离散型变量的次数分布9/
23、10/202432第三章第三章 统计整理统计整理直方图(直方图(直方图(直方图( Histogram ): : : : 用于显示连续型变量的次数分布用于显示连续型变量的次数分布用于显示连续型变量的次数分布用于显示连续型变量的次数分布9/10/202433第三章第三章 统计整理统计整理第六节 统计图圆形图(圆形图(圆形图(圆形图(饼图饼图 Pie ): : : : 用于显示定类变量的次数分布用于显示定类变量的次数分布用于显示定类变量的次数分布用于显示定类变量的次数分布9/10/202434第三章第三章 统计整理统计整理第六节 统计图9/10/202435第三章第三章 统计整理统计整理线图(线图(
24、线图(线图(LineLineLineLine): : : :主要用于显示连续型变量的次数分布主要用于显示连续型变量的次数分布主要用于显示连续型变量的次数分布主要用于显示连续型变量的次数分布和现象的动态变化和现象的动态变化和现象的动态变化和现象的动态变化9/10/202436散点图(散点图(散点图(散点图(ScatterScatter): : : :第三章第三章 统计整理统计整理主要用来观察变量间的相关关系,主要用来观察变量间的相关关系,主要用来观察变量间的相关关系,主要用来观察变量间的相关关系,也可显示数量随时间的变化情况也可显示数量随时间的变化情况也可显示数量随时间的变化情况也可显示数量随时间的变化情况。9/10/202437本章小结 1什么是统计整理?统计整理在统计研究中的作用如何? 2什么是统计分组?统计分组有什么作用? 3统计表由哪几部分组成?统计表有哪些种类 ? 第三章第三章 统计整理统计整理 本章主要介绍了有关统计整理的基础知识,包括统计整理的含义及其重要性、统计整理的内容、统计分组的意义、分组的类型和方法、次数分布的含义和类型、次数分布的编制方法、统计表的构成和编制、几种常用统计图的绘制等,这些内容. 复习思考题9/10/202438