第二章第2节统计数据的整理课件

上传人:我*** 文档编号:147130577 上传时间:2020-10-07 格式:PPT 页数:114 大小:766.50KB
返回 下载 相关 举报
第二章第2节统计数据的整理课件_第1页
第1页 / 共114页
第二章第2节统计数据的整理课件_第2页
第2页 / 共114页
第二章第2节统计数据的整理课件_第3页
第3页 / 共114页
第二章第2节统计数据的整理课件_第4页
第4页 / 共114页
第二章第2节统计数据的整理课件_第5页
第5页 / 共114页
点击查看更多>>
资源描述

《第二章第2节统计数据的整理课件》由会员分享,可在线阅读,更多相关《第二章第2节统计数据的整理课件(114页珍藏版)》请在金锄头文库上搜索。

1、第二节 统计数据的整理,本节内容: 一、 统计整理概述 二、统计分组 整理方法 三、统计分布(频数分布) 整理的结果,下一页,返回目录,第二章第一节 统计调查: 1、哪5种调查的方式? 2、5种组织方式从组织形式、调查对象包括的范围、调查的时间标志、调查的目的几个方面区别开。,上节内容:,第二章第二节,品质分组 变量分组,单项式分组 组距式分组,间断式分组 连续式分组,等距分组 异距分组,1、分组的概念和种类,种类,2、分组的概念、作用,3、组数、组距、组限和组中值,四个问题:概念、组数和组距的关系、组 限的划分、组中值的计算。,4、分布的概念和种类:,品质分布 变量分布,单项式分布 组距式分

2、布,等距分布 异距分布,分布又称为分配、数列等,种类,到78,5、累计频数分布的概念,6、统计表的构成和分类,7、认识三种分布:正态分布、U分布和J分布,一、统计整理概述,(一)统计整理意义 (二)统计整理的程序 (三)Excel中的统计整理工具,返回本节首页,(一)统计整理意义,狭义:根据研究的任务,将调查的原始资料进行分组 和汇总,使之系统化、条理化,从而有效的显 示所包含的信息的工作过程。,有广义和狭义之分,广义:既包括对原始资料的分类和汇总,也包括对 次级资料的再整理。,本节指狭义的整理,10;60;60;60;63;64;66;66;68;68; 69;70;71;71;73;75;

3、76;76; 77;78;79;79;80;81;82;83; 83;83;86;87;87;88;97。,42名学生统计学成绩:,试显示其规律,Fanhui3,学生统计学成绩分布表,通过整理可以将数据 的规律显示出来。,Fanhui3,整理的地位,在统计工作过程中起着承前启后的作用,统计调查,统计分析,统计整理,Fanhui3,(二)统计整理的程序,返回本问题,分一下几步: 1、对原始数据进行审核和排序 2、将数据进行分组 和 汇总 3、制作统计表和统计图整理结果的显示 4、积累和保管统计数据,1、对原始数据进行审核和排序,返回本问题,(1)审核:即检查数据中的错误,审核无误后将数据录入计算

4、机中建立数据表,(2)排序:录入的数据一般是无序的,不能反映 现象本质与规律性。,为了发现数据的一些明显特征或趋势, 可对其进行排序。,排序可借助于计算机完成,2、将数据分组 和汇总,为了更加清楚的显示数据的规律,可将已 排序的数据进行分组,并汇出各组总量。,使性质相同的数据归为一组 性质不同的数据分开,使数 据之间的差异性显示出来。,分组的目的:,通过分组能对总体的分布状况进行描述,某超市随机抽取50人进行调查,了解哪种 饮料更受欢迎,结果如下。试显示其规律,饮料分组表,返回10,4、制作统计表和统计图,返回本问题,两者均可借助于计算机完成,统计表和统计图是统计数据显示的方式,更形象 更直观

5、,饮料分组表,饮料分组图,社会,电冰箱消费者对广告宣传途径的效果评价?,您觉得哪种类型的广告宣传效果最好?(仅选一项)1.电视 2.网络 3.杂志 4.报纸 5.路牌 6.宣传页,返回26,(三)Excel中的整理工具,1、数据排序 2、频数分布表 3、数据透视表 4、统计图,返回本问题,都属于统计表,在“数据”中选择“排序”即可操作。,1. 数据排序,2.频数分布函数(Frequency),通过该函数,可以对数据进行分组与归 类,从而使数据的分布形态更加清楚地表 现出来。,新Excel:在“公式”中找“函数” 旧Excel :在“插入”中选择“函数”即可操作。,在“函数”中选“统计函数”,之

6、后选 “Frequency”即可操作,3.数据透视表,数据透视表是一种矩阵式表格,新Excel :在“插入”中选“数据透视表和图表向导” 旧Excel:在“数据”中选“数据透视表和图表向导”即可操作,统计图能够直观形象地描述现象的数量规律性。,返回本问题,4. 统计图,在“插入”中选“图表”即可,二、统计分组,(一)统计分组的意义和种类 (二)统计分组的原则和方法,返回本节首页,(一)统计分组的意义和种类,1、定义: 根据统计研究目的,将总体按照一定的 标志区分为若干个组成部分。,分组 对总体是“分”,对个体是“合”,返回本问题,(1)划分现象的类型,揭示内部结构, 发现其本质与规律。 (2)

7、分析现象之间的依存关系。,返回本问题,2、统计分组的作用,某年某地区居民的消费结构,分类 比重(%) 消费品 97.76 食品 62.68 其他 37.32 劳务 2.24 合计 100,=100%,年度 第一产业 第二产业 第三产业 1952 50.5 20.9 28.6 1962 39.4 31.3 29.3 1972 32.9 43.1 24.1 1985 28.4 43.1 28.5 1992 21.8 43.9 34.3 2000 15.9 50.9 33.2 2010 10.2 46.8 43.0 2011 10.1 46.8 43.1 2012 10.1 45.3 44.6 20

8、13 10.0 43.9 46.1 2014 9.2 42.6 48.2,我国历年三次产业结构(%),我国的产业结构状态:第一产业比重下降,第二、第三产业比重上升,合乎经济发展趋势。但第二产业比重偏高,第三产业比重偏低,说明产业结构需进一步优化。,发达国家第一产业在2%3%之间,第二产业在30%40%之间,第三产业在60%以上。 如美国三者的比例为:1 % 、23.7 %和75.3%,居民月收入和储蓄额之间有正依存关系,3、统计分组种类,(1)按分组标志的多少:,复合分组:用两个或两个以上的标志层叠 在一起对总体进行分组,简单分组:按一个标志对总体进行分组,对学生按学科、学历、性别分,学科 学

9、历 性别 文科 大专 男生 女生 本科 研究生及以上 理工科,平行分组体系和复合分组体系,平行分组体系:多个简单分组构成一个 平行分组体系 复合分组体系:复合分组本身构成复合 分组体系,(2)按分组标志的性质不同,品质分组: 变量分组:,又称属性分组,按品质 标志分组而成。,又称数量分组,按数量 标志分组而成,品质分组,变量分组,(二)统计分组的原则和方法,1、原则:穷尽性和互斥性,某百货公司:,分组是否正确?,分组是否正确?,2、统计分组方法,(1)品质分组的方法: 方法比较简单。,(2)数量分组的方法: 须注意:确定合适的数量分组界限 采用正确的分组形式,采用单项式还是组距式分 组;等距还

10、是异距分组; 间断式还是连续式分组.,能反映事物质的差异,数量分组的种类:,变量分组,单项式分组:一个变量值代表一组 组距式分组:一组变量值代表一组,等距分组和异距分组 间断式分组和连续式分组,单项式分组:,返回本问题,某厂工人按日产量分组,组距式分组,等距分组,异距分组,连续分组,异距分组,间断分组:,组距式 分组中涉及的概念:,组数(n) 组距(d) 组限 组中值,返回本问题,A、 组数(n)的计算公式,美国统计学家斯特吉斯: n= 1+ 3.322 lgN 其中, n 为组数,N为总体单位总数,经验分组见30页,B、 组距(d),组的最大值 减 组的最小值,返回本问题,即:R是已知的,在

11、组数确定后, d = R / 组数,注意:组数和组距的关系: 当全距(R)一定时,两者成反比。,100110 110120 ,C、 组限,分上限和下限,7080 8090 90100,组下限,组上限,若变量为 连续型:,组限的划分方法:,若变量为 离散型:,相邻组的组限必须重叠; 在统计次数时,应遵循的原则 为:上组限不统计在本组内。,相邻组的组限必须断开,D、组中值,各组上限和下限之间的中点值 上限+下限 2,返回本问题,开口组的组中值的求法,首组的组中值 = 首组上限 邻组组距 / 2 末组的组中值 = 末组下限 + 邻组组距 / 2,返回本问题,注意实际问题:,说明:,单项式分组只适用于

12、离散型变量且变量 值较少的情况。因为如果数据过多,单项式分组达不到显示数据规律的目的。 在数据较多或连续型变量的情况下,需使 用组距式分组。,三、频数分布(统计分布) 是统计整理的结果,(一)频数分布的概念 (二)频数分布的编制方法 (三)累计频数和累计频率分布表 (四)频数分布的类型,返回本节首,(一)频数分布的概念,1、定义: 在统计分组的基础上,将总体的所有单位按组归类排列,并计算其相应的次数,形成总体中各个单位在各组间的分布。,返回本问题,又称统计分布、次数分布、频数分布、分布数列,2、频数分布的构成要素,返回本问题,频率:次数的相对数,即:,总体按某种标志所分的组 各组出现的单位数(

13、次数或频数),f,f/f,3、频数分布的种类,返回本问题,注意变量数列的构成要素:标志值和次数,品质数列:,返回本问题,单项式数列:,返回本问题,组距式数列、等距数列:,返回本问题,组距式数列、异距数列:,返回本问题,含义:单位组距内分布的频数 公式:频数/组距,4、频数密度与频率密度,有了频数为什么 还计算频数密度? 原因:频数只能 比较等距数列中 各组标志值出现 的次数的多少。,对于异距数列,要比较各组标志值出现 的次数的多少,则需用频数密度或频率密度,注意区分频数分布和分组,频数分布是在分组的基础上加上次数(频数) 的分布。,下一页,分布数列的要素构成:分组和次数,变量数列的构成要素:标

14、志值和次数,(二)频数分布的编制方法,1、品质数列的编制(略) 2、变量数列的编制 (1)变量数列编制步骤 (2)编制变量数列应注意问题,返回到节首页,2、变量数列的编制,第一、对数据进行排序,以了解全部数据的变动 范围,确定全距R。 第二、确定分组组数n,计算各组组距d=R/n。 第三、确定分组的组限。 第四、统计各组数值所出现的频数,形成频数分布表,(1)编制步骤,第一、对数据进行排序,对数据进行排序,找出最大值和最小值。 假设组数据中最大为96,最小为48 全距等于48。,返回本问题,排序可利用计算机完成,第二、确定分组的组数和组距 A、组数的确定一般使用经验公式,即用 斯特吉斯的组数公

15、式。 本例中为6.67组,实际中可取6组或7 组,返回本问题,B、计算各组距,组距=全距 / 组数 假设本例分6组,全距为48,则: 组距=48/6=8,返回本问题,该组距通常称之为理论组距,实际计算时一 般以5或10的倍数为好,所以将组距取为10,第三、确定各组上限和下限,第一组下限=48 第一组上限=48+10=58 第二组下限=58+10=68 第二组上限=68+10=78 ,分组 4858 5868 6878 7888 8898 98以上,分组 60以下 6070 7080 8090 90100,合适的分组,第四、统计各组的频数,形成频数分布,频数分布表即为变量数列,可以用计算机完成, 使用的是频数分布函数 (FREQUENCY)。,返回本问题,Data array:用于编制频数分布数列的原始数据区域 Bins array:数据接收区域,(2)编制变量数列应注意问题,分组的目的是为了观察数据分布的特征, 因此,分组不能过粗,也不能过细。 例:某班40名学生统计学成绩资料: 89 88 76 99 74 60 89 86 82 60 93 99 94 82 77 79 97 78 95 92 87 84 79

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号