统计学课件-第三章

上传人:F****n 文档编号:106699418 上传时间:2019-10-15 格式:PPT 页数:76 大小:652.50KB
返回 下载 相关 举报
统计学课件-第三章_第1页
第1页 / 共76页
统计学课件-第三章_第2页
第2页 / 共76页
统计学课件-第三章_第3页
第3页 / 共76页
统计学课件-第三章_第4页
第4页 / 共76页
统计学课件-第三章_第5页
第5页 / 共76页
点击查看更多>>
资源描述

《统计学课件-第三章》由会员分享,可在线阅读,更多相关《统计学课件-第三章(76页珍藏版)》请在金锄头文库上搜索。

1、一、 统计整理的意义,统计整理:根据统计研究的目的,对原始资料进行科学加工,使之系统化、条理化的过程。 承上启下:介于统计调查和统计分析之间,实现了从个别单位的标志值向说明总体数量特征的指标值过渡,是人们对社会经济现象从感性认识上升到理性认识的过渡阶段,是进一步进行统计分析的必要前提。,二、统计数据整理的程序,制定统计整理方案。 原始数据预处理:审核:发现更正错误。 排序:观察数据的基本特征。 分组。 汇总:逐级汇总、越级汇总、混合汇总 汇总后审核。 显示:编制统计表、绘制统计图。,(一).制定统计整理方案: 根据统计调查目的,获得统计资料的整理流程计划: 一是对总体资料的处理方法,如如何分组

2、; 二是确定用哪些具体的统计指标来说明总体。,(二).对原始资料进行审核、订正: 原始资料:完整性和准确性 二手数据:完整性、准确性、适用性、时效性。,数据的审核 (原始数据), 审核的内容 准确性审核 检查数据是否真实反映客观实际情况,内容是否符合实际 检查数据是否有错误,计算是否正确等 完整性审核 检查应调查的单位或个体是否有遗漏 所有的调查项目或指标是否填写齐全,数据的审核 (原始数据),审核数据准确性的方法 逻辑检查 从定性角度,审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象 主要用于对定类数据和定序数据的审核 计算检查 检查调查表中的各项数据在计算结果和计算方

3、法上有无错误 主要用于对定距和定比数据的审核,数据的审核 (第二手数据),适用性审核 弄清楚数据的来源、数据的口径以及有关的背景材料 确定这些数据是否符合自己分析研究的需要 时效性审核 应尽可能使用最新的统计数据。,数据的排序,按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索 排序有助于对数据检查纠错,以及为重新归类或分组等提供依据 在某些场合,排序本身就是分析的目的之一 排序可借助于计算机完成。,数据的排序,定类数据的排序 字母型数据,排序有升序降序之分,但习惯上用升序 汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分 定距和定比数据

4、的排序 递增排序:设一组数据为X1,X2,XN,递增排序后可表示为:X(1)X(2)X(N),(五).汇总后审核: 审核汇总工作质量,汇总过程有无差错。主要四种方法: 一是复计审核; 二是表表审核; 三是表实审核; 四是对照审核。,1.概念 把同质总体中的具有不同特点的 单位分开,从而正确地认识事物 的本质及其规律性。,2.作用 主要有三个方面:,三、统计分组,揭露社会经济现象的类型,反映各类型的特点。, 类型分组,单位:亿元,说明社会经济现象的内部结构。, 结构分组,“九五”期间我国国内生产总值构成(%),研究经济现象之间的依存关系。, 分析分组,某乡某种农作物的耕作深度与收获率的关系,3.

5、原则: 穷尽原则 互斥原则,4.统计分组的种类,(1).按分组标志的多少 :,无论是简单分组还是复合分组,都只能对社会经济现象从一个方面或几个方面进行观察和分析研究,而对社会经济现象需要从各方面进行观察和分析研究,这就需要采用一系列相互联系、相互补充的标志对现象进行多种分组,这些分组结合起来构成一个体系,叫做分组体系。,简单分组 按一个标志对总体进行分组 复合分组 按两个或两个以上标志对同 一总体进行分组,品质标志分组 反映事物属性差异,4 统计分组的种类,(2).按分组标志的特征不同分为 :,- 简单分组。如人口按性别分组。 - 复杂分组,亦称分类。如人口按职业分组。,- 单项式分组 运用于

6、变量变动幅度 小、项目少的分组。如:看管机器台数分组(0,1,2,3,4,) - 组距式分组 运用于变量变动幅度大、项目多的分组。 如:按月工资(元)分组(600650,650700,700750,),数量标志分组 反映事物数量差异,4.统计分组的种类,(3).按分组的作用和任务 :,类型分组 将总体划分为若干不同性质的部分 结构分组 各组对总体的比重,研究总体各部分结构。,分析分组 为研究现象之间依存关系而进行的统计分组。,变量数列,变量数列:将总体按某一数量标志分组,分组后形成的、用以反映总体单位在各组中分布情况的数据集。,或,例:某地区农户收入分布,变量数列,形式: 单变量数列 组距式数

7、列,相关概念:组限、组距、组中值,组中值,闭口组连续组限:组中值=(下限+上限)/2 闭口组间断组限:组中值=(前组上限+本组上限)/2 缺下限组:组中值=上限-相邻组组距/2 缺上限组:组中值=下限+相邻组组距/2,变量数列,编制: 1、单变量数列还是组距式数列:变量的性质及变异程度 离散型变量且变异小:单变量数列 离散型变量但变异大或连续型变量:组距式数列 例如:按以五分制计分的成绩对全班100名学生进行分组,宜单变量数列;按以百分制计分的成绩对全班100名学生进行分组,宜组距式数列; 例如:按身高对全班100名学生分组,只能组距式数列。,变量数列,2、等距数列还是异距数列:变量分布的特征

8、 当分布值很不均匀时,一般采用异距数列。如学生成绩一般密集于某一区间,低于这一区间的学生为少数,高于这一区间的学生也为少数。合理的做法是在密集区间内使用较短的组距,在稀少区间内使用较长的组距。 当等量的标志值不具有相同的意义时,一般采用异距数列。如:对新生儿和成人的年龄,同样的一年或一月,其意义是不同的。进行人口疾病研究的年龄分组时,一般1岁以下按月分组,1-10岁按年分组,11-20岁按5年分组 当标志值按一定比例发展变化:某些时候采用公比为10的不等距分组。如商场按营业额分组为:5万元以下、550万元、50500万元、5005000万元,变量数列,3、开口数列还是闭口数列:极端变量值偏离分

9、布中心的程度。 极端变量值(极大值或极小值)远离分布中心:开口数列 极端变量值(极大值或极小值)接近分布中心:闭口数列 例如:成绩:20分1人、55分1人、58分3人、6070分10人8090分30人、91分3人、92分2人、95分1人 最小组:“90分”(实际平均分92分) 同时兼顾习惯。,统计汇总,频数:各组内的总体单位数 频率:各组内总体单位数占总体全部单位数的比率 累计频数(率):各组的频数(率)累计加和 向上累计制:由标志值较小组向较大组累计。每一组的累计次数表示小于该组下限(变量)值的次数共有多少。 向下累计制:由标志值较大组向较小组累计。每一组的累计次数表示大于该组下限(变量)值

10、的次数共有多少。,某班统计学考试成绩次数分配,直方图,仍以上例考试成绩数据,画成如下直方图:,若组距不等的话,用标准组距人数,然后据此画直方图:,直方图,一、定类数据的整理与显示,整理程序: 列出各类别 计算各类别的频数和频率 编制频数分布表 用图形显示数据,一、定类数据整理频数分布表 (实例),【例3.1】为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告问题做了邮寄问卷调查,其中的一个问题是“您比较关心下列哪一类广告?” 1商品广告;2服务广告;3金融广告;4房地产广告;5招生招聘广告;6其他广告。,定类数据的图示条形图 (条形图的制作),条形图是用宽度相同的条形的高度或长短

11、来表示数据变动的图形 条形图有单式、复式等形式 在表示定类数据的分布时,是用条形图的长度来表示各类别数据的频数或频率 绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图,定类数据的图示条形图 (由 Excel 绘制的条形图),定类数据的图示圆形图 (圆形图的制作),也称饼图,是用圆形及圆内扇形的面积来表示数值大小的图形 主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用 在绘制圆形图时,总体中各部分所占的百分比用园内的各个扇形面积表示,这些扇形的中心角度,是按各部分百分比占3600的相应比例确定的 例如,关注服务广告的人数占总人数的百分比为25.5%,那么其扇形

12、的中心角度就应为360025.5%91.80,其余类推,定类数据的图示圆形图 (由 Excel 绘制的圆形图),二、定序数据的整理与显示,整理程序: 列出各类别 计算各类别的频数、频率和累计频数、频率 编制频数分布表 用图形显示数据,二、定序数据频数分布表 (实例 ),【例3.2】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意? 1非常不满意;2不满意;3一般;4满意;5非常满意。,定序数据频数分布表 (实例),定序数据的图示累计频数分布图 (由 Excel 绘制的累计频数分布图),图3-3 甲城市家庭对住房状况评价的

13、累积频数分布,定类数据的图示环形图 (环形图的制作),环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示 环形图与圆形图类似,但又有区别 圆形图只能显示一个总体各部分所占的比例 环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环 环形图可用于进行比较研究 环形图可用于展示定类和定序的数据,定序数据的图示环形图 (由 Excel 绘制的环形图),三、数值型数据的显示,117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 1

14、34 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121,【例3.3】某生产车间50名工人日加工零件数如下(单位:个)。试采用单变量值对数据进行分组。,分组方法,分组方法,单变量值分组 (要点),1. 将一个变量值作为一组 2. 适合于离散变量 3. 适合于变量值较少的情况,单变量值分组表 (实例),组距分组 (要点),将变量值的一个区间作为一组 适合于连续变量 适合于变量值较多的情况 必须遵循“不重不漏”的原则 可采用等距分组,也可采用不等距分组,组距分

15、组 (步骤),确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按 Sturges 提出的经验公式来确定组数K,确定各组的组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距( 最大值 - 最小值) 组数,根据分组整理成频数分布表,等距分组表 (上下组限重叠),等距分组表 (上下组限间断),等距分组表 (使用开口组),分组数据直方图 (直方图的制作),用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布 在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频

16、数就形成了一个矩形,即直方图(Histogram),分组数据直方图 (直方图的绘制),频 数 (人),15,12,9,6,3,日加工零件数(个),图3-5 某车间工人日加工零件数的直方图,我一眼就看出来了,大多数人的日加工零件数在120125之间!,分组数据直方图 (直方图与条形图的区别),条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的 直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义 直方图的各矩形通常是连续排列,条形图则是分开排列,分组数据折线图 (折线图的制作),折线图也称频数多边形图(Frequency polygon) 是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉 折线图的两个终点要与横轴相交,具体的做法是 第一个矩形的顶部中

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 幼儿/小学教育 > 小学教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号