统计学之资料整理

上传人:luobi****88888 文档编号:94071654 上传时间:2019-08-01 格式:PPT 页数:33 大小:1.58MB
返回 下载 相关 举报
统计学之资料整理_第1页
第1页 / 共33页
统计学之资料整理_第2页
第2页 / 共33页
统计学之资料整理_第3页
第3页 / 共33页
统计学之资料整理_第4页
第4页 / 共33页
统计学之资料整理_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《统计学之资料整理》由会员分享,可在线阅读,更多相关《统计学之资料整理(33页珍藏版)》请在金锄头文库上搜索。

1、本资料来源,第三章 资料整理,统计调查,统计整理,统计分析,有组织、 有计划地 搜集资料。 要求:准确、 完整、及时,对调查资料 去伪存真、 去粗取精、 科学分类、 浓缩简化,描述性分析 推断分析、 决策分析。 要求:定性 定量结合,统计工作的三个中心阶段,本章主要内容,第一节 资料整理概述 第二节 统计分组 第三节 次数分布数列 第四节 统计表和统计图,第1节 资料整理概述,主要任务,资料审核、分组、 汇总、制表、制图等。,分组,频数分布,统计表,统计图,1统计资料整理 它是指将大量的个体单位的原始资料,进行科学性的分类、汇总,使其系统化、条理化,可以有效地展示,为下一阶段的统计分析作准备的

2、过程。 2资料整理的内容 (1)统计资料审核; 完整性审核、正确性审核 (2)统计资料分组; (3)汇总; (4)编制统计图表; (5)资料积累。,3数据的预处理 (1)数据的审核; 完整性审核、及时性审核、正确性审核 次级资料的审核 (2)资料审核后的订正。,4资料整理方案的设计 (1)确定汇总指标与综合表; (2)确定分组方法; (3)选择资料汇总的形式; (4)确定资料的审查内容与方法。,返回,它是根据统计研究的目的和任务,按照某种标志,将总体区分为若干部分的一种统计方法。,第2节 统计分组,统计分组的两层涵义;,统计分组的基本原则;,资料整理的重要环节。,什么是统计分组?,分组 P57

3、,分组前,分组后,25,33,42,1划分现象类型,作用:,例:按所有制性质划分,分为公有经济和非公有经济。公有经济包括国有及国有控股经济和集体经济;非公有经济包括私营经济、个体经济、联营经济、股份制经济、外商投资经济、港澳台投资经济等。,2揭示现象内部结构,例:上海市按GDP计算的三次产业结构(%) 1978年 1990年 2000年 2009年 GDP 100 100 100 100 第一产业 4.03 4.31 1.83 0.76 第二产业 77.36 63.81 47.54 39.86 第三产业 18.61 31.88 50.63 59.38,3分析现象之间的依存关系,例:中国农民家庭

4、按收入分组的恩格尔系数(1984年),按收入分组(元) 200 300 400 500 600 800 1000 恩格尔系数(%) 64.9 60.2 56.7 54.4 50.5 49.9 43.6,恩格尔系数介绍(由德国统计学家恩格尔的定律而得),反映人民生活水平类型的指标,用家庭或个人食品支出总额占消费支出总额比重计算。,30%以下,30%40%,40%50%,50%60%,60%以上,最富裕水平,富裕水平,小康水平,勉强度日水平(温饱),绝对贫困水平,2000年,我国居民的恩格尔系数首次低于50。,最新的调查统计显示,长三角地区15个城市居民生活水平相对较高。上海市统计局城调队提供的数

5、据表明,2003年,15个城市的恩格尔系数继续走低,全部降到35至43之间,其中有10个城市恩格尔系数降到40以下。 因此,长三角地区15个城市中,已有六成以上的城市居民过上富裕生活。,广东顺德恩格尔系数跌破30% 成为全球最富裕地区之一。(新华网 2004年08月02日),分组标志的选择与分组形式,1、正确选择分组标志的原则:,形式,按分组标志性质分,品质标志分组,数量标志分组,按分组标志个数分,简单分组,复合分组,分组体系,(1)根据研究问题的目的来选择分组标志;,(2)要选择最能反映被研究现象本质特征的标志 作为分组标志;,(3)要结合现象所处的具体历史条件或经济条件 来选择分组标志。,

6、2、分组的形式,返回,采用一系列相互联系、相互补充的标志对现象进行多种分组,这些分组结合起来构成的一个体系称为分组体系。,第3节 次数分布数列,是一种重要的分组资料,反映总体单位在各组的分布 状态。,基本形式:,分组,单位数(频数),频率(%)或比重,合计,100,频数分布,频率分布,分类,品质数列,变量数列,单项数列,组距数列,等距数列,异距数列,例,例,例,例,变量数列的编制,1计算全距,初步分析,全距(R)变量的最大值变量的最小值,2估算组数与组距,3定上下限,组数:K = R / I R 为全距,I 为组距,变量数列的编制,2组限的确定与归类,1确定形式,单项数列:离散型且取值不多。,

7、组距数列:离散型且取值多或连续型。,连续变量、离散变量的组限,重合式归类:上限不在内,组限(上限和下限):一组的最大值和最小值。,开口组,具体问题,变量数列的编制,3组距的计算,4组中值的计算,组距上限下限,离散变量组的组距:,组距上组的下限本组的下限,开口组的组距怎么办?,组中值=(上限+下限)/2,缺上限的组中值=下限(邻组组距/2),缺下限的组中值=上限(邻组组距/2),累计次数分布表和分布图,某班统计学成绩的累计次数分布表,累计次数分布表和分布图,某班统计学成绩的累计次数分布折线图,较小制累计次数分布折线,较大制累计次数分布折线,第4节 统计表和统计图,构成,总标题,横行标题:统计研究

8、的对象。也称主词。,纵栏标题:说明主词的指标名。也称宾词。,数字资料,分类,主词,简单表(表3-8),简单分组表(表3-7),复合分组表(表3-9),宾词,平行形式,复合(交叉)形式(表3-10),编制统计表注意点:P69,统计表 ,某地区工业企业的工人性别和工龄,平行形式,统计图,直方图,图3-4,折线图,曲线图,等距数列:(组中值,频数),异距数列:(组中值,频数密度),单项数列:(变量,频数),较小累计分布:(变量上限,累计频数),较大累计分布:(变量下限,累计频数) ,变量的组数无限增多时,折线 便趋于一条光滑的曲线。,P72 图3-5,图形,条形图 书 P 71,饼形图 书 P 71

9、,象形图 书 P 73,分布类型,1、正态分布(也叫钟型分布):对称和偏态,特征:两头小,中间大。 图,2、U型分布,特征:两头大,中间小。 图,3、J型分布:正J型和反J型,特征:一头大,一头小。 图,返回,本章结束!,某厂职工人数统计表,按性别分组,男 职 工,女 职 工,合 计,人数(人),(频数),比率(),(频率),253,115,368,68.75,31.25,100.00,返回,某厂职工家庭人口分组统计,按家庭人口分组,1,合 计,职工户数,(频数),比率(),(频率),7,返回,2,3,4,5,6,38,105,54,31,20,2.9,15.2,41.3,20.5,12.1,8.0,255,100.0,某小区居民家庭人均月消费性支出分布表,返回,等距数列,我国土地状况分组表,返回,异距数列,中国统计年鉴1998,上海市总人口数,年份,1980,年末总人口,1147,返回,年份,年末总人口,1985,1988,1991,2002,2003,2004,2005,2006,2007,2009,2008,1217,1262,1287,1334,1342,1352,1360,1368,1379,1391,1397,返回,返回,返回,返回,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > IT计算机/网络 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号