应用统计学(第二版) 第 3 章 数据整理讲解

上传人:我** 文档编号:113950383 上传时间:2019-11-10 格式:PPT 页数:71 大小:2.30MB
返回 下载 相关 举报
应用统计学(第二版) 第 3 章 数据整理讲解_第1页
第1页 / 共71页
应用统计学(第二版) 第 3 章 数据整理讲解_第2页
第2页 / 共71页
应用统计学(第二版) 第 3 章 数据整理讲解_第3页
第3页 / 共71页
应用统计学(第二版) 第 3 章 数据整理讲解_第4页
第4页 / 共71页
应用统计学(第二版) 第 3 章 数据整理讲解_第5页
第5页 / 共71页
点击查看更多>>
资源描述

《应用统计学(第二版) 第 3 章 数据整理讲解》由会员分享,可在线阅读,更多相关《应用统计学(第二版) 第 3 章 数据整理讲解(71页珍藏版)》请在金锄头文库上搜索。

1、1,第3章 数据整理,2,3,主要内容和学习目标,3.1 数据的整理(掌握) 3.2 数据整理结果的描述: 统计指标(掌握) 3.3 数据整理结果的描述: 统计表和统计图(掌握),4,3.1.1 数据整理的步骤 3.1.2 数据分组 3.1.3 数据汇总,3.1 数据的整理,5,数据整理:根据统计研究的目的,对收集到的大量原始数据(包括次级数据),用科学的方法进行加工整理,使之条理化、系统化,为统计分析做好准备。,6,原始数据整理的主要步骤是: 第一步, 对原始数据进行审核和订正。 审核它们是否准确、及时、完整 第二步,对原始数据进行分组。 数据分组的恰当与否直接关系到整理结果所显现出的“总体

2、数量分布特征”能否显示现象的根本特征。 第三步,对各项指标进行汇总和计算。 计算各组的总数和合计总数,各组指标和综合指标等。 第四步,编制统计表与绘制统计图。,3.1.1 数据整理的步骤,数据整理也叫分组整理包括数据的分组、汇总、计算。可见,统计整理中统计分组是关键。,7,统计数据的审核是统计整理的首要环节。审核的内容包括四个方面,即:完整性、准确性、适用性和时效性。 数据是否符合实际;检查数据登记是否有错误、计算是否正确。 逻辑检查 准确性审核的方法 计算检查,数据的审核,8,1原始数据的审核: 完整性 准确性 2次级数据的审核: 完整性 准确性 适用性 时效性 经过对统计数据的完整性、准确

3、性、适用性和及时性的审核之后,确认符合调查分析研究的需要,就可以对所搜集到的数据进行加工整理。,9,3.1.2 数据分组,1、分组的意义,2、分组的标志的选择,3、分组的形式,4、分组体系,10,1、分组的意义,分组的概念: 分组是根据统计研究的需要,将统计总体按照一定的标志区分为若干组或部分的一种统计方法。,分组的核心:选择分组标志,分组的作用: 数据分组是贯穿于整个统计工作过程的重要方法,它的主要作用有以下几个方面: (1) 划分现象的类型; (2) 研究现象的内部结构; (3) 分析现象之间的依存关系。,11,2、分组标志的选择,当选择某一分组标志时就突出了现象在这方面的差异,掩盖了现象

4、在其他方面的差异,从而可能得出不同的结论。只有选择最恰当的分组标志,才能使分组的结果正确反映现象的本质特征。,统计分组的结果: 组内具有同质性 组间具有差异性,12,分组标志的多少: 简单分组:总体按一个标志进行分组 。 复合分组:总体用两个或两个以上的标志层叠分组,3、分组的形式,4、分组体系,采用一系列相互联系、相互补充的标志对现象进行多种分组,形成分组体系。,分组体系: 平行分组体系:对同一总体选择两个或两个以上标志分 别进行简单分组形成的体系。 复合分组体系:复合分组形成的分组体系,13,简单分组和平行分组体系,按分组标志的多少观察统计分组类型,14,复合分组和复合分组体系,15,3.

5、1.3 数据汇总,1、数据汇总的组织与技术,2、次数分配,16,数据汇总的组织:在一定的统计管理体制下,将原始数据采用何种纵向汇总方式进行汇总的问题,是采用逐级汇总还是集中汇总,还是两者结合的综合汇总。,1、数据汇总的组织与技术,统计汇总技术:将同级单位(横向)的统计调查数据进行汇总的方法,也称横向汇总法。,17,2、次数分配,次数分配的概念与种类: 次数分配总体中的所有单位按一定标志分组整理,并将各组按一定顺序排列,形成总体中各个单位在各组间的分布. 由总体分组和各组相对应的分配次数两个要素构成。 按照分组标志的不同 次数分配:品质型分配数列 数量型分配数列,18,编制次数分配的步骤,第一步

6、:对数据进行分组 第二步:计算各组的频数、频率、 c 累积频数和累积频率 第三步:编制频数分布表,19,统计分组的原则: 穷尽原则:使总体中的每一个单位都有组可归 互斥原则:使总体中的每一个单位只有一组可归,20,频数(Frequency,亦称为次数) 是指落入各组中的数据的个数或次数 频率(Relative frequency,亦称比重或百分比) 是指各组中的数据个数或次数占全部数据总数的比例 累积频数(Cumulative frequencies) 是将各有序类别或组的频数逐级累加起来 累积方法:向上累积、向下累积 累积频率(Cumulative percentages) 是将各有序类别或

7、组的频率逐级累加起来 累积方法:向上累积、向下累积,21,频数分布表 是各组及其相应的频数(还可包括频率、累积频数和累积频率)依一定的次序排列而成的表格,XXX频数分布表,22,品质型数据的分组整理,品质型数据的分组方法: 把每一个变量值作为一组 分类数据的频数分布表可以包括:分组、频数和频率。如,例3.1 顺序数据的频数分布表可以包括:分组、频数、频率、累积频数和累积频率。,23,【例3.1】坐落于杭州西湖西山路的一家饭店使用一种调查问卷,用来询问顾客对饭店的服务、食物质量、价格与气氛的看法。每一个属性分别以极好(1)、非常好(2)、良好(3)、一般(4)和较差(5)的标准来评价。60份饭店

8、食物质量状况的问卷结果如表3-2所示。,表3-2 饭店食物质量状况调查的样本数据,24,表3-3 饭店食物质量状况的频数分布,25,数值型数据的分组整理,数值型的频数分布表可以包括: 分组、频数、频率、累积频数和累积频率。如,例3.2,数值型数据的分组方法: 单项式分组:把每一个具体的变量值作为一组 适用于变量值较少的离散变量的情况 , 组距式分组:将全部变量值依次划分为若干个 数值区间,每一个数值区间作为一个组。 适合于变量值较多的离散变量和连续变量的情况,26,例如,某生产车间50名工人日加工零件数原始资料 (单位:个),27,表2 某车间50名工人日加工零件数分组表,28,表3 某车间5

9、0名工人日产零件数分组,29,例3.2,90家中国A股房地产上市公司2010年财务负责人年薪数据。(单位:万元),2010年90家中国A股房地产上市公司财务负责人年薪数据排序表,确定数量型数据频数分布组的步骤: 第一步,确定组数。确定互不重叠的组的个数。 第二步,确定组距。确定每一组的宽度。 第三步,确定组限。确定每组变量值两端的界限。,30,原始数据分布比较均匀、对称时,分组的步骤: (1)计算全距R: 或 R最大值组的上限最小值组的下限 (2)确定组数K:组数的多少以能显示数据分布的特征 和规律为宜。 经验公式:,31,(3)确定组距d:一个组的上限与下限之差,(4)确定组限:应遵循“不重

10、不漏”原则,为便于计算,组距宜取5或10的倍数,首先确定最小值组的下限,然后利用 组限和组距的关系依次确定其他组限。,(5)编制频数分布表,32,1、 正确使用间断式组限和连续式组限 间断式组限:保证无数据限落在相邻两组上下限之间 连续式组限:遵循“上限不在内” 原则 2、正确选择第一组的下限和最后一组的上限 第一组的下限:应略小于或等于最小变量值 最后一组的上限:应略大于或等于最大变量值 3、正确使用开口组形式 第一组:采取“以下” 最后一组:采取“以上”,确定组限的细节问题,33,1、使用间断式组限时 各组的组距本组的上限前组的上限 2、使用连续式组限时 各组的组距本组的上限本组的下限 3

11、、开口组通常以相邻组的组距为其组距,确定组距的细节问题,34,1、不等距分组,需要计算频数密度和频率密度 频数密度频数/组距 频率密度频率/组距 2、组距式分组通常用组中值作为各组数据的代表值 连续式组限 : 组中值(本组下限值本组上限值)/2 间断式组限 : 组中值(本组下限值后组下限值)/2 3、开口组组中值的确定方法 “以上”组: 组中值本组下限值相邻组组距/2 “以下”组: 组中值本组上限值相邻组组距/2,其他的细节问题,35,3.2.1 总量指标 3.2.2 平均指标 3.2.3 相对指标,3.2 数据整理结果的描述:统计指标,36,3.2.1 总量指标,概念: 总量指标反映被研究总

12、体的单位总数或它的某种标志的总量。,作用: 反映社会经济发展情况的基本指标 计算相对指标和平均指标的基础,分类: 反映的内容不同:总体单位总量 总体单位标志总量 反映的时间状况不同:时期总量 时点总量,37,总量指标的计算方法:直接计算法 间接计算法,推算法:根据各种关系或非全面调查资料推算总量的方法具体有以下五种方法: 1、平衡关系推算法 2、抽样推算法 3、关系推算法 4、比例关系推算法 5、插值估算法,直接计算法:对调查所得的总体单位、总体单位诸标志值进行汇总。,38,3.2.2 平均指标,概念: 平均指标是概括地反映现象的一般水平的综合指标。 作用: 是个代表值,可作为评价事物和决策的

13、数量标准或参考。,分类:静态平均指标 动态平均指标(见第9章),39,(静态)平均指标具有两个特点: (1) 它抽去了数量标志在总体单位之间的数值差异; (2) 它是一个代表值,是在同质总体中计算出来的反映总体某一数量标志的一般水平。,静态平均指标是总体内各单位某一数量标志表现的一般水平。其计算公式为: 平均指标=总体标志总量总体单位数,40,3.2.3 相对指标,概念: 除了平均指标外,两个互有联系的指标对比所得的结果都是相对指标。,作用: 1、从现象间数量对比关系中,清晰地认识事物; 2、使原来不便于或无法直接比较的现象,转变成可科学地对比分析。,分类: 结构相对指标 比例相对指标 比较相

14、对指标 计划完成程度相对指标 强度相对指标 动态相对指标,41,总体部分数值 结构相对指标 100 总体全部数值,某一总体某项指标数值 比较相对指标 100 另一总体同类指标数值,总体中某一部分数值 比例相对指标 100 总体中另一部分数值,42,实际完成数 计划完成相对指标 100 计划任务数,某一总量指标数值 强度相对指标 100 另一有联系而性质不同的总量指标数值,报告期某一指标数值 动态相对指标 100 基期同一指标数值,43,44,3.3.1 统计表 3.3.2 统计图,3.3 数据整理结果的描述:统计表与统计图,45,统计表的构成要素: 表题 纵栏标题 横行标题 指标数值 统计表的

15、内容: 主词 宾词,统计表,统计表是由纵横交叉线条所绘制的,符合一定要求的表格来表现统计资料的一种形式。 设计良好的统计表使统计资料表现充分、明显而又深刻、有力,可以避免冗长的叙述。,1. 统计表的设计,46,统计表的结构,横行标题,纵栏标题,统计指标,表题,(主词栏),(宾词栏),47,统计表的设计原则:“科学、实用、简练、美观” (1)总标题的表述 (2)行、列标题的排列 (3)计量单位的安排 (4)合计栏的安排 (5)表格线的绘制 (6)指标数值的填写 (7)表外附加的设置,2. 编制统计表需注意的几点,48,统计图,统计图是依据数字资料应用点、线、面、体、色彩等绘制成整齐而又规律、简明

16、而又数量化的图形。,一图知万言,1. 统计图的设计,统计图4要素: 图号及图题 图目 图形 图注,49, 图号, 图题, 图注,注:P=(技术改造经费+技术引进经费+消化吸收经费+购买国内技术经费)/内部科技活动经费。 资料来源:中国科技统计年鉴2004,中国统计出版社。,图3-4 2003年全国及若干省市大中型工业企业的技术源构成,图注,图形,图目,图号,图题,50,常用的统计图有: 柱形图和条形图、饼图和圆环图、 累积频数分布图和累积频率分布图、 直方图、折线图和曲线图 散点图、气泡图和雷达图,2. 统计图的种类,51,分类数据的显示:柱形图、条形图、 饼图、 圆环图 顺序数据的显示:柱形图、条形图、 饼图、 圆环图、 累积

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号