第3章数据的整理与显示讲解

上传人:今*** 文档编号:107044204 上传时间:2019-10-17 格式:PPT 页数:120 大小:1.20MB
返回 下载 相关 举报
第3章数据的整理与显示讲解_第1页
第1页 / 共120页
第3章数据的整理与显示讲解_第2页
第2页 / 共120页
第3章数据的整理与显示讲解_第3页
第3页 / 共120页
第3章数据的整理与显示讲解_第4页
第4页 / 共120页
第3章数据的整理与显示讲解_第5页
第5页 / 共120页
点击查看更多>>
资源描述

《第3章数据的整理与显示讲解》由会员分享,可在线阅读,更多相关《第3章数据的整理与显示讲解(120页珍藏版)》请在金锄头文库上搜索。

1、2019/10/17,非统计学专业本科3学分,1,第三章 数据的整理与显示,讲课:3-4课时 上机:2课时,2019/10/17,非统计学专业本科3学分,2,内容体系,第一节 统计整理的一般问题:意义和程序 重点:把握统计整理的基本程序 Excel应用:数据的预处理(筛选与排序) 第二节 统计分组 重点:理解统计分组的含义和作用,掌握分组的原则、方法 Excel应用:分类汇总与数据透视表 第三节 分配数列 重点:理解分配数列的概念、种类和编制方法 Excel应用:分配数列的编制 第四节 统计资料的表现形式:统计图表 重点:掌握各类统计表的适用性 Excel应用:绘制统计图,2019/10/17

2、,非统计学专业本科3学分,3,第一节 统计整理的一般问题,意义和程序,2019/10/17,非统计学专业本科3学分,4,一、统计整理的意义,按照统计研究的要求,对统计调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化的工作过程 对已整理过的二手资料进行再整理,也属于统计整理 注意: 整理数据前要弄清面对的数据的类型。因为不同类型的数据,所采取的处理方式和方法不同 适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据。分析方法也是如此 统计整理的地位:承上启下、承前启后,?,2019/10/17,非统计学专业本科3学分,5,统计数据

3、的类型,统计数据的分类,2019/10/17,非统计学专业本科3学分,6,二、整理的基本程序,1.方案设计:由设计阶段完成 据研究目的,制定统计资料的整理流程。 设计内容: 对整理方法的设计,包括:预处理方法(审核、筛选、排序等)、分组方法、汇总方法、表现形式等 对整理结果的设计,包括:指标和指标体系的设计、资料对分析方法的要求是否满足等等 2.基本程序,调查 资料,2019/10/17,非统计学专业本科3学分,7,三、数据的预处理,审核、筛选、排序,2019/10/17,非统计学专业本科3学分,8,数据的预处理审核,审核的工作多数需要人工来完成 1、汇总前审核:可能需要经过一审、二审甚至三审

4、等才能完成 (1)审核内容 统计资料的准确性 统计资料的及时性 统计资料的全面性 (2)审核方法准确性的审核 逻辑检查,例如: 生产企业的原材料与产量之间是否符合投入产出比 问卷上的“陷阱”之间的逻辑关系是否被打破 与通常的经验数据是否吻合 计算检查,2019/10/17,非统计学专业本科3学分,9,数据的预处理审核,2、汇总后审核 复计审核:对每一个指标值重新计算 表表审核:利用表与表之间的联系进行审核 例如,两个表上有同一项统计指标,其数值是否相等 表实审核:把表上的数字资料同实际资料(比如问卷或报表或有关单据)核对,一般是让有实际经验的人来检查,判断其正误 对照审核:利用会计、统计、业务

5、三种核算资料进行审核,2019/10/17,非统计学专业本科3学分,10,数据的预处理 筛选(data filter),1、当数据中的错误不能予以纠正,或有些数据不符合调查的要求且又无法弥补,或研究目的有特别要求时,要对数据进行筛选 2、数据筛选的内容包括 剔除某些不符合要求的数据或有明显错误的数据 筛选出符合某种特定条件的数据,而剔除不符合特定条件的数据 比如,仅对30-50岁硕士学位及以上女性的消费行为进行研究 数据筛选可借助计算机自动完成,2019/10/17,非统计学专业本科3学分,11,例:某消费品的消费者调查,对该消费品的潜在消费者群体,按某些特征分组分别进行分析,挖掘目标市场,开

6、发具有不同特征的产品,针对不同的目标市场实施差异化战略 感兴趣的分组特征包括: 年龄特征 性别特征 职业特征 家庭背景 消费习惯 等,2019/10/17,非统计学专业本科3学分,12,数据的预处理 排序(data rank),1、按一定顺序排列数据,以发现一些明显的特征或趋势,找到解决问题的线索 2、排序有助于对数据检查纠错,以及为重新归类或分组等提供依据 比如发现极端值,分析极端值存在的合理性 3、在某些场合,排序本身就是分析的目的之一,2019/10/17,非统计学专业本科3学分,13,数据的排序方法,1、分类数据的排序 字母型数据,排序有升序降序之分,但习惯上用升序 汉字型数据,可按汉

7、字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分 2、数值型数据的排序 递增排序:设一组数据为x1,x2,xn,递增排序后可表示为:x(1)x(2)x(n),2019/10/17,非统计学专业本科3学分,14,Excel汇总(上机),1.利用“分类汇总” 数据按分类标志进行分类、排序 选择“数据”下拉菜单中的“分类汇总”,打开“分类汇总”对话框 对话框中确定“分类字段”、“汇总方式”、“选择汇总项”等,单击确定 2.利用“数据透视表” 建立数据透视表:选择“数据”下拉菜单中的“数据透视表和图表报告” 将分组字段和汇总(或其他)字段拖至相应位置,2019/10/17,非统计学

8、专业本科3学分,15,第二节 统计分组,统计分组的概念、作用、原则、方法等 Excel应用:分类汇总和数据透视表,2019/10/17,非统计学专业本科3学分,16,统计分组,统计分组的理论问题 统计分组的概念、作用、原则 分组标志的选择 统计分组的方法问题 品质分组和变量/数量分组 单项式分组和组距式分组 等距分组和不等距分组 组数、组限、组距和组中值 注意识别一些基本的分组方法和概念,2019/10/17,非统计学专业本科3学分,17,一、统计分组的意义,2019/10/17,非统计学专业本科3学分,18,(一)统计分组的概念,据研究任务的需要,按一个或几个标志将总体划分为几个组,使组与组

9、之间具有差异性,而同一组内的单位保持相对的同质性 分组标志,必须是可变标志 统计分组的两层含义: 对总体而言“分” 对个体而言“合”,20个小球,2019/10/17,非统计学专业本科3学分,19,(二)统计分组的作用 体现统计分组的种类,按分组的任务和作用的不同 类型分组 结构分组 分析分组,2019/10/17,非统计学专业本科3学分,20,1、类型分组的目的划分社会经济类型,表 我国2000年不同经济类型的投资总额 单位:亿元,资料来源:中国统计年鉴(2001),中国统计出版社。,2019/10/17,非统计学专业本科3学分,21,资料来源:中国统计年鉴(2001),中国统计出版社。,2

10、、结构分组的目的 研究总体内部的结构,总体构成的静态评价 总体构成的动态评价 表 我国1990和2000年从业人员按三次产业的分组,2006 42.6 25.2 32.2,2019/10/17,非统计学专业本科3学分,22,3、分析分组的目的 分析变量间的依存关系,表 某商业企业销售额与流通费用率表,分组标志为原因变量/自变量,结果变量是因变量,往往需要计算各组的相对数或平均数,实为平均流通费用率,2019/10/17,非统计学专业本科3学分,23,二、统计分组的原则,1、 组内同质性和组间差别性的原则 2、“穷举”性原则 3、“互斥”性原则 2、3原则可以归纳为:将不同类的单位归入不同的组,

11、每一单位只能归入一组,不存在某个单位同时属于两组或者无法归入任何一组的情况 分组的结果即概率论中提到的 完备事件组 A为全集,A1,A2,An为分组后的子集,则 AiAj=(ij),且A1A2An=A,2019/10/17,非统计学专业本科3学分,24,三、分组标志的选择,正确选择分组标志和划分各组界限是统计分组的关键 选择分组标志时,应注意三方面: 1.根据研究目的选择分组标志 2.选择反映事物本质区别的标志 3.根据经济发展变化及历史条件选择分组标志,2019/10/17,非统计学专业本科3学分,25,1.根据研究目的选择分组标志,例:对全国工业企业进行研究 目的:了解计划完成情况,选:计

12、划完成% 目的:了解内部结构,选:相应的职能或生产部门 目的:了解盈亏状况,选:净利润、资金利润率等反映盈亏的标志 目的:反映生产技术力量状况,选:职工技术等级、技术装备水平等,2019/10/17,非统计学专业本科3学分,26,2.反映事物本质区别的标志,事物有多方面的特征(属性/数量),同一研究目的也可能有若干个相关标志可作为分组标志的备选 例,研究居民家庭生活水平,可以按收入分组,反映家庭收入的标志有每户月收入和每户人均月收入等,哪个更好? 按人均月收入分组,因为剔除了家庭人口多少的影响因素,比按每户月收入分组更能反映每个家庭的真正收入水平和生活状况,从而真正区分开各家庭生活水平上的本质

13、差异,平均数比总量更有可比性,2019/10/17,非统计学专业本科3学分,27,3.根据经济发展变化及历史条件选择分组标志,即使是同样的研究问题,所选的分组标志也应该随经济社会的变化而变化,并符合当时的历史条件 比如,研究企业规模 在生产力水平较低、粗放式经营、劳动密集型的生产条件下,“职工人数”是一个不错的选择 随着生产力水平的提高,集约化程度提高,“固定资产投资额”、“技术装备水平”以及“企业的生产能力”等更适合做企业规模的分组标志,2019/10/17,非统计学专业本科3学分,28,四、统计分组的方法,按分组标志的性质品质分组和数量分组 按数量标志的表现形式 单项式分组和组距式分组 按

14、组距式分组的分组标志的表现形式 等距分组和不等距分组 按分组标志的多少简单分组和复合分组,2019/10/17,非统计学专业本科3学分,29,(一)按分组标志的性质 品质分组和数量分组,品质分组:按品质标志进行的分组 数量分组:按数量标志进行的分组 品质分组和数量分组有时候被称为分组的方法论,2019/10/17,非统计学专业本科3学分,30,1、品质分组,分组标志选择的是品质标志(分类/排序变量),反映事物的属性差异 要划分各组的性质界限,形成品质数列 品质分组按复杂程度可分为三种情况: (1)最简单的情况:在分组标志下各单位性质差异较明确,各组划分比较简单。例如:性别、产品等级等 (2)差

15、异界线不十分明显:在分组标志下存在性质差异的过渡形态,以至差异界限不分明。例如:城乡结合部 (3)有些现象本身情况复杂:比如工业行业分类、产品/商品的分类、企业的经济类型等,很复杂,需要借助于统计分类标准或分类目录,对不同的现象总体确定分类名称、分类标准、计量单位和编码方法,作为分组的统一依据,供长期稳定使用,2019/10/17,非统计学专业本科3学分,31,2、数量分组,分组标志是数量标志,用来分析该数量标志的变动及其在各组的分配情况,反映事物的数量差异 需要划分各组的数量界限,形成变量数列 按数量标志的表现形式 单项式分组和组距式分组,2019/10/17,非统计学专业本科3学分,32,

16、(1)单项式分组,单项式分组:分组标志是离散型变量,且变量值的变动范围不大,变量值的项数又很少。此时,可以将每一个变量值作为一组,形成单项式分布或单项式数列 表 居民家庭按人口数单项式分组,2019/10/17,非统计学专业本科3学分,33,(2)组距式分组,当离散型变量取值范围大、项数又多的情况下,就不宜进行单项式分组 将变量值的一个区间作为一组,每组区间的数值距离称为组距(class width) 适用性:离散型变量值较多的情况,同时也适用于连续型变量,因为其值无法一一列举 可以等距分组也可以不等距分组 按组距式分组在一定程度上会损害资料的真实性。因此,在统计研究中,假定变量值在各组内部均匀分布,2019/10/17,非统计学专业本科3学分,34,表 企业工人按日产零件数分组,等距式分组 首组为开口组,2019/10/17,非统计学专

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号