统计资料的收集与整理

上传人:宝路 文档编号:6909853 上传时间:2017-08-09 格式:PPT 页数:84 大小:2.04MB
返回 下载 相关 举报
统计资料的收集与整理_第1页
第1页 / 共84页
统计资料的收集与整理_第2页
第2页 / 共84页
统计资料的收集与整理_第3页
第3页 / 共84页
统计资料的收集与整理_第4页
第4页 / 共84页
统计资料的收集与整理_第5页
第5页 / 共84页
点击查看更多>>
资源描述

《统计资料的收集与整理》由会员分享,可在线阅读,更多相关《统计资料的收集与整理(84页珍藏版)》请在金锄头文库上搜索。

1、,第一节 统计调查方案设计第二节 统计数据收集第三节 统计数据整理第四节 统计数据表现形式第五节 统计数据特征描述本章小节,主要内容,第一节 统计调查方案设计,一、明确调查目的和任务 明确调查目的和任务是设计统计调查方案最根本的问题,它决定着调查工作的内容、范围、方法和组织。二、确定调查对象和调查单位 确定调查对象 调查对象是指根据调查目的、任务确定的由那些性质上相同的众多调查单位所组成的总体。即统计总体。 确定调查单位 调查单位就是构成调查总体的每一个单位,调查总体中的个体,也就是在调查过程中应该登记其标志的那些具体单位。,第一节 统计调查方案设计,三、确定调查项目、设计调查表或问卷确定调查

2、项目 调查项目是指对调查单位所要调查的具体内容属性,这些属性在统计上又称标志。它是由调查对象的性质、调查目的和任务所决定的,包括一系列品质属性和数量属性。设计调查表或问卷 调查项目一般采用调查表或调查问卷的形式。将调查项目科学地分类、排列,就构成调查表或调查问卷。,第一节 统计调查方案设计,四、确定调查时间、调查地点和调查方式方法 调查时间 调查时间是指调查资料所属的时点或时期。调查时间包括三方面内容:调查资料所属的时间、调查期限和调查工作进行的时间。 调查地点 调查地点是指调查单位的空间位置。确定调查地点,就是规定在什么地方进行调查。 调查方式方法 调查方式方法是指调查工作的组织方式方法,这

3、主要取决于调查的目的、内容和调查的对象。 统计调查的方式多种多样。按其组织形式不同,可分为统计报表制度和专门组织的统计调查;专门组织的调查有普查、重点调查、典型调查和抽样调查等方式。统计调查的方法有直接观测法、实验法、报告法、采访法和网上调查法等。,五、制定调查的组织实施计划 调查的组织计划,是指为确保实施调查的具体工作计划。调查的组织实施计划应包括以下内容:建立调查工作的组织领导机构,做好人员的配备与分工; 做好调查前的准备工作。如宣传教育、人员培训、文件资料的印发、方案的传达布置、经费的筹措等; 制定调查工作的检查、监督方法; 调查成果的公布及工作后的总结等。,第一节 统计调查方案设计,第

4、二节 统计数据收集,一、收集资科的方式 取得统计数据有多种途径,但概括起来不外乎是直接方式和间接方式。(一)统计资料的直接收集 直接获取第一手统计资料的主要方法包括:统计调查和试验设计。统计调查的方式主要有普查抽样调查重点调查统计报表制度。,普查普查是专门组织的一次性的全面调查,用来调查属于定时点上或时期内的社会经济现象的总量。 抽样调查 抽样调查是一种非全面调查,它是按照随机的原则,从总体中抽取一部分单位作为样本来进行观测研究,以抽样样本的指标去推算总体指标的一种调查。重点调查 重点调查的组织方式有两种:一种是专门组织的一次性调查;另一种是利用定期统计报表经常性地对一些重点单位进行调查。统计

5、报表制度 统计报表制度是根据国家有关统计法的规定,依据自上而下统一规定的表格形式、项目及其指标、报送时间与程序布置调查要求和任务,自下而上逐级汇总上报的统计报表制度。,(一)统计资料的直接收集,试验设计 科学试验是进行科学研究的重要手段,在许多学科中几乎都起着积极的作用。统计中的试验设计是科学试验研究的组成部分之一 。试验设计,包括五个相互关联的环节,分别是:方案设计方案实施数据采集数据分析优化生产,(一)统计资料的直接收集,凡不是通过直接的统计调查和试验,而是从其他各种渠道搜集的第二手资料,我们把它总称为统计资料的间接收集。 间接资料的来源大体包括:统计年鉴、统计摘要、统计资料汇编、统计台账

6、、统计公告、报纸、杂志、网上资料等。,(一)统计资料的间接收集,二、收集资料的方法,数据资料的收集方法可以分为初级资料收集方法和次级资料收集方法或称文案资料。初级资料收集方法访问法 访问法是按所拟调查事项,有计划地通过访谈询问方式向被调查者提出问题,通过他们的回答来获得有关信息资料的方法。 按访问内容的传递方式不同,可分为: 面谈调查、电话调查、邮寄调查、留置调查、日记调查和网上调查等方法。,二、收集资料的方法,搜集资料的方法,观测法,报告法,次级资料搜集法,统计的整个工作过程就是对数据的加工过程,从原始数据的收集开始,经过整理、显示、样本信息的获取到总体数量规律性的科学推断,都有一个减少误差

7、、提高数据质量的问题。也就是说,统计数据的质量控制问题是贯穿于统计全过程的重要问题,因此,加强统计数据质量的管理要体现在统计研究的全过程。,三、统计数据的质量问题,主要任务,资料审核、分组、汇总、制表、制图等。,分组,频数分布,统计表,统计图,第三节 统计数据整理,一、统计分组 统计分组是根据统计研究目的,将总体按一定标志区分为不同类型或不同性质的组,使组与组之间有比较明显的差别,而在同一组内的单位具有相对的同质性,即同一组内各单位之间具有某些共同的特征。 (一) 统计分组原则根据统计研究的目的选择分组标志选择能够反映现象总体本质特征的标志 考虑现象所处的具体时间、地点、条件来分组 满足完备性

8、、互斥性及一致性,第三节 统计数据整理,(二) 统计分组的方法 按标志的特征分组 总体单位的各个标志按分组标志的特征分组区分为品质标志和数量标志。 按分组标志数量分组 统计分组按分组标志多少不同,可分为简单分组和复合分组。,第三节 统计数据整理,第三节 统计数据整理,简单分组 简单分组是对研究对象按照一个标志进行的分组。例如某高校职工按照性别或者职称进行的分组,如表2.3.1、2.3.2所示。,第三节 统计数据整理,复合分组 复合分组是对研究对象按两个或两个以上的标志层叠起来进行的分组。即先按一个标志进行分组,然后再按另一个标志在已分好的各个组内划分成若干个小组。例如企业职工按性别分组后,在每

9、组内再按年龄分组,如表2.3.3所示 。,第三节 统计数据整理,(三) 统计分组体系统计分组体系有两种:平行分组体系和复合分组体系,如图2.3.1、2.3.2所示。,(三) 统计分组体系,二、分配数列,将统计总体按某一标志分组后,用来反映总体单位在各组中分配情况的数列叫分配数列。分配在各组的总体单位数叫次数或频数。各组次数与总次数的比值称为频率。 (一)分布数列的分类 根据分组标志的不同,分配数列可以分为品质分配数列和变量分配数列两种。,(一)分布数列的分类,品质数列按品质标志分组所形成的分配数列称品质分配数列或属性分配数列,简称品质数列。它是由总体各组名称及各组总体单位数(次数)组成,如表2

10、.3.4所示。,(一)分布数列的分类,变量数列 按数量标志分组形成的分配数列,称为变量分配数列,简称变量数列。它由各组变量值及各组总体单位数(次数)组成。 变量数列按照用以分组的变量的表现形式,可分为单项数列和组距数列两种。单项数列就是指以一个变量值代表一组而编制的变量数列,如表2.3.5所示。,组距数列的分类: 等距分组 异距分组 等距分组即各组组距相等的分组。异距分组即各组组距不相等的分组。在标志值变动比较均匀的条件下,可采用等距分组。当标志值变动很不均匀,如急剧的增大、下降,变动幅度大时,可采用异距分组。,(二)分布数列的编制,(二)分布数列的编制,组限和组中值 由于变量有离散型与连续型

11、两种,因此,其组限的划分也有所不同。离散变量其变量值可以依次列举,而相邻组两个变量值之间没有中间数值,因此,分组时相邻组的组限必须间断。 连续变量由于其变量值不能依次列举,而且相邻两个变量值之间可以存在无限多的中间数值,因此,相邻组的上限和下限无法用两个确定的数值分别表示,这时相邻的上、下限采用重叠的方法分组界定。 在统计工作中,为保证变量的分组不发生混乱,习惯上规定各组一般均只包括本组下限变量值的单位,而不包括上限变量值的单位,这就是“上限不在内”原则。,(二)分布数列的编制,若按照间断式组限分组时,则需要转换成连续式组限后再计算组中值,闭口组时采用上 (2.3.1) 式计算。,若按照间断式

12、组限分组时,则需要转换成连续式组限后再计算组中值,闭口组时采用上 (2.3.1) 式计算,开口组时需要采用 (2.3.2) 式、 (2.3.3) 式以下近似算:第一组为以下,缺少下限,则,组中值=组上限-下一组组距/2 (2.3.2) 最末组为以上,缺少上限,则组中值=组下限+上一组组距/2 (2.3.3),(二)分布数列的编制,间断式组中值的计算事例如表2.3.6所示。,第四节 统计数据表现形式,一、统计表,(一) 统计表的结构,从形式上看,统计表的结构是由表题、横行标题、纵栏标题和指标数值等要素构成,统计表结构的一般形式如图2.4.1所示。,(一) 统计表的结构,例:2001年我国工业增加

13、值的一个统计表示如表2.4.1所示。,按照统计表的主词是否分组和分组的程度,分为简单表,分组表和复合表三种。 简单表 简单表是统计表的主词未经任何分组的统计表。分组表分组表指统计表的主词按某一标志进行分组。复合表 复合表指统计表的主词按两个或两个以上标 志进行复合分组,(二) 统计表的种类,二、统计图,条形图(Bar chart)条形图常用于描述离散型数据的情况,是我们经常见到的一种图形,它是用宽度相等而高度为频数(率)来表示各类数据的大小。,例2.4.1 某高校2005年各院教师在国内核心杂志上发表论文情况,如表2.4.2所示,条形图(Bar chart),解:由表2.4.2中的数据应用Ex

14、cel软件中的“插入”功能中的“图表”功能绘成的条形图如图2.4.2所示。,直方图(Histogram),直方图表征数据的频数分布特征,它与条形图在形式上有类似之处,都是用条形来表示数据特征,但直方图中的条形之间是没有间隔的。,例2.4.2 某连锁企业2005年度各分公司完成销售计划如表2.4.3所示,试绘制直方图。,直方图(Histogram),解:应用Spss软件中的“Gragh”功能绘制的直方图,如图2.4.3所示。,饼分图(Pie chart),饼分图经常用来表示各成分在总体中所占的百分比。,例2.4.3某课题组为了科学评价某高校学科建设项目的绩效,对构建的学科建设绩效评估指标权重进行

15、了问卷调查,累计发放问卷调查表243份,回收有效问卷223份,其中,教授占65%,研究员占1%,副教授占12%,副研究员占1%,讲师占20%,助教占1%,则样本职称分布如图2.4.4所示。,洛伦茨曲线是20世纪初美国经济学家、统计学家洛伦兹(M.E.Lorentz)绘制成的描述收入和财富分配性质的曲线,洛伦兹曲线如图2.4.5所示。,洛伦茨曲线,洛伦茨曲线,为了更准确地反映收入分配的变化程度,20世纪初意大利经济学家基尼(Gini)根据洛伦茨曲线,提出了计算收入分配公平程度的统计指标,称为基尼系数。其公式为:,联合国有关组织规定:G小于0.2表示收入绝对平均,在0.20.3之间表示比较平均,在0.30.4之间表示相对合理,在0.40.5之间表示收入差距较大,大于0.6表示收入差距悬殊。基尼系数0.4为国际警戒线,超过了0.4则应采取措施缩小收入差距。,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号