第二章 统计数据的搜集整理显示

上传人:今*** 文档编号:112612372 上传时间:2019-11-06 格式:PPT 页数:60 大小:2.14MB
返回 下载 相关 举报
第二章 统计数据的搜集整理显示_第1页
第1页 / 共60页
第二章 统计数据的搜集整理显示_第2页
第2页 / 共60页
第二章 统计数据的搜集整理显示_第3页
第3页 / 共60页
第二章 统计数据的搜集整理显示_第4页
第4页 / 共60页
第二章 统计数据的搜集整理显示_第5页
第5页 / 共60页
点击查看更多>>
资源描述

《第二章 统计数据的搜集整理显示》由会员分享,可在线阅读,更多相关《第二章 统计数据的搜集整理显示(60页珍藏版)》请在金锄头文库上搜索。

1、,思考 Thinking Challenge,你用什么办法可以知道我校学生的生活消费水平?,?1984-1994 T/Maker Co.,1,版权归属理工学院:孙静讲师,第二章 统计数据的搜集、整理和显示,2.1 数据的搜集 2.2 数据的整理 2.3 数据的显示,2,版权归属理工学院:孙静讲师,2.1 数据的搜集,3,版权归属理工学院:孙静讲师,一、统计数据的直接来源 直接来源数据一般称原始资料,第一手数据。 二、统计数据的间接来源 是指通过其他渠道(非自已直接调查或试验)获取别人调查或科学试验的数据。 间接来源数据一般称次级资料,第二手数据。,常用的统计数据来源,中国统计年鉴 中国统计摘要

2、 中国统计信息网(国家统计局网站) ,5,版权归属理工学院:孙静讲师,常用的统计数据来源,美国经济分析局http:/www.bea.doc.gov 美国人口普查局http:/www.census.gov 美国劳工统计局http:/stats.bls.gov 美联储经济数据库http:/www.stls.frb.org/fred 美国联邦统计http:/www.fedstats.gov 世界银行http:/www.worldbank.org 国际货币基金组织http:/www.imf.org OECD http:/www.oecd.org,6,版权归属理工学院:孙静讲师,7,版权归属理工学院:孙

3、静讲师,8,版权归属理工学院:孙静讲师,9,版权归属理工学院:孙静讲师,调查方案是指导整个调查过程的纲领性文件,大体包括调查目的、调查对象、调查项目等内容。 1、调查目的:回答“为什么调查”; 2、调查对象:回答“向谁调查”; 3、调查项目:回答“调查什么” 4、其他内容:明确调查所采用的方法和组织方式、调查时间、调查组织和实施的细节,调查方案的设计,如何获取第一手调查资料?(准确,及时),10,版权归属理工学院:孙静讲师,注意调查单位与填报单位 的区别:,填报单位是在行政、经济上具有一定独立性的单位。 调查单位可以是个人,企事业单位或物。,11,版权归属理工学院:孙静讲师,普查、抽样调查、重

4、点调查、典型调查、统计报表,12,版权归属理工学院:孙静讲师,1、普查: 为某一特定目的而专门组织的一次性全面调查。 如:人口普查、农业普查、经济普查等 特点: (1)通常是周期性的或一次性的,涉及面广、耗时、费力,一般需间隔较长时间; 如:1953、1964、1982、1990、2000(人口普查) 逢“0”年份:人口普查 逢“6”年份:农业普查 逢“3”和“8”的年份:经济普查(将第三产业普查、工业普查、基本单位以及建筑业普查合并),13,版权归属理工学院:孙静讲师,(2)一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏;,(3)准确性一般较高,较规范; (4)适用的对象较窄,只

5、能调查一些最基本、最一般的现象。,如:第五次人口普查登记的标准时间是2000年11月1日零时。,14,版权归属理工学院:孙静讲师,2、抽样调查,从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果推断总体数量特征。 特点: (1)经济性强:工作量小、可节省人、财、物力 (2)时效性高:可迅速、及时地获得所需要的信息 (3)适应面广:可获得更广泛的信息,适用于各个领域、各种问题的调查; (4)准确性高:用工量小,从而工作可做得更细,误差往往很小。,指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会,15,版权归属理工学院:孙静讲师,3、统计报

6、表,按国家有关法规规定,自上而下地统一布置,自下而上地逐级提供基本统计数据。 特点: 统一的表式、统一的指标、统一的报送时间、统一的报送程序。 类型: (1)按报送调查范围分: 全面报表:调查对象中的每一个单位都填报 非全面报表:只要求调查对象中的一部分单位填报 (2)按报送时间间隔分 日报、月报、季报、年报 (3)按报送地域(机构)范围分: 国家报表、地方报表、部门报表,16,版权归属理工学院:孙静讲师,4、重点调查,从调查对象的全部单位中选择少数重点单位进行调查(适用于“同类”中的“大户”,调查的标志值在总体中占很大比重的单位)。 5、典型调查 从调查对象的全部单位中选择一个或几个有代表性

7、的单位进行调查。(不一定针对“大户”) 注意: 重点调查、典型调查与抽样调查的不同处在于: 1、抽样调查是随机抽取调查单位,不存在对调查对象选择的主观性,因此可以根据抽样结果推断总体的数量特征; 2、重点调查和典型调查不是随机取样,具有一定的主观性,因此调查结果不能推断总体。,17,版权归属理工学院:孙静讲师,统计调查形式示意图,18,版权归属理工学院:孙静讲师,我国统计调查方法体系改革的目标模式是:,建立以周期性普查为基础,以经 常性的抽样调查为主体,以必要 的统计报表、重点调查和科学的 推断为辅助手段的调查方法体系 模式。,19,版权归属理工学院:孙静讲师,数据整理的内容,是指对所搜集的数

8、据进行加工整理、使之系统化、条理化,以符合分析的需要。,2.2 数据的整理,一、数据的预处理:审核、筛选与排序 1、审核: 对 第一手资料(直接调查或试验取得):审核其完整性与准确性。 完整性审核:应调查的单位或个体是否有遗漏;所调查的项目是否填齐全。 准确性审核:内容是否符合实际;计算是否正确。 如:文化程度:小学 职业:大学教师 对第二手资料(获取他人的资料):审核其完整性、准确性、适用性、时效性,21,版权归属理工学院:孙静讲师,2、筛选: 剔除不符合要求的数据或有明显错误的数据; 将符合特定条件的数据筛选出来。 3、数据的排序:是按一定顺序将数据排列。 目的: 通过浏览数据发现一些明显

9、的特征趋势或解决问题的线索; 有助于数据的检查纠错; 为分组提供依据。,22,版权归属理工学院:孙静讲师,统计分组的涵义: 是将预处理过的数据按照某个重要标志(或几个标志)将总体分成不同性质的组。变量,预处理数据,分组,计算频数,统计分组的原则:穷尽原则和互斥原则,即不重不漏原则。,二、统计分组与频数分布,23,版权归属理工学院:孙静讲师,分组,分组前,分组后,25,33,42,划分现象类型 研究总体结构 研究现象之间的依存关系,作用,24,版权归属理工学院:孙静讲师,1.按总体所选择标志的个数分 :,简单分组 按一个标志对总体进行分组 复合分组 按两个或两个以上标志对同 一总体进行分组,分组

10、标志的选择与分组形式:,关键:服从研究任务需要,反映总体本质特征。,2.按分组标志的特征不同分为 :,品质标志分组 反映事物属性差异。针对定性数据。,- 简单分组。如人口按性别分组。 - 复杂分组,分类。如人口按职业分组。,数量标志分组 反映事物数量差异。针对定量数据。,- 单项式数量分组 运用于离散变量,变量值变动幅度小、项目少的分组。 组距式分组 运用于连续变量或离散变量变动幅度大、项目多的分组。有等距分组、异距分组;连续组距分组、间断组距式分组。,26,版权归属理工学院:孙静讲师,每组变量值变动区间的长度,一般为上下限之差。,每组变量取值范围的中点数值 ,即上下限的中间值。,相关概念,组

11、距,组中值,闭口式组距(上下限齐全)适用于数据均匀的场合。例40-60分,90-100分。 开口式组距(上下限不全)可适用于仅存在少数极端数值的场合,常见于最低组与最高组。例:成绩60分以下,90分以上。,27,版权归属理工学院:孙静讲师,某地区100个百货商店 月销售额与流通费用情况,上组限U,下组限L,如:组距d=U-L =100-50=50(万元),如:组中值x=(U+L)/2 =(100+200)/2 =150(万元),理解相关概念,例:,连续分组:上组限不在内,28,版权归属理工学院:孙静讲师,频数分布数列(汇总),频数分布:记录和展现特定数据出现次数多少的方法。也称次数分布。 分布

12、数列:即全部数据按其分组标志归类排列以反映总体单位在各组内分布状态的数列。也称分配数列。 频数分布数列种类:(以分组标志特征不同)品质数列,变量数列(又称数量数列,还可再分为单项式变量数列,组距式变量数列)。,29,版权归属理工学院:孙静讲师,基本形式:,频数或次数:分布在各组内的总体单位的个数。,相对频数/频率/比重:各组频数与全部频数之和(总体单位数)的比重。,组别(变量) 次数(频数) 频率(比率),组距式变量数列,30,版权归属理工学院:孙静讲师,例1: 50个计算机购买者所购买的不同品牌的机型数据,电脑消费品牌分布表 品牌 频数(台) 比重/频率 频率(%) Apple 13 0.2

13、6 26 Compaq 12 0.24 24 Gatewy2000 5 0.10 10 IBM 9 0.18 18 Packard Bell 11 0.22 22 Total 50 1.00 100,品质数列,【例2】己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。,33,版权归属理工学院:孙静讲师,编制结果如下:,单项式变量数列,34,版权归属理工学院:孙静讲师,1.确定组数:组数的确定应以能够显示数据的分布特征和规律

14、为目的(经验公式或可对总体结构进行定性分析),2.确定组距(等距分组):组距是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距( 最大值 - 最小值) 组数,3.确定各组组限,统计各组的频数并整理成频数分布表,(等距)分组计频基本步骤:,对数据进行排序确定分组的形式确定组数 确定组距(按组)整理成分布频数表,4.计算组中值(根据需要),35,版权归属理工学院:孙静讲师,例3:一会计事务所对其20家客户(clients)年底帐目辑核(audits)时间(天)统计如下表:,Table Year-End Audit Times(in days) 12 14 19 1

15、8 15 15 18 17 20 27 22 23 22 21 33 28 14 18 16 13,等距分组与计频的例题,36,版权归属理工学院:孙静讲师,组数的确定一般视数据本身的特点及数据的多少而定。,经验上以520之间为好,尤其注意不要确定太多的组数,使得每组包含的数据太少。 实际分组时常按斯特格斯提出的经验公式来确定组数n:,其中N为数据的个数(总体单位数或样本数),一般对结果取整数。,例3中:n=5,第一步,确定组数。,根据经验公式,分组组数参考标准表:,37,版权归属理工学院:孙静讲师,组距是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定: 组距=(最大值 - 最小值)/组数,例3中,组距=(33-12)/5=4

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号