应用统计学3复习课程

上传人:yuzo****123 文档编号:138385945 上传时间:2020-07-15 格式:PPT 页数:77 大小:1.30MB
返回 下载 相关 举报
应用统计学3复习课程_第1页
第1页 / 共77页
应用统计学3复习课程_第2页
第2页 / 共77页
应用统计学3复习课程_第3页
第3页 / 共77页
应用统计学3复习课程_第4页
第4页 / 共77页
应用统计学3复习课程_第5页
第5页 / 共77页
点击查看更多>>
资源描述

《应用统计学3复习课程》由会员分享,可在线阅读,更多相关《应用统计学3复习课程(77页珍藏版)》请在金锄头文库上搜索。

1、第三章 统计资料的整理,学习要求 明确统计资料整理的概念,了解其步骤; 能对不同的社会经济现象进行统计分组; 利用分配数列对原始数据进行系统整理; 掌握统计表的编制方法和统计图的种类。,第三章内容,第一节 统计整理的意义和步骤 第二节 统计分组 第三节 分配数列 第四节 统计表和统计图,第一节 统计整理的意义和步骤,一、统计整理的意义 统计整理的任务就是根据统计研究的目的和要求,借助综合指标,有组织、有计划的对统计调查中搜集到的资料进行加工处理,使其成为系统化、条理化的综合资料,对总体内部规律性、相互联系、结构关系做出概括的说明。,第二节 统计分组,一、统计分组的概念 统计分组是在统计总体内部

2、进行的一种特定分类,它同时具有两方面的含义:对总体而言是“分”,即将总体分为性质相异的若干部分;对个体而言是“合”,即将在某些方面性质相同的个体组合起来。,统计分组的原则,1.必须坚持组内统计资料的同质性和组间资料的差别性,这是统计分组的一个基本原则:2.必须符合完备性原则,即所谓“穷举”性。 3.必须遵守“互斥性”原则,即总体任一单位都只能归属于一组,而不能同时属于两个或两个以上的组。,第二节 统计分组,2008年末中国人口数及构成情况,第二节 统计分组,2008年末中国人口数及年龄构成情况,二、统计分组的作用,(一)区分总体现象的类型。社会和自然现象之间存在着质的差异,这些差异构成了不同类

3、型的现象。不同类型的现象具有不同的特征和变化规律,通过统计分组把现象加以区别,可以深刻研究现象总体的发展过程和特征。例如,我国把经济成分划分为公有经济(国有经济、集体经济)和非公有经济(私有经济、港澳台经济和外商经济)。再如国民经济按产业分组:农业可分为农,林,牧,渔和农林牧渔服务业各组;再如城镇居民家庭消费支出及构成,按商品类别分组,可分为食品类、衣着类、家庭设备及用品类、医疗保健类、交通通讯类、教育文化娱乐用品类、居住类和杂项商品和服务类8类。,(二)揭示事物内部结构。总体内部结构是统计定量分析的重要组成部分。它反映了不同性质的事物在总体内的分布状况和分布特征,表明各部分对总体作用的大小,

4、进而表明事物的特点及所处的发展阶段,此外通过分组可以取得总体各部分之间比例关系的资料。而这些资料对于全面认识总体是非常重要的。,例:中国2007,2008,2009年按GDP计算的三次产业结构(%) 2007年 2008年2009年 第一产业10.8 10.7 10.3 第二产业 47.3 47.4 46.3 第三产业41.9 41.8 43.4,三个产业的划分,第一产业: 农业(包括种植业、林业、牧业和渔业等)。第二产业: 工业饱括采掘业、制造业,自来水、电力、蒸汽、热水、煤气等供应业)和建筑业。第三产业: 除上述第一、二产业以外的其他各业。由于第三产业包括的行业多、范围广,根据我国的实际情

5、况,第三产业可分为两大部分:一是流通部门,二是服务部门,具体又可分为四个层次。第一层次:流通部门,包括交通运输业、邮电通讯业、商业饮食业、物资供销和仓储业。第二层次:为生产和生活服务的部门,包括金融、保险业,地质普查业,房地产业、公用事业,居民服务业、旅游业,咨询信息服务业和各类技术服务业等。第三层次;为提高科学文化水平和居民素质服务的部门,包括教育、文化、广播电视事业,科学研究事业,卫生、体育和社会福利事业等。第四层次:为社会公共需要服务的部门,包括国家机关、党政机关、社会团体,以及军队和警察等。,研究贫富差别的基本方法:将人口按收入水平等分为 5 组,观察收入差别。,20% 20% 20%

6、 20% 20%,中国九十年代:最富的20家庭拥有全部财富的48,最穷的20家庭拥有全部财富的4。,统计学第二章,(三)分析现象之间的依存关系。一切社会、自然现象都不是孤立的,而是相互联系、相互制约的。通过分组可以反映出现象之间的这种依存关系。如:企业销售额与产品广告费之间、个人收入与消费之间、工人的劳动生产率与产值之间的依存关系,例:中国农民家庭按收入分组的恩格尔系数(1984年),按收入分组(元) 200 300 400 500 600 800 1000 恩格尔系数(%) 64.9 60.2 56.7 54.4 50.5 49.9 43.6,2009年12月21日,中国社会科学院社会学所所

7、长李培林在“2010年社会蓝皮书发布暨中国社会形势报告会”上称,2009年中国城乡居民恩格尔系数将分别降低到37%和43%左右,总体上已经进入小康居民消费阶段。恩格尔系数(EngelsCoefficient)是食品支出总额占个人消费支出总额的比重,是国际上通用的衡量居民生活水平高低的一项重要指标,一般随居民家庭收入和生活水平的提高而下降。,三、统计分组的方法,关键问题:分组标志的选择和各组界限的划分,前者主要指品质标志分组,后面主要指数量标志分组。 (一)选择分组标志的原则 1. 要选择能够反映事物本质或主要特征的标志 2. 应根据研究的目的与任务选择分组标志 研究人口的年龄构成时,就应该按“

8、年龄”分组;研究各类型的工业企业在工业生产中的地位和作用时,就应该按“经济类型”分组 3. 根据现象所处的历史条件的变化选择分组标志,(二)统计分组的方法 1. 按品质标志分组 即以反映事物属性差异的标志作为分组标志,将总体分为若干性质不同的组成部分。例如,人口按性别分为男、女两组,按文化程度分为大学以上程度、高中文化程度、初中文化程度、小学文化程度,职工按民族、技术等级、籍贯等分组都是按品质标志分组。 2 按数量标志分组 即以反映事物数量差异的标志划分各组。例如,职工按月工资数额分组,商店按月销售额分组等。这种方法是通过量的变化反映质的特征。因此必须弄清量的变化积累到何种程度才发生质的飞跃。

9、而这些只有在进行分组时,经过对总体的数量特征进行深入的分析和细致的研究之后才有可能做到。,三、统计分组体系 (一)简单分组和平行分组体系 简单分组是只用一个标志对总体进行分组。只能反映现象在某一标志特征方面的差异情况,而不能反映现象在其他标志特征方面的差异。对于同一总体运用两个或两个以上标志进行简单分组后平等排列形成的体系即平行分组体系。如企业按行业分组,产品按用途分组。只能反映现象在某一标志特征方面的差异情况,而不能反映现象在其他标志特征方面的差异。对于同一总体运用两个或两个以上标志进行简单分组后平行排列形成的体系即平行分组体系。例如对大学新生按性别、文理科、年龄进行简单分组形成的平行分组体

10、系如下: 按文理科分组:文科学生;理科学生。 按年龄分组:16岁以下;1618岁;1820岁;20岁以上。 按性别分组:男生;女生。,平行分组体系,对教师的分类,按性别分类,男性,女性,按职称分类,按年龄分类,高级,中级,初级,青年,中年,共计7组 2+3+2,平行分组体系的特点:,每一个分组只能反映各总体单位在一个标志上的差异,而不能反映其它标志的差异.,(二)复合分组和复合分组体系 复合分组是对同一总体按两个或两个以上标志层叠进行的分组。进行复合分组时,要注意先按主要标志分组,再按次要标志分组。,复合分组体系,按性别分类,按职称分类,按年龄分类,男,女,高级,中级,初级,青年,中年,共计1

11、2组232,对教师的分类,复合分组的特点,第一次分组只固定一个标志的影响,第二次分组则同时反映两个标志的影响,最后一次分组时,则所有选择的标志的影响已全部确定,男 生 本科学生组 女 生 理科学生组 男 生 专科学生组 女 生 高校学生 男 生 本科学生组 女 生 文科学生组 男 生 专科学生组 女 生,统计分组体系与统计指标体系的联系,统计分组体系往往与统计指标体系相联系,形成一个统计资料信息系统,共同反映社会经济现象各个方面的联系,是统计研究的重要方法.,第三节 分配数列,一、分配数列的概念与种类 在统计分组的基础上,把总体的所有单位按组归并排列,形成总体中各个单位在各组间的分布,称为分配

12、数列,也称分布数列或次数分布。 分配数列包括两个要素:一是总体按某标志所分的组;二是各组所占有的总体单位数。 分配数列在统计研究中具有重要意义。分配数列是统计分组结果的主要表现形式,也是统计分析的一种重要方法。它可以表明总体单位在各组的分布特征、结构状况,并在这个基础上来进一步研究标志的构成、平均水平及其变动规律性。 分配数列有品质数列和变数数列两种。,(一)品质数列 品质数列又称属性分配数列、品质分配数列,就是按照品质标志进行分组所形成的分配数列。 注意分组时候,应该包括分组标志的所有表现,不能有遗漏,各种表现相互独立,不能相融.,品质数列例子:中国体育代表团在悉尼奥运会上获金牌的项目28金

13、(2000年),获金牌项目金牌数 占总数比例 跳水枚 0.1786 举重枚 0.1786 乒乓球枚 0.1429 羽毛球枚 0.1429 体操枚 0.1071 射击枚 0.1071 柔道枚 0.0714 田径枚 0.0357 跆拳道枚 0.0357,(二)变量数列 变量数列就是按照数量标志进行分组所形成的分配数列。变量数列分为单项式变量数列和组距式变量数列,也可简称为单项数列和组距数列。1、单项变量数列单项变量数列,是指在变量数列中的每一个组,只用一个变量值来表示所形成的数列。但单项变量数列的应用,受到一定的限制,一般仅适用于数列变异幅度不太大的情况;如果数列的变异范围很大,就要采用组距数列。

14、 2、组距数列 组距数列,是指在变量数列中的每一个组,并不是由一个变量值来表示,而是由表明一定变动范围或表示一定距离的两个变量值所形成的数列。,同时 具备,二、变量数列的编制,【例】己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。,编制结果如下:,变量值变动区间的长度相等,变量值变动区间的长度不完全相等,编制等距数列,适用于总体单位的标志值变动比较均匀的情况,实例,己知某班35个学生统计学期末考试成绩如下,单位(分) 4

15、4 50 56 60 62 63 65 65 69 69 69 70 74 76 77 78 78 79 80 83 84 85 85 86 87 88 89 90 91 91 92 93 94 94 要求编制组距数列。,组距数列的编制,原始数据,计算组中值,排序,确定组限,计算变异全距,确定组数、组距,汇总各组单位数,制作组距数列统计表,编制步骤或内容,编制步骤:,求变异全距,确定组距及组数,确定组距的原则:,要能区分各组的性质差异 要能反映总体资料的分布特征 为方便计算,尽可能为5或10的整数倍,R组距(d) 组数(n),编制等距数列,编制等距数列,(1)计算组数(组数不宜过多,也不宜太少),n=1+3.3logN (斯特杰斯经验公式) 式中:n为组数,N为总体单位数,(2)计算组距,d = R/n = R / (1+3.3logN) 式中:d为组距,R为全距,确定组限,编制等距数列,组中值的计算,组中值=(上限+下限)/2 开口组组中值的计算: 缺下限的组中值=该组上限-邻组组距/2 缺上限的组中值=该组下限+邻组组距/2,4、计算各组次数,5、制作组距数列,某班统计学考试成绩表,累计次数(频率),从变量值低的组开始,将各组次数(频率)逐次向变量值

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号