《统计学基础全套电子课件完整版ppt整本书电子教案最全教学教程》由会员分享,可在线阅读,更多相关《统计学基础全套电子课件完整版ppt整本书电子教案最全教学教程(428页珍藏版)》请在金锄头文库上搜索。
1、 统 计 学 基 础课程内容框架课程内容框架项目一项目一项目一项目一 认识统计认识统计认识统计认识统计 项目二项目二项目二项目二 统计调查统计调查统计调查统计调查项目三项目三项目三项目三 统计整理统计整理统计整理统计整理项目项目项目项目四四四四 统计描述分析统计描述分析统计描述分析统计描述分析项目项目项目项目五五五五 时间序列分析时间序列分析时间序列分析时间序列分析项目项目项目项目六六六六 统计指数分析统计指数分析统计指数分析统计指数分析项目项目项目项目七七七七 抽样推断分析抽样推断分析抽样推断分析抽样推断分析项目项目项目项目八八八八 相关与回归分析相关与回归分析相关与回归分析相关与回归分析n
2、 n单元一单元一 认识统计认识统计n n单元二单元二 掌握统计学中的几个基掌握统计学中的几个基本概念本概念项目一 认识统计项目一导学项目一导学一、统计的产生和发展 1、政治算术学派:产生于、政治算术学派:产生于17世纪,代表人物是英国的世纪,代表人物是英国的经济学家经济学家威廉威廉.配第配第,代表作是,代表作是政治算术政治算术。 2、国势学派:产生于、国势学派:产生于18世纪德国,代表人物是世纪德国,代表人物是阿亨瓦阿亨瓦尔尔,代表作是,代表作是近代欧洲各国国势学概论近代欧洲各国国势学概论。 3 3、数理统计学派:产生于、数理统计学派:产生于1919世纪比利时,代表人物世纪比利时,代表人物是是
3、阿道夫,凯特勒阿道夫,凯特勒,代表作是,代表作是社会物理学社会物理学,运用大数,运用大数定律,证明社会现象的发展并非偶然,而是具有内在的规定律,证明社会现象的发展并非偶然,而是具有内在的规律性。律性。 统计是人类在进行经济活动和政治活动中产生的,并随着社会经济的发展和国家管理的需要而发展起来的。 统计工作,它是对事物数量特征的统计工作,它是对事物数量特征的有关资料进行搜集、整理和分析的活动有关资料进行搜集、整理和分析的活动过程。过程。 二、统计的三种含义 例如:要了解我国人口情况,统计部门例如:要了解我国人口情况,统计部门首先就要编制调查表,设计调查项目,然后首先就要编制调查表,设计调查项目,
4、然后派调查人员逐户调查,再对调查结果进行汇派调查人员逐户调查,再对调查结果进行汇总、分析,最后得出我国人口的各种总量指总、分析,最后得出我国人口的各种总量指标、构成指标及反映人口发展变化情况的指标、构成指标及反映人口发展变化情况的指标等等,这一系列的活动就是统计工作。标等等,这一系列的活动就是统计工作。 它是统计实践活动过程中所取得的各它是统计实践活动过程中所取得的各项数字资料以及与之相关的其它实际资项数字资料以及与之相关的其它实际资料的总称,是统计工作的对象和成果料的总称,是统计工作的对象和成果 。 统计学是关于如何搜集、整理、和统计学是关于如何搜集、整理、和分析统计数据的一门方法论的科学。
5、分析统计数据的一门方法论的科学。三三 种种 涵涵 义义 的的 关关 系系统计工作统计学统计资料统计实践活动与统计成果的关系统计实践活动与统计理论的关系指导三、统计的研究对象和特点1、统计研究的对象:、统计研究的对象: 大量社会经济现象总体的方面(数量特征和数量关系)。大量社会经济现象总体的方面(数量特征和数量关系)。 (1)从质和量的辩证统一中研究大量社会经济现象总体的数量方面。 (2)研究大量社会经济现象的综合数量。即是说,总体性总体性大量现象的整体数据大量现象的整体数据客观性客观性在特定的社会条件下的客观现象、客观资料在特定的社会条件下的客观现象、客观资料数量性数量性从数量上认识事物,研究
6、数量特征和数量关系从数量上认识事物,研究数量特征和数量关系2、统计研究对象的特点、统计研究对象的特点具体性具体性在一定时空条件下具体的数量而非抽象在一定时空条件下具体的数量而非抽象社会性社会性是是人人类类社社会会活活动动的的产产物物。一方面统计研究的是社社会会经经济济现现象象,是人类类社社会活动的条件、过程和结果会活动的条件、过程和结果,是人类有意识的社会活动,及其产物。 另一方面,统计是一种社社会会认认知知活活动动,要受到一定的社会、经济观点的影响,并为一定的社会集团利益服务,谁进行统计,统计就为谁服务。四、统计的功能四、统计的功能信息采集、处理、传递、存贮和提供大量的以数量描述为基本特征的
7、信息(运用统计调查方法、结合统计指标)咨询对获取的“信息资料”运用科学的分析方法进行分析研究,为决策和管理提供各种可供选择的咨询建议和对策方案。监督根据统计调查和分析,及时、准确地从总体上反映社会经济现象的运行情况,对其实行全面、系统的定量检查、监测和预警五、统计的工作过程 一个完整的统计工作过程一般可分为统计设计、统计设计、统计统计调查调查、统计、统计整理整理、统统计分析计分析四个主要阶段。统计整理统计调查统计研究目的统计设计统计分析统计报告大大量量观观察察法法统统计计分分组组法法统统计计描描述述法法统统计计模模型型法法归归纳纳推推断断法法 大量观察法就是对所要研究的事物的全部或足大量观察法
8、就是对所要研究的事物的全部或足 够多数的单位进行观察并加以综合研究。够多数的单位进行观察并加以综合研究。统计分组法就是根据所研究事物的特点和统计研究的任务,统计分组法就是根据所研究事物的特点和统计研究的任务,将总体单位按照某种标志划分为若干不同性质或类型的组将总体单位按照某种标志划分为若干不同性质或类型的组的研究方法。的研究方法。例如:人口按年龄分组、企业按经济类型分类、国民例如:人口按年龄分组、企业按经济类型分类、国民经济按部门分类等。经济按部门分类等。统计描述法就是运用各种统计综合指标来反映和研统计描述法就是运用各种统计综合指标来反映和研究社会经济现象总体的一般数量特征和数量关系的究社会经
9、济现象总体的一般数量特征和数量关系的研究方法。研究方法。在统计分析中广泛运用着各种综合指标来反映总体在统计分析中广泛运用着各种综合指标来反映总体内部的各种数量关系。如结构分析法、对比分析法、内部的各种数量关系。如结构分析法、对比分析法、动态分析、因素分析、回归与相关分析等。动态分析、因素分析、回归与相关分析等。统计模型法指根据一定的经济理论和假定条件,用数统计模型法指根据一定的经济理论和假定条件,用数学方程去模拟现实经济现象相互关系的一种研究方法。学方程去模拟现实经济现象相互关系的一种研究方法。统计模型包括三个基本要素:统计模型包括三个基本要素: 社会经济变量、基本关系式、模型参数社会经济变量
10、、基本关系式、模型参数归纳是一种从个别到一般,从事实到概括的一种推理方法,归纳是一种从个别到一般,从事实到概括的一种推理方法,推断是通过对样本数据的观察,推断出总体的数量特征的推断是通过对样本数据的观察,推断出总体的数量特征的研究方法。研究方法。从某种意义上说,统计工作搜集的资料都是样本资料,样从某种意义上说,统计工作搜集的资料都是样本资料,样本资料分散、零碎,必须经过整理归纳才能据此推断总体本资料分散、零碎,必须经过整理归纳才能据此推断总体的数量特征。所以归纳推断法在统计分析中得到广泛应用的数量特征。所以归纳推断法在统计分析中得到广泛应用。六 、统计研究的基本方法七、统计学的分类七、统计学的
11、分类1、按研究对象的不同划分、按研究对象的不同划分 理论统计学理论统计学(抽象的数量为研究对象)(抽象的数量为研究对象)应用统计学应用统计学(具体的数量为研究对象)具体的数量为研究对象)2、按研究方法的不同划分、按研究方法的不同划分 描述统计学描述统计学(计算获取总体的各指标(计算获取总体的各指标并显示)并显示) 推断统计学推断统计学(样本数据推断总体数量(样本数据推断总体数量特征)特征)单元二 统计学中的基本概念总体总体个体个体一、总体与总体单位一、总体与总体单位总体(population)即统计总体,是所要研究事物的全体。由许多个别事物构成的至少在某一方面具有相同性质的一个整体。1.总体(
12、全及总体)思考总体的特点思考总体的特点?无限总体:含无限多个总体单位无限总体:含无限多个总体单位按构成总体的单位数分按构成总体的单位数分 总体分为总体分为有限总体:含有限个总体单位有限总体:含有限个总体单位差异性差异性同质性同质性大量性大量性总体的特点总体的特点差异性是统计研究的前提2.总体单位(个体)总体单位 是构成总体的每个单位。是各项统计数字的原始承担者。 注意:注意: (1)统计总体的范围可大可小,总体单位可以是人、物,也可以是事件。 (2)统计总体与总体单位这两个概念具有相对性,不是固定不变的,而是随着研究目的的改变而改变。二、标志和指标例如: 表现一个人的特征的标志: 性别、职业、
13、政治面貌、 年龄、身高、体重、 收入水平等。 概念:说明概念:说明总体单位所具有总体单位所具有的特征的的特征的名称名称。1. 标志标志 (2)标志的种类 标志按本身标志按本身的性质分的性质分品质标志品质标志说明总体单位质(属性)的特征的标志。用文字表示具体表现值数量标志数量标志说明总体单位量(数量)的特征的标志用数值表示下列标志属于何种标志:订单号 供应商 合同号 运价 出厂价 车牌号 货运量 库存量姓名 专业 学号 账号 3)标志表现:)标志表现:即标志在各总体单位上的具体表现。标志表现文文字字表表述述数数值值 表表述述数数量量标标志志品品质质标标志志标志性别年龄民族宗教信仰政治倾向身高体重
14、男男汉族汉族佛教佛教无党派无党派43岁岁182cm75公斤公斤张三标志表现分为品质标志表现(文字来表现)和数量标志品质标志表现(文字来表现)和数量标志表现(数值来表现)表现(数值来表现)。品品质质标标志志表表现现数数量量标标志志表表现现2.指标指标(1)指标概念:名称、计算方法、计量单位。 (2)数值部分:时间限制、空间限制、具体数值。概念:说明概念:说明总体某一数量特征总体某一数量特征的名称和数值。特点:综合性数量性具体性时间限制空间限制指标名称指标数值计量单位计算方法要素:14.002019年末中国大陆 总人口亿人 (2)指标的分类 1)按照总体数量特征不同指标分数量指标(总量数量指标(总
15、量指标)指标)反映总体总规模、总水平的绝对数量多少的指标。又称总量指标或绝对指标。(如总人口、总额度)质量指标(相质量指标(相对、平均指标)对、平均指标)反映总体相对水平或平均水平的指标,又称为相对数指标或平均数指标,一般表现为相对数或平均数(如比例、百分数、平均值、成数) 。下列指标属于何种指标?2015年上半年全国公路完成货运量162.9亿吨2009-2014 年,全国社会物流总额年均复增长率达 17.2%2014 年我国工业品物流总额占社会物流总额的比重为 92.2%;2)按照核算的范围不同指标分总体指标(总体总体指标(总体参数、参数)参数、参数)是要研究现象总体的特征值。通常参数有总体
16、均值、标准差、总体比例样本指标样本指标(样(样本统计量、统本统计量、统计量)计量)根据样本数据计算的量。通常有样本均值、样本标准差、样本比例。3)按其指标值的表现形式分(1 1)绝对数指标)绝对数指标 表现形式为绝对数的指标。如人口总数,社会总产值;工资总额。(2 2)相对数指标)相对数指标 表明两个有联系的统计指标之比,表现形式为相对数的指标。人中密度;出生率;设备利用率(3 3)平均数指标)平均数指标 是同质总体内标志总量与单位总量相除的结果,表明总体各单位标志值一般水平,表现形式为平均数。如班平均成绩,平均工资,平均年收入。指标与标志的区别和联系指标与标志的区别和联系1、区别:(1)标志
17、说明总体单位;标志说明总体单位;指标是说明总体;指标具有综合性,标志不具有。(2)标志有品质标志和数量标志之分;而指标都是用数值来说明的;指标具有可量性,标志不一定具有。2、联系:指标数值是通过总体单位的数量标志汇总得来的。 (1)转换关系 (2)汇总关系数量指标质量指标品质标志数量标志*标志和指标实例调查研究我国工业企业的经营管理状况。 总体总体:全国的所有工业企业 指标指标:所有制构成;轻重工业结构;年末职工总数;职工平均工资;工业总产值、工业增加值;各种工业产品产量。 总体单位:总体单位:每一个工业企业 标志:标志:所有制类型;行业类别;年末职工人数;职工平均工资;总产值;增加值;成本总
18、额;利润总额三、变异和变量概念:概念: 是标志的具体表现具体表现在各总体单位间的差异差异。变异有品质变异和数量变异之分。1. 变异变异标志按变异情况可分为:标志按变异情况可分为: (1)可变标志可变标志(决定总体的差异性)(决定总体的差异性)各单位具体表现不同各单位具体表现不同各单位具体表现不同各单位具体表现不同 (2)不变标志不变标志(决定总体的同志性)(决定总体的同志性)各单位具体表现相同各单位具体表现相同各单位具体表现相同各单位具体表现相同三、变异和变量概念:概念:概念:概念:可变的数量标志是变量可变的数量标志是变量。其具体取值叫变量值。2. 变量变量按变量值是否连续按变量值是否连续分为
19、 (1)离散变量)离散变量:就是变量值可以按一定顺序一一列举(通常取整数)的变量;如高校个数,电脑台数,女生人数。 (2)连连续续变变量量:就是变量值在一个区间内可以有无限多个的变量。如身高、体重。四、我国统计的组织形式1、我国统计组织形式的发展变化 *统计实践历史悠久。 *清朝后期引入西方数理统计学。 *新中国成立后,引入前苏联的社会经济统计学。 *改革开放以后,多元化发展:社会统计学、社会经济统计学、数理统计学、国民经济核算体系等等。 2、统计学的分科(1)社会经济统计学的基本分科: 统计学原理,人口统计学,农业统计学,工业统计学,商业统计学,交通统计学,劳动统计学,基本建设统计学,财政金
20、融统计学,文化卫生统计学,国民经济综合平衡统计学,统计史等。(2)统计学原理与各专业统计学的关系: 统计学原理研究的是指导一切统计工作的最基本的原理,是各专业统计工作经验的最一般概括。 各专业统计学研究的是各专业指标体系的性质,以及取得指标资料和分析运用这些资料的原则和方法,是统计学原理在各专业领域的具体应用。五、我国统计工作的组织类型 我国的社会主义统计工作基本上属于集中型的。(集中型统计体制是指中央一级的统计工作,基本上集中在国家的统计机构进行,其他各主管部门一般不负责统计工作,国家的统计机构对全国的统计工作实行集中统一领导。) 我国统计工作实行统一领导、分级负责统一领导、分级负责。项目小
21、结项目小结1、统计的含义。统计作为一种社会实践活动,一般可以从3个方面来理解,即统计资料、统计工作、统计学。2、统计的工作过程。一般包括统计设计、统计调查、统计整理和统计分析四个环节。3、统计研究的基本方法。统计研究的一些基本方法有大量观察法、统计分组法、综合指标法、统计模型法、归纳推断法。4、总体与总体单位。总体,又叫统计总体,是所要研究事物的全体,是由许多个个别事物构成的至少在某一方面具有相同性质的一个整体,是统计研究的对象;总体的每个单位称为总体单位。5、总体必须同时具备三方面的特点,即同质性、大量性和差异性。6、标志与指标。标志是说明总体单位特征的名称。标志按其特征的性质不同,可以分为
22、品质标志和数量标志,标志表现分为品质标志表现和数量标志表现。指标是说明统计总体数量特征的名称和数量表现,指标按照其说明总体数量特征的不同,分为数量指标和质量指标。7、变异与变量。项目二 统计调查n n单元一单元一 统计调查概述统计调查概述n n单元二单元二 统计调查的组织形式统计调查的组织形式n n单元三单元三 统计调查资料的收集方法统计调查资料的收集方法n n单元四单元四 统计调查方案设计统计调查方案设计项目二导学项目二导学单元一 统计调查的组织形式一、统计调查的概念统计调查就是按照预定的要求和科学的方法,有有组织、有计划、有步骤组织、有计划、有步骤的取得统计资料的工作过程. 统计调查是统计
23、工作的基础;是统计整理与分析的前提。 二、统计调查的基本要求 准确性准确性 及时性及时性 全面性全面性 系统性系统性三、统计调查的种类 1.按按被被研究研究总体总体的的范范围围分分 全面调查全面调查非全面调查非全面调查 2.按按调查登记的调查登记的时间时间是否是否连续连续分分 连续调查连续调查 (经常性调查)(经常性调查)非连续调查(一次性调查)非连续调查(一次性调查)(是对调查对象中的所有调查单位都无一不漏的进行调查的一种调查方式)(经常性调查(经常性调查连续不地断随研究对象的变化进行登记)(销售额、配送量、进货量、入库量、工业企业总产值、产品产量、原材料消耗量)和跟和跟踪调查踪调查以及二手
24、资料收以及二手资料收集方法:文献、集方法:文献、报刊、网络法等报刊、网络法等3、按、按搜集资料的方法搜集资料的方法划分划分直接观察法直接观察法 访问法访问法 报告法报告法(逐级报送资料)(逐级报送资料) 问卷法问卷法 卫星遥感法卫星遥感法网络调查法网络调查法4、按、按调查的组织形式调查的组织形式分分统计报表统计报表(按国家规定表式,自上而下提供资料)专门调查专门调查普查普查 抽样调查抽样调查 重点调查重点调查典型调查典型调查组织方式 全面调查全面调查是对调查对象中的所有调查单位都无一不漏的进行调查的一种调查方式。如人口普查、工业普查、农业普查、第三产业普查、基本单位普查及全面的统计报表等。 非
25、全面调查非全面调查是对根据调查对象的特点和调查任务的需要,对调查对象中的一部分单位进行调查的一种调查方式。如重点调查、典型调查、抽样调查等。 连续调查连续调查是指对调查对象连续不断地进行登记而取得资料的一种方式。 它适合于对时期现象的调查,当调查对象的数值变化很大,必须连续进行登记,才能满足需要。如工业企业总产值、产品产量、原材料消耗量等,在观察期内连续登记。连续调查所得资料是现象在一段时间内的总量。 一次性调查一次性调查是指对调查对象某一时点的情况进行登记而取得资料的一种方式。 它适合于对时点现象的调查。一次性调查可以是定期的,也可以是不定期的。如人口普查、第三产业普查、工业普查、农业普查每
26、10年进行一次,分别在逢0、3、5、7的年份实施。建立基本统计单位普查,每5年进行一次,逢一、六的年份实施。都属于定期一次性调查。 直接观察法直接观察法:指由调查人员直接到现场对被调查对象直接观察计量,指由调查人员直接到现场对被调查对象直接观察计量,以取得资料的一种调查方法。以取得资料的一种调查方法。 访问法访问法:指访问者应用口头交谈的方式,向被调查者提出问题,由指访问者应用口头交谈的方式,向被调查者提出问题,由被调查者回答,以搜集信息的一种调查方法被调查者回答,以搜集信息的一种调查方法 报告法报告法:指由报告单位利用原始记录和核算资料作基础,依据统计指由报告单位利用原始记录和核算资料作基础
27、,依据统计报表格式的要求逐级向有关部门提供资料的一种调查方法。报表格式的要求逐级向有关部门提供资料的一种调查方法。 问卷法问卷法:是根据统计调查研究目的,将调查项目编制成调查问卷,是根据统计调查研究目的,将调查项目编制成调查问卷,由被调查者按照要求回答,以取得统计资料的一种方法。由被调查者按照要求回答,以取得统计资料的一种方法。 网络调查法网络调查法:借助网络工具开展的调查借助网络工具开展的调查 卫星遥感法卫星遥感法:用卫星高度分辨辐射计提供地面资料的方法,全球卫:用卫星高度分辨辐射计提供地面资料的方法,全球卫星定位系统(星定位系统(GPS)2024/9/2449常用的统计调查方法搜集资料方法
28、单元二 统计调查概述 1.普查普查 2.抽样调查抽样调查 3.重点调查重点调查 4.典型调查典型调查 5.统计报表统计报表现行的中华人民共和国统计法中明确规定:“统计调查应当以周期性的普查为基础,以经常性的抽样调查为主体,以必要的统计报表、重点调查、综合分析等为补充,搜集、整理基本统计资料。”单元二单元二 统计调查的组织形式统计调查的组织形式 普查是为某一特定目的而专门组织的一次性全面调查。普查是为某一特定目的而专门组织的一次性全面调查。普查一般是范围较广、规模较大的全面调查。如普查一般是范围较广、规模较大的全面调查。如“人口、人口、工业、农业、经济普查工业、农业、经济普查”。2024/9/2
29、4521.1. 普查普查(人口普查(人口普查10年一次,逢尾数为年一次,逢尾数为“0”的年份;经济普查每的年份;经济普查每5年年进行一次,第一次是进行一次,第一次是2004年,后逢尾数为年,后逢尾数为“3、8”的年份;农业的年份;农业普查每普查每10年进行一次,逢尾数为年进行一次,逢尾数为“6”的年份进行。的年份进行。2006年年12月月31日日 一年度)一年度)1.1.普查特点:普查特点: (1 1)需要大量的人、财、物力。(不宜经常进行)需要大量的人、财、物力。(不宜经常进行) (2 2)需要规定统一的标准调查时点。(如)需要规定统一的标准调查时点。(如“第六次全国第六次全国人口普查人口普
30、查2010.11.12010.11.1零点零点”) (3 3)获得的资料更准确、更全面、更系统。)获得的资料更准确、更全面、更系统。 (4 4)调查项目一般较简单)调查项目一般较简单2.2.普查的方法:普查的方法: 1)逐级普查)逐级普查 2)快速普查)快速普查 例如例如1982 年全国共产党员人数普查、联网直报。年全国共产党员人数普查、联网直报。1.1. 普查普查3.3.普查的程序:普查的程序: 1)准备工作:)准备工作: 普查方案;设置机构、挑选培训人员;试点普查;方案修改;宣传动员;文件印制。2)调查登记:)调查登记:普查登记;复核;随机抽检;汇总、编码;入库。3)汇总整理分析、公布结果
31、)汇总整理分析、公布结果如第三次全国经济普查:2012年,筹备阶段,2013年,准备阶段,做好登记前的各项准备工作。2014年,登记、数据审核处理和普查结果发布阶段。2015年,资料出版(广泛应用广泛应用) 是从研究对象总体中是从研究对象总体中按照一定的方法随机抽取按照一定的方法随机抽取一部分单位一部分单位进行调查并根据部分进行调查并根据部分推断总体数量特征推断总体数量特征的一种调查方法。的一种调查方法。 2024/9/24542.2. 抽样调查抽样调查总体总体随机样本随机样本 推断推断1.抽样调查特点抽样调查特点: 1)按随机原则从总体中抽取样本;)按随机原则从总体中抽取样本; 2)是一种非
32、全面调查;)是一种非全面调查; 3)由部分推断总体虽有一定误差,但可以事先加以控制;)由部分推断总体虽有一定误差,但可以事先加以控制; 4)较全面调查节省人、财、物力;)较全面调查节省人、财、物力; 5)能得到比较准确的统计资料。)能得到比较准确的统计资料。2024/9/24552.2. 抽样调查抽样调查 是在调查对象(总体)中从选择是在调查对象(总体)中从选择少数重点单位少数重点单位进行调查,进行调查,以以了解了解总体基本情况的非全面调查。总体基本情况的非全面调查。 2024/9/24563.3. 重点调查重点调查特点:特点: 1 1)重点单位的确定重点单位的确定:是在总体中数目不多但具有重
33、量级:是在总体中数目不多但具有重量级的位置;其标志值占的比重大;总体中要存在重点单位。的位置;其标志值占的比重大;总体中要存在重点单位。(如:了解全国钢铁产量情况,选(如:了解全国钢铁产量情况,选鞍钢鞍钢 上钢上钢 宝钢宝钢 武钢武钢 攀钢攀钢为重点单位)为重点单位) 2 2)调查单位少,可以了解详细的情况;)调查单位少,可以了解详细的情况; 3 3)节省人、财、物力;)节省人、财、物力; 4 4)能了解总体但不能推算总体情况;)能了解总体但不能推算总体情况; 是在对调查对象有一定了解的基础上,是在对调查对象有一定了解的基础上,有意识有意识地选择若地选择若干干典型或有代表性典型或有代表性的单位
34、进行的单位进行全面深入全面深入的调查。的调查。 其目的不在其目的不在于取得总体数值。于取得总体数值。 而是:而是:2024/9/24574.4. 典型调查典型调查特点:特点:1)调查单位少,能深入详细剖析调查单位;)调查单位少,能深入详细剖析调查单位;2)可以节省人、财、物力)可以节省人、财、物力3)具有主观性;)具有主观性; 1 1)抓典型、研究新生事物,及时发现新问题、新情况;)抓典型、研究新生事物,及时发现新问题、新情况; 2 2)深入分析典型单位,弄清其一般规律,总结经验教训;)深入分析典型单位,弄清其一般规律,总结经验教训; 3 3)分析事物的类型,差别和关系;)分析事物的类型,差别
35、和关系; 4 4)补充和验证全面调查的数字,推论和测算有关现象的总体;)补充和验证全面调查的数字,推论和测算有关现象的总体;解剖麻雀;划类选典;抓两头。解剖麻雀;划类选典;抓两头。 2024/9/24584.4. 典型调查典型调查1.1.典型单位的选取典型单位的选取 1)近似估算总体)近似估算总体划类选典划类选典; 2)了解总体一般数量表现)了解总体一般数量表现中等典型单位中等典型单位; 3)总结经验教训)总结经验教训先进、后进典型(抓典型);先进、后进典型(抓典型); 是依据国家统计法律法规,按是依据国家统计法律法规,按统一规定的表式,统一的指统一规定的表式,统一的指标项目,统一的报送时间,
36、自下而上逐级定期提供标项目,统一的报送时间,自下而上逐级定期提供基本统计资料基本统计资料的调查方法。的调查方法。2024/9/24595.5. 统计报表统计报表1.1.统计报表的特点:统计报表的特点:(1)可以事先布置到基层填报单位;)可以事先布置到基层填报单位;(2)报表资料来源于基层单位的原始记录;基层单位的各种原始记录使统)报表资料来源于基层单位的原始记录;基层单位的各种原始记录使统计报表的资料来源有可靠的基础,以保证统计资料的准确、及时、完整;计报表的资料来源有可靠的基础,以保证统计资料的准确、及时、完整;(3)由于它采用逐级上报、汇总的形式,各级领导部门都能得到管辖范围)由于它采用逐
37、级上报、汇总的形式,各级领导部门都能得到管辖范围内的统计资料;内的统计资料;(4)它是经常性调查,内容又相对稳定,有利于积累资料和进行对比分析,)它是经常性调查,内容又相对稳定,有利于积累资料和进行对比分析,(5)有一定局限性:成本高,需要花费较高的人、财、物力;受人为干扰)有一定局限性:成本高,需要花费较高的人、财、物力;受人为干扰严重。严重。(6)合法报表必须经过法定的审批程序制定,含有(表号、制表机关、审)合法报表必须经过法定的审批程序制定,含有(表号、制表机关、审批或备案文号、有效期限)批或备案文号、有效期限)2024/9/24605.5. 统计报表统计报表2.2.统计报表的分类:统计
38、报表的分类: (1)按调查范围不同,分为)按调查范围不同,分为全面统计报表和非全面统计报表全面统计报表和非全面统计报表。全面统计报表要求调查对象中的全部单位都填报,非全面统计全面统计报表要求调查对象中的全部单位都填报,非全面统计报表只要求调查对象中的一部分单位填报。目前的大多数统计报表只要求调查对象中的一部分单位填报。目前的大多数统计报表是全面报表。报表是全面报表。(2)按报送周期不同,分为)按报送周期不同,分为日报、旬报、月报、季报、半年报日报、旬报、月报、季报、半年报和年报统计报表和年报统计报表,其中以月报和年报统计报表为主。,其中以月报和年报统计报表为主。 (3)按报送范围不同,分为)按
39、报送范围不同,分为国家报表、部门报表、地方报表国家报表、部门报表、地方报表。(4)按填报单位不同,分为)按填报单位不同,分为基层报表和综合报表。基层报表和综合报表。(5)按制发统计机构不同,)按制发统计机构不同,分为基本统计报表和专业统计报表。分为基本统计报表和专业统计报表。基本统计报表是由国家统计系统机构制发的,专业统计报表是基本统计报表是由国家统计系统机构制发的,专业统计报表是由各业务部门制发的。由各业务部门制发的。 几种调查方式的结合运用几种调查方式的结合运用实际统计工作中,视具体情况,几种调查方式可以结合运实际统计工作中,视具体情况,几种调查方式可以结合运用。用。就物流统计而言:以周期
40、性的普查为基础,抽样调查为就物流统计而言:以周期性的普查为基础,抽样调查为主体,辅之以全面调查、重点调查等其他方式取得统计主体,辅之以全面调查、重点调查等其他方式取得统计资料。故此:资料。故此:第一,建立周期性的物流统计普查制度,掌握重要的反映国情、国力的最主要的物流统计基本指标;第二,大力普及、广泛采用抽样调查技术,依据部分单位资料,推断总体的有关数据;第三,适当采用全面统计报表掌握物流领域全面情况,继续发挥重点调查和其他科学推算方法的作用。单元三 统计调查资料的收集方法一手资料一手资料2024/9/2463一手资料(原始资料)一手资料(原始资料)是统计调查人员通过现场实地调查,直接向调查对
41、象收集的信息资料。是原创的实物资料。常用的收集一手资料的方法有直接观察法、访问法、报告法、直接观察法、访问法、报告法、问卷调查法、网络调查法问卷调查法、网络调查法、卫星遥感法、卫星遥感法等。 直接观察法直接观察法:指由调查人员直接到现场对被调查对象直接观察计量,指由调查人员直接到现场对被调查对象直接观察计量,以取得资料的一种调查方法。以取得资料的一种调查方法。 访问法访问法:指访问者应用口头交谈的方式,向被调查者提出问题,由指访问者应用口头交谈的方式,向被调查者提出问题,由被调查者回答,以搜集信息的一种调查方法被调查者回答,以搜集信息的一种调查方法 报告法报告法:指由报告单位利用原始记录和核算
42、资料作基础,依据统计指由报告单位利用原始记录和核算资料作基础,依据统计报表格式的要求逐级向有关部门提供资料的一种调查方法。报表格式的要求逐级向有关部门提供资料的一种调查方法。 问卷法问卷法:是根据统计调查研究目的,将调查项目编制成调查问卷,是根据统计调查研究目的,将调查项目编制成调查问卷,由被调查者按照要求回答,以取得统计资料的一种方法。由被调查者按照要求回答,以取得统计资料的一种方法。 网络调查法网络调查法:借助网络工具开展的调查借助网络工具开展的调查 卫星遥感法卫星遥感法:用卫星高度分辨辐射计提供地面资料的方法,全球卫:用卫星高度分辨辐射计提供地面资料的方法,全球卫星定位系统(星定位系统(
43、GPS)2024/9/2464一手资料搜集方法二手资料二手资料2024/9/2465二手资料二手资料 二手数据,是指已经收集、记录、整理好的各种二手数据,是指已经收集、记录、整理好的各种现成的数据和信息资料。与一手资料相比,二手数据现成的数据和信息资料。与一手资料相比,二手数据收集起来更快、更容易,所需的费用和时间也相对节收集起来更快、更容易,所需的费用和时间也相对节约得多。约得多。 常用的收集二手资料的方法是文案调查法。 二手资料二手资料2024/9/2466 一手资料的加工整理一手资料的加工整理查阅广泛的文献资料查阅广泛的文献资料二手资料的来源二手资料的来源 可查阅使用的文献资料如:各种出
44、版物资料出版物资料、政府和统计部门公布的有关资料;各种经济信息中心、专业信息咨询机构、行业协会公布和保存的信息和情报;国内外有关书籍、报刊和电台、电视台所提供的信息资料;各种国际组织、外国使领馆、商会所提供的国际市场信息;各种类型的图书馆和资料室;有关生产和经营机构提供的商品目录、广告说明书、专利资料及商品价目表等;专业性、学术性经验交流会议上所发放的文件和材料。可查阅使用的文献资料如:可查阅使用的文献资料如:内部资料内部资料:如资料负债表、现金流量表、各种统计台账、统计报表等。如资料负债表、现金流量表、各种统计台账、统计报表等。外部资料外部资料:外部资料是存在于企业外部各种各样信息源。外部资
45、料是存在于企业外部各种各样信息源。 1.中国统计年鉴中国统计年鉴 2.专业统计网站专业统计网站 3.搜索引擎搜索引擎2024/9/2467二手资料搜集方法单元四 统计调查方案设计调查方案的设计调查方案的设计 调查方案是指整个调查过程的纲领性的文件,是对调查过程的总体安排和计划其内容包括有:调查目的、任务调查目的、任务 调查对象和调查对象和调查单位调查单位调查项目调查项目和调查表和调查表 调查的方调查的方式和方法式和方法调查时间和期限调查时间和期限 调查的其他组织工作调查的其他组织工作 统计调查方案的统计调查方案的内内 容容调查目的是调查所要达到的具体目标调查目的是调查所要达到的具体目标 它回答
46、的是:为什么调查?要解决什么样的问题?调它回答的是:为什么调查?要解决什么样的问题?调查具有什么样的社会经济意义?查具有什么样的社会经济意义?调查目的的写作应简明扼要。调查目的的写作应简明扼要。 例如:我国人口普查的目的是例如:我国人口普查的目的是“为准确地查清我国在人为准确地查清我国在人口数量、地区分布、构成和素质方面的变化,为科学地制定口数量、地区分布、构成和素质方面的变化,为科学地制定国民经济和社会发展战略与规划,统一安排人民的物质和文国民经济和社会发展战略与规划,统一安排人民的物质和文化生活,检查人口政策执行情况,提供可靠的资料化生活,检查人口政策执行情况,提供可靠的资料”。(一)调查
47、目的(一)调查目的调查对象是根据调查目的确定的调查研究的总调查对象是根据调查目的确定的调查研究的总体或调查范围。体或调查范围。调查单位是构成调查对象的每一个单位,是搜调查单位是构成调查对象的每一个单位,是搜集数据资料的基本单位。集数据资料的基本单位。(二)调查对象和调查单位(二)调查对象和调查单位调查对象和调查单位所解决的问题是:调查对象和调查单位所解决的问题是:注意:注意:调查单位调查单位与与填报单位填报单位的区别。的区别。向谁调查?向谁调查?由谁来提供所需资料?由谁来提供所需资料? 调查单位是调查资料的直接承担者,报告单位是调查资料的提交者,二者有时一致,有时不一致。如上述人口普查中,每一
48、个常住的人即是调查单位,而是报告单位则是某一人口普查组织。调查项目调查项目是向调查单位调查的具体内容(标志)是向调查单位调查的具体内容(标志)(三)调查项目和调查表(三)调查项目和调查表 调查表是用于登记调查数据的一种表格,一般由表头、表体和表外附加三部分组成。2024/9/2474调查项目调查项目通常以表格的形式来体现,称为通常以表格的形式来体现,称为调查表调查表, 以问卷的形式来体现,称为以问卷的形式来体现,称为调查问卷调查问卷调查表可以是调查问卷、调查方案的组成部分,是调查表可以是调查问卷、调查方案的组成部分,是登记调查单位资料登记调查单位资料(数量标志与品质标志)的统一的统一表格!表格
49、!(一般要有填表说明)75调查表调查表有单一表有单一表(一表一单位)(一表一单位)和一览表,一般由和一览表,一般由表头、表体和表头、表体和填表说明填表说明(如何填写的解释说明)三部分组成。(如何填写的解释说明)三部分组成。调查项目调查项目 项目代码项目代码 计量单位计量单位 实际数值实际数值 在岗职工在岗职工 1 人人 叉车叉车 2 台台 库房面积库房面积 3 m2 表表体体*物流企业基本情况报表物流企业基本情况报表 (表头)表头)表号:表号:制表机关:制表机关:批准或备案文号:批准或备案文号:有效期限:有效期限:说明:说明:(表外附加表外附加)一览表:一张表上登记若干个调查单位的相关项目一览
50、表:一张表上登记若干个调查单位的相关项目单位名称主管部门运输车辆(辆)载重量中 转 地(个)设备总数(台)企业1企业二企业三企业四企业五 为确保调查资料的准确性,统计调查必须规定这两种时间: 是调查资料所属的时间。即规定所调查的是哪个时期或时点的资料。 是进行调查工作的期限。即从调查工作开始到结束的时间度。调查时间调查时间:调查时限调查时限:(四)调查时间和调查时限(四)调查时间和调查时限2024/9/2477即调查的组织形式(方式)和搜集资料的具体方法。即调查的组织形式(方式)和搜集资料的具体方法。(五)调查的方式和方法(五)调查的方式和方法直接观察法直接观察法 访问法访问法 报告法报告法(
51、逐级报送资料)(逐级报送资料) 问卷法问卷法 网络调查法网络调查法卫星遥感法卫星遥感法二手资料收集方法二手资料收集方法(文案调查法)(文案调查法) 1.普查普查 2.抽样调查抽样调查 3.重点调查重点调查 4.典型调查典型调查 5.统计报表统计报表78 这项内容包括比较多,如:这项内容包括比较多,如:(六)调查工作的组织实施计划(六)调查工作的组织实施计划调查工作组人员的分工、调查机构的确定;调查工作组人员的分工、调查机构的确定;调查人员的选择、培训;调查人员的选择、培训;调查的宣传;调查的宣传;调查表或问卷及调查工具的准备(资料印调查表或问卷及调查工具的准备(资料印刷)以及其它一些调查工作的
52、准备等刷)以及其它一些调查工作的准备等调查经费的预算和支出办法等;调查经费的预算和支出办法等;单元五 调查问卷设计调查问卷设计调查问卷设计问卷结构:问卷结构:说明词+主题词句+作业记录问卷问卷设计设计 基本要求:基本要求:主题明确,形式简明,文字通俗,容易理解,便于回答。词句编排,层次分明,先易后难。 问卷形式:问卷形式:自由回答式词句两项选择式词句多项选择式词句赋值评价式词句问卷中问题的形式及答案的设计1、开放式问题。、开放式问题。就是允许被调查者用自己的话来回答问题。由于采取这种方式提问会得到各种不同的答案,收集到更多的信息但不利于资料统计分析。2、封闭式问题。、封闭式问题。就是在每个问题
53、后面给出若干个选择答案,被调查者在这些被选答案中选择自己的答案。包括(填空题、两项选择、包括(填空题、两项选择、单选、多选、顺序式(排序)、矩阵式(将问题和答案排列成一个单选、多选、顺序式(排序)、矩阵式(将问题和答案排列成一个矩阵)矩阵) 、表格式(将同类问题和答案排列成一个表)、表格式(将同类问题和答案排列成一个表)封闭式问题答案的设计:封闭式问题答案的设计: 1 1、互斥性原则(不重叠)、互斥性原则(不重叠) 2 2、穷尽性原则、穷尽性原则开放式问题不便于汇总 (三)问卷设计时注意事项:(三)问卷设计时注意事项:1、依据研究的目的,确定所需要收集的数据,从而确定设置、依据研究的目的,确定
54、所需要收集的数据,从而确定设置哪些问题。即问题与主题相关。哪些问题。即问题与主题相关。2、对变量之间的相互关系的猜想、对变量之间的相互关系的猜想(思考、猜想设计出与研究目的有关的有深度的问题)3 3、问题答案的设计遵循、问题答案的设计遵循“穷尽性、互斥性穷尽性、互斥性”原则。原则。4、问题的排列顺序要合理,逐步启发被调查者,做到循序渐、问题的排列顺序要合理,逐步启发被调查者,做到循序渐进、注意内在逻辑性。进、注意内在逻辑性。(有趣、易答的可放前面)(有趣、易答的可放前面)5、问题设立的关键之一是:能够获得诚实的回答。、问题设立的关键之一是:能够获得诚实的回答。 (一般而言,与被调查者利益密切相
55、关的问题可能得不到诚实的回答)6、问卷不宜过长,问题不能过多,时间为、问卷不宜过长,问题不能过多,时间为20分钟左右。(拦分钟左右。(拦截问卷:截问卷:3-5分钟)分钟)【项目小结】【项目小结】1.统计调查是按照统计任务的要求,运用科学的调查方法,有组织地向社会实际搜集各项原始资料的过程。按组织方式不同分为统计报表和专门调查;按调查对象包括的范围分为全面调查和非全面调查;按调查登记时间是否连续分为经常性调查和一次性调查。2.一个完整的统计调查方案包括调查的目的和任务、调查对象和调查、调查项目和调查、调查时间和调查实施方案。3.调查的组织形式有统计报表和专门调查,专门调查又分为普查、抽样调查、典
56、型调查、重点调查几种。4. 调查资料的收集方法:一手资料的收集方法和二手资料的收集方法。5.一手资料也叫原始资料,是指经过搜集整理和直接经验所得的数据和信息资料,是原创的实物资料。一手资料的收集方法很多,常用的有直接观察法、访问法、问卷调查法、报告法、网络调查法等。6.二手资料是指因为其他目的已经被收集好的资料。与原始资料相比,二手资料收集起来更快、更容易,所需的费用和时间也相对节约得多。一、判一、判 断断 对对 错错1 1、全面调查和非全面调查是根据调查结果所得到的资料是、全面调查和非全面调查是根据调查结果所得到的资料是 否全面来划分的。(否全面来划分的。( )2 2、对某市下岗职工生活状况
57、进行调查,要求在一个月内报、对某市下岗职工生活状况进行调查,要求在一个月内报送调查结果。所规定的一个月时间是调查时间。(送调查结果。所规定的一个月时间是调查时间。( )3 3、我国人口普查的总体单位和调查单位都是每一个人,而、我国人口普查的总体单位和调查单位都是每一个人,而 填报单位是户。(填报单位是户。( )4 4、采用重点调查搜集资料时,选择的调查单位是标志值较、采用重点调查搜集资料时,选择的调查单位是标志值较 大的单位。(大的单位。( )5 5、统计调查误差就是指由于错误判断事实或者错误登记事、统计调查误差就是指由于错误判断事实或者错误登记事 实而发生的误差。(实而发生的误差。( )6
58、6、典型调查既可以搜集数字资料,又可以搜集不能用数字、典型调查既可以搜集数字资料,又可以搜集不能用数字 反映的实际情况。(反映的实际情况。( )7 7、重点调查与抽样调查的目的是一致的,即都是通过对部、重点调查与抽样调查的目的是一致的,即都是通过对部分单位的调查,来达到对总体数量特征的认识。(分单位的调查,来达到对总体数量特征的认识。( )二、单二、单 项项 选选 择择 题题1、连续调查与不连续调查的划分依据是(连续调查与不连续调查的划分依据是( )。)。A A、调查的组织形式不同、调查的组织形式不同 B B、调查登记的时间是否连续、调查登记的时间是否连续C C、调查单位包括的范围是否全面、调
59、查单位包括的范围是否全面 D D、调查资料的来源不同、调查资料的来源不同B2 2、对一批商品进行质量检验,最适宜采用的方法是(、对一批商品进行质量检验,最适宜采用的方法是( )。)。A A、全面调查、全面调查 B B、抽样调查、抽样调查 C C、典型调查、典型调查 D D、重点调查、重点调查 B3 3、下列调查中,调查单位与填报单位一致的是(、下列调查中,调查单位与填报单位一致的是( )。)。 A A、企业设备调查、企业设备调查 B B、人口普查、人口普查 C C、农村耕地调查、农村耕地调查 D D、工业企业现状调查、工业企业现状调查D4 4、抽样调查的主要目的是(、抽样调查的主要目的是( )
60、。)。A A、计算和控制抽样误差、计算和控制抽样误差 B B、推断总体总量、推断总体总量C C、对调查单位作深入研究、对调查单位作深入研究 D D、广泛运用数学方法、广泛运用数学方法B 5 5、下述各项调查中属于全面调查的是(、下述各项调查中属于全面调查的是( )。)。 A A、对某种连续生产的产品质量进行检验、对某种连续生产的产品质量进行检验 B B、某地区对工业企业设备进行普查、某地区对工业企业设备进行普查C C、对全面钢铁生产中的重点单位进行调查、对全面钢铁生产中的重点单位进行调查 D D、抽选部分地块进行农产量调查、抽选部分地块进行农产量调查B三、多项选择题部分1、在工业设备普查中(在
61、工业设备普查中( )、工业企业是调查对象、工业企业是调查对象 B B、每个工业企业是填报单位、每个工业企业是填报单位、每台设备是填报单位、每台设备是填报单位 D D、每台设备是调查单位、每台设备是调查单位 E E、工业企业的全部设备是调查对象、工业企业的全部设备是调查对象BDE2 2、制定统计调查方案,应确定(、制定统计调查方案,应确定( ) 、调查目的和调查对象、调查目的和调查对象 B B、调查单位和填报单位、调查单位和填报单位 、调查项目和调查表、调查项目和调查表 D D、调查资料的使用范围、调查资料的使用范围 、调查的时间和时限、调查的时间和时限ABCE3 3、抽样调查和重点调查的共同点
62、是(、抽样调查和重点调查的共同点是( ) 、两者都是非全面调查、两者都是非全面调查 、两者选取单位都不受主观因素的影响、两者选取单位都不受主观因素的影响、两者都按随机原则选取单位、两者都按随机原则选取单位 、两者都按非随机原则选取单位、两者都按非随机原则选取单位、两者都可以用来推断总体指标、两者都可以用来推断总体指标AB4 4、调查单位是(、调查单位是( )、需要调查的总体、需要调查的总体 、需要调查的总体单位负责人、需要调查的总体单位负责人 、调查项目的承担者、调查项目的承担者 、负责报告调查结果的单位、负责报告调查结果的单位、调查对象所包含的具体单位、调查对象所包含的具体单位CE项目四 统
63、计描述单元一单元一 运用总量指标进行规模描述运用总量指标进行规模描述单元二单元二 运用相对指标进行对比关系描述运用相对指标进行对比关系描述单元三单元三 运用平均指标进行集中趋势运用平均指标进行集中趋势描述描述单元单元四四 运用运用标志变异指标进行离中趋势标志变异指标进行离中趋势描述描述单元五单元五 Excel在统计描述中的应用在统计描述中的应用项目四导学项目四导学单元一 运用总量指标进行规模描述单元一单元一 运用总量指标进行规模描述运用总量指标进行规模描述一、总量指标的概念和作用 二、总量指标的种类三、总量指标的计量单位 四、总量指标的计算五、我国国民经济的主要总量指标一、总量指标的概念和作用
64、一、总量指标的概念和作用 总量指标是反映社会经济现象在一定时间、地点、条件下的总规模总规模或总水平总水平的统计指标。 表现形式:绝对数,绝对差数绝对数,绝对差数。二、总量指标的种类二、总量指标的种类二、总量指标的种类二、总量指标的种类 1、按反映总体内容分:、按反映总体内容分: 总总体体单单位位总总量量:总体单位数,如企业数、学校数、职工人数、学生人数等。 总总体体标标志志总总量量:总体单位数量标志值之和,如总产量、总产值、工资总额、税金总额等。 2 2、按反映时间状况不同分:、按反映时间状况不同分: 时期指标时期指标:在某一时期发展过程的总数量,如某种产品的产量、商品销售量(额)、工资总额、
65、国民(内)生产总值、人口增长量、人口出生数等。 时点指标时点指标:在某一时刻上状况的总量,如人口数、商品库存量、固定资产的价值等。 时期指标和时点指标的区别:时期指标和时点指标的区别: 时期指标连续计数,时点指标间断计数; 时期指标具有累加性,时点指标不具有累加性; 时期指标受时期长短影响,时点指标不受时点间隔影响。三、总量指标的计量单位三、总量指标的计量单位实物单位 自然单位:人、辆 度量衡单位:千克、吨 双重单位或多重单位:千瓦/台 复合单位:吨公里货币单位 现行价 不变价劳动单位:工时、工日四、总量指标的计算四、总量指标的计算 1、总量指标计算应注意的问题 同类现象才能加总; 明确总量指
66、标的含义 在统计汇总时,必须有统一的计量单位。五、我国国民经济的主要总量指标五、我国国民经济的主要总量指标 社会总产值社会总产值 也称社会总产品,是以货币表现的各物质生产部门在一定时期内生产的社会产品总量,即物质生产部门的总产出。它反映一个国家(或地区)在一定时期内物质生产的总成果。 从使用价值看,社会总产值可分为生产资料和消费资料两大类;从价值角度看,社会总产值可分为:生产过程中消耗掉的生产资料转移的价值(物质消费);劳动者新创造的价值,其中包括工资、利润、税金和利息等。可见,社会总产值的价值构成为C+V+M。 国民经济中的物质生产部门是指工业、农业、建筑业、货物运输业、邮电业和商业。其中商
67、业包括饮食业和批发、零售业。工业总产值采用“工厂法”计算;农业总产值采用“产品法”计算。增加值增加值企业或部门在一定时期内从事生产经营活动所增加的价值。增加值=总产值-中间投入国内生产总值国内生产总值(Gross Domestic Product,GDP)一个国家常住单位在一定时期内所生产和提供的最终使用的产品和服务的总价值。国内生产总值是SNA核算体系中一个重要的综合性指标,也是我国新国民经济核算体系中的核心指标,它是一个生产性指标。国内生产总值的计算,有生产法、收入法和支出法三种。1、生产法:国内生产总值=各部门增加值之和增加值=总产出中间消费2、收入法:国内生产总值固定资产折旧劳动者报酬
68、生产税净额营业盈余3、支出法:国内生产总值总消费总投资净出口国民生产总值国民生产总值(Gross National Produat,GNP):国民总收入=国内生产总值+国外要素收入净额=国内生产总值+来自国外的劳动者报酬和财产收入外国从本国获得的劳动者报酬和财产收入国民生产总值反映了本国常住单位原始收入的总和,因此,国民生产总值不是一个生产的概念,而是一个收产概念。在联合国的新SNA核算体系中已将国民生产总值改称为国民总收入。单元二 运用相对指标进行对比关系描述单元二单元二 运用相对指标进行对比关系描述运用相对指标进行对比关系描述一、相对指标的概念和表现形式二、相对指标的种类和计算方法三、正确
69、运用相对指标的原则一、相对指标的概念和表现形式一、相对指标的概念和表现形式1 1、概念、概念 相对指标是两个有联系的统计指标对比而得到相对指标是两个有联系的统计指标对比而得到的一种抽象的比值的一种抽象的比值。2 2、作用:、作用:综合反映社会经济现象之间的比例关系使不能直接对比的事物进行比较便于记忆 3 3、相对指标的表现形式、相对指标的表现形式有名数:有名数:以分子、分母的双重单位表示例:人口密度(人/平方公里) 人均国民生产总值(元/人)无名数无名数 系数 倍数 成数:1成=10% 百分数:% 1/100 千分数: 1/1000二、相对指标的种类和计算方法二、相对指标的种类和计算方法计划完
70、成程度相对指标计划完成程度相对指标计划完成相对数的一般公式计划完成相对数的一般公式 2 2、计划完成相对数的计算、计划完成相对数的计算 根据总量指标计算 某厂计划完成工业增加值200万元,实际完成220万元,则:根据相对指标计算计划完成程度根据相对指标计算计划完成程度 例例1 1:某厂计划2016年劳动生产率要比上年提高4%,实际提高5%,则即:超额0.96%完成计划。 例例2 2:某企业计划产品单位成本比上年降低5%,实际降低6%,则即:成本降低率比计划多完成1.05%。商场2013年2013年实际销售额2013年2012年增长%计划实际完成计划%销售额比重%销售额比重%甲120030122
71、430.9102110011.27乙100025102625.9102.690014.0丙180045171043.295.016404.3合计400010039601003640例例 单位:万元3 3、长期计划的检查、长期计划的检查(1 1 1 1)水平法:)水平法:)水平法:)水平法: 当计划任务是以计划期期末(最后一年)应达当计划任务是以计划期期末(最后一年)应达到的水平下达的,检查计划执行情况用水平法。到的水平下达的,检查计划执行情况用水平法。 确定提前完成计划的时间:如果计划期内有连续确定提前完成计划的时间:如果计划期内有连续一年的实际数,达到计划规定最后一年应达到的水平,一年的实际
72、数,达到计划规定最后一年应达到的水平,后面所余的时间就是提前完成计划的时间。后面所余的时间就是提前完成计划的时间。(2 2)累计法)累计法)累计法)累计法 当计划任务是以计划期全期累计应达到的水平下达的,当计划任务是以计划期全期累计应达到的水平下达的,检查计划执行情况用累计法。检查计划执行情况用累计法。 确定提前完成计划的时间:从计划期开始至某一时间确定提前完成计划的时间:从计划期开始至某一时间所累计完成的实际数达到了计划规定的累计数,以后的时所累计完成的实际数达到了计划规定的累计数,以后的时间就是提前完成计划的时间。间就是提前完成计划的时间。结构相对指标结构相对指标定义定义计算:计算:例某班
73、学生的性别构成情况某班学生的性别构成情况按性别分组绝对数人数 比重(%)男3075女1025合计40100比例相对指标比例相对指标定义定义计算:计算:例在上例中某班男女生比例为3:1。比较相对指标比较相对指标定义定义计算:计算:例 中国国土面积为960万平方公里,美国为937万平方公里,两者之比为强度相对指标强度相对指标定义定义计算:计算:例1998年末我国人口密度动态相对指标动态相对指标定义定义计算计算:例 某市1-3季度工业总产值同比增度17%三、正确运用相对指标的原则三、正确运用相对指标的原则注意可比性总量指标和相对指标结合起来使用多种相对指标结合使用四、相对指标的比较四、相对指标的比较
74、指标类型指标类型表现形式表现形式分子、分母位置分子、分母位置是否可以互换是否可以互换分子、分母分子、分母性质性质计算公式计算公式结构相对指标结构相对指标一般用百分数不可以=总体中的部分/总体全部*100%比例相对指标比例相对指标百分数、1比几、几比1可以=总体中的一部分/总体种的另一部分比较相对指标比较相对指标百分数、倍数、系数可以同类现象、不同空间=同一时间甲的某指标值/同一时间乙的某指标值强度相对指标强度相对指标复名数可以(正、逆)不同性质、有联系=某一总量指标/另一有联系的总量指标动态相对指标动态相对指标百分数不可以同类现象、不同时期=报告期指标值/基期指标值*100%计划完成相对指计划
75、完成相对指标标百分数不可以=本期实际数/本期计划数*100%单元三 运用平均指标进行集中趋势描述单元三单元三 运用平均指标进行集中趋势描述运用平均指标进行集中趋势描述一、平均指标的概念和作用 二、常用的平均指标三、平均指标在市场经济管理中的应用一、平均指标的概念和作用一、平均指标的概念和作用 概念:概念:平均指标是反映总体各单位某一数量标志值在一定时间、地点条件下达到一般水平的综合指标,一般用平均数表示。 特点:特点:将数量差异抽象化必须具有同质性反映总体变量值的集中趋势作用:作用: 1、用来比较同类现象在不同时间、空间发展的一般水平; 2、作为论断事物的一种数量标准或参考; 3、用来分析现象
76、之间的依存关系; 4、用来估算和推算其他有关数字;二、常用的平均指标二、常用的平均指标常用的平均指标有数值平均数和位置平均数。平均指标(集中趋势的测度)数值平均数算术平均数简单、加权算术平均数调和平均数简单、加权调和平均数几何平均数简单、加权几何平均数位置平均数众数中位数(一)数值平均数(一)数值平均数数值平均数是根据总体各单位所有标志值计算得来的平均数。主要有算术平均数、调和平均数和几何平均数。算术平均数、调和平均数和几何平均数。1.算术平均数算术平均数基本公式基本公式 在计算算术平均数时,分子与分母必须同属一个总体,在经济内容上有着从属关系,即分子数值是分母各单位标志值的总和。也就是说,分
77、子与分母具有一一对应的关系,有一个总体单位必有一个标志值与之对应。只有这样计算出的平均指标才能表明总体的一般水平。(1)(1)简单算术平均数简单算术平均数1 1、简简单单算算术术平平均均数数总总体体各各单单位位标标志志值值和和简简单单算算术术和除以总体单位数。(已知每个单位具体标志值)和除以总体单位数。(已知每个单位具体标志值)2 2、计算公式、计算公式式式中:中: 算术平均数算术平均数 总和符号总和符号 x 总体各单位标志值总体各单位标志值 n 总体单位数总体单位数该公式用于所给资料未分组的情况。该公式用于所给资料未分组的情况。 例例, , 某机械厂某生产班组有某机械厂某生产班组有1010名
78、工人,生产某种零件,每名工人,生产某种零件,每个工人的日产量分别为个工人的日产量分别为4545件,件,4848件,件,5252件,件,6262件,件,6969件,件,4444件,件,5252件,件,5858件,件,3838件,件,6464件。试用简单算术平均数法计算工人平件。试用简单算术平均数法计算工人平均日产量。均日产量。 (2)(2)加权算术平均数加权算术平均数1 1、加加权权算算术术平平均均数数各各组组的的标标志志值值乘乘以以该该组组的的次次数数求求得得的的和除以各组的次数总和。(资料已经分组并取得了分配数列)和除以各组的次数总和。(资料已经分组并取得了分配数列)2 2、计算公式、计算公
79、式注:如果是组距式分组,注:如果是组距式分组, 为组中值。为组中值。例,某企业工人按日产量分组可得下表例,某企业工人按日产量分组可得下表加权算术平均数计算表加权算术平均数计算表按日产量分组(件)按日产量分组(件)x 工人数工人数f 各组日产量(件)各组日产量(件)xf 12131617 2312 24391634 合计合计 8 113 根据表资料,计算平均日产量的计算应是根据表资料,计算平均日产量的计算应是 在加权算术平均数公式中,在加权算术平均数公式中,f称为权数。这是因为在各组标志值一称为权数。这是因为在各组标志值一定的情况下,定的情况下,f的大小对的大小对X的大小起着权衡轻重的作用。的大
80、小起着权衡轻重的作用。加权算术平均数的另一个计算公式加权算术平均数的另一个计算公式: : 拓展:这就是加权算术平均数的基本公式。在分组资料时,x用组中值代替。可见,加权算术平均数不但受各组标志值x的影响,而且也受各组次数f的影响。次数越多对标志总量的影响越大,次数越少对标志总量的影响越小。各组标志次数的多少在平均数的计算中具有权衡轻重的作用,因此,在统计上又称为权数权数。权数有两种形式:一种是以绝对数表示以绝对数表示,称次数或频数;另一种是以比重表示以比重表示,称频率。同一总体资料,用这两种权数所计算的加权算术平均数完全相同。2.调和平均数调和平均数调和平均数是各个标志值倒数的算术平均数的倒数
81、,是在资料受到限制的条件下算术平均数的一种变形。(1 1)简单)简单调和平均数调和平均数例1:某种蔬菜价格早上为5元/斤、中午为4元/斤、晚上为2.5元/斤。现早、中、晚各买1斤,求平均价格。例2:某种蔬菜价格早上为5元/斤、中午为4元/斤、晚上为2.5元/斤。现早、中、晚各买10元,求平均价格。在例2中,先求早、中、晚购买的斤数。早 10/5=2(斤)中 10/4=2.5(斤)晚 10/2.5=4(斤) 实际上,例2是用下列公式计算:这就是简单调和平均数的公式。(2 2)加权调和平均数)加权调和平均数例例3:某种蔬菜价格早上为5元/斤、中午为4元/斤、晚上为2.5元/斤。现早、中、晚各买20
82、元、30元、40元,求平均价格。这就是加权调和平均数公式:调和平均数是各个算术平均数倒数的算术平均数的倒数,是算术平均数的一种变形。 在已知每种价格x、销售量f时,求平均价格用加权算术平均数。在已知每种价格x、销售额m时,求平均价格用加权调和平均数。 判断在什么情况下可以采用算术平均数或调和判断在什么情况下可以采用算术平均数或调和平均数的依据平均数的依据 (1 1)如果缺分子资料,可用简单或加权算术平均数形式)如果缺分子资料,可用简单或加权算术平均数形式计算,计算, (2 2)如缺分母资料,可用简单或加权调和平均数计算。)如缺分母资料,可用简单或加权调和平均数计算。总之,根据所掌握产资料条件来
83、决定。总之,根据所掌握产资料条件来决定。 3.3.几何平均数几何平均数 几何平均数是n项变量值连乘积的n次方根。(1 1)简单几何平均数)简单几何平均数例:2004-2008年某地工业品的产量分别是上年的107.6%、102.5%、100.6%、102.7%、102.2%,计算这5年的平均发展速度。4.4.众数(众数(M M0 0) (1 1)众数)众数的概念的概念 众数是总体中出现次数最多的标志值。它能直观地说明客观现象分配中的集中趋势,用字母M M0 0表示。 例如某车间80名工人中技术等级为4级的有58人,人数最多,则4级为众数。用它表示该车间工人技术等级的一般水平。 如果总体中出现次数
84、最多的标志值不是一个,而是两个,那么,合起来就是复(双)众数。 (2 2)众数的计算方法)众数的计算方法单项数列确定众数观察次数,出现次数最多的标志值就是众数。这种方法比较简单。如下表所列: 某种商品的价格情况价格(元)价格(元)销售数量(公斤)销售数量(公斤)2.00202.40603.001404.0080合计合计300300上面数列中价格为3.00元的商品销售量最多,即出现次数最多,则众数M M0 0=3.00元。组距数列确定众数观察次数,首先由最多次数来确定众数所在组,然后再用比例插值法推算众数的近似值。其计算公式为:下限公式: 上限公式: 例2, 某班学生统计学考试成绩情况表学生成绩
85、学生成绩x学生人数学生人数f学生人数比重(学生人数比重(%)50以下22.550604560701417.570804657.580901012.590以上45合计合计8080100100下限公式:5.5.中位数(中位数(MeMe) 中位数的概念:中位数的概念:中位数是将各单位标志值按大小排列,居于中间位置的那个标志值就是中位数。中位数的计算:中位数的计算:未分组资料:先将数据按从小到大顺序排列,如项数为奇数,居于中间的哪个单位标志值。中位数位次: 例例:有9个数字,2,3,5,6,9,10,11,13,14中位数为第5个,即9。先将数据按从小到大顺序排列,如项数为偶数,中位数为居于中间的那2
86、个单位标志值的平均值。例:例:有10个数字,2,3,5,6,9,10,11,13,14,15中位数为第5个和第6个的平均值,即9.5。如为单项式分组资料,要将次数进行累计,中位数为居于中间位置所对应的标志值。中位数的位置: 例:例:某厂工人日产零件中位数计算表中位数位置=80/2=40 按向上累计次数,到34所在组为54,到32所在组为27,故中位数应在34所在组,即中位数=34。 按日产零件分组按日产零件分组(件件)工人数工人数(人人)向上累计次数向上累计次数263331101332142734275436187241880合计合计80801)单项式数列求)单项式数列求中位数中位数(a)先确
87、定中位数的位置 ;(b)根据累计次数确定中位数所在的组;(c)中位数所在组的标志值就是中位数。2)组距组距式数列求式数列求中位数中位数(a)先确定中位数的位置 ;(b)根据累计次数确定中位数所在的组;(c)利用上限、下限公式求中位数的近似值。组距式数列计算中位数公式 月工资总额(元/人)人数(人)人数累计向上累计(人) 向下累计(人)35004000662004000450028341944500500042761665000550049125124550060003516075600065002718740650070001320013合计200例:求某企业职工月收入总额的中位数。表4- 1
88、1 某企业职工按月收入总额分组情况解:解:(a)先确定中位数的位置(200/2=100;(b)根据累计次数确定中位数所在的组是第四组;(c)利用下限公式求中位数的近似值单元四 运用标志变异指标进行离中趋势描述单元四单元四 运用标志变异指标进行离中趋势描述运用标志变异指标进行离中趋势描述一、标志变异指标的概念和作用二、常用的标志变异指标一、标志变异指标的概念和作用一、标志变异指标的概念和作用(一)标志变异指标的概念(一)标志变异指标的概念标志变异指标是反映总体各单位标志值差异程度或离散程度的综合指标,弥补平均指标在反映总体一般水平时掩盖总体各单位标志值数量差异的不足。统计中一般用标志变异指标描述
89、离中趋势。(二)标志变异指标的作用二)标志变异指标的作用(1)标志变异指标可以衡量数据分布的离散程度;(2)标志变异指标是衡量平均数代表性好坏的尺度;(3)标志变异指标可以反映社会经济活动变动过程的节奏性和均衡性;(4)标志变异指标的大小有助于确定必要的抽样数目;二、常用指标的标志变异指标二、常用指标的标志变异指标变异指标变异指标(离中趋势的测度)(离中趋势的测度)全距分位差平均差标准差变异系数常用的标志变异指标有全距、分位差、平均差、方差、标准差、离散系数等。1.1.全距全距(1 1)全距的概念与计算)全距的概念与计算全距又称极差,是总体各单位标志的最大值和最小值之差。 R=Xmax-Xmi
90、n(2 2)全距的特点:)全距的特点:计算方便、易于理解、指标粗糙2.平均差平均差(1 1)平均差的概念与计算)平均差的概念与计算 平均差是各单位标志值对平均数离差绝对值的平均数。用符号“A.D”表示,可以分为简单平均差和加权平均差 。 计算公式例例4-19某企业A车间100名工人日产量资料如下表,计算该车间100名工人日产量的平均差。表4- 15 100名工人日产量资料(1)算术平均数:由此可知:该车间00名工人日产量的平均差为6.6件。工人按日产量分工人按日产量分组(件)组(件) 工人数(人)工人数(人) 255125-17178535351225-77245454520253313555
91、158251313195合计1004200660(2)平均差:3.标准差(1 1)标准差的概念与计算)标准差的概念与计算标准差是各单位标志值与其算术平均数离差平方的算术平均数的平方根。又称均方差,用 表示,标准差的平方 称为方差。标准差克服了平均差带有绝对值的缺点,它是测定标志变异程度的主要指标。根据掌握的资料不同,标准差可以分为简单标准差和加权标准简单标准差和加权标准差差。 计算公式1、简单标准差、简单标准差例例甲货运物流公司20个驾驶百吨公里的油耗资料如下(单位:升/百吨公里): 甲货运公司20名驾驶员百吨公里油耗资料5.864.95.654.334.544.455.335.215.215
92、.335.455.125.134.125.234.765.114.935.224.12(1)计算甲货运公司20个驾驶员百吨公里油耗的标准差。(2)若乙货运物流公司驾驶员百吨公里油耗的平均数为5升,标准差为0.3升,则哪个物流公司油耗平均数的代表性好?解:解:根据标准差的计算公式,我们需要先求算数平均数,再计算甲货运公的标准差。2、加权标准差、加权标准差例例某快递公司200名快递员每日派送快递件数如下表4- 17,求该快递公司200名快递员每日派送快递件数的标准差。200名快递员每日派送快递件数表解:解:由于本题是组距式数列,考虑用组中值代替各组的变量值,故可以计算算术平均数和标准差按每日派送件
93、数分组(件)按每日派送件数分组(件)快递员数(人)快递员数(人)90-11010110-13070130-15090150-17030合计合计200200(1)计算算术平均数(2)计算标准差由此可知:该快递公司200名快递员每日派送快递件数的标准差为15.6件。4.变异系数标志变异指标数值大小,不仅受离散程度影响,而且还受平均水平高低的影响,因此,在平均数不相等时,不能简单根据标准差或平均差大小来比较离散程度。变异系数,是各种变异指标与平均数的比率。反映总体各单位标志值的相对离散程度,有全距变异系数、平均差变异系数、标准差变异系数全距变异系数、平均差变异系数、标准差变异系数。最常用的是标准差变
94、异系数标准差变异系数。例例甲、乙两公司近6个月的销售额情况如下(万元):甲公司(6个月):626570738082乙公司(6个月):81317192224试比较甲、乙两公司近6个月平均销售额的代表性(甲、乙两公司近6个月销售额的离散程度)。解:解:(1)计算甲、乙两公司销售额的算术平均数:(2)计算甲、乙两公司近6个月销售额的标准差由于甲公司销售额标准差大于乙公司销售额标准差,似乎可以得出乙公司近6个月平均销售额的代表性比甲公司好的结论。实际情况的确如此吗?因此,当两总体标志值平均水平不一样或计量单位不同时,要比较两总体标志值平均水平代表性的好坏,要判断总体各单位标志值的离散程度,需要计算其变
95、异系数。(3)计算甲、乙两公司近6个月销售额的标准差变异系数由计算结果可知:甲司销售额的标准差系数小于乙公司销售额的标准差系数,说明甲公司近6个月销售额的离散程度小于乙公司,甲公司近6个月平均销售额的代表性好于乙公司。单元五 Excel在统计描述中的应用单元五单元五 ExcelExcel在统计描述中的应用在统计描述中的应用一、Excel在计算总量指标中的应用二、Excel在计算相对指标中的应用三、Excel在计算平均指标中的应用四、Excel在计算标志变异指标中的应用三、Excel在计算平均指标中的应用(一)未分组资料计算集中趋势指标一)未分组资料计算集中趋势指标1.利用利用Excel中的函数
96、功能计算中的函数功能计算Excel提供了数学函数、统计函数、财务函数等等诸多函数工具,如统计函数中的“AVERAGE(平均数)”、“HARMEAN(调和平均数)”、“MODE(众数)”、“MEDIAN(中位数)”、“VARP(方差)”、“STDEV(标准差)”、“MAX(最大值函数)”、“MIN(最小值函数)”等等。2.利用利用excel中的数据分析工具计算中的数据分析工具计算除了利用Excel提供的函数工具完成数据计算外,还可以利用Excel的数据分析功能进行集中趋势指标的计算。四、Excel在计算标志变异指标中的应用一、未分组资料计算离中趋势指标一、未分组资料计算离中趋势指标1.利用利用E
97、xcel中的函数计算中的函数计算Excel提供了数学函数、统计函数、财务函数等等诸多函数工具,在计算未分组数据资料中的离中趋势指标时,可以直接使用Excel提供的“AVEDEV(标准差)”、“VARP(方差)”、“STDEV(标准差)”、“MAX(最大值函数)”、“MIN(最小值函数)”函数。2.利用利用excel中的数据分析工具计算中的数据分析工具计算除了利用Excel提供的函数工具进行离中趋势指标计算外,还可以利用Excel的数据分析功能计算离中趋势指标。二二、分组资料计算离中趋势指标、分组资料计算离中趋势指标对于分组数列,不能简单地利用Excel中的函数工具或数据分析工具,主要利用Exc
98、el的公式和填充柄进行数据的计算。【项目小结】【项目小结】1、总量指标。、总量指标。总量指标是用来反映社会经济现象在一定时间、地点、条件下所达到的总规模、总水平或工作总量的统计指标,是对总体规模进行描述的常用指标。2、总量指标的分类:、总量指标的分类:按指标反映总体的内容不同分为总体单位总量和总体标志总量;按指标反映的时间状况不同分为时期指标和时点指标。3、相对指标。、相对指标。相对指标是由两个有联系的统计指标对比而得到的一种抽象的比值,又称为相对数,是从数量上展示和说明研究对象规模的大小、发展程度、结构、强度、普通程度或比例关系等。相对指标有两种具体表现形式:无名数和有名数。4、相对指标的种
99、类:、相对指标的种类:1)结构相对指标;2)比例相对指标;3)比较相对指标;4)强度相对指标;5)动态相对指标;6)计划完成程度相对指标;5、平均指标。、平均指标。平均指标又称统计平均数,是反映总体各单位某一数量标志值在一定时间、地点条件下达到一般水平的综合指标,一般用平均数表示;是将总体各单位数量标志差异抽象化以反映总体一般水平、集中趋势的统计指标。统计中一般用平均指标描述集中趋势。常用的平均指标有数值平均数和位置平均数。数值平均数主要有算术平均数、调和平均数和几何平均数;位置平均数主要有众数、中位数等。6、标志变异指标。、标志变异指标。标志变异指标是反映总体各单位标志值差异程度或离散程度的
100、综合指标,弥补平均指标在反映总体一般水平时掩盖总体各单位标志值数量差异的不足。常用的标志变异指标有全距、分位差、平均差、方差、标准差、离散系数等。项目三 统计整理n n单元一单元一 认识认识统计统计整理整理n n单元单元二二 了解了解统计统计分组分组n n单元单元三三 编制编制分布分布数列数列n n单元单元四四 绘制绘制统计图和编制统计图和编制统计表统计表n n单元单元五五 Excel在统计整理中的应用在统计整理中的应用项目三导学项目三导学单元一 认识统计整理一、统计调查的概念与意义一、统计调查的概念与意义 统计资料整理,就是根据统计研究任务的要求,对统计调查所取得的各项原始资料进行科学的加工
101、与汇总,使其系统化出能反映现象总体特征的综合资料;或对已加工过的资料(包括历史资料)进行再加工。 统计整理的意义统计整理的意义1.统计整理是从对个体现象的认识到对总体现象数量特征认识的过程。2.统计整理是调查的继续,是统计分析的前提,起承上启下的作用。3.是对现象由感性认识到理性认识的过程。 统计整理是统计工作过程的重要阶段,是实现从个体单位标志值向总体数量特征值过渡的必要阶段。 二、统计二、统计资料整理的步骤资料整理的步骤 第一步,设计和制定统计整理方案整理方案。它是对资料整理工作的各个方面各步骤做出具体的安排与规定。 第二步,对原始资料进行审核进行审核。审核被调查单位的资料是否全部收齐,填
102、报是否缺漏与差错,发现问题,及时解决,以保证资料汇总计算能顺利进行。 第三步,对经过审核的资料进行分组进行分组、汇总汇总,计算出总体总量指标。 第四步,将汇总计算的结果,以统计表或统计图统计表或统计图的形式表现出来。 第五步,对统计资料妥善保存,系统积累保存,系统积累。 三三、统计资料审核、统计资料审核(一)预处理(一)预处理 1 1、数据汇总前的审核,对统计调查取得的资料,要、数据汇总前的审核,对统计调查取得的资料,要进行准确性进行准确性 、及时性、及时性 、完整性三个方面的审核。、完整性三个方面的审核。 2 2、资料审核后的订正、资料审核后的订正(二)(二) 汇总后审核汇总后审核四、统计资
103、料汇总四、统计资料汇总(一)统计资料的汇总技术(一)统计资料的汇总技术 1、手工汇总 2、电子计算机汇总(二)统计汇总的组织形式(二)统计汇总的组织形式 1、逐级汇总 2、集中汇总 3、综合汇总单元二 了解统计分组 一、统计分组的概念一、统计分组的概念 与意义与意义 (一)统计(一)统计分组的概念分组的概念 统计分组就是根据统计研究的需要,将统计总体按照一定的标志分为若干个组成部分。 统计分组具有两个方面的含义:对总体而言,是“分分”,即将同质总体区分为性质有别的不同组成部分;对总体单位而言,它是“合合”,即将性质相同或相近的不同总体单位组合在一起,构成一个组。 174(二)统计分组的意义(二
104、)统计分组的意义统计分组的目的就是要将同质总体中有差异的单位区分开来,同时又将性质相同的某些单位组合在一起,统计分组的意义主要表现在以下三个方面:(1)划分现象的类型;(2)反映总体的构成及特征;(3)研究现象之间的依存关系。 分组标志的选择是统计分组的核心问题,为了保证统计分组科学合理,选择分组标志必须遵循穷尽的原则、互斥原则。同时,在选取分组标志时还要考虑:(1)根据研究的目的、任务选择分组标志 (2)选择能够反映事物本质的标志分组(3)要考虑现象所处的历史条件和经济条件 二、分组标志的选择二、分组标志的选择1.1.按分组标志的性质分类按分组标志的性质分类统计分组可分为:(1)品质标志分组
105、:(2)数量标志分组:2.2.按分组标志的多少分类按分组标志的多少分类统计分组可分为:(1)简单分组(2)并列分组(3)重复分组三、统计分组的分类三、统计分组的分类1.1.确定统计分组的内容和分组体系确定统计分组的内容和分组体系 简单分组与平行分组体系复合分组与复合分组体系2.2.选择分组标志选择分组标志3.3.划定组间界限划定组间界限三、统计分组的步骤三、统计分组的步骤单元三 编制分布数列一、分布数列的概念与种类一、分布数列的概念与种类 分布数列的概念分布数列的概念:分布数列又称分配数列、次数分配数列,是在统计分组的基础上,将总体中的所有单位按其所属的组别归类整理,并且按照一定的顺序排列,形
106、成总体单位数在各组分布的一系列数字。两两个要素组成:个要素组成:(1)各组名称或各组变量值(总体按某标志分组)(2)各组单位数(次数或频数)二、分布数列的概念与种类二、分布数列的概念与种类 品品质质分分布布数数列列变变量量分分布布数数列列单项式变量数列单项式变量数列组距式变量数列组距式变量数列分布数列分布数列等距数列等距数列异距数列异距数列(这这种种数数列列一一般般比比较较稳稳定定,只只要要分分组组标标志志确确定定的的比比较较恰恰当当,通通常常能能准准确确地地反反映映总体的分布特征。)总体的分布特征。)根据分组时采用的分组标志不同,分布数列可分为: 1.1.品质数列品质数列:按品质标志分组的数
107、列,用来观察总体单位中不同属性的单位分布情况。 2. 2.变量数列变量数列:将总体按数量标志分组,将分组后形成的各组变量值与该组中所分配的单位次数或频数,按照一定的顺序相对应排列所形成的分配数列。 变量数列按各组表现形式不同分为单项式变量数列和组距式变量数列。 组距式变量数列相关概念组距式变量数列相关概念(1)组限:就是每一组两端的数值。(2)上限:各组最大的变量值(3)下限:各组最小的变量值(4)组距:各组的上限与上限之差(5)组中值:每组上限与下限之间的中点数值。即组中值 = (上限值+下限值)2(6)全距:最大与最小的变量值之差(7)开口式组距数列组中值: 缺下限组的组中值=该组上限-相
108、邻组组距/2 缺上限组的组中值=该组下限+相邻组组距/2 三、分布数列的编制三、分布数列的编制 (一)品质数列的编制(一)品质数列的编制按品质标志对总体作属性分组;划分各组界限;汇总各组单位数,并编制分布数列表,即得到品质数列;(二)变量数列的编制(二)变量数列的编制1.单项式分布数列的编制2.组距式分布数列的编制二、变量数列的编制举例二、变量数列的编制举例单项式变量数列的编制单项式变量数列的编制 某工厂生产车间人工人日产量原始数据如下:20 21 21 24 23 22 20 21 22 2324 20 24 21 22 22 23 24 22 2122 23 22 21 21 22 22
109、23 22 23 单项式变量数列单项式变量数列直接将每一变量值作为一组,汇总计算各组相应的单位数(次数),并采用表格形式列示即可,例如表某工厂生产车间工人按日产量分布(各组变量值) (次数) (频率)日产量 工人数 比率(%) 2021222324 371064 10.023.333.320.113.3 合计 30 100.0 186 组距变量数列的编制组距变量数列的编制例,对某企业30个工人完成劳动定额的情况进行调查,某原始资料如下(%) 98 81 95 84 93 86 91 102 100 103105 100 104 108 107 108 106 109 112 114109 11
110、7 125 115 120 119 118 116 129 113 第一步:计算全距第一步:计算全距。(将各变量值由小到大排序,确定某最大值,最小值,并计算全距。) 81 84 86 91 93 95 98 100 100 102103 104 105 106 107 108 108 109 109 112113 114 115 116 117 118 119 120 125 129变量的最大值是129%最小值是81%全距 = 最大值 - 最小值=129% - 81%= 48% 第二步:确定组数和组距第二步:确定组数和组距 组距和组数的确定没有顺序规定,即可以先根据数据的变化特征确定组数,也可
111、以在事先对研究对象的性质比较了解的情况下,先确定组数,然后确定组距,但组数必须是整数。在等距分组时,组距与组数的关系是: 本例中的数据为劳动定额的完成情况,属于工作成绩的评定。根据一般将成绩分成优、良、中、及格和不及格的五档评分习惯,可以先确定组数为5。在等距分组时,计算组距如下: 为了符合习惯和计算方便,组距近似地取10%。第三步:确定组限第三步:确定组限第一,最小组的下限(起点值)应低于最小变量值,最大组的上限(终点值)应高于最大变量值。第二,组限的确定应有利于表现出总体分布的特点,应反映出事物质的变化。第三,为了方便计算组限应尽可能取整数,最好是5或10的整倍数。第四,由于变量有连续型变
112、量和离散型变量两种,其组限的确定方法是不同的。 第四步:编制频数(频率)分布表。第四步:编制频数(频率)分布表。 计算本例中各组的频数(工人数)和频率,编制某企业30个工人劳动定额完成情况的分布表 某企业30个工人劳动定额完成情况分布图表劳动定额完成程度(%) 频数(人) 频数(%) 809090100100110110120120130 341283 10.013.340.026.710.0 合计 30 100.0 第五步:计算累计频数和累计频率第五步:计算累计频数和累计频率 为了更详细的认识变量的分布特征,还可以计算累计频数和累计频率,编制累计频数和累计频率数列。累计频数和累计频率有向上累
113、计频数(频率)和向下累计频数(频率)两种。 向上累计数向上累计数:小于各组的该组上限的各组的频数或频率之和;相反,由变量值大的组向变量值小的组累计各组的频数或频率,称为向下累计频数或向下累计频数。 向下累计数向下累计数:大于及等于该组下限的各组的频数或频数或频率之和。 根据某企业工人完成劳动定额的资料编制的向上累计频数(频率)根据某企业工人完成劳动定额的资料编制的向上累计频数(频率)和向下累计频数(频率)分布如表。和向下累计频数(频率)分布如表。 劳动定额完成情况(%) 频数(人) 频率(%) 向上累计 向下累计 频数(人) 频率(%) 频数(人) 频率(%) 8090901001001101
114、10120120130 341283 10.013.340.026.710.0 37192730 10.023.363.390.0100.0 302723113 100.090.076.736.710.0 合计 30 10.0 单元四 绘制统计图和编制统计表 一、统计表一、统计表 统计表的概念:统计表的概念:统计表是统计表是以纵横交叉的线条所形成的表格来表现统计资料以纵横交叉的线条所形成的表格来表现统计资料的形式;是统计用数字说话的一种常用形式。的形式;是统计用数字说话的一种常用形式。统计表的作用:统计表的作用:1.1.能有条理地、系统地显示数据,使人们阅读时一目了然,能有条理地、系统地显示数
115、据,使人们阅读时一目了然,印象深刻;印象深刻;2.2.能合理地、科学地组织数据,便于人们阅读时对照比较;能合理地、科学地组织数据,便于人们阅读时对照比较;3.3.具有容量大、方便计算等优势;具有容量大、方便计算等优势;一、统计表Page 195以纵横交叉的线条以纵横交叉的线条所形成的表格来表所形成的表格来表现统计资料的形式;现统计资料的形式;是统计用数字说话是统计用数字说话的一种常用形式。的一种常用形式。1 1)能将统计资料系统条理化,使)能将统计资料系统条理化,使资料显得紧凑、简明、醒目资料显得紧凑、简明、醒目2 2)便于检查数字的准确性与完整)便于检查数字的准确性与完整性性3 3)具有容量
116、大、方便计算等优势)具有容量大、方便计算等优势4 4)是分析研究的工具)是分析研究的工具(一)从统计表的形式看:(一)从统计表的形式看:(一)从统计表的形式看:(一)从统计表的形式看:总总 标标 题题纵栏标题纵栏标题横行标题横行标题数字资料数字资料1)总标题:是:是统计表的名称、表表的名称、表头。放在表上方。放在表上方说明明统计表的主要内容表的主要内容2)横行)横行标题:是各:是各组的名称。反映的名称。反映总体体单位的分位的分组情况情况3)纵栏标题:是:是统计指指标的名称。的名称。说明明纵栏所列的各所列的各项资料料4)数字)数字资料:也称指料:也称指标数数值,是,是统计表的具体内容,每一数表的
117、具体内容,每一数值位于相位于相应 纵横横栏交叉交叉处。此外,如此外,如资料来源、指料来源、指标注注释等附件等附件资料放表下方料放表下方 二、统计表的结构(二)从统计表的内容看(二)从统计表的内容看(二)从统计表的内容看(二)从统计表的内容看统计表包括主词主词和宾词宾词两部分。纵栏标题:纵栏标题:纵栏标题:纵栏标题: 主词:主词:主词:主词:数据资料数据资料数据资料数据资料宾词主主词词宾词列于表的列于表的纵栏用来用来说明主明主词的各个指的各个指标,包括,包括指指标名称、指名称、指标数数值、指、指标单位位主词列于表的横行主词列于表的横行主词列于表的横行主词列于表的横行要说明的总体及总体要说明的总体
118、及总体要说明的总体及总体要说明的总体及总体的各单位、各组的的各单位、各组的的各单位、各组的的各单位、各组的名称,或各个时期。名称,或各个时期。名称,或各个时期。名称,或各个时期。统计表的种类统计表的种类 简单表 主词未经过任何分组,反映出总体各单位的名称或按时间顺序简单排列,或同时反映以上内容的统计表。分组表 主词按照一定标志分组的统计表,也称简单分组表。复合表 主词按照两个或两个以上的标志层叠分组所形成的统计表。四、四、统计表的表的编制原制原则qq合理安排表的结构合理安排表的结构合理安排表的结构合理安排表的结构(行、列标题位置,表的长度比例)(行、列标题位置,表的长度比例)(行、列标题位置,
119、表的长度比例)(行、列标题位置,表的长度比例)qq选择合适的总标题,选择合适的总标题,选择合适的总标题,选择合适的总标题,(简明、确切概括统计表的内容)(简明、确切概括统计表的内容)(简明、确切概括统计表的内容)(简明、确切概括统计表的内容)qq主词栏与宾词栏要各归其位,相互对应;主词栏与宾词栏要各归其位,相互对应;主词栏与宾词栏要各归其位,相互对应;主词栏与宾词栏要各归其位,相互对应;qq如果表中数据必须注明计量单位:若数据用同一计量单位,则单如果表中数据必须注明计量单位:若数据用同一计量单位,则单如果表中数据必须注明计量单位:若数据用同一计量单位,则单如果表中数据必须注明计量单位:若数据用
120、同一计量单位,则单位可以放右上角;否则应放在指标后括号内或另起一列;位可以放右上角;否则应放在指标后括号内或另起一列;位可以放右上角;否则应放在指标后括号内或另起一列;位可以放右上角;否则应放在指标后括号内或另起一列;qq表中数据一般右对齐,有小数时以小数点位置对齐;表中数据一般右对齐,有小数时以小数点位置对齐;表中数据一般右对齐,有小数时以小数点位置对齐;表中数据一般右对齐,有小数时以小数点位置对齐;qq数据栏不能有空白。没有数字用数据栏不能有空白。没有数字用数据栏不能有空白。没有数字用数据栏不能有空白。没有数字用“ “”表示;表示;表示;表示;qq栏数多时,可在各列的文字标题下面设置编号加
121、以标识;栏数多时,可在各列的文字标题下面设置编号加以标识;栏数多时,可在各列的文字标题下面设置编号加以标识;栏数多时,可在各列的文字标题下面设置编号加以标识;qq表的上、下端用粗线或双线封口,左右两端一般不封口;列标题表的上、下端用粗线或双线封口,左右两端一般不封口;列标题表的上、下端用粗线或双线封口,左右两端一般不封口;列标题表的上、下端用粗线或双线封口,左右两端一般不封口;列标题之间用细线隔开,行则不要求;之间用细线隔开,行则不要求;之间用细线隔开,行则不要求;之间用细线隔开,行则不要求;qq必要时在表的下方加注释、资料来源等。必要时在表的下方加注释、资料来源等。必要时在表的下方加注释、资
122、料来源等。必要时在表的下方加注释、资料来源等。(一)统计图的概念(一)统计图的概念 统计图是以图形形象地表现统计资料的一种形式。用统计图表现统计资料,具有具有直观、醒目、生动、易具有直观、醒目、生动、易具有直观、醒目、生动、易具有直观、醒目、生动、易于理解等特点。于理解等特点。于理解等特点。于理解等特点。因而绘制统计图是统计整理的重要内容之一。 二、二、统计图 (二)统计图的种类(二)统计图的种类常用的统计图主要有常用的统计图主要有直方图、条形图、折线图、曲线图、饼图、环形图。直方图、条形图、折线图、曲线图、饼图、环形图。(一)直方(一)直方图和条形和条形图直方图直方图:是用矩形的:是用矩形的
123、宽度和高度乘积宽度和高度乘积来表示次数分布的图形来表示次数分布的图形直方图直方图( Histogram )用于显示连续型变量的用于显示连续型变量的次数分布次数分布条形图条形图:是用是用宽度相同的条形的高度或长度宽度相同的条形的高度或长度表示数据次数的图形表示数据次数的图形条形图条形图条形图条形图(BarBar)一般用于显示离散型量的次数分布一般用于显示离散型量的次数分布一般用于显示离散型量的次数分布一般用于显示离散型量的次数分布两者区两者区别:条形图:用条形的长度或高度表示各类别数量的多少,条形图:用条形的长度或高度表示各类别数量的多少,宽度固定宽度固定直方图:用面积表示数量的多少直方图:用面
124、积表示数量的多少(二)折(二)折线图和曲和曲线图折线图折线图:是在直方图的基础上是在直方图的基础上把相邻直方形的顶边中点连接把相邻直方形的顶边中点连接成一成一条折线。条折线。曲线图曲线图:当变量数列的组数无限多时,折线图就近似地表现为平:当变量数列的组数无限多时,折线图就近似地表现为平滑的曲线,称为曲线图。滑的曲线,称为曲线图。折线图、曲线图主要用于显示连续型变量的次数分布和现象的动态变化折线图、曲线图主要用于显示连续型变量的次数分布和现象的动态变化折线图、曲线图主要用于显示连续型变量的次数分布和现象的动态变化折线图、曲线图主要用于显示连续型变量的次数分布和现象的动态变化折线图折线图曲线图曲线
125、图曲曲线图是用曲是用曲线的升降起伏来表示被研的升降起伏来表示被研究究现象的象的变动情况及其情况及其趋势的的图形。曲形。曲线图根据所示数据的性根据所示数据的性质和作用不同,和作用不同,可分可分为频数分布曲数分布曲线图、动态曲曲线图和和依存关系曲依存关系曲线图。 (三)(三)饼图和和环形形图饼图饼图:又称圆形图,是以:又称圆形图,是以圆的面积或扇形面积的大小圆的面积或扇形面积的大小来表示数来表示数值大小或总体内部结构的一种图形。值大小或总体内部结构的一种图形。环形图环形图:环形图是用环形图是用环中的一段环中的一段表示总体各部分数据大小的图表示总体各部分数据大小的图形。环形图可形。环形图可同时绘制多
126、个同时绘制多个数据系列。数据系列。用于显示用于显示定类变量定类变量的分布情的分布情况况圆形图圆形图(饼图饼图 Pie )环形图环形图环形图环形图用于显示定类量的次数用于显示定类量的次数分布分布单元五 Excel在统计整理中的应用一、一、Excel编制分布数列制分布数列(一)使用数据透视表编制品质数列(一)使用数据透视表编制品质数列1.单击自定义快速访问工具栏的“数据透视表”按钮,在弹出的“创建数据透视表”窗口,选择要分析的数据区域,单击“确定”按钮。2.在“数据透视表字段列表”中选择行、列、数值字段,左侧报表区域将生成按性别分组的数据透视表。(二)使用频数函数(二)使用频数函数(FREQUEN
127、CY)编制频数分布表)编制频数分布表(1)输入数据(2)数据排序(3)确定分段点(每组上限):统计结果“上在内下不上在内下不再再”(4)确定频数放置区域(先选定先选定)(5)计算频数:插入/函数/统计/FREQUENCY,ctrl+shift+enter(6)计算频率,频数分布表的文字添加、输入。(三)使用数据分析工具编制频数分布表(三)使用数据分析工具编制频数分布表 数据/数据分析/直方图 (如果“数据”下面没有“数据分析”,其他命令/加载项 调出“数据”项) “直方图”对话框中的“接收区域”是指分组标志所在的区域,此处输入每组的上限值。打开打开“数据分析数据分析”对话框对话框 输入数据输入
128、数据 打开打开“直方图直方图”对话框。对话框。 二二、Excel绘制制统计图(1)将表中数据输入)将表中数据输入Excel。(2)绘制统计图。)绘制统计图。 单击“插入”菜单,选择“图表”选项卡中的图表类型。(3)统计图的布局设置。)统计图的布局设置。可以根据需要对初步绘制的统计图进行修改设置。如添加数据标签,增加图标标题,设置次要坐标轴等。项目项目小结小结1.统计整理。统计整理。统计整理是根据统计研究任务的目的要求,对调查所搜集到的大量、零星分散的原始资料进行审核,分组、汇总,使其条理化、系统化、规范化,变成能反映总体特征的综合资料的工资过程,或对二手资料进行再加工的工作过程。2.统计资料审
129、核审核统计资料审核审核。主要包括资料的完整性、准确性和及时性三个方面。3.统计分组。统计分组。4.分布数列。分布数列。分布数列是在分组的基础上,将总体的所有单位按组归类形成总体单位在各组间的分布。又称分配数列、次数分配数列,简称分布数列。分布数列的构成:(1)各组名称或各组变量值(总体按某标志分组);(2)各组单位数(次数或频数)5.组距式分布数列的编制步骤。组距式分布数列的编制步骤。将原始资料按大小排序,确定总体中的最小值、最大值及全距;确定编制数列的类型;确定组数和组距;确定组限;计算各组次数和比重,编制分布数列表;6计算累计频数和累计频率;6.统计表和统计图。统计表和统计图。项目五 时间
130、数列分析单元一单元一 时间时间数列的概念和数列的概念和种类种类单元单元二二 时间时间数列分析的水平指标数列分析的水平指标单元单元三三 时间时间数列分析的速度数列分析的速度指标指标单元单元四四 时间时间数列的数列的趋势分析趋势分析单元单元五五 EXCEL在时间数列分析中的应用在时间数列分析中的应用项目五导学项目五导学单元一 时间数列的概念和种类一、时间序列的概念一、时间序列的概念把反映某种社会经济现象的同一指标在不同时间上的指标数值,按时间(如按年、季、月、日等)先后顺序编排所形成的数列,称为时间数列或动态数列,又称时间序列。时间数列具有两个基本要素,一是时间,二是时间数列具有两个基本要素,一是
131、时间,二是各时间指标值。各时间指标值。年份20132014201520162017国内生产总值(万亿元)5929636412816859937400618207542013年年2018年我国国内生产总值年我国国内生产总值(二二二二)时间数列的作用时间数列的作用时间数列的作用时间数列的作用(1)时间数列可以反映现象发展变化过程和历史情况;(2)利用时间数列计算动态分析指标,可以反映现象发展变化的方向、速度、趋势和规律;(3)利用时间数列对现象发展变化趋势与规律的分析,可以进行动态预测;(4)将多个时间数列纳入同一模型中研究,可以揭示现象之间相互联系的程度及动态演变关系。二、时间数列的种类二、时间
132、数列的种类 (1)绝对数时间数列)绝对数时间数列(总量指标动态序列)(总量指标动态序列)把一系列总量指标按时间先后顺序排列起来所形成的动把一系列总量指标按时间先后顺序排列起来所形成的动态数列称为绝对数动态数列。态数列称为绝对数动态数列。1. 1.时期数列:时期数列:各项指标反映某现象在一段时期内发展过程的各项指标反映某现象在一段时期内发展过程的总量,如工业总产值等。总量,如工业总产值等。 时期数列的特点:时期数列的特点: 各项数值是可加的各项数值是可加的 指标值大小与时期长短有关指标值大小与时期长短有关 每个指标数值通过连续登记而得每个指标数值通过连续登记而得2. 2.时点数列:时点数列:各项
133、指标反映某现象在某一时点上所各项指标反映某现象在某一时点上所处的水平,如职工人数、人口数等。处的水平,如职工人数、人口数等。 时点数列的特点:时点数列的特点: 各项数值是不可加的各项数值是不可加的 指标值大小与时期长短无关指标值大小与时期长短无关 每个指标数值通过一定时期登记一次而得每个指标数值通过一定时期登记一次而得(2)相对数时间数列)相对数时间数列(相对指标时间序列)(相对指标时间序列) 把一系列同类相对指标按时间先后顺序排列起来把一系列同类相对指标按时间先后顺序排列起来所形成的动态数列称为相对数动态数列。所形成的动态数列称为相对数动态数列。(3)平均数动态数列(平均指标时间序列) 把一
134、系列同类的平均指标按时间先后顺序排列起把一系列同类的平均指标按时间先后顺序排列起来所形成的动态数列称为平均数动态数列。来所形成的动态数列称为平均数动态数列。二、时间数列的种类二、时间数列的种类 三、动态数列的编制原则三、动态数列的编制原则 (一) 时间长度应当一致(二)总体范围应当一致(三)指标内容应当一致(四)计算方法应当一致单元二 时间数列分析的水平指标发展水平发展水平 发展水平是动态数列各个时期(时点)的指标数值。发展水平是动态数列各个时期(时点)的指标数值。 一般用总量指标表示,也可用相对指标或平均指标一般用总量指标表示,也可用相对指标或平均指标表示。表示。一、发展水平一、发展水平以符
135、号以符号a a代表数列发展水平,则有代表数列发展水平,则有或:或:最初水平最初水平中间水平中间水平最末水平最末水平( N 项数据)项数据)( n+1 项数据)项数据)0、1、2N时间序号时间序号1、报告期和基期、报告期和基期在对时间数列发展水平进行分析时,经常用到报告期水平和在对时间数列发展水平进行分析时,经常用到报告期水平和基期水平。基期水平。当前研究分析的时期当前研究分析的时期与之对照比较的时期与之对照比较的时期报告期报告期基期基期关于时间数列的说明:平均发展水平又称序时平均数、动态平均数序时平均数、动态平均数:就就是把时间数列中各个时期(或时点上)的指标数值各个时期(或时点上)的指标数值
136、加以平均而求得的平均数。是将事物在时间上变动的差异平均化。 平均发展水平用来反映现象在一段时间发展变化所达到的一般水平。思考:序时平均数(动态)与一般算术平均数(静态)的异同?二、平均发展水平二、平均发展水平二、平均发展水平的计算方法二、平均发展水平的计算方法n n由由由由绝对数绝对数绝对数绝对数计算序时平均数计算序时平均数计算序时平均数计算序时平均数n n由时期数列计算序时平均数由时期数列计算序时平均数若数列为若数列为时点数列时点数列(不具有可加性,直接相加无意义)不具有可加性,直接相加无意义)。第一种情况:连续时点数列连续时点数列计算序时平均数。序时平均数。第二种情况:间断时点数列间断时点
137、数列计算序时平均数。序时平均数。数列的资料是数列的资料是逐日登记逐日登记的,的,采用采用算术平均数法算术平均数法计算平均计算平均连续时点数列连续时点数列每隔一段时间才登记一次时点资料所形每隔一段时间才登记一次时点资料所形成的数列成的数列,采用采用“先求各间断点平均,然后再先求各间断点平均,然后再平均平均”首尾折半法首尾折半法间断时点数列间断时点数列按是否逐日登记按是否逐日登记分两种情况计算序时平均数序时平均数日期日期6 6月月1 1日日6 6月月2 2日日6 6月月3 3日日6 6月月4 4日日6 6月月5 5日日收盘价收盘价16.216.2元元16.716.7元元17.517.5元元18.2
138、18.2元元17.817.8元元某股票连续某股票连续 5 5 个交易日价格资料如下:个交易日价格资料如下:【例例2】求该股票求该股票 5 5 个交易日的平均价格。个交易日的平均价格。解:解:请看请看连续连续时点时点数列数列某物流企业某物流企业3 3月份每日实有送货人数资料如下:月份每日实有送货人数资料如下:日日 期期18日日 915日日 1622日日 2331日日实有送货人实有送货人数(人)数(人) 701 772 795 800解:解:【例例3】求平均每日实有送货人数。求平均每日实有送货人数。间断时点数列计算序时平均数间断时点数列计算序时平均数先求各间断点的平均先求各间断点的平均再对各间断点
139、的平均再对各间断点的平均求平均求平均一季一季度初度初二季二季度初度初三季三季度初度初四季四季度初度初次年一次年一季度初季度初A:间隔相等的间断时点数列;间隔相等的间断时点数列;时间3月末4月末5月末6月末库存量(百件)60596472解:解:该问题是间隔相等的间断时点数列,则该问题是间隔相等的间断时点数列,则3-63-6月末的的月末的的月平均库存额为:月平均库存额为:某商业企业某商业企业20152015年年3-63-6月末某商品库存资料如下,求这月末某商品库存资料如下,求这三个月的月平均库存额。三个月的月平均库存额。【例例4】 B:间隔不相等不相等时,采用加权序时平均法加权序时平均法90天天9
140、0天天180天天一季一季度初度初二季二季度初度初三季三季度初度初次年一次年一季度初季度初由相对数或平均数时间数列计算序时平均数由相对数或平均数时间数列计算序时平均数基本公式基本公式 由于相对数、平均数是根据两个相联系的绝对数动态由于相对数、平均数是根据两个相联系的绝对数动态数列对应值数列对应值a a和和b b求得的,所以相对数或平均数时间数列求求得的,所以相对数或平均数时间数列求序时平均的方法:序时平均的方法:先求分子、分母的平均,然后相除。先求分子、分母的平均,然后相除。【例例5 5】 某企业某企业20192019年第二季度劳动生产率和工人数资料,年第二季度劳动生产率和工人数资料,计算第二季
141、度月平均劳动生产率。计算第二季度月平均劳动生产率。月月 份份四月四月五月五月六月六月七月七月劳动生产率(万元劳动生产率(万元/ /人)人) 月初工人数(人)月初工人数(人) 2.12.11001002 21101101.81.81041042 2102102根据劳动生产率公式可以求出每个月的产值:根据劳动生产率公式可以求出每个月的产值:熟练之后可以一步写出熟练之后可以一步写出时时 间间一月份一月份二月份二月份三月份三月份计划产值计划产值计划完成程度计划完成程度% %3003001101103603609595400400120120课堂练习课堂练习1 1 某企业某企业20192019年第一季度
142、产值计划完成情况年第一季度产值计划完成情况 单位:万元单位:万元计算一季度月平均计划完成程度(保留计算一季度月平均计划完成程度(保留1 1位小数)。位小数)。 时时 间间一季度一季度二季度二季度三季度三季度四季度四季度产值(万元)产值(万元)劳动生产率(万元劳动生产率(万元/ /人)人)1001001.01.090900.80.81201201.21.21401401.31.3课堂练习课堂练习2 2 某企业某企业20192019年四季度产值计划完成情况(保留年四季度产值计划完成情况(保留1 1位小数)位小数)1 1)计算季平均劳动生产率)计算季平均劳动生产率2 2)计算月平均劳动生产率)计算月
143、平均劳动生产率3 3)计算)计算20192019年(年平均)劳动生产率年(年平均)劳动生产率4 4)计算半年平均劳动生产率)计算半年平均劳动生产率 序时平均数求解总结:序时平均数求解总结:连续时点数列连续时点数列间断时点数列间断时点数列非连续变动时点序列非连续变动时点序列连续变动时点序列连续变动时点序列绝对数数列绝对数数列时期数列时期数列时点数列时点数列间隔不等的时点序列间隔不等的时点序列间隔相等的时点序列间隔相等的时点序列相对数相对数/平均数数列平均数数列分子分母时间范分子分母时间范围必须一致;时围必须一致;时期数列只涉及时期数列只涉及时间量纲,时点数间量纲,时点数列只涉及记录次列只涉及记录
144、次数。数。三、增长量三、增长量增长量增长量是报告期水平与基期水平之差,说明社会经济现象在一定时期内增长(或减少)的绝对数量。计算公式:二者的关系:二者的关系:增长量=报告期水平-基期水平逐期增长量逐期增长量累计增长量累计增长量增长量报告期水平与其前一期水平之差报告期水平与其前一期水平之差报告期水平与一固定时间(如初期)水平之差报告期水平与一固定时间(如初期)水平之差2010-20182010-2018中国社会物流总费用中国社会物流总费用年份201020112012201320142015201620172018社会物流总费用(万亿)7.18.49.410.210.610.811.112.113
145、三、增长量的符号表示三、增长量的符号表示 若时间数列中各期发展若时间数列中各期发展水平为:水平为:逐期增长量逐期增长量累计增长量累计增长量二者的关系:二者的关系:四、平均增长量四、平均增长量平均增长量平均增长量是逐期增长量的平均数,用于描述现象在观察期内平均每期增长的数量。末期的累计增长量单元三 时间数列分析的速度指标 速度分析是水平分析的继续,是对社会经济现象发展速度分析是水平分析的继续,是对社会经济现象发展变化变化快慢程度快慢程度进行的分析。进行的分析。时间数列速度分析指标主要有?时间数列速度分析指标主要有?发展速度发展速度平均发平均发展速度展速度增长速度增长速度平均增平均增长速度长速度单
146、元三单元三 时间数列速度分析时间数列速度分析一、发展速度一、发展速度 发展速度是反应社会经济现象发展速度是反应社会经济现象发展快慢程度发展快慢程度的相对指标。的相对指标。发展速度指数列中发展速度指数列中报告期水平与基期水平之比(相对数),报告期水平与基期水平之比(相对数),用百分率或倍数表示,说明现象报告期较基期的变动程度。用百分率或倍数表示,说明现象报告期较基期的变动程度。环比发展速度环比发展速度定基发展速度定基发展速度发展速度报告期水平与前一期水平之比报告期水平与前一期水平之比报告期水平与某一固定时间(如初期)水平之比报告期水平与某一固定时间(如初期)水平之比2010-20182010-2
147、018中国社会物流总费用中国社会物流总费用年份201020112012201320142015201620172018社会物流总费用(万亿)7.18.49.410.210.610.811.112.113若时间数列为:若时间数列为:则环比发展速度与定基发展速度的关系:则环比发展速度与定基发展速度的关系:同比发展速度(年距发展速度)同比发展速度(年距发展速度)常用的发展速度:常用的发展速度: 增长速度是表明社会经济现象增长速度是表明社会经济现象增长快慢程度增长快慢程度的相对指标。的相对指标。 是指报告期是指报告期增长量与基期水平增长量与基期水平的比值,说明报告期水平较的比值,说明报告期水平较基期水
148、平增长的程度(百分之几或多少倍)基期水平增长的程度(百分之几或多少倍) 。基期可以是前基期可以是前一期或第一期一期或第一期二、增长速度二、增长速度环比增长速度环比增长速度定基增长速度定基增长速度根据选择的基期不同增长速度报告期增长量与其前一期水平之比报告期增长量与其前一期水平之比报告期增长量与某一固定时间(如初期)水平之比报告期增长量与某一固定时间(如初期)水平之比2010-20182010-2018中国社会物流总费用中国社会物流总费用年份201020112012201320142015201620172018社会物流总费用(万亿)7.18.49.410.210.610.811.112.113
149、环比增长速度环比增长速度定基增长速度定基增长速度注注意意qq发展速度与增长速度性质不同。前者是动态相对数,后发展速度与增长速度性质不同。前者是动态相对数,后者是强度相对数;者是强度相对数;qq 定基增长速度与环比增长速度之间有直接的换算关系定基增长速度与环比增长速度之间有直接的换算关系吗?吗?若时间数列为:若时间数列为:增长增长1%1%的的绝对值绝对值指现象每增长指现象每增长11所代表的增长的绝对所代表的增长的绝对数量。是增长量与增长速度的数量。是增长量与增长速度的100100倍之倍之比。比。定基增定基增长长速度增速度增长长1%1%的的绝对值绝对值环环比增比增长长速度增速度增长长1%1%的的绝
150、对值绝对值例:某市物流业2013-2019年的总产值如下:计算2014-2019年增长1%的绝对值。年份2013201420152016201720182019总产值(亿元)6768248569101028106811702014年增长量1482014年增长速度21.89%增长1%绝对值6.76三、平均发展速度三、平均发展速度平均发展速度是各平均发展速度是各环比发展速度的平均数环比发展速度的平均数,说明现,说明现象在一定时期内速度发展变化的平均程度,用象在一定时期内速度发展变化的平均程度,用表示。表示。 平均发展速度的计算方法平均发展速度的计算方法采用几何平均数法采用几何平均数法:总速度总速度
151、【例例】甲地区近甲地区近5 5年的粮食产量如下,计算近年的粮食产量如下,计算近5 5年粮食产量的平均年粮食产量的平均发展速度。:发展速度。:年份2014(基期)20152016201720182019粮食产量(万吨)10010610410811092解:解:甲地区近甲地区近5 5年粮食产量的平均发展速度为年粮食产量的平均发展速度为98.35%98.35%。四、平均增长速度四、平均增长速度平均增长速度说明现象逐期增减的平均程度。平均增长速度说明现象逐期增减的平均程度。练一练:练一练: 2010-2019年我国年我国GDP总量如下,请在下列空白总量如下,请在下列空白处填上正确数字。处填上正确数字。
152、年份2010201120122013201420152016201720182019GDP(万亿元)41.21248.79453.85859.29664.12868.59974.00682.075490.03199.087环比发展速度定基发展速度环比增长速度定基增长速度增长1%的绝对值指指标计算公式算公式含含 义发展速度展速度环比发展速度环比发展速度 现象逐期象逐期发展展变化的程度化的程度定基发展速度定基发展速度 在整个在整个观察期内察期内总的的发展展变化程度化程度增增长速度速度环比增长速度环比增长速度 现象逐期增象逐期增长的程度的程度定基增长速度定基增长速度 现象在象在观察期内察期内总的增的
153、增长程度程度平均平均发展速度展速度在整个在整个观察期内平均察期内平均发展展变化的程度化的程度平均增平均增长速度速度逐期增逐期增长的平均程度的平均程度动态速度指标的计算及含义小结动态速度指标的计算及含义小结动态速度指标是反映社会经济现象发展变化快慢程度。单元四 时间数列的趋势分析(一)时间数列的构成因素(一)时间数列的构成因素一般来讲,影响时间数列变动的因素为长期趋势、季节变动、循环变动和不规则变动四种主要因素。1、长期趋势长期趋势是指客观现象在一个相当长的时期内,受某种稳定性因素影响所呈现的上升或下降趋势,也可以表现为只围绕某一常数值而无明显增减变化的水平趋势。2、季节变动季节变动是指客观现象
154、受季节更换的影响,在一年或更短的时间内,随时间的变动而呈现的周期性波动。3、循环变动循环变动是指客观现象以若干年为周期的涨落起伏相间的变动。4、不规则变动一、一、时间数列变动的因素分析时间数列变动的因素分析(二)时间数列的分解模型(二)时间数列的分解模型 设时间数列为,长期趋势为,季节变动为,循环波动为,不规则变动为,则两种模型可表述如下:1、加法模型、加法模型假设四个因素是相互独立的,则时间数列各期水平的数值可视为四个因素相加的总和,其分解模型为: 2、法模型、法模型假设四个因素变动之间存在某些相互影响的关系,则时间数列各期水平的数值就是四种因素相乘的乘积,其分解模型为: 长期趋势测定的方法
155、很多,常用的有:长期趋势测定的方法很多,常用的有:(一)时距扩大法(一)时距扩大法(二)移动平均法(二)移动平均法(三)数学模型法等等。(三)数学模型法等等。二、长期趋势的测定二、长期趋势的测定时距扩大法时距扩大法是把原来时间数列中所包括的各个时期资料加以合并,得出较长时距的资料,用以消除由于时距较短,受偶然因素影响所引起的不均匀状况。经过对原始动态数列扩大时距修匀,可以整理出新的能明显表示现象发展趋势的动态数列。(一)时距扩大法(一)时距扩大法移动平均法是对原数列按一定间隔扩大时距,逐期移动,边移动边平均,得到一个新的移动平均数时间数列,作为现象发展的长期趋势。(二)移动平均法(二)移动平均
156、法月份月份机器台数机器台数(台台)3项移动平均值项移动平均值5项移动平均值项移动平均值 14124245.00 35245.67 44.644346.67 46.654546.33 48.865149.67 46.475348.00 4884048.00 48.895146.67 49.8104952.00 50115653.00 1254例例:某机器厂某年各月生产机器台数资料如下表,其三项移动平均和项五项移动平均数的计算如下:某机器厂各月生产机器台数的移动平均数它是用适当的数学模型来反映动态数列各因素之间的关系,从而计算各期的趋势值的方法。如以时间因素作为自变量(t),把数列水平作为因变量(
157、ye),拟合的直线趋势方程为ye=a+bt(5.21)(三)数学模型法(三)数学模型法(一)简单平均法(一)简单平均法简单平均法又称按月(季)平均法。计算时,首先根据历年(三年以上)同月(季)资料求出该月(季)的平均数,然后将各月(季)的平均数与总平均数相比,得到季节比率(指数)。其计算步骤与方法如下:1、分别就每年各月的数字加总后,求各该年的月平均数;、分别就每年各月的数字加总后,求各该年的月平均数;2、各年同月数字加总,求若干年内同月的平均数;、各年同月数字加总,求若干年内同月的平均数;3、若干年内每个月的数字总计,求总的月平均数;、若干年内每个月的数字总计,求总的月平均数;4、将若干年内
158、同月的平均数与总的平均数相比,即得季节比率,也叫季、将若干年内同月的平均数与总的平均数相比,即得季节比率,也叫季节指数。节指数。季节比率季节比率=各月(季)的平均数除以总平均数各月(季)的平均数除以总平均数按月或季平均法计算季节比率要求至少三年以上的资料,具体来说按月平均不能少于36个月的资料;按季平均不能少于12个季的资料。三、季节变动的测定三、季节变动的测定某地区各月毛线销售量季节变动计算表 单位:百千克月份年份123456789101112合计第一年150904026108122035853403601176第二年230150604020103240701504204801702第三年2
159、8012080301293748841404705001820合计66036018096422781108189375123013504698月平均数2201206032149273663125410450130.5季节比率(%)168.5891.9545.9824.5210.736.9020.6927.5948.2895.79314.18344.831200例例预测方法:预测方法:若知,今年若知,今年4 4月份销售量为月份销售量为5050百千克,预测今年百千克,预测今年1010、1111月份销售量月份销售量:(二)(二) 趋势剔除法趋势剔除法这种方法的特点是将移动平均数作为长期趋势加以剔除,
160、再测定季节变动。所以又称之为移动平均趋势剔除法。其具体计算步骤:其具体计算步骤:1、据各年的月(季)资料、据各年的月(季)资料Y计算计算12项(项(4项)移动平均项)移动平均T;2、计算修匀比率:、计算修匀比率:Y/T;3)将)将Y/T按月(季)排列,求同月(季)的平按月(季)排列,求同月(季)的平均值,再与总平均比即得季节比率。这里不介绍具体的计算。均值,再与总平均比即得季节比率。这里不介绍具体的计算。三、季节变动的测定三、季节变动的测定为方便计算,把上例月资料改为季资料为方便计算,把上例月资料改为季资料:单位:百千克季度年份一二三四第一年2804467785第二年440701421050第
161、三年480511691120例例季度销售量y(百千克)四项移动平均二项移正yc趋势值剔除减法y-yc除法y/yc100%第一年 280 - 44- 67314-247 21.34 785337.25 447.75232.77第二年 440349.875 90.125125.76 70392.375-322.375 17.84 142430.5-288.5 32.98 1050433.125 616.875242.42第三年 480434.125 45.875110.57 51446.25-395.25 11.43 169- 1120-294334340.5359.25425.5435.5430
162、.75437.5455对减法剔除分析如下:对减法剔除分析如下:对减法剔除分析如下:对减法剔除分析如下:第一季第二季第三季第四季合计第一年-247447.75第二年90.125-322.375-288.5616.875第三年45.875-395.25-合计136-717.625-535.51064.625平均68-358.8125-267.75532.3125-26.25校正数+6.56+6.56+6.56+6.56季节变差S.V.74.56-352.25-261.19538.870对除法剔除分析如下:对除法剔除分析如下:对除法剔除分析如下:对除法剔除分析如下:第一季第二季第三季第四季合计第一年
163、-21.34232.77第二年125.7617.8432.98242.42第三年110.5711.43-合计236.3329.2754.32475.19平均118.16514.63527.16237.60397.56校正比例1.00611.00611.00611.0061季节比率S.I.118.8914.7227.33239.05400单元五 EXCEL在时间数列分析中的应用一、时间数列的水平指标计算一、时间数列的水平指标计算二、时间数列的速度指标计算二、时间数列的速度指标计算三、时间数列变动的趋势分析三、时间数列变动的趋势分析EXCEL在时间数列分析中的应用在时间数列分析中的应用【项目小结】
164、【项目小结】1.时间数列是将某一统计指标在不同时间上的数值按照时间先后顺序排列所形成的数列。时间数列由两个基本要素组成:一个是现象的所属时间;另一个是反映一个是现象的所属时间;另一个是反映该现象的同一指标在不同时间条件下的具体数值。该现象的同一指标在不同时间条件下的具体数值。3.时间数列按其排列的统计指标的表现形式不同分为总量指标时间数列、相对指标时间数列和平均指标时间数列三种。其中:总量指标时间数列是最基本的时间数列,其余两种是在其基础上派生的。4.编制时间数具体要求是:时间长度应当一致;总体范围应当一致;指标内容时间长度应当一致;总体范围应当一致;指标内容应当一致;计算方法、计算价格和计量
165、单位应当一致。应当一致;计算方法、计算价格和计量单位应当一致。5.时间数列分析的水平指标是以绝对数形式表示的动态分析指标,包括发展水平、平均发展水平、增长量和平均增长两等指标。6.时间数列的速度指标是以相对数形式表示的动态分析指标,包括发展速度、平均发展速度、增长速度以及平均增长速度等指标。 7.影响时间数列变动的因素可分解为长期趋势、季节变动、循环变动和不规则变动四种主要因素。8.长期趋势测定的方法很多,常用的有:时距扩大法、移动平均法、数学模型时距扩大法、移动平均法、数学模型法法等等。项目六 统计指数分析单元一单元一 统计统计指数的意义及分类指数的意义及分类单元单元二二 综合综合指数的指数
166、的编制编制单元单元三三 平均指数平均指数单元单元四四 指数体系和指数体系和因素分析因素分析单元单元五五 Excel在指数分析中的应用在指数分析中的应用项目六导学项目六导学单元一 统计指数的意义及分类一、统计指数的概念 广义的概念,指数广义的概念,指数是指同类事物变动程度的相是指同类事物变动程度的相对数,包括动态相对数、比较相对数、计划完成相对对数,包括动态相对数、比较相对数、计划完成相对数,即所有的动态比较指标。数,即所有的动态比较指标。 狭义的概念,指数狭义的概念,指数是综合反映多种不同事物在是综合反映多种不同事物在不同时间上的总变动的特殊的相对数。即专门用来综不同时间上的总变动的特殊的相对
167、数。即专门用来综合说明那些不能直接相加和对比的复杂社会经济现象合说明那些不能直接相加和对比的复杂社会经济现象的变动情况。的变动情况。如:零售物质价指数、股票价格指数。统计指数简称指数,其涵义有广义与狭义之分统计指数简称指数,其涵义有广义与狭义之分。二、统计指数的作用二、统计指数的作用1.综合分析事物的变动方向和变动程度2.分析多因素影响现象的总变动中,各个因素的影响大小和影响程度例:商品销售额=商品销售量单位商品价格3.研究事物在长时间内的变动趋势三、统计指数的种类三、统计指数的种类按照说明现象的范围不同,统计指数分为:按照说明现象的范围不同,统计指数分为:个体指数:说明单项事物动态比较指标,
168、也叫单项指数。总指数:说明多种事物综合动态比较指标。二、统计指数的种类二、统计指数的种类按照指标的性质内容不同分:按照指标的性质内容不同分:数量指标指数:反映数量指标变动的相对数,如销售量总指数。质量指标指数:反映质量指标变动的相对数,如价格总指数。按照指数编制方法和计算形式不同分:按照指数编制方法和计算形式不同分:综合指数:两个总量指标对比。平均指标指数:对个体指数用加权平均法算出的指数。平均指标对比指数:加权算术平均指标对比而计算的指数。二、统计指数的种类二、统计指数的种类(四)按照对比基期的不同分:(四)按照对比基期的不同分:定基指数。以固定时期为基期编制的指数为定基指数;环比指数:以指
169、数所属时期前一期为基期编制的指数为环比指数。单元二 综合指数的编制一、综合指数编制的基本问题一、综合指数编制的基本问题 综合指数是总指数的基本形式,它是两个总量指标对综合指数是总指数的基本形式,它是两个总量指标对比形成的指数。比形成的指数。 综合指数可以完整地研究对象的相对量和绝对量方面综合指数可以完整地研究对象的相对量和绝对量方面的内容。的内容。 u基本方法:基本方法:先综合,后对比。先综合,后对比。u编制综合指数,首先要解决好两个问题:编制综合指数,首先要解决好两个问题:u(1)(1)正确选择同度量因素;正确选择同度量因素;u(2)(2)选择同度量因素的所属时期。选择同度量因素的所属时期。
170、编制综合指数的关键:引进同度量因素编制综合指数的关键:引进同度量因素n同度量因素:把不能直接相加的指标过渡为可以直接相加的媒介因素。n同度量因素有两个作用:同度量作用和权数作用。n 同度量因素的选择同度量因素的选择 不能任意选用同度量因素,而应根据所要研究问题不能任意选用同度量因素,而应根据所要研究问题的经济关系来选择的。如求产量总指数,要看产量的经的经济关系来选择的。如求产量总指数,要看产量的经济联系,例如知道济联系,例如知道产值产值= =产量产量出厂价出厂价 选择出厂价作为同度量因素是适当的。选择出厂价作为同度量因素是适当的。n 同度量因素的固定同度量因素的固定 所要计算的总指数中,只希望
171、包含所要指数化指标的变所要计算的总指数中,只希望包含所要指数化指标的变动,因此同度量因素应该对应固定。固定期一般有基期和报动,因此同度量因素应该对应固定。固定期一般有基期和报告期两种选择。告期两种选择。l 将同度量因素将同度量因素固定在基期固定在基期,称为,称为拉氏指数拉氏指数l 将同度量因素将同度量因素固定在报告期固定在报告期,称为,称为派氏指数派氏指数二、数量指标综合指数的编制二、数量指标综合指数的编制数量指标综合指数是根据数量指标编制的综合数量指标综合指数是根据数量指标编制的综合指数,如物量指数(产量、销售量)、产值(销售指数,如物量指数(产量、销售量)、产值(销售额)指数、职工人数指数
172、等。额)指数、职工人数指数等。 数量指标综合指数的编制数量指标综合指数的编制其同度量因其同度量因素往往取素往往取基期的质量指标基期的质量指标。计算公式为:商品销售量指数:结果表明:报告期销售量比基期销售提高了14.29%,销售额增加了6000元。例例三、质量指标综合指数三、质量指标综合指数质量指标总指数是根据质量指标编制的综质量指标总指数是根据质量指标编制的综合指数,质量指数是反映质量指标总变动合指数,质量指数是反映质量指标总变动程度析指数,如价格指数、单位成本指数程度析指数,如价格指数、单位成本指数等。等。 质量指标综合指数的编制质量指标综合指数的编制质量指标综合指数的编制质量指标综合指数的
173、编制 其同度量因素往往取其同度量因素往往取其同度量因素往往取其同度量因素往往取报告期的数量指标报告期的数量指标报告期的数量指标报告期的数量指标。计算公式为:计算公式为:计算公式为:计算公式为:商品销售价格指数:计算结果表明:三种商品价格平均增长了2.05%,销售额增加了1200元。例例单元三 平均指数一、平均指数的含义一、平均指数的含义平均指数是计算总指数的另一种形式,它是在个体指数的基础上计算总指数。平均指数之所以被称之为平均指数,是因为它利用了加加权权算算术术平平均均数数和加加权权调调和和平平均均数数的计算形式。平均指数编制的基本方法:先对比、后平均二、平均指数的种类二、平均指数的种类(一
174、)(一)加权算术平均数指数加权算术平均数指数主要适用于已知销售量个体指数和基期销售额的情况,其计算公式: 某商业企业三种商品销售量变动情况及销售额资料如下:计算结果表明,该商业企业三种商品销售量总的比基期增长8.33%,由于销售量的增长,使销售额增加37.5万元。商品名称计量单位销售量个体指数基期商品销售额p0q0(万元)kp0q0=p0q1(万元)甲双110220242乙千克115130149.5丙米9610096合计-450487.5例例二、平均指数的种类二、平均指数的种类(二)(二)加权调和平均指数加权调和平均指数如果知道个体质量指标指数及报告期的总量指标时,则可采用加权调和平均法,加权
175、调和平均数指数通常用于编制质量指标综合指数。其计算公式:设某商店仅有设某商店仅有20192019年商品收购额和年商品收购额和20182018年、年、20132013年各年各种商品收购单价,要求计算价格总指数。种商品收购单价,要求计算价格总指数。商品名称单位单价(元)个体指数(%)2019年商品收购额(元)按2018年价格计算的2019年收购额(元)2018年2019年代表符号p0p1p1q1甲件1010.3103158002153400乙千克22.1105145005138100丙米55.41088002874100丁千克44.411050164560合计-388051370160计算结果表明
176、,这商店四种商品计算结果表明,这商店四种商品20192019年收购价格比年收购价格比20182018年平均提年平均提高高4.8%4.8%;由于价格提高,使该商店;由于价格提高,使该商店20192019年商品收购额增加年商品收购额增加17 89117 891元。元。例例单元四 指数体系和因素分析社会经济现象是错综复杂的,它往往受制于多个相互联系社会经济现象是错综复杂的,它往往受制于多个相互联系的因素影响,这种联系往往表现为一种连乘的关系。分析的因素影响,这种联系往往表现为一种连乘的关系。分析各构成因素变动对总体变动的影响方向和影响程度,这种各构成因素变动对总体变动的影响方向和影响程度,这种方法,
177、也称连乘因素分析法。方法,也称连乘因素分析法。(一)指数体系的概念(一)指数体系的概念指数体系是由三个或三个以上有联系的指数所组成的数学关系式。例如:商品销售额指数=商品销售量指数商品销售价格指数统统计上把这些互相联系的指数所构成的体系,叫做指数体系计上把这些互相联系的指数所构成的体系,叫做指数体系一、指数体系一、指数体系(二)指数体系的作用(二)指数体系的作用可用来推算体系中某一个未知的指数。可以作因素分解。 3.确定同度量因素时期的依据二、因素分析二、因素分析(一)因素分析的内容(一)因素分析的内容因素分析包括以下两方面内容:(1)从相对数上分析各影响因素的变动对总变动产生影响的方向和程度
178、。(2)从绝对数上分析各影响因素的变动使总变动增加或减少的绝对数额。二、因素分析二、因素分析(二二)因素分析的)因素分析的步骤步骤1、分析被研究对象及其影响因素2、分析各因素指标对被研究对象的影响程度和影响方向。3、建立指数体系三、总量指标变动的两因素分析三、总量指标变动的两因素分析(1)进行因素分解)进行因素分解 例:销售额=销售量价格 m=qp(2)写出各因素的指数)写出各因素的指数 销售额指数为总量动态指标,等于报告期的销售额除以基期销售额,即: 三、总量指标变动的两因素分析三、总量指标变动的两因素分析销售量指数为数量指标指数 销售价格指数为质量指标指数(3 3)建立指数体系)建立指数体
179、系 销售额指数=销售量指数销售价格指数上述指数体系为方便记忆,可以按如下方法记忆:首先是量在前,价在后。首先是量在前,价在后。q0p0变 到 q1p1, 先 是 量 变 , 价 不 变 , 即q1p0 ;然后由q1p0变到q1p1变。写成指数体系有: 这是相对数分解。(4 4)进行绝对量分解)进行绝对量分解q1p1-q0p0=(q1p1-q0p0)+(q1p1-q0p0)例:例:按下列数据进行因素分解分析数字表明:销售额上升17.14%,是由于销售量上升14.29%,销售价格上升2.5%。从绝对量看:销售额增加7200元,是由于销售量影响增加6000元,销售价格上升影响增加1200元。四、平均
180、指标变动的两因素分析四、平均指标变动的两因素分析(1)可变构成指数;(2)固定构成指数;(3)结构变动影响指数; (4)写出指数体系)写出指数体系 (5)进行绝对量分解进行绝对量分解可变构成指数:可变构成指数:固定构成指数:固定构成指数:结构影响指数:结构影响指数:三种指数之间的关系:三种指数之间的关系:例:例: 某企业职工工资水平变动资料如下:某企业职工工资水平变动资料如下:工资总额工资总额( (元元) )x x0 0 f f0 096000096000038000038000013400001340000合合 计计技术工人技术工人辅助工人辅助工人基期基期x x0 0320032001900
181、1900月工资水平月工资水平( (元元) )报告期报告期x x1 13600360022002200基期基期f f0 0300300200200工人数工人数( (人人) )500500报告期报告期f f1 14004006006001000010000x x1 1 f f1 1144000014400001320000132000027600002760000x x0 0 f f1 11280000128000011400001140000 2420000 2420000分析该企业职工总平均工资的变动。分析该企业职工总平均工资的变动。职工总平均工资变动的可变构成指数:职工总平均工资变动的可变构
182、成指数:职工总平均工资变动的可变构成指数:职工总平均工资变动的可变构成指数:各组工资水平变动的固定构成指数:各组工资水平变动的固定构成指数:职工人数变动的结构影响指数:职工人数变动的结构影响指数:相对分析:相对分析:绝对分析:绝对分析: 计算表明计算表明: : 各组工人工资水平上升使总平均工资增各组工人工资水平上升使总平均工资增加了加了14.05%14.05%,增加了,增加了340340元;各组工人结构变动使总平均元;各组工人结构变动使总平均工资下降了工资下降了9.7%9.7%,减少了,减少了260260元。两者综合使该企业职工元。两者综合使该企业职工总平均工资报告期比基期增加了总平均工资报告
183、期比基期增加了2.99%2.99%,增加了,增加了8080元。元。五、总量指标的多因素分析*分析步骤:分析步骤:*(1 1)进行因素分解)进行因素分解例:原材料费用总额=生产量单位产品原材料消耗量单位原材料价格 = qm p注意:因素分解时,仍要注意量在前,价在后*(2 2)相对数分析)相对数分析 上述指数体系为方便记忆,可以按如下方法记忆:q0m0p0变到q1m1p1,先是q变,m、p不变,即q1m0p0;其次是m变,p不变,即q1m1p0;最后是p变,即q1m1p1。*(3 3)绝对数分析)绝对数分析q1m1p1-q0m0p0=(q1m0p0q0m0p0)+(q1m1p0q1m0p0)+(
184、q1m1p1q1m1p0)例:例:按下列数据进行多因素分析计算一些中间结果计算一些中间结果:q0m0p0=64800,q1m0p0=80000,q1m1p0=80800,q1m1p1=76160。相对数分析相对数分析:117.53%=123.46%101% 94.26%分析数字表明:原材料费用上升17.53%,是由于产量增加影响上升23.46%,单耗增加影响上升1%,原材料单价降低影响下降5.76%。从绝对量看:原材料费用上升11360f元,是由于产量增加影响上升15200元,单耗增加影响上升800元,原材料单价降低影响下降4640元。绝对数分析绝对数分析: 76160-64800=(8000
185、0-64800)+(80800-80000)+ (76160-80800)统计指数的应用一、生产指数二、产品成本指数三、空间价格指数四、居民消费价格指数消费者物价指数(Consumer Price Index),英文缩写为CPI,是反映与居民生活有关的商品及劳务价格统计出来的物价变动指标,通常作为观察通货膨胀水平的重要指标。五、股票价格指数【项目小结】【项目小结】1、统计指数、统计指数简称指数,其涵义有广义与狭义之分。凡是两个指标的对比而得到的统计相对数,从广义上讲都可以称为指数。而狭义的统计指数,则是从一种特定意义上讲的,它是用来综合说明复杂现象总体在数量上总变动程度的一种特殊相对数。2、指
186、数的分类:、指数的分类:指数按其所反映的现象范围不同,分为个体指数与总指数;指数按其总指数的编制方法和计算形式的不同,分为综合指数和平均指数;指数按其所反映的现象特征(或指标性质)的不同,可以分为数量指标指数和质量指标指数;指数按其对比基期的不同,可以分为定基指数和环比指数。3、综合指数、综合指数是总指数的一种表现形式。编制综合指数,首先要解决好两个问题:(1)正确选择同度量因素;(2)选择同度量因素的所属时期。4、平均指数、平均指数是计算总指数的另一种形式,它是在个体指数的基础上计算总指数。可分为加权算术平均指数指数和加权调和平均指数两种基本形式。5、指数体系的概念:、指数体系的概念:由三个
187、或三个以上具有内在联系的指数构成的有一定数量对等关系的整体,叫指数体系。6:因素分析:因素分析:根据指数体系,对社会经济现象总变动中各影响因素的影响进行分析,掌握其影响方向、影响程度及影响所产生的绝对经济效果,这种分析方法称为指数因素分析法。7、因素分析的步骤:(、因素分析的步骤:(1)分析被研究对象及其影响因素;(2)分析各因素指标对被研究对象的影响程度和影响方向;(3)通过编制综合指数,分别从相对数和绝对数的形式分析各因素指标对被分析指标的影响。8、总量指标变动的因素分析:、总量指标变动的因素分析:两因素分析的最关键的是确定同度量因素的时期,一般应遵循的原则是,一个因素指数的同度量因素固定
188、在报告期,则另一个同度量因素指数的同度因素固定在基期。项目七 抽样推断分析n n单元一单元一 认识认识抽样抽样推断推断n n单元单元二二 运用运用参数估计参数估计分析分析n n单元单元三三 确定样本容量确定样本容量n n单元四单元四 EXCEL在抽样推断中的在抽样推断中的应用应用项目七导学项目七导学单元一 认识抽样推断一、抽样推断的含义和特点一、抽样推断的含义和特点(一)抽样推断的含义(一)抽样推断的含义 抽样推断又称抽样推断又称抽样估计抽样估计,是,是按照随机原则按照随机原则,从,从全部研究总体中抽取一部分单位进行调查,并全部研究总体中抽取一部分单位进行调查,并依据依据所获得的数据所获得的数
189、据对总体的某一数量特征做出对总体的某一数量特征做出具有一定具有一定可靠程度可靠程度的估计与推断的估计与推断,从而认识总体的一种统计,从而认识总体的一种统计方法。方法。(二)抽样推断的特点及作用(二)抽样推断的特点及作用Page 3311.1.抽样推断是建立在随机抽样的基抽样推断是建立在随机抽样的基础上础上2.2.抽样推断伴随着一定的误差,但抽样推断伴随着一定的误差,但是误差可以事先计算和加以控制;是误差可以事先计算和加以控制;3.3.抽样推断结果具有一定的可靠程抽样推断结果具有一定的可靠程度(概率估计)度(概率估计)1.1.可以用来了解不能进行全面调查可以用来了解不能进行全面调查现象的资料现象
190、的资料2.2.节省人财物力节省人财物力3.3.可以进行抽检、质量控制可以进行抽检、质量控制4.4.可以对总体参数进行假设检验可以对总体参数进行假设检验二、抽样推断的几个基本概念二、抽样推断的几个基本概念 332(一)总体及样本(一)总体及样本(二)样本容量和(二)样本容量和样本个数样本个数(三)重复抽样和(三)重复抽样和不重复抽样不重复抽样(五)参数与统计量(五)参数与统计量(四)抽样框与抽样单元(四)抽样框与抽样单元(一)总体和样本(一)总体和样本333总体总体 随机样本随机样本(一)总体和样本(一)总体和样本1、总体、总体:又称又称全及总体全及总体,是所要认识的对象的全体,简称总,是所要认
191、识的对象的全体,简称总体,也叫母体。它是调查对象范围内具有某种共同性质或特体,也叫母体。它是调查对象范围内具有某种共同性质或特征的许多单位的集合体。全及总体的单位数通常用征的许多单位的集合体。全及总体的单位数通常用N来表示,来表示,N总是很大的数总是很大的数,所有要进行抽样调查与推断。,所有要进行抽样调查与推断。334n2、样本:、样本:又称又称子样子样或抽样总体。它是从总体中或抽样总体。它是从总体中随机抽取随机抽取出来,出来,代表总体的那部分调查单位的集合体。样本的单位数通常用代表总体的那部分调查单位的集合体。样本的单位数通常用n表示(表示(n也成为样本容量也成为样本容量),),相对相对N来
192、说,来说,n是很小的数是很小的数。思考思考1 1:对于某一研究问题,总体是唯一的,样本唯一对于某一研究问题,总体是唯一的,样本唯一吗?吗?335(二)样本容量和样本可能个数(二)样本容量和样本可能个数 样本容量样本容量:是指一个样本所包含的单位数:是指一个样本所包含的单位数n。样本可能个数样本可能个数:又称样本个数,:又称样本个数, 是在一定的是在一定的抽样抽样方法方法和和样本容量样本容量下从总体抽取的所有可能的样本个下从总体抽取的所有可能的样本个数。数。 一般来说,样本单位数达到或超过一般来说,样本单位数达到或超过3030个称为大样本,而在个称为大样本,而在3030个以下个以下称为小样本。社
193、会经济统计的抽样推断多属于大样本,科学实验的称为小样本。社会经济统计的抽样推断多属于大样本,科学实验的抽样则多属小样本。)抽样则多属小样本。) 全部样本的可能数目和样本容量、抽样方法有关。全部样本的可能数目和样本容量、抽样方法有关。思考思考2 2:从总体单位数:从总体单位数N=100N=100的总体中随机抽取容量为的总体中随机抽取容量为1010的样本,样本可能数目为多少?的样本,样本可能数目为多少?类推类推从从N N中随机抽取容量为中随机抽取容量为n n的样本,样本可能数目的样本,样本可能数目为多少?为多少?(三)重复抽样和不重复抽样(三)重复抽样和不重复抽样1、重复抽样、重复抽样也称重置抽样
194、、放回抽样、回置抽样也称重置抽样、放回抽样、回置抽样。它是指从总体。它是指从总体N N个单位个单位中随机抽取容量为中随机抽取容量为n n的样本时,每次从总体中抽取一个单位,的样本时,每次从总体中抽取一个单位,把结果登记下来后把结果登记下来后重新放回重新放回,再从总体中抽取下一个样本单,再从总体中抽取下一个样本单位。位。在这种抽样方式中,同一单位可能有多次被重复抽取的在这种抽样方式中,同一单位可能有多次被重复抽取的机会。机会。例如例如2、不重复抽样、不重复抽样也也称不重置抽样、不放回抽样、不回置抽样称不重置抽样、不放回抽样、不回置抽样。它是指从总体。它是指从总体N N个单位中随机抽取容量为个单位
195、中随机抽取容量为n n的样本时,每次从总体中抽取一个的样本时,每次从总体中抽取一个单位,单位,不再放回去不再放回去,下一次则从剩下的总体单位中继续进行,下一次则从剩下的总体单位中继续进行抽取,如此反复构成一个样本。抽取,如此反复构成一个样本。就是说,每个总体单位只能就是说,每个总体单位只能被抽取一次,从总体中每抽取一次,总体就少一个单位,因被抽取一次,从总体中每抽取一次,总体就少一个单位,因此,先后抽出来的各个单位被抽中机会是不相等的。此,先后抽出来的各个单位被抽中机会是不相等的。例如例如336重复抽样重复抽样总体有总体有A、B、C、D4个单位,要从中随机抽取个单位,要从中随机抽取2个单位个单
196、位构成样本。可先从构成样本。可先从4个单位中取一个,结果登记后放回,个单位中取一个,结果登记后放回,然后再从相同的然后再从相同的4个中取一个,就构成一个样本。全部可个中取一个,就构成一个样本。全部可能抽取的样本数目为能抽取的样本数目为44=16个。它们是:个。它们是:AA,AB,AC,AD,BA,BB,BC,BD,CA,CB,CC,CD,DA,DB,DC,DD。一般地说,从总体一般地说,从总体N个单位中,随机抽取个单位中,随机抽取n个单位构成样本,则样本可能数目为个单位构成样本,则样本可能数目为 个。个。337不重复抽样不重复抽样前例中,用不重复抽样的方法从中抽两个单位构成样本,前例中,用不重
197、复抽样的方法从中抽两个单位构成样本,则全部可能抽取得样本共有则全部可能抽取得样本共有43=12个,它们是:个,它们是: AB,AC,AD,BA,BC,BD,CA,CB,CD,DA,DB,DC。338一般地讲,从总体一般地讲,从总体N N个单位中,随机不重复抽取个单位中,随机不重复抽取n n个单位个单位构成一样本,则样本可能数目为?构成一样本,则样本可能数目为?由此知:在相同的样本容量的要求下,不重复抽样的样本可由此知:在相同的样本容量的要求下,不重复抽样的样本可能数目比重复抽样为少。在实际工作中,一般能数目比重复抽样为少。在实际工作中,一般多采用不重复多采用不重复抽样抽样,但有些调查如公交车辆
198、乘客情况的调查,商场顾客流,但有些调查如公交车辆乘客情况的调查,商场顾客流量情况的调查只宜用重复抽样。量情况的调查只宜用重复抽样。N(N1)(N2)(Nn+1) 个。个。339(四)抽样框和抽样单元(四)抽样框和抽样单元抽样框抽样框:又称抽样结构,是指对可以选为样本的:又称抽样结构,是指对可以选为样本的总体单位列出名册或排序编号,以确定总体的抽总体单位列出名册或排序编号,以确定总体的抽样范围和结构。样范围和结构。抽样单元:抽样单元:构成抽样框的单元称为抽样单元。构成抽样框的单元称为抽样单元。 抽样时,抽取的不是具体的总体中某个单元,而是抽抽样时,抽取的不是具体的总体中某个单元,而是抽取它的编号
199、,我们是从抽样框中进行抽取的,因此取它的编号,我们是从抽样框中进行抽取的,因此 1)抽样框必须是有有序的编号;)抽样框必须是有有序的编号; 2)抽样框中的抽样单元必须)抽样框中的抽样单元必须“不重不漏不重不漏”(五)参数和统计量(五)参数和统计量参数参数:反映:反映总体数量特征的指标总体数量特征的指标称为参数。也叫称为参数。也叫总体指标总体指标或母体参数或母体参数。由于全及总体是唯一确定的,所以根据全及。由于全及总体是唯一确定的,所以根据全及总体计算的全及指标也是唯一确定的。总体计算的全及指标也是唯一确定的。抽统计量:又称为抽样指标,抽统计量:又称为抽样指标,由样本总体各单位标志值或由样本总体
200、各单位标志值或标志特征计算的,反映样本数量特征的综合指标。它是用标志特征计算的,反映样本数量特征的综合指标。它是用来估计全体指标的。来估计全体指标的。 340在一个调查总体中,参数是唯一确定的量,是一个未知在一个调查总体中,参数是唯一确定的量,是一个未知量;是需要通过样本指标(统计量)来推断的。量;是需要通过样本指标(统计量)来推断的。 常用的参数有总体平均值、总体方差、标志差、总常用的参数有总体平均值、总体方差、标志差、总体成数、总体成数方差、总体成数标准差。体成数、总体成数方差、总体成数标准差。 用相应的小写字母表示与总体对应的统计量。用相应的小写字母表示与总体对应的统计量。参数和统计量的
201、计算公式 341变变量量总总体体总体平均数总体标准差 总体方差参数(总体指标)参数(总体指标) 统计量(样本指标)统计量(样本指标) 参数和统计量的相关公式342属属性性总总体体总体成数总体成数标准差 总体成数方差参数(总体指标)参数(总体指标) 统计量统计量三、三、几种基本的抽样方式几种基本的抽样方式3431.简单随机抽样简单随机抽样2.分层抽样分层抽样3.等距抽样等距抽样4.整群抽样整群抽样四、抽样误差及抽样误差的可靠程度四、抽样误差及抽样误差的可靠程度(一)抽样误差(一)抽样误差u抽样误差抽样误差是抽样推断产生的误差,是样本指标与总体是抽样推断产生的误差,是样本指标与总体指标之间的离差。
202、指标之间的离差。样本平均数与总体平均数的绝对离差(即样本平均数与总体平均数的绝对离差(即 ););样本成数与总体成数的绝对离差(即样本成数与总体成数的绝对离差(即 )。)。抽样误差的大小受什么影响?抽样误差的大小受什么影响?思考:抽样误差越大越好还是越小越好?思考:抽样误差越大越好还是越小越好?影响抽样误差的因素1.样本容量大小;2.总体各单位标志值的差异程度;3.抽样的方法;4.抽样调查的组织形式。 差异越大,抽样误差越大单位数越多,抽样误差越小重复抽样的抽样误差比不重复抽样的大简单随机抽样的抽样误差最大346(二)抽样平均误差(二)抽样平均误差 是反映抽样误差的一般水平(平均数);通常是反
203、映抽样误差的一般水平(平均数);通常用样本平均数(或样本成数)的标准差来表示,用样本平均数(或样本成数)的标准差来表示,用符号用符号 表示。表示。 因为抽样有重复抽样和不重复抽样,所以因为抽样有重复抽样和不重复抽样,所以抽样平均误差分两种:抽样平均误差分两种:347样本平均数的抽样平均误差例题:样本平均数的抽样平均误差例题:某工厂有1500个工人,用简单随机重复抽样的方法抽出50个工人作为样本,调查其工资水平资料如下月平均工资月平均工资524524534534540540550550560560580580600600660660工人数工人数4 46 69 910108 86 64 43 3计
204、算样本平均数和抽样平均误差解:先列表解:先列表 xfxf5244209612965184534632046764056540948604003600550105500100100056084480005806348040024006004240016006400660319801000030000502800052640计算平均数即平均工资:样本成数的抽样平均误差例题:某钢铁厂生产某种钢管,现从该厂某月生产的500根产品中抽取一个容量为100根的样本。已知一级品率为60%,试求样本一级品率的抽样平均误差。解:已知p=60% 、n=100、N=500(三)抽样(三)抽样极限误差(抽样允许误差)极
205、限误差(抽样允许误差) 抽样极限误差抽样极限误差是指样本指标和总体参数之间抽样误差可是指样本指标和总体参数之间抽样误差可 能的最大范围。用符号能的最大范围。用符号 表示。表示。352353抽样极限误差通常需要以抽样极限误差通常需要以抽样平均误差为标准单位抽样平均误差为标准单位来来衡量。抽样极限误差衡量。抽样极限误差 除以抽样平均误差除以抽样平均误差 得相对数得相对数t.t是测量估计可靠程度的一个参数,称为是测量估计可靠程度的一个参数,称为抽样估计的概抽样估计的概率度率度。 (四)抽样误差的概率度(四)抽样误差的概率度t t这个公式表明,在抽样平均误差一定的条件下,概率度t越大,则抽样误差范围
206、越大,反之t越小,抽样误差范围 越小。354我们可以计算抽样统计量和总体参数的误差不超过一定区间范围(置信区间)内的概率,这种概率就称之为抽样估计的可靠程度,也称为置信度(即总体参数落在一定区间范围的概率把握程度)。用P表示,它是概率度t的函数(P=F(t)。在实际应用中,我们所研究的总体大部分为正态总体,根据在实际应用中,我们所研究的总体大部分为正态总体,根据“正态分正态分布概率表布概率表”,已知概率度,已知概率度t可查得相应的可查得相应的概率保证程度概率保证程度F(t);相反,已;相反,已知概率保证程度知概率保证程度F(t)也可查得相应的概率度也可查得相应的概率度t。现将几个常用的对应数。
207、现将几个常用的对应数值列于下表。值列于下表。概率度t 概率F(t) (%) 1.002.003.001.641.962.58 68.2795.4599.7390.0095.0099.00 (五)抽样估计的可靠程度(五)抽样估计的可靠程度F F(t t)常用概率度与概率保证度表常用概率度与概率保证度表 从抽样极限误差的计算公式看,极限误差从抽样极限误差的计算公式看,极限误差 与概与概率度率度t和抽样平均误差和抽样平均误差 三者之间存在如下关系:三者之间存在如下关系:1、在、在 保持不变的情况下,增大保持不变的情况下,增大t值,把握程度值,把握程度P相应增加,误差范围相应增加,误差范围 也随之扩大
208、,这时估计的也随之扩大,这时估计的精确度精确度 将降低;反之,要提高估计的精确度,将降低;反之,要提高估计的精确度,就得缩就得缩t值,此时把握程度也会相应降低。值,此时把握程度也会相应降低。2、在、在t保持不变的情况下,抽样平均误差保持不变的情况下,抽样平均误差 小,小,则误差范围就小,估计的精确度就高;反之,抽则误差范围就小,估计的精确度就高;反之,抽样平均误差样平均误差 大,误差范围大,误差范围 就大,估计的精确就大,估计的精确度就低。度就低。355抽样估计的可靠程度大,抽样极限误差大,估计的精度低;抽样估计的可靠程度大,抽样极限误差大,估计的精度低;抽样估计的可靠程度小,抽样极限误差小,
209、估计的精度高;抽样估计的可靠程度小,抽样极限误差小,估计的精度高;3561样本容量样本容量n。在其他条件不变的情况下,样本容量越大,抽样误差则越小。当样本容量大到等于总体单位数N时,则统计量和总体参数完全重合;反之,样本容量愈小,抽样误差愈大。2总体标志的变异程度总体标志的变异程度 。总体标志变动程度越大,抽样误差就越大,反之,总体标志变化程度越小,则抽样误差越小。3抽样的组织方式和抽样方法。抽样的组织方式和抽样方法。在相同条件下,重复抽样的误差大于不重复抽样的误差。(六)影响抽样误差的因素(六)影响抽样误差的因素单元二 运用参数估计分析一、点估计一、点估计 点点估估计计是以样本统计量的取值直
210、接作为总体参数的估计值的一种估计方法。如:用样本均值 直接作为总体均值 的估计值,用样本方差 作为总体方差 的估计值,用样本乘数 作为总体成数 的估计值等等。即有点估计的基本公式:u点估计的特点:点估计的特点:1)优点是简便易行,原理直观,常为实际工作采用。2)不足之处是没有表明抽样估计的误差,更没有表明误差在一定范围内的概率保证程度有多大。359二、区间估计二、区间估计u区间估计区间估计 区间估计区间估计是依照一定的概率保证程度,用样本估计值是依照一定的概率保证程度,用样本估计值估计总体参数一个区间范围的方法。估计总体参数一个区间范围的方法。u区间估计与点估计的区别:区间估计与点估计的区别:
211、1)点估计是一个确切的估计值,而区间估计是区间范围,根据概率度的要求区间范围可宽可窄;2)点估计无法回答估计值落在某区间的概率保证程度,而区间估计可以回答待估参数落在估计区间的把握程度。 360二、区间估计二、区间估计(一)总体平均数的估计区间(置信区间)(二)总体成数的估计区间(置信区间)361(一)总体平均数的估计区间(置信区间)(一)总体平均数的估计区间(置信区间)1正正态总体、体、总体方差体方差 已知或者非正已知或者非正态总体、大体、大样本本时总体均体均值的区的区间估估计当总体服从正态分布,且总体方差已知,或者总体是非正态总体但抽选的样本为大样本(n=30)时,可以证明抽选自总体的样本
212、的样本均值服从均值为 ,方差为 的正态分布在显著性水平a下,总体均值 在1-a 的置信度下的置信区间为:(1)若抽样方式为不重复抽样,则上述情况总体均值的置信区间为:(2)若总体方差 未知,可以用样本方差 代替:362(一)总体平均数的估计区间(置信区间)(一)总体平均数的估计区间(置信区间)2正正态总体、体、总体方差体方差 未知,小未知,小样本本时总体均体均值的区的区间估估计当总体服从正态分布,且总体方差未知,且样本为小样本时,用样本方差 代替。此时新的统计量是服从自由度为n-1的t分布,记为 : 在显著性水平a下,总体均值 在1-a 的置信度下的置信区间为:(1)若抽样方式为不重复抽样,则
213、上述情况总体均值的置信区间为:(2)若总体方差 未知,可以用样本方差 代替:例例 :总体均值的区间估计:总体均值的区间估计要估计S乡粮食亩产量和总产量,从该乡1万亩粮食作物中抽取200亩,求得其平均亩产量为400公斤。如果确定抽样极限误差为5公斤,试估计该乡粮食平均亩产量和总产量的置信区间。所以该乡粮食平均亩产量的区间落在4005公斤的范围内,即在395405公斤之间。粮食总产量在10000(4005)公斤,即在395405万公斤之间例例 对一批某型号的电子元件进行耐用性能检查,按重复对一批某型号的电子元件进行耐用性能检查,按重复随机抽样的资料分组列表如下,要求估计耐用时数的允许随机抽样的资料
214、分组列表如下,要求估计耐用时数的允许误差范围误差范围=10.5小时,试估计该批电子元件的平均耐用时小时,试估计该批电子元件的平均耐用时数(见下表)。数(见下表)。耐用时数 组中值 抽样检查结果(只) 900以下9009509501000100010501050110011001150115012001200以上 87592597510251075112511751225 1263543931合计 100364第一步第一步,计算,计算第二步第二步,根据给定的,根据给定的 =10.5小时,计算总体平均数的上下小时,计算总体平均数的上下限:限:下限下限= =1055.510.5=1045(小时)(小
215、时)上限上限= =1055.5+10.5=1066(小时)(小时)365第三步第三步,根据,根据 , 查正态分布概率表得查正态分布概率表得概率概率F(t)=95.66%。(。(可靠程度可靠程度)推断的结论是:以推断的结论是:以95.66%的概率保证程度,的概率保证程度,估计该批电子元件的耐用时数在估计该批电子元件的耐用时数在10451066小时之间。小时之间。366367(二)总体成数的区间估计(置信区间)(二)总体成数的区间估计(置信区间)在大样本情况(在大样本情况(np5,n(1-p)5)下,根据中心极限定理可以证明样本乘数近似服)下,根据中心极限定理可以证明样本乘数近似服从正态分布。即从
216、正态分布。即与样本均值的区间估计一样,在显著性水平在显著性水平a下,总体成数P在1-a 的置信度下的置信区间为:例例5:总体成数的区间估计要估计某高校10000名在校生的近视率,现随机从中抽取400名,计算的近视率为80,如果确定允许误差范围为4,试估计该高校在校生近视率所在的置信区间。该校学生近视率的区间落在804的范围内,即在7684之间。 某灯泡厂某月生产5000000个灯泡,在进行质量检查中,随机抽取500个进行检验,检查500个灯泡中不合格产品占0.4%,试在0.6827概率保证下,估计全部产品中不合格率的取值范围。例例6: p=0.4%概率保证程度为概率保证程度为0.6827时,时
217、,t=1该批灯泡的不合格率取值范围在0.12%0.68%之间。单元三 确定样本容量Page 3721. 1.在一定的抽样允许误差条件下,在一定的抽样允许误差条件下,样本容量太大,则会增大工作量,样本容量太大,则会增大工作量,造成人力、财力和时间的浪费。造成人力、财力和时间的浪费。2. 2.样本容量太小,会导致抽样误样本容量太小,会导致抽样误差增大,抽样的准确程度得不得差增大,抽样的准确程度得不得保证。保证。抽样推断时,样抽样推断时,样本容量为多大合本容量为多大合适?适?(一)平均数样本容量的确定(一)平均数样本容量的确定1. 1.对于重复抽样:对于重复抽样:2. 2.对于不重复抽样:对于不重复
218、抽样:由于由于由于由于(二)成数样本容量的确定(二)成数样本容量的确定1. 1.对于重复抽样:对于重复抽样:2. 2.对于不重复抽样:对于不重复抽样:由于由于由于由于练习2:对某批成品按重复抽样方法抽选200件检查,其中废品8件,又知样本容量为成品总量的(120)。以95的把握程度估计该批成品的废品率范围。 练习3:从全校近万名学生中,随机抽取一部分学生测得其平均身高160厘米。根据以往经验学生身高的标准差为3厘米,现要求抽样允许误差最大不超过0.6厘米,则至少应抽多少学生(重复抽样)? 练习4:某电子元件厂日产10000只元件,经多次一般测试一等品率为92%,现拟采用随机抽样方式进行抽检,如
219、要求误差范围在2%之内,可靠程度95.45%,试求需要抽取多少只电子元件?单元四 EXCEL在抽样推断中的应用377一、一、EXCEL在抽取样本中的应用在抽取样本中的应用第一步,对第一步,对总体编号,即编制抽样框;总体编号,即编制抽样框;第二步,将编号输入第二步,将编号输入Excel中建立数据库;中建立数据库;第三步,单击第三步,单击“数据数据”菜单,选择菜单,选择“数据分析数据分析”选项卡,在选项卡,在“数据分析数据分析”对话框中的对话框中的“分析工具分析工具”列表中选择列表中选择“抽样抽样”,点击,点击“确定确定”,打开,打开“抽样抽样”对话框。对话框。在“输入区域”中输入编号所在的单元格
220、地址,在“样本数”文本框中输入样本量n,在“输出区域”中输入单元格如U1。第四步,第四步,单击“确定”,即可得到随机抽取的样本编号。第五步,第五步,根据样本编号整理对应的样本。二、二、Excel在抽样极限误差计算中的应用在抽样极限误差计算中的应用一、一、利用利用“CONFIDENCECONFIDENCE”函数计算允许误差(极限误差)函数计算允许误差(极限误差)该函数适用于大样本数据。插入函数统计选“CONFIDENCE”设置“CONFIDENCE”对话框,其中ALPHA框中输入a值,即1-置信度”得出允许误差(二)利用(二)利用“NORMSINVNORMSINV”( (正态正态) )、“TIN
221、VTINV”(t t分布、小样本)函分布、小样本)函数先计算概率度,然后计算允许误差(极限误差)数先计算概率度,然后计算允许误差(极限误差)插入函数统计选择“NORM.S.INV”函数 “NORM.S.INV”对话框。插入函数统计选择“T.INV.2T”函数“T.INV.2T”对话框。第二步:在对话框中的“Probability”文本框中输入“显著性水平/2”,单击确定按钮,计算概率度, 然后根据公式计算抽样极限误差。379三、三、EXCEL在区间估计中的应用在区间估计中的应用在EXCEL中,对总体均值和总体成数的区间估计主要使用“CONFIDENCE”函数、“NORMSINV”、“TINV”
222、函数。一、总体均值的区间估计一、总体均值的区间估计(一)利用(一)利用“CONFIDENCECONFIDENCE”函数计算允许误差(极限误差)函数计算允许误差(极限误差)该函数适用于大样本数据。插入函数统计选“CONFIDENCE”设置“CONFIDENCE”对话框其中ALPHA框中输入a值,即1-置信度”得出允许误差(二)利用(二)利用“NORMSINVNORMSINV”( (正态正态) )、“TINVTINV”(t t分布)函数计算概分布)函数计算概率度,然后计算允许误差(极限误差)率度,然后计算允许误差(极限误差)380【项目小结】【项目小结】1、抽样推断。抽样推断是按照随机原则,从全部
223、研究总体中抽取一部分单位进行调查,并依据抽样调查所获得的数据对总体的某一数量特征(总体参数)做出具有一定可靠程度的估计与推断的一种统计分析方法。2、几种基本的抽样方式。抽样有概率抽样和非概率抽样,关于概率抽样(主要采用的抽样方式)又分为简单随机抽样、分层抽样、等距抽样、整群抽样。3、抽样误差。抽样误差是样本的统计量与总体的参数之间存在的差距。抽样误差不是由人为因素造成的登记性误差,而是进行抽样调查时所固有的误差。4、抽样平均误差(Averageerrorofsampling)是所有可能样本的统计量与相应的总体参数的平均离差,通常用符号来表示。 表示样本平均数的抽样平均误差; 表示样本成数的抽样
224、平均误差。5、抽样极限误差。是以一定的可靠程度(P=F(t)保证抽样误差不超过某一给定的范围。6、参数估计:点估计、区间估计7、样本容量。平均数的必要样本容量:重复抽样 不重复抽样成数的必要样本容量;重复抽样 不重复抽样项目八 相关分析与回归分析 项目八 相关分析与回归分析n n单元一单元一 相关分析相关分析n n单元单元二二 一一元线性回归分析元线性回归分析n n单元单元三三 一一元线性回归元线性回归预测预测n n单元四单元四 Excel在相关与回归分析中的在相关与回归分析中的应用应用项目八导学项目八导学单元一 相关分析(一) 相关关系 它它反映着现象间确实存在依存关系,但数量关系上不反映着
225、现象间确实存在依存关系,但数量关系上不严格确定的依存关系称为相关关系。,这种关系有二个明严格确定的依存关系称为相关关系。,这种关系有二个明显特点:显特点:1.1.现现象之间确实存在数量象之间确实存在数量上的依存关系,即某一社会上的依存关系,即某一社会经济现象变化要引起另一社经济现象变化要引起另一社会经济现象的变化;会经济现象的变化;2.2.现现象之间的这种依存关系象之间的这种依存关系是不严格的,即无法用数学是不严格的,即无法用数学公式准确表示。公式准确表示。x xy y 若现象间的这种不严格的依存关系近似于一种直线关系,若现象间的这种不严格的依存关系近似于一种直线关系,则其相关关系的图示如右。
226、则其相关关系的图示如右。一、相关关系与函数关系一、相关关系与函数关系相关关系的例子商品的消费量(y)与居民收入(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温度(x3)之间的关系收入水平(y)与受教育程度(x)之间的关系父亲身高(y)与子女身高(x)之间的关系商品消费量与居民收入之间,当居民收商品消费量与居民收入之间,当居民收入发生变动,商品消费量也会随之发生变动。入发生变动,商品消费量也会随之发生变动。所以,居民收入为自变量所以,居民收入为自变量X X,而商品消费量为,而商品消费量为因变量因变量Y Y。 在在具有相互依存关系
227、的两个变量中,作为具有相互依存关系的两个变量中,作为根据的变量称自变量,一般用根据的变量称自变量,一般用X X表示;发生对表示;发生对应变化的变量称因变量,一般用应变化的变量称因变量,一般用y y表示。表示。如如一般地一般地 ( (二二) ) 函数关系函数关系 它它反映着现象之间存在着严反映着现象之间存在着严格的依存关系,也就是具有确格的依存关系,也就是具有确定性的对应关系,这种关系可定性的对应关系,这种关系可用一个数学表达式反映出来。用一个数学表达式反映出来。 若两个现象若两个现象x x、y y有严格的直有严格的直线依存关系,则其函数关系还线依存关系,则其函数关系还可用右图表示。可用右图表示
228、。x xy y函数关系的例子某种商品的销售额某种商品的销售额( (y y) )与销售量与销售量( (x x) )之间的关系之间的关系可表示为可表示为 y y = = p x p x ( (p p 为单价为单价) )圆的面积圆的面积(S)(S)与半径之间的关系可表示为与半径之间的关系可表示为S S = = R2 R2 企业的原材料消耗额企业的原材料消耗额( (y y) )与产量与产量( (x x1) 1) 、单位产、单位产量消耗量消耗( (x x2) 2) 、原材料价格、原材料价格( (x x3)3)之间的关系可之间的关系可表示为表示为y y = = x x1 1 x x2 2 x x3 3 (
229、 (三三) ) 相关关系与函数关系的区别和联系相关关系与函数关系的区别和联系相同点:相同点:两者都是现象之间确实存在依存关系。不同点:不同点:(1)函数关系现象之间的关系是确定的,而相关关系现象之间的依存关系则是不确定;(2)函数关系变量之间的依存可用一定的方程y=f(x)表示出来,而相关关系变量之间则不能用一定的方程表示。(3)相关关系中变量关系是对等的,函数关系中有自变量X和因变量Y之分。1.按相关关系涉及的因素多少来分,可分为: 单相关和复相关。 在实际工作中,如存在多个自变量,可抓住其在实际工作中,如存在多个自变量,可抓住其中主要的自变量,研究其相关关系,而保持另一些中主要的自变量,研
230、究其相关关系,而保持另一些因素不变,这时复相关可转化为因素不变,这时复相关可转化为偏相关偏相关。单相关单相关,即只涉及一个自变量和一个因变量。,即只涉及一个自变量和一个因变量。复相关,复相关,三个或三个以上因素的相关关系,即三个或三个以上因素的相关关系,即涉及二个或二个以上的自变量和因变量。涉及二个或二个以上的自变量和因变量。二、相关关系的种类二、相关关系的种类 2.按相关关系的性质来分,可分为:正相关和负相关正相关正相关是指两相关现象变化的方向是一致的。是指两相关现象变化的方向是一致的。负相关负相关是指两相关现象变化的方向是相反的。是指两相关现象变化的方向是相反的。3. 按相关关系的形式来分
231、,分为:直线相关和曲线相关直线相关直线相关是指两个相关现象之间,当自变量是指两个相关现象之间,当自变量X X的数的数值发生变动时,因变量值发生变动时,因变量y y随之发生近似于固定比例的变动,随之发生近似于固定比例的变动,在相关图上的散点近似地表现为直线形式,因此称其为在相关图上的散点近似地表现为直线形式,因此称其为直线相关关系。直线相关关系。曲线相关曲线相关是指两个相关现象之间,当自变量是指两个相关现象之间,当自变量X X的数的数值发生变动时,因变量值发生变动时,因变量y y也随之发生变动,但这种变动在也随之发生变动,但这种变动在数值上不成固定比例,在相关图上的散点可表现为抛物数值上不成固定
232、比例,在相关图上的散点可表现为抛物线、指数曲线、双曲线等形式,因此称其为曲线相关关线、指数曲线、双曲线等形式,因此称其为曲线相关关系。系。4. 按相关程度分,分为:完全相关、不完全相关和不相关 完全相关完全相关就是相关现象之间的关系是完全确定就是相关现象之间的关系是完全确定的关系,因而完全相关关系就是函数关系。的关系,因而完全相关关系就是函数关系。 不相关不相关是指两现象之间在数量上的变化上各自是指两现象之间在数量上的变化上各自独立,互不影响。独立,互不影响。 不完全相关不完全相关就是介于完全相关和不相关之间的就是介于完全相关和不相关之间的一种相关关系。相关分析的对象主要是不完全相关一种相关关
233、系。相关分析的对象主要是不完全相关关系。关系。不相关不相关不相关不相关不相关不相关 负线性相关负线性相关负线性相关负线性相关负线性相关负线性相关正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关(一)相关表 将自变量x的数值按照从小到大的顺序,并配合因变量y的数值一一对应而平行排列的表。四、相关关系的判断四、相关关系的判断简单相关表简单相关表分组相关表分组相关
234、表单变量分组相关表单变量分组相关表双变量分组相关表双变量分组相关表 又称散点图。将x置于横轴上,y置于纵轴上,将(x,y)绘于坐标图上。用来反映两变量之间相关关系的图形。 当有三个变量存在相关关系时,如何用相关图表示呢?(二)相关图(二)相关图 例例1 1:简单相关表和相关图:简单相关表和相关图 例例2 2 相关图相关图 相相关系数是在直线相关条件下,表明两关系数是在直线相关条件下,表明两个现象之间相关关系的方向和密切程度的综个现象之间相关关系的方向和密切程度的综合性指标。合性指标。一般用样本数据计算,记为一般用样本数据计算,记为r r;若;若用总体全部数据计算,则称为总体相关系数,用总体全部
235、数据计算,则称为总体相关系数,记为记为 。(三)相关系数(三)相关系数 1、相关系数、相关系数r的计算方法的计算方法简化后为:2、相关系数计算结果的分析及应用相关系数计算结果的分析及应用(1) (1) r r取正值或负值决定于分子协方差;取正值或负值决定于分子协方差;(2) (2) r r的绝对值,在的绝对值,在0 0与与1 1之间;之间;(3) (3) r r的绝对值大小,可说明现象之间相关关系的紧的绝对值大小,可说明现象之间相关关系的紧密程度。密程度。-1.0+1.00-0.5+0.5完全负相关完全负相关无线性相关无线性相关完全正相关完全正相关负相关程度增加负相关程度增加r正相关程度增加正
236、相关程度增加对现象之间相互关系及其相互关系密切程度的研究称为相关分析.(一)相关分析的内容(一)相关分析的内容1 1确定现象之间有无相关关系。确定现象之间有无相关关系。判断现象间是否存在着依存关系是相关分析的起始点。有相互依存关系,才有必要采用相关分析方法去研究。2 2确定相关关系的表现形式。确定相关关系的表现形式。只有判明了现象相关关系的具体表现形式后,才能运用相应的相关分析方法去进步研究相关的程度。3 3判定相关关系的密切程度和方向。判定相关关系的密切程度和方向。从现象之间不严格的数量关系中判定其相关关系的密切程度和方向。(二)相关分析的特点(二)相关分析的特点 在相关分析中,所涉及的变量
237、关系对等,即在相关分析中,不必定出哪个变量是自变量x,哪个变量是因变量Y,可以根据具体情况,进行统计函数的设定。四、相关分析的内容及特点四、相关分析的内容及特点单元二 一元线性回归分析在在回归分析中,两个变量之间的回归称回归分析中,两个变量之间的回归称为简单回归,两个以上变量之间的回归称为为简单回归,两个以上变量之间的回归称为复回归。无论是简单回归还是复回归,数学复回归。无论是简单回归还是复回归,数学模型均有线性模型均有线性( (直线直线) )回归和非线性回归和非线性( (曲线曲线) )回回归之分。归之分。回归分析回归分析是对具有相关关系的现象,运用一个数学模型(回归方程)近似地表示变量之间的
238、一般关系或平均变化关系,并近似地进行估算和预测的一种统计分析方法。回归分析的特点:回归分析的特点:1)回归分析中两变量是非对等关系,一个是自变量,一个是因变量。必须根据研究目的确定哪个是自变量,哪个是因变量。2)回归方程不是抽象的数学模型,而是用给定自变量数值推算因变量值的根据,反映变量之间关系的一般变动情况。 3)因变量y是随机变量,自变量x是可控的非随机变量。4)回归分析中回归方程反映的是变量间的变动关系,回归系数可正可负,正、负表示相关方向。而相关分析反映的是变量间的密切关系。一、一、回归分析回归分析回归分析的具体内容包括:回归分析的具体内容包括:确定现象之间相关关系的数学表达模型进行回
239、归方程的显著性检验和测定估计标准误差运用回归方程进行预测一、一、回归分析回归分析一、简单直线回归方程的一般形式为:一、简单直线回归方程的一般形式为: y yc c=a+bx=a+bx y yc c 因变量的估计值;因变量的估计值; x x 自变量;自变量; a a 回归直线在回归直线在y y轴上的截距;轴上的截距; b b 回归直线的斜率,称回归系数回归直线的斜率,称回归系数, ,表明表明x x每增加每增加 一个单位,因变量一个单位,因变量y yc c的的平均变化值平均变化值 b0b0,x x与与y y为正相关为正相关 b0b0,x x与与y y为负相关为负相关(二)回归分析与相关分析的区别与
240、联系(二)回归分析与相关分析的区别与联系1.区别区别回归分析所研究的两个变量是非对等关系,必须根据研究目的,先确定其中一个是自变量,另一个是因变量;相关分析所研究的两个变量是对等关系。对两个变量x和y来说,回归分析中,对互有因果关系的变量,根据研究目的的不同可以建立两个不同的回归方程。以x为自变量,y为因变量,可以得出x对y的回归方程;以y为自变量,x为因变量,可得出y对x的回归方程;相关分析只能计算出一个反映两个变量间相关密切程度的相关系数,x和y的位置不影响相关系数。回归分析对资料的要求是:自变量是可以控制的变量或给定的变量,而因变量是随机变量;相关分析对资料的要求是:两个变量必须都是随机
241、变量。2.联系联系相关分析是回归分析的基础和前提,如果缺少相关分析,没有说明现象间是否具有相关关系,没有对相关关系的密切程度做出判断,就不能进行回归分析,即便进行了回归分析,其回归方程的代表性也是值得质疑的。回归分析是相关分析的深入和继续。一、一、回归分析回归分析回归分析的种类回归分析的种类一元回归一元回归(简单回归)(简单回归)多元回归多元回归(复回归)(复回归)线性回归线性回归非线性回归非线性回归一元线性回归SimpleLinearregression按自变量的按自变量的 多少分多少分按回归曲线的形态分按回归曲线的形态分一元线性回归分析是用直线方程表明两个变量之间的变动关系,并进行估计推算
242、的分析方法。也称为简单线性回归分析。是一般回归分析的基础。(一)一元线性回归分析的条件(一)一元线性回归分析的条件1)现象之间确实存在数量上的相互依存关系2)现象之间的一依存关系是线性关系,这种关系可以通过绘制相关图来判断3)具备一组因变量与自变量的对应资料,且明确哪个是因变量哪个是自变量。二、一元线性回归分析(简单线性回归分析)二、一元线性回归分析(简单线性回归分析)(二)一元线性回归方程的建立(二)一元线性回归方程的建立 对于具有线性关系条件的两个变量对于具有线性关系条件的两个变量y y与与x x,可以建立一元线性回归方程:,可以建立一元线性回归方程:yc是根据回归方程推算出来的因变量的理
243、论值,是实际值y的平均值;a 称为回归直线的截距,表示在没有自变量x的影响时,其它各种因素对因变量y的平均影响;回归系数b 表明自变量x每变动一个单位,因变量y平均变动b个单位。一元线性回归方程的几何意义一元线性回归方程的几何意义截距斜率一元线性回归方程的可能形态b为正b为负b为0(三)一元线性回归方程中参数a、b的确定:最小平方法基本数学要求:整理得:思考:回归系数b与相关系数r的关系如何?【例例2 2】建立年广告费用和销售收入的线性回归方程建立年广告费用和销售收入的线性回归方程年度年度20102010201120112012201220132013201420142015201520162
244、016201720172018201820192019销售收入销售收入y y(万元)(万元)5050515152525353535354545555565656565757广告费用广告费用x x(万元)(万元)2 22 23 34 45 56 66 66 67 78 8解:解:先绘制散点图观察销售收入与年广告费用之间是否存在线性相关关系。 设线性回归方程为yc=a+bx 计算a、b的值,下面列表计算年度年度销售收入销售收入y y广告费用广告费用x xx x2 2y y2 2xyxy2010201050502 24 4250025001001002011201151512 24 42601260
245、11021022012201252523 39 9270427041561562013201353534 41616280928092122122014201453535 52525280928092652652015201554546 63636291629163243242016201655556 63636302530253303302017201756566 63636313631363363362018201856567 74949313631363923922019201957578 8646432493249399399合计合计53753748482642642888528885
246、26162616即即线性回归方程为:线性回归方程为:计算结果表明,在其他条件不变时,年广告费用每增加计算结果表明,在其他条件不变时,年广告费用每增加1 1万元,销售收入增加万元,销售收入增加1.14291.1429万元。万元。由y2计算估计标准误在建立了回归方程后,就可以利用回归方程由给定的自变量值估计因变量的理论值(估计值) yc=a+bx。而因变量的实际值y与理论值yc有差距,这就需要测定估计值的准确性问题。实际值y与理论值yc之差称为残残差、估计误差。度量观测值与估计值离差的一般水平用差、估计误差。度量观测值与估计值离差的一般水平用估计标准误差。估计标准误差。 估计标准误差(s)是观察值
247、与估计值之间的标准差;是衡量回归直线代表性的统计指标;是反映观测值围绕回归直线的分散程度。估计标准误越小,说明估估计标准误越小,说明估计值的代表性越好、回归方程的拟合度较好。计值的代表性越好、回归方程的拟合度较好。四、一元回归模型的估计标准误四、一元回归模型的估计标准误估计标准误差的计算公式单元三 一元线性回归预测在不考虑估计误差的条件下,进行一元线性回归预测,显得比较简单。根据元线性回归方程ycabx进行预测,其预测值为yc0abx0。x0为给定x具体数值,yc0是当xx0时y的预测值,通常也称点估计或点预测。一、一、点预测点预测1)一般来说,在大样本时(即n30时),且x0不远离时,则可以
248、根据正态分布进行预测,在给定置信度下,预测区间为:二二、区间预测区间预测2)在小样本情况下,采用t分布进行预测。当给定置信概率(即可靠度)时,y0预测区间为:单元四 Excel在相关与回归分析中的应用(一)相关图的绘制(一)相关图的绘制“插入”菜单,选择“图表”选项卡中的“散点图”。(二)相关系数的计算(二)相关系数的计算1.利用CORREL函数计算相关系数2.利用数据/数据分析工具计算相关系数一、一、Excel在相关分析中的应用在相关分析中的应用单击单击“数据数据”菜单,选择菜单,选择“数据分析数据分析”选项卡,在选项卡,在“数据数据分析分析”对话框中的对话框中的“分析工具分析工具”列表中选
249、择列表中选择“回归回归”,点击,点击“确定确定”,打开,打开“回归回归”对话框。对话框。二二、Excel在回归方程建立及检验中的应用在回归方程建立及检验中的应用项目小目小结1、相关关系。、相关关系。客观现象间确实存在依存关系,但数量关系上不严格确定的依存关系称为相关关系。相关分析有定性和定量两种分析方法。定性分析一般可以通过编制相关表、绘制相关图来进行。定量分析是在定性分析的基础上,通过计算相关系数与判定系数、构建数学模型等方法来进行。2、相关关系的种类:、相关关系的种类:(1)按研究变量的个数多少,可以分成单相关和复相关;(2)按相关的密切程度,可以分成完全相关、不完全相关和不相关;(3)按
250、变量变化的方向,可以分成正相关和负相关;(4)按变量之间依存关系的形式,可以分成线性相关和非线性相关。3、相关系数、相关系数r。取值范围为:-1r1。正负说明现象之间是正相关还是负相关。r的绝对值越接近于1,表明线性相关关系越密切;r0,表明两变量无线性相关关系;r1或r1,表明两现象完全线性相关,即函数关系。4、回、回归归分析。分析。回归分析是对具有相关关系的现象,运用一个数学模型(回归方程)近似地表示变量之间的一般关系或平均变化关系,并近似地进行估算和预测的一种统计分析方法。回归分析中一个是自变量,一个是因变量;因变量y是随机变量,自变量x是可控的非随机变量。5、一元、一元线线性回性回归归分析。分析。一元线性回归分析是用直线方程表明两个变量之间的变动关系,并进行估计推算的分析方法。一元线性回归模型:6、一元线性回归预测。、一元线性回归预测。建立回归模型的目的之一是进行预测,所谓预测,就是当自变量x取一个值x0时,估计y的取值,有点估计和区间估计之分。