第12章_相关与回归分析

上传人:洪易 文档编号:34305974 上传时间:2018-02-23 格式:PPT 页数:61 大小:1.29MB
返回 下载 相关 举报
第12章_相关与回归分析_第1页
第1页 / 共61页
第12章_相关与回归分析_第2页
第2页 / 共61页
第12章_相关与回归分析_第3页
第3页 / 共61页
第12章_相关与回归分析_第4页
第4页 / 共61页
第12章_相关与回归分析_第5页
第5页 / 共61页
点击查看更多>>
资源描述

《第12章_相关与回归分析》由会员分享,可在线阅读,更多相关《第12章_相关与回归分析(61页珍藏版)》请在金锄头文库上搜索。

1、1,统计学原理,第十二章 相关分析,2,第一节 相关分析的意义和任务,一、相关关系的概念在社会经济现象中,变量之间的关系大致可分为两种,函数关系和相关关系。,3,1.函数关系,变量之间以一定的函数形式形成的一一对应关系称为函数关系。在具有相互依存关系的两个变量之中,作为根据的变量叫做自变量,x来表示,发生对应变化的变量叫做因变量,用y表示。例如,设y为出租汽车费用,x为行驶里程,y与x之间的关系,可以表达为: Y=51.2x式中:5是出租汽车的固定服务费用,1.2是每公里的出租费用。当x=2时,所应支付的费用为y=7.4元。在研究过程中,保持一定数值的量叫做常数。,4,2.相关关系,两个变量之

2、间,存在某种依存关系,但,变量y并不是由变量x唯一确定的,它们之间没有严格的一一对应关系。两个变量之间的这种关系称为相关关系。例如,身体高的人,一般讲体重也要重一些;商品价格降低时,一般讲销售量会增加。这里,身高与体重,商品价格与销售量之间的关系不是函数关系,而是相关关系。特点:现象之间数量依存关系的具体关系值不是固定的。例如,身高180m的人,可以表现为许多个体重值。,5,二、相关关系的种类,1.按照相关关系涉及的变量(或因素)的多少可以分为单相关和复相关单相关:两个因素之间的相关关系叫做单相关。 如:施肥量与亩产量复相关:三个或三个以上因素之间的相关关系叫做复相关。 如:同时研究种子、施肥

3、量、降雨量与亩产量。 我们这里,只讲单相关,而不讲复相关。,6,二、相关关系的种类,2.按照变量之间相互关系的表现形式不同,可分为直线相关和非直线相关直线相关(也称线性相关) 当相关关系的一个变量变动时,另一个变量也相应地发生大致均等的变动,这种相关关系称为线性相关。非线性相关(也称曲线相关) 当相关关系的一个变量变动时,另一个变量也相应地发生变动,但这种变动是不均等的,这种相关关系称为非直线相关。 这里,只讲直线相关,而不讲曲线相关。,7,二、相关关系的种类,3.按照变量之间相互关系的方向不同,可分为正相关和负相关正相关:当自变量x值增加,因变量y值也随之相应地增加,这样的相关关系就是正相关

4、。例如,身高增加,体重也增加。负相关:当自变量x的值增加时,因变量y的值相应减少,或者自变量数值减少时,因变量数值相应增加,这样的相关关系就是负相关。 例如,商品价格降低,产品销售量增多。,8,三、相关分析的目的和内容,相关分析是研究一个变量与另一个变量之间相关关系密切程度和相关方向的一种统计分析方法。 目的:帮助我们对因素之间的关系密切程度和变化的规律性有一个具体的数量上的认识,用于进行各种推算和预测。,9,主要内容:,1.绘制相关图。相关图能帮助我们做一般性判断,即通过相关图,确定现象之间有无关系,确定相关关系的表现形式。 2.计算相关系数。相关系数能从数量上明确说明关系的密切程度和方向。

5、 3.测定两个因素之间的一般的关系值。这需要用回归方程来解决。 4.计算估计标准误差。测定因变量估计值和实际值之间的差异用来反映因变量估计值的可靠性。,10,第二节 线性相关分析,一、相关关系的一般性判断要分析说明现象之间相关关系,首先要判断了解现象之间有没有关系,有什么样的关系。 进行这种判断一般有两种方法:从定性分析进行一般判断 现象之间有没有关系,有什么样的关系,这是一种质的规定性。对于这种质的规定性的认识属于定性认识。从认识的一般顺序来讲,只有在定性判断的基础上才能够进行定量的分析和判断。定性认识,来自于研究者的理论知识,专业知识,实际经验和研究能力。,11,用编制相关表或画相关图的方

6、法来帮助判断。,12,13,二、相关系数,相关表和相关图只能大体上反映现象之间的相关关系,不能准确推断其相关的密切程度如何。要判断现象之间相关关系的密切程度,需要计算相关系数。相关系数的意义相关系数是测定二个变量之间线性相关密切程度和方向的统计分析指标,用表示。,14,相关系数的基本公式:,15,相关系数的基本公式:,16,三、相关系数值的意义:,17,判断标准:,18,四、相关系数的计算,19,相关系数的简捷计算法,积差法相关系数在计算过程中要使用两个数列的平均数,这样在计算上会发生一些麻烦,我们可以利用简化公式计算相关系数。这个简化公式和后面将要讲到的回归直线可以使用同一张计算表。这是用得

7、比较多的一种计算公式。,20,1.未分组资料,21,2.分组资料,22,五、相关系数的显著性检验,r值是未知总体的相关系数( =0,1)的一个样本估计值,即一系列类似抽样(或观测)的样本值r1, r2, r3 ,中的一个数值,这许多r值的次数分布,可作为检验r值显著性的依据。在小样本(n30)情况下,通常采用t分布来检验r 的显著性。其方法和步骤如下:,23,五、相关系数的显著性检验,第一步:提出假设。 H0 := 0 H1 : 0第二步:计算检验的统计量。,第三步:进行决策。,接受域,否定域,否定域,24,例:10名工人的智商值和劳动生产率的数据列表7-6 (P435),计算得出智商值与劳动

8、生产率之间的相关系数 r=0.867。 试对 r 进行显著性检验。,解:第一步:提出假设。 H0 := 0 ; H1 : 0 第二步:计算检验的统计量。,第三步:进行决策。,25,作业,P367-三、计算题 13 题。,26,相关系数的计算公式,27,二、相关程度的判断标准:,28,三、相关系数的显著性检验,第一步:提出假设。 H0 := 0 H1 : 0第二步:计算检验的统计量。,第三步:进行决策。,接受域,否定域,否定域,29,第三节 一元线性回归分析,一、概念 相关系数可以用来说明在直线相关条件下,两个现象相关关系的方向和程度,是有关系还是没关系,关系密切还是不密切。但它不能说明一个现象

9、发生一定量的变化,另一个现象一般地会发生多大的变化。相关系数不能说明两个变量之间的一般关系值。为了测定现象之间数量变化的一般关系要使用数学方法。这种数学方法总称为回归分析。 所谓模型,简单地说,即是一些数学方程式。如果两个变量之间存在相关关系,并且一个变量的变化会引起另一个变量按某一种线性关系变化,则两个变量之间的关系可以用一元线性回归模型表述。,30,一元线性回归模型的一般形式为:,31,下面,根据表7-6的资料,说明建立一元线性回归模型的原理和方法。,32,根据表中资料,画出相关图。,33,二、一元线性回归模型的求解,34,35,36,37,三、判定系数 r2判定系数r2是测定回归直线拟合

10、优度的一个重要指标。,38,三、判定系数 r2判定系数r2是测定回归直线拟合优度的一个重要指标。,39,四、估计标准误差,(一)概念 根据对x的回归直线方程,可用x的值去估计y的值。但是,推算出来的因变量的数值不是精确的数值,它是一个估计值,和实际值有出入。因此,建立了回归方程后,还需进一步测定估计值的可靠性,即计算估计标准误差。 估计标准误差就是用来说明回归方程推算结果的准确程度的统计分析指标,或者说是反映回归直线代表性大小的统计分析指标。,40,作用:,1.说明以回归直线为中心的所有相关点的离散程度。估计标准误差大,则说明相关点与回归直线的离散程度大,反之,则说明离散程度小。2.说明回归直

11、线的代表性大小,估计标准误差大,则回归直线的代表性小,估计标准误差小,则回归直线的代表性大。3.能表示出变量y 诸观测值与的绝对离差数。,41,(二)计算方法,42,43,五、线性回归方程的显著性检验,第一步:提出假设。假设观测的样本是从一个没有线性关系的总体中选出的。 H0 := 0 (总体回归系数) H1 : 0第二步:计算回归系数b的检验统计量t值。,第三步:进行决策。,对回归系数b的检验就是要验证变量x与y之间是否真正存在线性关系。一般采用t检验,其步骤如下:,44,五、线性回归方程的显著性检验,第一步:提出假设。假设观测的样本是从一个没有线性关系的总体中选出的。第二步:计算回归系数b

12、的检验统计量t值。第三步:进行决策。,45,第三步:进行决策。,第一步:提出假设。H0:= 0 ; H1 : 0第二步:计算回归系数b的检验统计量t值。,46,47,48,2、相关系数r的显著性检验 第一步:提出假设。 H0 := 0 ; H1 : 0 第二步:计算检验的统计量。,49,50,51,52,(5)线性回归方程的显著性检验第一步:提出假设。H0:= 0 ; H1 : 0第二步:计算回归系数b的检验统计量t值。,第三步:进行决策,53,根据表中资料,画出相关图。,54,作业,P3684、5、6、7、8、9,55,复习:一、相关系数的计算公式,56,二、相关程度的判断标准:,57,三、相关系数的显著性检验,第一步:提出假设。 H0 := 0 H1 : 0第二步:计算检验的统计量。,第三步:进行决策。,接受域,否定域,否定域,58,四、一元线性回归模型的一般形式为:,59,五、估计标准误差的计算,60,六、线性回归方程的显著性检验,第一步:提出假设。假设观测的样本是从一个没有线性关系的总体中选出的。 H0 := 0 (总体回归系数) H1 : 0第二步:计算回归系数b的检验统计量t值。,第三步:进行决策。,61,六、线性回归方程的显著性检验,第一步:提出假设。假设观测的样本是从一个没有线性关系的总体中选出的。第二步:计算回归系数b的检验统计量t值。第三步:进行决策。,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 研究报告 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号