相关和回归分析课件

上传人:我*** 文档编号:143885419 上传时间:2020-09-02 格式:PPT 页数:75 大小:871.50KB
返回 下载 相关 举报
相关和回归分析课件_第1页
第1页 / 共75页
相关和回归分析课件_第2页
第2页 / 共75页
相关和回归分析课件_第3页
第3页 / 共75页
相关和回归分析课件_第4页
第4页 / 共75页
相关和回归分析课件_第5页
第5页 / 共75页
点击查看更多>>
资源描述

《相关和回归分析课件》由会员分享,可在线阅读,更多相关《相关和回归分析课件(75页珍藏版)》请在金锄头文库上搜索。

1、第七章 相关与回归分析,相关和回归分析是研究事物的相互关系、测定它们联系的紧密程度、揭示其变化的具体形式和规律性的统计方法,是经济分析、预测和控制的重要工具。,一、函数关系与相关关系 二、相关关系的种类 三、相关分析与回归分析 四、相关表与相关图,第一节 相关与回归分析的基本概念,一、函数关系与相关关系,1.函数关系,当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,我们称这种关系为确定性的函数关系。,函数关系,(1)是一一对应的确定关系 (2)设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称

2、 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量 (3)各观测点落在一条线上, 函数关系的例子 某种商品的销售额(y)与该商品的销售量(x)以及该商品价格(p)之间的关系表示为y = p x 圆的面积(S)与半径之间的关系可表示为S = r2 企业的原材料消耗额(y)与产量(x1) 、单位产量消耗(x2) 、原材料价格(x3)之间的关系可表示为y = x1 x2 x3,2.相关关系,当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。我们称这种现象之间客观存在的不严格、不确定的数量依存关系为相关关系

3、。,(1)变量间关系不能用函数关系精确表达; (2)一个变量的取值不能由另一个变量唯一确定; (3)当变量 x 取某个值时,变量 y 的取值可能有几个; (4)各观测点分布在直线周围。,相关关系, 相关关系的例子 商品的消费量(y)与居民收入(x)之间的关系 商品的消费量(y)与物价(x)之间的关系 商品销售额(y)与广告费支出(x)之间的关系 粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温度(x3)之间的关系 收入水平(y)与受教育程度(x)之间的关系, 出租汽车费用与行驶里程: 总费用=行驶里程 每公里单价, 家庭收入与恩格尔系数: 家庭收入高,则恩格尔系数低。,函数关系 (确定

4、性关系),相关关系 (非确定性关系),比较下面两种现象间的依存关系,函数关系是变量之间的一种严格、完全确定性的关系,即一个变量的数值完全有另一个(或一组)变量的数值所决定、控制。函数关系通常可以用数学公式确切地表示出来。 相关关系难以像函数关系那样,用数学公式去准确表达。,相关关系与函数关系的区别,由于客观上常会出现观察或测量上的误差等原因,函数关系在实际工作中往往通过相关关系表现出来。 当人们对某些现象内部规律有较深刻认识时,相关关系可能变为函数关系。为此,在研究相关关系时,又常常使用函数关系作为工具,用一定的函数关系表现相关关系的数量联系。,相关关系与函数关系的联系,相关关系的种类,根据相

5、关关系的程度划分,根据相关关系的方向划分,根据自变量的多少划分,根据变量间相互关系的表现形式划分,不完全相关,完全相关,不相关,正相关,负相关,二、相关关系的种类,偏相关,1、不相关。 当两个现象彼此互不影响,其数量变化各自独立时,称为不相关现象。 2、完全相关。如果一个变量的变化是由其他变量的数量变化所确定,此时变量间的关系称为完全相关。在这种场合下,相关关系便成为函数关系。所以,函数关系是相关关系的一种特殊情况。 3、不完全相关。如果变量间的关系介于不相关和完全相关之间,则称为不完全相关。大多数相关关系属于不完全相关,是统计研究的主要对象。,根据相关关系的程度划分,1、正相关。两个相关现象

6、间,当一个变量的数值增加(或减少)时,另一个变量的数值也随之增加(或减少),即同方向变化。例如,工业总产值增加,企业税利总额也随之增加;家庭消费支出随收入增加而增加等。 2、负相关。当一个变量的数值增加(或减少)时,而另一个变量的数值相反地呈减少(或增加)趋势变化,即反方向变化。如劳动生产率提高,产品成本降低;产品成本降低,企业利润增加等。,根据相关关系的方向划分,1、单相关:两个因素之间的相关关系叫单相关。 2、复相关:三个或三个以上因素的相关关系叫复相关,即研究时涉及两个或两个以上的自变量和因变量。例如,某种商品的需求与其价格水平以及收入水平之间的相关关系便是一种复相关。 3、偏相关:在某

7、一现象与多种现象相关的场合,假定其他变量不变,专门考察其中两个变量的相关关系称为偏相关。例如,在假定人们的收入水平不变的条件下,某种商品的需求与其价格水平的关系就是一种偏相关。,根据自变量的多少划分,1、直线相关(或线性相关)。当相关关系的自变量x发生变动,因变量y值随之发生大致均等的变动,从图像上近似地表现为直线形式,这种相关通称为直线(或线性)相关。 2、曲线(或非线性)相关。在两个相关现象中,自变量x值发生变动,因变量y也随之发生变动,这种变动不是均等的,在图像上的分布是各种不同的曲线形式,这种相关关系称为曲线(或非线性)相关。曲线相关在相关图上的分布,表现为抛物线、双曲线、指数曲线等非

8、直线形式。,根据变量间相互关系的表现形式划分,1.相关分析,就是用一个指标来表明现象间相互依存关系的密切程度。广义的相关分析包括相关关系的分析(狭义的相关分析)和回归分析。,2.回归分析,是指对具有相关关系的现象,根据其相关关系的具体形态,选择一个合适的数学模型(称为回归方程式),用来近似地表达变量间的平均变化关系的一种统计分析方法。,(一)概念:,三、相关分析与回归分析,根据回归变量多少,分为一元回归方程和多元回归方程。 根据回归是否线性,分为线性回归方程和非线性回归方程。 根据回归是否有滞后关系,分为自身回归方程和无自身回归现象的方程。,回归的种类,(二)相关分析与回归分析的区别,1.相关

9、分析研究随机变量之间相互依存关系的方向和密切程度,用相关系数表示。回归分析研究某一因变量与一个或多个自变量之间数据关系的变动趋势,用回归方程表示。 2.在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。,3.相关分析不能指出变量间相互关系的具体形式;而回归分析能确切的指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。 4.相关分析所涉及的变量一般都是随机变量,而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。,(三)相关分析与回归分析的联系,相关分析和回归

10、分析有着密切的联系,它们不仅具有共同的研究对象,而且在具体应用时,常常必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。 简单说:1、相关分析是回归分析的基础和前提; 2、回归分析是相关分析的深入和继续。,相关分析的主要内容 揭示现象之间是否存在相关关系。 确定相关关系的表现形式。 确定现象变量间相关关系的密切程度和方向。 回归分析的主要内容 建立相关关系的回归方程。 测定因变量的估计值与估计值的误差程度。,(四)相关分析和回归分析的任务,进行相

11、关关系的定性分析 确定回归方程 计算相关系数或相关指数,对回归方程进行显著性检验。 利用回归方程式进行推算和预测 对推算和预测作出置信区间估计。,(五)相关分析与回归分析的步骤,四、相关关系的判断,定性分析,是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判断。,定量分析,在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数等方法,来判断现象之间相关的方向、形态及密切程度。,相关表:在定性判断的基础上,把具有相关关系的两个量的具体数值按照一定顺序平行排列在一张表上,以观察它们之间的相互关系; 相关图:把相关表上一一对应的具体数值在直角坐标系中用点标出来

12、而形成的散点图。利用相关图和相关表,可以更直观、更形象地表现变量之间的相互关系。,相关表、相关图法,相关表:,1978-2004年我国GDP与出口额的相关关系表,相 关 图,第二节 一元线性回归分析,一、基本概念 二、一元正态线性回归 三、一元线性回归方程的建立,回归模型的类型,一、基本概念,回归分析是指根据相关关系的具体形态,选择一个合适的数学模型来近似地表达变量间平均变化关系的统计分析方法。,二、一元正态线性回归,(一)总体回归函数 et是随机误差项,又称随机干扰项,它是一个特殊的随机变量,反映未列入方程式的其他各种因素对的影响。 (二)样本回归函数: 称为残差,在概念上,与总体误差项et

13、相互对应;是样本的容量。,(t)01t,X,Yt,Y,。 。 。,。,。,et,总体回归线是未知的,只有一条。样本回归线是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归线。,。,(三)误差项的基本标准假定,假定1:误差项的期望值为0,即对所有的t总有 假定2:误差项的方差为常数,即对所有的t总有 假定3:误差项之间不存在序列相关关系,即协方差为0,即当 假定4:自变量是给定的变量,与误差项线性无关。 假定5:误差随机项服从正态分布。 满足以上标准假定的一元线性模型,称为标准的一元线性回归模型。,总体回归参数 和 是未知的,必需利用样本数据去估计。,用样本统计量 和 代替回归方程中的

14、未知参数 和 ,就得到了估计的回归方程。,简单线性回归中估计的回归方程为,其中: 是估计的回归直线在 y 轴上的截距, 是直线的斜率,它表示对于一个给定的 x 的值,是 y 的估计值,也表示 x 每变动一个单位时, y 的平均变动值。,三、一元线性回归方程的建立,最小二乘法,使因变量的观察值与估计值之间的离差平方和达到最小来求得 和 的方法。即,用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小。,最小二乘法(图示),3、回归系数的估计的最小二乘法公式 设 将对求偏导数,并令其等于零,可得: 加以整理后有:, 解方程组可得求解 和 的标准方程如下:,最小二乘估计量

15、的特性,1.小样本性质: 1)线性:指最小二乘估计量不仅是yi的线性函数,还是ei的线性函数; 2)无偏性:最小二乘估计量的期望值等于它所估计的参数的真值; 3)有效性:在 的一切线性无偏估计量中,最小二乘估计量的方差最小。,满足这三个条件的估计量称为最优线性无偏估计量。,2.大样本性质: 1)渐近无偏性:随着样本容量越来越大, 的期望值可达到参数 的真值。 2)一致性:如果随着样本容量越来越大,如果 与 的差的绝对值小于一个任意小的正数( )的概率接近1,那么 就是 的一致估计量。,几个常用记号:,例:1992-2006年我国人均可支配收入与人均消费支出的有关资料如下表所示(单位:元),估计

16、我国城镇居民的边际消费倾向和基础消费水平。,解:(1)绘制散点图,样本回归方程式为: 上式中:0.7295是边际消费倾向,表示人均可支配收入每增加1元,人均消费收入会增加0.7295元,295元是基本消费水平,即与收入无关最基本的人均消费为295元。,第三节 简单直线相关分析,一、相关系数及其检验 (一)相关系数的定义 1.简单相关系数:在线性条件下说明两个变量之间相关关系密切程度的统计分析指标,简称相关系数。 若相关系数是根据总体全部数据计算的,称为总体相关系数,记为 若是根据样本数据计算的,则称为样本相关系数,记为 r。,样本相关系数的定义公式实质,总离差平方和的分解,因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面: 由于自变量 x 的取值不同造成的; 除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响。 对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示。,离差平方和的分解(图示),离差平方和的分解 (三个平方和的关系

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号