第八章相关与回归分析

上传人:汽*** 文档编号:592230191 上传时间:2024-09-20 格式:PPT 页数:100 大小:1.30MB
返回 下载 相关 举报
第八章相关与回归分析_第1页
第1页 / 共100页
第八章相关与回归分析_第2页
第2页 / 共100页
第八章相关与回归分析_第3页
第3页 / 共100页
第八章相关与回归分析_第4页
第4页 / 共100页
第八章相关与回归分析_第5页
第5页 / 共100页
点击查看更多>>
资源描述

《第八章相关与回归分析》由会员分享,可在线阅读,更多相关《第八章相关与回归分析(100页珍藏版)》请在金锄头文库上搜索。

1、STAT第八章第八章 回归分析与相关分析回归分析与相关分析第八章第八章 回归分析与相关分析回归分析与相关分析8.18.1相关分析概述相关分析概述8.28.2一元线性回归分析一元线性回归分析相关和回归分析是研究事物的相互关系、相关和回归分析是研究事物的相互关系、测定它们联系的紧密程度、揭示其变化的测定它们联系的紧密程度、揭示其变化的具体形式和规律性的统计方法,是构造各具体形式和规律性的统计方法,是构造各种经济模型、进行结构分析、政策评价、种经济模型、进行结构分析、政策评价、预测和控制的重要工具。预测和控制的重要工具。STAT第八章第八章 回归分析与相关分析回归分析与相关分析一、相关分析的意义一、

2、相关分析的意义二、相关关系的测定二、相关关系的测定8.18.1相关分析概述相关分析概述 出租汽车费用与行驶里程:出租汽车费用与行驶里程: 总费用总费用=行驶里程行驶里程 每公里单价每公里单价 家庭收入与恩格尔系数:家庭收入与恩格尔系数: 家庭收入高,则恩格尔系数低。家庭收入高,则恩格尔系数低。函数关系函数关系(确定性关系)(确定性关系)相关关系相关关系(非确定性关系)(非确定性关系)比较下面两种现象间的依存关系比较下面两种现象间的依存关系STAT第八章第八章 回归分析与相关分析回归分析与相关分析 函数关系的例子函数关系的例子某某种种商商品品的的销销售售额额(y)与与销销售售量量(x)之之间间的

3、的关关系系可可表表示示为为 y = p x (p 为单价为单价)圆圆的的面面积积(S)与与半半径径之之间间的的关关系系可可表示为表示为S = R2 企企业业的的原原材材料料消消耗耗额额(y)与与产产量量(x1) 、单单位位产产量量消消耗耗(x2) 、原原材材料料价价格格(x3)之之间间的的关关系系可可表表示示为为y = x1 x2 x3 STAT第八章第八章 回归分析与相关分析回归分析与相关分析 相关关系的例子相关关系的例子商商品品的的消消费费量量(y)与与居居民民收收入入(x)之之间间的关系的关系商商品品销销售售额额(y)与与广广告告费费支支出出(x)之之间间的关系的关系粮粮食食亩亩产产量量

4、(y)与与施施肥肥量量(x1) 、降降雨雨量量(x2) 、温度温度(x3)之间的关系之间的关系收收入入水水平平(y)与与受受教教育育程程度度(x)之之间间的的关系关系父父亲亲身身高高(y)与与子子女女身身高高(x)之之间间的的关关系系现象间的依存关系大致可以分成两种类型:现象间的依存关系大致可以分成两种类型:函数关系函数关系指指现象间所具有的严格的确定性现象间所具有的严格的确定性的依存关系的依存关系相关关系相关关系指指客观现象间确实存在,但数量客观现象间确实存在,但数量上不是严格对应的依存关系上不是严格对应的依存关系函数关系与相关关系之间并无严格的界限:函数关系与相关关系之间并无严格的界限:函

5、数关系与相关关系之间并无严格的界限:函数关系与相关关系之间并无严格的界限:有函数有函数有函数有函数关系的变量间,由于有测量误差及各种随机因素的关系的变量间,由于有测量误差及各种随机因素的关系的变量间,由于有测量误差及各种随机因素的关系的变量间,由于有测量误差及各种随机因素的干扰,可表现为相关关系;对具有相关关系的变量干扰,可表现为相关关系;对具有相关关系的变量干扰,可表现为相关关系;对具有相关关系的变量干扰,可表现为相关关系;对具有相关关系的变量有深刻了解之后,相关关系有可能转化为或借助函有深刻了解之后,相关关系有可能转化为或借助函有深刻了解之后,相关关系有可能转化为或借助函有深刻了解之后,相

6、关关系有可能转化为或借助函数关系来描述。数关系来描述。数关系来描述。数关系来描述。相关分析的意义相关分析的意义现象之间的相互联系,在许多情况下表现现象之间的相互联系,在许多情况下表现为一定的因果关系,将这些现象数量化则为一定的因果关系,将这些现象数量化则成为变量:成为变量:其中一个或若干个起着影响作其中一个或若干个起着影响作用的变量称为用的变量称为自变量自变量,通常用,通常用X表示,它表示,它是引起另一现象变化的原因,是可以控制、是引起另一现象变化的原因,是可以控制、给定的值;给定的值;而受自变量影响的变量称为而受自变量影响的变量称为因因变量变量,通常用,通常用Y表示,它是自变量变化的表示,它

7、是自变量变化的结果,是不确定的值。结果,是不确定的值。相关分析的意义相关分析的意义按涉及变量的多少分为按涉及变量的多少分为相相关关关关系系的的种种类类按照表现形式不同分为按照表现形式不同分为按照变化方向不同分为按照变化方向不同分为一元相关一元相关多元相关多元相关直线相关直线相关曲线相关曲线相关负相关负相关正相关正相关相关分析的意义相关分析的意义STAT第八章第八章 回归分析与相关分析回归分析与相关分析单相关单相关是一个因变量与一个自变量的相是一个因变量与一个自变量的相关。因此也称为关。因此也称为一元相关。一元相关。复相关复相关 是一个因变量与两个或更多个自是一个因变量与两个或更多个自变量之间的

8、相关因此也称为变量之间的相关因此也称为多多元相关。元相关。STAT第八章第八章 回归分析与相关分析回归分析与相关分析直线相关直线相关 当自变量当自变量X值每变动一个单值每变动一个单位,因变量位,因变量Y值则随着发生值则随着发生大致均等的变动,这就是直大致均等的变动,这就是直线相关。亦称为简单相关或线相关。亦称为简单相关或一元线性相关。一元线性相关。 曲线相关曲线相关 当自变量当自变量X值每变动一个单值每变动一个单位,因变量位,因变量Y值则随之发生值则随之发生不均等的变化,这就曲线相不均等的变化,这就曲线相关。亦称为一元非线性相关关。亦称为一元非线性相关 。STAT第八章第八章 回归分析与相关分

9、析回归分析与相关分析正相关正相关 当自变量当自变量X值增加,因变量值增加,因变量Y值也随之增加,这样的相关值也随之增加,这样的相关关系就是正相关,也叫同向关系就是正相关,也叫同向相关。相关。 负相关负相关 当自变量当自变量X的值增加时,因的值增加时,因变量变量Y的值随之而减少,这的值随之而减少,这样的相关关系就是负相关,样的相关关系就是负相关,也叫异向相关。也叫异向相关。STAT第八章第八章 回归分析与相关分析回归分析与相关分析真实相关真实相关 两变量确实存在内在联系两变量确实存在内在联系虚假相关虚假相关 两变量的相关只是表面上的,两变量的相关只是表面上的,实质上并没有内在联系。实质上并没有内

10、在联系。STAT第八章第八章 回归分析与相关分析回归分析与相关分析一、相关分析的意义一、相关分析的意义二、相关关系的测定二、相关关系的测定8.18.1相关分析概述相关分析概述定性分析定性分析是是依据研究者的理论知识和实践经依据研究者的理论知识和实践经验,对客观现象之间是否存在相关验,对客观现象之间是否存在相关关系,以及何种关系作出判断关系,以及何种关系作出判断定量分析定量分析在在定性分析的基础上,通过编制定性分析的基础上,通过编制相相关表关表、绘制、绘制相关图相关图、计算、计算相关系数相关系数与与判定系数判定系数等方法,来判断现象之等方法,来判断现象之间相关的方向、形态及密切程度间相关的方向、

11、形态及密切程度相关关系的测定相关关系的测定简单简单相关表相关表适用于所观察的样本单位数适用于所观察的样本单位数较少,不需要分组的情况较少,不需要分组的情况分组分组相关表相关表适用于所观察的样本单位数适用于所观察的样本单位数较多标志变异又较复杂,需较多标志变异又较复杂,需要分组的情况要分组的情况将现象之间的相互关系,用将现象之间的相互关系,用表格的形式来反映。表格的形式来反映。相关表相关表正正 相相 关关负负 相相 关关曲线相关曲线相关不不 相相 关关xyxyxyxy又称又称散点图散点图,用直角坐标系的,用直角坐标系的x轴代表自变量,轴代表自变量,y轴轴代表因变量,将两个变量间相对应的变量代表因

12、变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关值用坐标点的形式描绘出来,用以表明相关点分布状况的图形。点分布状况的图形。相关图相关图在在直线相关直线相关的条件下,用以反映的条件下,用以反映两变量两变量间间线线性相关性相关密切程度的统计指标,用密切程度的统计指标,用r表示表示相关系数相关系数相关系数相关系数r r的取值的取值范围:范围:-1r1-1r1r0 为为正相关正相关,r 0 为为负相关负相关;|r|=0 表示不存在表示不存在线性线性关系;关系;|r|1 表示表示完全完全线性线性相关相关;0|r|1表示存在表示存在不同程度线性相关不同程度线性相关: |r| 0.4 为

13、低度线性相关;为低度线性相关; 0.4 |r| 0.7为显著性线性相关;为显著性线性相关; 0.7|r| 1.0为为高度高度显著性线性相关。显著性线性相关。STAT第八章第八章 回归分析与相关分析回归分析与相关分析相关关系的测度(相关系数取值及其意义)-1.0+1.00-0.5+0.5完全负相关无线性相关无线性相关完全正相关完全正相关负负相关程度增加相关程度增加r正相关程度增加正相关程度增加是相关系数的平方,用是相关系数的平方,用 表表示;用来衡量回归方程对示;用来衡量回归方程对y y的的解释程度。又称可决系数解释程度。又称可决系数判定系数取判定系数取值值范围:范围: 越接近于越接近于1 1,

14、表明,表明x x与与y y之间之间的相关性越强;的相关性越强; 越接近于越接近于0 0,表明两个变量之间几乎没有直,表明两个变量之间几乎没有直线相关关系线相关关系. .判定系数判定系数【例例】计算工业总产值与能源消耗量之间的相计算工业总产值与能源消耗量之间的相关系数及判定系数关系数及判定系数 资料资料结论:结论:工业总产值与能源消耗量之间存工业总产值与能源消耗量之间存在高度的正相关关系,能源消耗量在高度的正相关关系,能源消耗量x的变的变化能够解释工业总产值化能够解释工业总产值y变化的变化的95.2。STAT第八章第八章 回归分析与相关分析回归分析与相关分析第八章第八章 相关与回归分析相关与回归

15、分析8.18.1相关分析概述相关分析概述8.28.2一元线性回归分析一元线性回归分析STAT第八章第八章 回归分析与相关分析回归分析与相关分析一、回归分析概述一、回归分析概述二、一元线性回归模型二、一元线性回归模型三、回归估计标准差三、回归估计标准差四、线性相关的显著性检验四、线性相关的显著性检验五、回归估计与预测五、回归估计与预测8.28.2一元线性回归分析一元线性回归分析回归分析回归分析指根据相关关系的数量表达指根据相关关系的数量表达式(回归方程式)与给定的式(回归方程式)与给定的自变量自变量x x,揭示揭示因变量因变量y y在数在数量上的平均变化和求得因变量上的平均变化和求得因变量的预测

16、值的统计分析方法量的预测值的统计分析方法回归:退回回归:退回regression回归分析回归分析的的主要任务主要任务就是要采用适就是要采用适当的方法,充分利用样本信息,使当的方法,充分利用样本信息,使估计的样本函数尽可能地接近于真估计的样本函数尽可能地接近于真实总体回归函数实总体回归函数。回归分析与相关分析回归分析与相关分析q理论和方法具有一致性;理论和方法具有一致性;q无相关就无回归,相关程度越高,回无相关就无回归,相关程度越高,回归越好;归越好;q 相关系数和回归系数方向一致,可相关系数和回归系数方向一致,可以互相推算。以互相推算。联系:联系:q相关分析中相关分析中x与与y对等,回归分析中

17、对等,回归分析中x与与y要要确定自变量和因变量;确定自变量和因变量;q相关分析中相关分析中x、y均为随机变量,回归分析均为随机变量,回归分析中只有中只有y为随机变量;为随机变量;q相关分析测定相关程度和方向,回归分析相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。用回归模型进行预测和控制。回归分析与相关分析回归分析与相关分析区别:区别:回归分析的种类回归分析的种类一元回归一元回归(简单回归)(简单回归)多元回归多元回归(复回归复回归)线性回归线性回归非线性回归非线性回归一一 元元线线性性回回归归Simple Linear regression按自变量的按自变量的 个数分个数分按回

18、归曲线按回归曲线的形态分的形态分STAT第八章第八章 回归分析与相关分析回归分析与相关分析一、回归分析概述一、回归分析概述二、一元线性回归模型二、一元线性回归模型三、回归估计标准差三、回归估计标准差四、线性相关的显著性检验四、线性相关的显著性检验五、回归估计与预测五、回归估计与预测8.28.2一元线性回归分析一元线性回归分析STAT第八章第八章 回归分析与相关分析回归分析与相关分析 一元线性回归模型的估计一元线性回归模型的估计 回归模型的估计回归模型的估计要求要求找到一种方法找到一种方法,使估计的样本回归函数能够尽可能地接近总体回归函数,从而作为总体回归函数的代表来描述变量间的具体相关关系。

19、方法有多种,最小二乘法最小二乘法(最小平方法最小平方法)是其中最简单、适用性最广的一种估计方法。 最小二乘法的基本思想最小二乘法的基本思想: 让所寻找的样本回归函数(线)上的点尽可能地接让所寻找的样本回归函数(线)上的点尽可能地接近实际观测点,即样本回归线上的点与实际观测点的近实际观测点,即样本回归线上的点与实际观测点的离离差平方差平方和最小和最小。 可以证明可以证明,在总体随机扰动项的上述假设下,最小二乘法找到的样本回归函数是最优的最优的(样本函数的系数满足线性性线性性、无偏性、最小方差性无偏性、最小方差性)。一元线性回归模型一元线性回归模型对于经判断具有线性关系的两个变量对于经判断具有线性

20、关系的两个变量y y与与x x,构造一元线性回归模型为:构造一元线性回归模型为:假定假定E( )=0,有,有总体一元线性回归方总体一元线性回归方程程:一元线性回归方程的几何意义一元线性回归方程的几何意义截距截距斜率斜率一元线性回归方程的可能形态一元线性回归方程的可能形态 为正为正 为负为负 为为0总体一元线性总体一元线性回归方程回归方程:样本一元线性回归方程:样本一元线性回归方程:以样本统计量估计总体参数以样本统计量估计总体参数斜率(回归系数)斜率(回归系数)截距截距截距截距a 表示在没有自变量表示在没有自变量x的影响时,其它各的影响时,其它各种因素对因变量种因素对因变量y的平均影响;的平均影

21、响;回归系数回归系数b 表表明自变量明自变量x每变动一个单位,因变量每变动一个单位,因变量y平均变平均变动动b个单位。个单位。(估计的回归方程估计的回归方程)(一元线性回归方程)(一元线性回归方程)随机干扰:随机干扰:各种偶然各种偶然因素、观察误差和其因素、观察误差和其他被忽视因素的影响他被忽视因素的影响X对对y的线性影响而形的线性影响而形成的系统部分,反映两成的系统部分,反映两变量的平均变动关系,变量的平均变动关系,即本质特征。即本质特征。残差残差(Residual):e一元线性回归方程一元线性回归方程中参数中参数a、b的确定:的确定:最小平方法最小平方法基本数学要求:基本数学要求:整理得到

22、由两个关于整理得到由两个关于a、b的二元一次的二元一次方程组成的方程组:方程组成的方程组:进一步整理,有:进一步整理,有:【分析分析】因为工业总产值与能源消耗量之间存因为工业总产值与能源消耗量之间存在高度正相关关系(在高度正相关关系( ),),所以可以拟合工业总产值对能源消耗量的线性所以可以拟合工业总产值对能源消耗量的线性回归方程。回归方程。【例例】建立工业总产值对能源消耗量的线建立工业总产值对能源消耗量的线性回归方程性回归方程 资料资料解:设解:设线性回归方程为线性回归方程为即线性回归方程为:线性回归方程为:计算结果表明,在其他条件不变时,能源消耗计算结果表明,在其他条件不变时,能源消耗量每

23、增加一个单位(十万吨),工业总产值将量每增加一个单位(十万吨),工业总产值将增加增加0.79610.7961个单位(亿元)。个单位(亿元)。最小二乘法估计的优良性质最小二乘法估计的优良性质q残差之和为零残差之和为零q所拟合直线通过样本散点图的重心所拟合直线通过样本散点图的重心q误差项与解释变量不相关误差项与解释变量不相关qa a与与b b分别是总体回归系数的无偏估计量分别是总体回归系数的无偏估计量qa a与与b b均为服从正态分布的随机变量均为服从正态分布的随机变量一元线性回归模型的一元线性回归模型的假定假定b与与r的关系:的关系: r0 r0 r=0b0 b0 b=0判定系数与相关系数的关系

24、判定系数与相关系数的关系判定系数与相关系数的区别:判定系数与相关系数的区别:q判定系数判定系数无方向性,无方向性,相关系数相关系数则有方向,则有方向,其方向与样本回归系数其方向与样本回归系数 b 相同;相同;q判定系数判定系数说明变量值的总离差平方和中说明变量值的总离差平方和中可以用回归线来解释的比例可以用回归线来解释的比例(就回归模型就回归模型而言)而言),相关系数相关系数只说明两变量间关联只说明两变量间关联程度及方向(就两个变量而言);程度及方向(就两个变量而言);q相关系数相关系数有夸大变量间相关程度的倾向,有夸大变量间相关程度的倾向,因而因而判定系数判定系数是更好的度量值。是更好的度量

25、值。STAT第八章第八章 回归分析与相关分析回归分析与相关分析一、回归分析概述一、回归分析概述二、一元线性回归模型二、一元线性回归模型三、回归估计标准差三、回归估计标准差四、线性相关的显著性检验四、线性相关的显著性检验五、回归估计与预测五、回归估计与预测8.28.2一元线性回归分析一元线性回归分析回归估计标准差回归估计标准差是是因变量各实际值与其估计值之间的因变量各实际值与其估计值之间的平均差异程度,表明其估计值对各实平均差异程度,表明其估计值对各实际值代表性的强弱;其值越小,回归际值代表性的强弱;其值越小,回归方程的代表性越强,用回归方程估计方程的代表性越强,用回归方程估计或预测的结果越准确

26、。或预测的结果越准确。在在大样本条件下,可用公式计算:大样本条件下,可用公式计算:【例例】计算前面拟合的工业总产值对能源消耗计算前面拟合的工业总产值对能源消耗量回归方程的回归标准差量回归方程的回归标准差 资料资料STAT第八章第八章 回归分析与相关分析回归分析与相关分析一、回归分析概述一、回归分析概述二、一元线性回归模型二、一元线性回归模型三、回归估计标准差三、回归估计标准差四、线性相关的显著性检验四、线性相关的显著性检验五、回归估计与预测五、回归估计与预测8.28.2一元线性回归分析一元线性回归分析线性相关的显著性检验线性相关的显著性检验相关系数的显著性检验(相关系数的显著性检验(t t检验

27、法)检验法)提出假设:提出假设:目的目的检验检验总体总体两变量间线性相关性是否显著两变量间线性相关性是否显著步步骤骤构造检验统计量:构造检验统计量:相关系数的显著性检验(相关系数的显著性检验(t t检验法)检验法) 根据给定的显著性水平根据给定的显著性水平 ,确定临确定临界值界值 ; 计算检验统计量并做出决策。计算检验统计量并做出决策。 确定原假设的拒绝规则确定原假设的拒绝规则:若若 ,则接受,则接受H H0 0 , ,表示总体两表示总体两变量间线性相关性不显著变量间线性相关性不显著; ;若若 ,则拒绝,则拒绝H H0 0 , ,表示总体两表示总体两变量间线性相关性显著变量间线性相关性显著步步

28、骤骤【例例】检验工业总产值与能源消耗量之间检验工业总产值与能源消耗量之间的线性相关性是否显著的线性相关性是否显著 资料资料当当 成立时,则统计量成立时,则统计量STAT第八章第八章 回归分析与相关分析回归分析与相关分析 线性回归模型的检验检验分二大类分二大类:统计检验计量经济检验从统计学的角度检验所估计的样本回归函数的有效性从基本假设是否成立这一角度检验最小二乘估计法的适用性及其改进拟合优度检验显著性检验一元线性回归模型的检验一元线性回归模型的检验 本课程只学习本课程只学习统计检验:统计检验: 1、拟合优度检验、拟合优度检验 主要用来检验样本回归函数与实际观测点的“接近”程度,它是通过对Yt的

29、样本点距其样本均值的离差平方和的分解来进行的。即实际观测值落在样本回归“线”上,则拟合最拟合最好好。误差平方和误差平方和回归回归平方和平方和总离差平方和总离差平方和Lyy=U+Q总离差平方和总离差平方和回归平方和回归平方和误差平方和误差平方和STAT第八章第八章 回归分析与相关分析回归分析与相关分析总离差平方和SST回归平方和SSR残差平方和SSE来自样本回归线来自残差回归线上的点与样本均值离差的平方和可决系数可决系数(coefficient of determination)的取值范围:0,1,越接近1,说明实际观测点离样本线越近,拟合优度越高。在给定样本中,SST不变, 如果实际观测点离样

30、本回归线越近,则SSR在SST中占的比重越大,因此样本拟合优度样本拟合优度可用下面的可决系数可决系数测度:实际观测点与回归线上的点的离差的平方和STAT第八章第八章 回归分析与相关分析回归分析与相关分析2、回归方程的显著性检验 (线性关系的检验 )1.检验自变量和因变量之间的线性关系是否显著2.具体方法是将回归离差平方和(SSR)同剩余离差平方和(SSE)加以比较,应用F检验来分析二者之间的差别是否显著如果是显著的,两个变量之间存在线性关系如果不显著,两个变量之间不存在线性关系STAT第八章第八章 回归分析与相关分析回归分析与相关分析回归方程的显著性检验 (检验的步骤)1.提出假设H0:线性关

31、系不显著2. 计算检验统计量F3.确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F 4.作出决策:若FF ,拒绝H0;若F t t,拒绝拒绝H H0 0; t t t t,接受接受H H0 0STAT第八章第八章 回归分析与相关分析回归分析与相关分析一、回归分析概述一、回归分析概述二、一元线性回归模型二、一元线性回归模型三、回归估计标准差三、回归估计标准差四、线性相关的显著性检验四、线性相关的显著性检验五、回归估计与预测五、回归估计与预测8.28.2一元线性回归分析一元线性回归分析回归方程的估计与预测回归方程的估计与预测估计的前提:估计的前提:回归方程经过检验,证明回归方程经过

32、检验,证明 X 和和 Y 的关系在统计上是显著相关的。的关系在统计上是显著相关的。对于给定的对于给定的 X X 值,求出值,求出 Y Y 平均值的一平均值的一个估计值或个估计值或 Y Y 的一个个别值的预测值。的一个个别值的预测值。对于给定的对于给定的 X X 值,求出值,求出 Y Y 的平均值的平均值的的置信区间置信区间或或 Y Y 的一个个别值的的一个个别值的预测预测区间区间。点估计点估计区间估计区间估计点估计点估计若若 x = 80(十万吨)十万吨),则:则:区间估计区间估计对于给定的对于给定的 x = x0 ,Y 的的1- 置信区间为:置信区间为:自由度为自由度为n-2的的 t 分布分

33、布的的 水平双侧分位数水平双侧分位数即:即:预测标准误差预测标准误差预测标准误差预测标准误差的估计值的估计值的估计值的估计值在大样本条件下,近似有:在大样本条件下,近似有:SPSS输出结果(一)输出结果(一)方差分析表方差分析表SPSS输出结果(二)输出结果(二)SPSS输出结果(三)输出结果(三)35.0024.0021.34872 -1.6755718.71588 23.9815738.0025.0023.73710 -1.4496521.36539 26.1088140.0024.0025.32935 -1.2990423.12509 27.5336042.0028.0026.92160

34、 -1.1484224.87796 28.9652349.0032.0032.49447 -.6212830.92932 34.0596252.0031.0034.88284 -.3953633.45997 36.3057254.0037.0036.47509 -.2447535.11637 37.8338259.0040.0040.45572 .1317939.12628 41.7851662.0041.0042.84409 .3577141.43978 44.2484164.0040.0044.43634 .5083242.94855 45.9241365.0047.0045.23247

35、.5836343.69437 46.7705668.0050.0047.62084 .8095545.90378 49.3379169.0049.0048.41697 .8848546.63245 50.2014871.0051.0050.00922 1.0354748.08053 51.9379072.0048.0050.80534 1.1107748.80060 52.8100876.0058.0053.98984 1.4120051.66055 56.31912非标准预测值非标准预测值标准预测值标准预测值下限下限上限上限企业编号企业编号月产量(千吨)月产量(千吨)X生产费用(万元)生产费

36、用(万元)Y123456781.22.03.13.85.06.17.28.0628680110115132135160八个八个同类工业企业的月产量与生产费用同类工业企业的月产量与生产费用简单相关表简单相关表平均每昼平均每昼夜产量夜产量 固定资产原值固定资产原值35404045455050555560606565706006501 15506001235005502134505001517400450224350400030035022223543120(百万元)(百万元)(吨)(吨)20个同类工业企业固定资产原值与平均每昼夜产量个同类工业企业固定资产原值与平均每昼夜产量分组相关表分组相关表序号

37、序号能源消耗量能源消耗量(十万吨(十万吨)x工业总产值工业总产值(亿元)(亿元)yx2y2xy1234567891011121314151635384042495254596264656869717276242524283231374041404750495148581225144416001764240127042916348138444096422546244761504151845776576625576784102496113691600168116002209250024012601230433648409509601176156816121998236025422560305534

38、003381362134564408合计合计916625550862617537887STAT第八章第八章 回归分析与相关分析回归分析与相关分析相关分析与回归分析的关系相关分析与回归分析的关系相关分析与回归分析的关系相关分析与回归分析的关系1.相关分析与回归分析的联系相关分析与回归分析的联系相关分析与回归分析的联系相关分析与回归分析的联系两者具有互为补充关系。通过回归分析可以求出一个估计的回归方程,用来反映变量之间在数量变化上的联系;相关分析通过计算出来的相关指标,反映在回归方程这种固定联系的形式下变量之间联系的密切程度。仅仅进行回归分析,回归方程的有效性便遭到怀疑,而仅仅进行相关分析,便不能

39、由自变量来推断因变量,两者是不可偏废某一方的。上一页下一页STAT第八章第八章 回归分析与相关分析回归分析与相关分析相关分析与回归分析的关系相关分析与回归分析的关系相关分析与回归分析的关系相关分析与回归分析的关系2相关分析与回归分析的区别 两者在关心变量性质上的不同。在回归分析中,必须将变量分为自变量和因变量,以便建立回归方程;也必须将变量分为确定性变量和随机变量,以便研究随机变量的分布以及对其进行统计推断。区分变量的性质是回归分析的前提条件,是回归分析中首先要解决的一个问题。 上一页下一页STAT第八章第八章 回归分析与相关分析回归分析与相关分析上一页下一页在一元线性相关分析中,只要求变量具

40、有随机性,两个变量具有完全对等的关系,谁对谁相关是无所谓的,它不关心变量之间的因果关系,所关心的仅仅是两个变量联系的紧密程度,倘若改变两个变量的地位也绝不会影响它们的相关关系,因此,所表现出来的相关系数也只有一个,即 2相关分析与回归分析的区别STAT第八章第八章 回归分析与相关分析回归分析与相关分析(2)两者的任务和目的不同。回归分析是根据现象之间关系的特点,运用一定的办法,建立最适合于变量之间关系的回归方程,而且随着变量的变换,回归方程也会随之改变,回归方程是用来反映变量之间数量的平均变动关系,进而对因变量进行估算或预测。相关分析是通过计算相关指标,用来反映回归方程所表明变量之间依存关系的

41、密切程度,是不能进行估算和预测的。 2相关分析与回归分析的区别上一页下一页STAT第八章第八章 回归分析与相关分析回归分析与相关分析(3)两者的使用范围不同。回归分析只限于研究数量标志之间或指标之间的数量关系,对于品质标志之间和等级之间的关系在没有数量化之前是无法研究的。相关分析研究范围比回归分析研究的范围要广泛得多。从研究的范围来看,可以说,凡是能够进行回归分析的,都能够也必须进行相关分析,而能够进行相关分析的,却不一定能够或不都需要进行回归分析,回归分析总需要相关分析的帮助,而相关分析却不一定需要回归分析的帮助,相关分析具有独立性。 2相关分析与回归分析的区别上一页下一页STAT第八章第八

42、章 回归分析与相关分析回归分析与相关分析利用图表进行回归分析例 近年来国家教育部决定将各高校的后勤社会化。某从事饮食业的企业家认为这是一个很好的投资机会,他得到十组高校人数与周边饭店的季度销售额的数据资料,并想根据高校的数据决策其投资规模。 上一页下一页返回本节首页STAT第八章第八章 回归分析与相关分析回归分析与相关分析操作过程:上一页下一页返回本节首页打开“ 简单线性回归.xls”工作簿,选择“饭店” 工作表,如下图所示。STAT第八章第八章 回归分析与相关分析回归分析与相关分析从“插入”菜单中选择“图表”选项,打开“图表向导”对话框如下图所示。在“图表类型”列表中选择XY散点图,单击“下

43、一步”按钮。上一页下一页返回本节首页STAT第八章第八章 回归分析与相关分析回归分析与相关分析在数据区域中输入B2:C11,选择“系列产生在列”,如下图所示,单击“下一步”按钮。上一页下一页返回本节首页STAT第八章第八章 回归分析与相关分析回归分析与相关分析打开“图例”页面,取消图例,省略标题,如下图所示。上一页下一页返回本节首页STAT第八章第八章 回归分析与相关分析回归分析与相关分析单击“完成”按钮,便得到XY散点图如下图所示。上一页下一页返回本节首页STAT第八章第八章 回归分析与相关分析回归分析与相关分析如图1所示,用鼠标激活散点图,把鼠标放在任一数据点上,单击鼠标右键,打开菜单,在

44、菜单栏里选择“填加趋势线”选项,打开趋势线对话框如图2所示。 图1上一页下一页返回本节首页STAT第八章第八章 回归分析与相关分析回归分析与相关分析图2上一页下一页返回本节首页STAT第八章第八章 回归分析与相关分析回归分析与相关分析打开“类型”页面,选择“线性”选项,Excel将显示一条拟合数据点的直线。 打开“选项”页面如图3所示,在对话框下部选择“显示公式”和“显示R平方根”选项,单击“确定”按钮,便得到趋势回归图如图4所示。图3上一页下一页返回本节首页STAT第八章第八章 回归分析与相关分析回归分析与相关分析图4上一页下一页返回本节首页STAT第八章第八章 回归分析与相关分析回归分析与

45、相关分析回归分析工具的应用例 某房地产经纪人从政府部门列举的地区中随机抽取了15户居民作为样本, 记录了他们的家庭住房面积及其相应的价格,他想确认一下住房面积(平方米)与价格(千元)的关系,并想据此拟合住房价格的回归方程。 上一页下一页返回本节首页STAT第八章第八章 回归分析与相关分析回归分析与相关分析操作过程:打开“简单线性回归.xls”工作簿,选择“住房”工作表如下图所示。上一页下一页返回本节首页STAT第八章第八章 回归分析与相关分析回归分析与相关分析在“工具”菜单中选择“数据分析”选项,打开“数据分析”对话框如下图所示。上一页下一页返回本节首页STAT第八章第八章 回归分析与相关分析

46、回归分析与相关分析在“分析工具”列表中选择“回归”选项,单击“确定”按钮,打开“回归”对话框如下图所示。上一页下一页返回本节首页STAT第八章第八章 回归分析与相关分析回归分析与相关分析在Y值输入区域中输入C1:C16。在X值输入区域中输入B1:B16。选择“标志”,置信度选择95%。在“输出选项”中选择“输出区域”,在其右边的位置输入“D1”,单击 “确定”按钮。输出结果如下图所示。上一页下一页返回本节首页STAT第八章第八章 回归分析与相关分析回归分析与相关分析Excel的回归分析工具计算简便,但内容丰富,计算结果共分为三个模块:回归统计表 方差分析表回归参数 回归分析工具的输出解释上一页

47、下一页返回本节首页STAT第八章第八章 回归分析与相关分析回归分析与相关分析回归统计表包括以下几部分内容:Multiple R(复相关系数R):R2的平方根,又称为相关系数,它用来衡量变量x和y之间相关程度的大小。 若R为0.848466,表示二者之间的关系是高度正相关。R Square(判决系数R2 ):用来说明用自变量解释因变量变差的程度,以测量同因变量y的拟合效果。 若系数为0.719894,表明用自变量可解释因变量变差的71.99%。1. 回归统计表上一页下一页返回本节首页STAT第八章第八章 回归分析与相关分析回归分析与相关分析Adjusted R Square (调整判决系数R2)

48、:仅用于多元回归才有意义,它用于衡量加入独立变量后模型的拟合程度。当有新的独立变量加入后,即使这一变量同因变量之间不相关,未经修正的R2也要增大,修正的R2仅用于比较含有同一个因变量的各种模型。标准误差:又称为标准回归误差或叫估计标准误差,它用来衡量拟合程度的大小,也用于计算与回归有关的其他统计量,此值越小,说明拟合程度越好。上一页下一页返回本节首页STAT第八章第八章 回归分析与相关分析回归分析与相关分析观测值:是指用于估计回归方程的数据的观测值个数。2. 方差分析表方差分析表的主要作用是通过F检验来判断回归模型的回归效果。3. 回归参数表如下页图所示,回归参数表是表中最后一个部分:上一页下

49、一页返回本节首页STAT第八章第八章 回归分析与相关分析回归分析与相关分析上一页下一页返回本节首页STAT第八章第八章 回归分析与相关分析回归分析与相关分析图中,回归参数如下:Intercept:截距0第二、三行:0(截距) 和1(斜率)的各项指标。第二列:回归系数0(截距)和1(斜率)的值。第三列:回归系数的标准误差第四列:根据原假设Ho:0=1=0计算的样本 统计量t的值。第五列:各个回归系数的p值(双侧)第六列:0和195%的置信区间的上下限。 上一页下一页返回本节首页STAT第八章第八章 回归分析与相关分析回归分析与相关分析案例研究:销售额与广告媒体的关系例 某VCD连锁店非常想知道在

50、电视台做广告与在广播 电台做广告哪种媒体更有效。它收集了连锁店各个 商店的每月销售额(万元)和每月用在以上两种媒 介的广告支出。试问:在显著性水平为0.05的基础上,销售额是否同两种媒介的广告有关?每种媒介上的广告支出额对销售额的影响如何?哪种广告形式带来的成本效益更高?上一页下一页返回本节首页STAT第八章第八章 回归分析与相关分析回归分析与相关分析操作过程:打开“多元回归分析.xls”工作簿,选择“VCD”工作表,如下图所示。上一页下一页返回本节首页STAT第八章第八章 回归分析与相关分析回归分析与相关分析在“工具”菜单中选择“数据分析”选项,打开“数据分析”对话框,在“分析工具”列表中选择 “回归”选项,单击“确定”按钮,进入“回归”对话框。在“Y值输入区域”中输入A1:A21单元格,它代表销售额的数据范围。在“X值输入区域”中输入B1:C21单元格,这里包括“广播”与“电视”两个自变量,回归工具要求自变量之间必须是相邻的,不能隔开。上一页下一页返回本节首页STAT第八章第八章 回归分析与相关分析回归分析与相关分析选中标志。选择95%的置信度在“输出区域”中输入D1单元格,表示输出结果的起点。单击“确定”按钮。得多元回归计算结果如下图所示。上一页下一页返回本节首页

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号