第十章节相关与回归分析课件

上传人:E**** 文档编号:91094507 上传时间:2019-06-21 格式:PPT 页数:69 大小:1.31MB
返回 下载 相关 举报
第十章节相关与回归分析课件_第1页
第1页 / 共69页
第十章节相关与回归分析课件_第2页
第2页 / 共69页
第十章节相关与回归分析课件_第3页
第3页 / 共69页
第十章节相关与回归分析课件_第4页
第4页 / 共69页
第十章节相关与回归分析课件_第5页
第5页 / 共69页
点击查看更多>>
资源描述

《第十章节相关与回归分析课件》由会员分享,可在线阅读,更多相关《第十章节相关与回归分析课件(69页珍藏版)》请在金锄头文库上搜索。

1、第八章 相关与回归,学习目的和要求 学习重点 学习难点 教学方法 授课时数 基本内容,学习目的和要求,目的:掌握相关与回归分析的基本理论和方法,以便在实际工作中能对具有相关关系的社会经济现象进行有效的分析,为管理层的预测和决策服务。 要求:首先要了解相关与回归分析的概念、特点,相关分析与回归分析的区别与联系,进而掌握相关分析的定性和定量分析方法,在此基础上进一步掌握回归模型的拟合方法、对回归方程拟合精度的测定和评价的方法。,学习重点,相关分析的方法和回归分析的方法。 在具体应用时要根据给定的数据资料,列示统计计算表,进而据以计算。 掌握简捷计算法公式。,基本内容,一、相关分析 二、一元线性回归

2、分析 三、多元线性回归分析 四、 非线性回归分析,一、相关分析,(一)相关关系的概念 1变量相互关系 它反映现象之间存在着严格的依存关系,在这种关系中,对于某一变量的每一个数值,都有另一个变量的确定值与之相对应。有的时候这种关系可以用一个确切的数学表达式反映出来,如:圆的面积与半径之间的关系,即 有的时候,这种关系不太明确,呈现出一种模糊的非确定型数学关系,如,相关关系反映现象之间确实存在的,但关系数值不固定的相互依存关系。这一概念表明: (1)相关关系是指现象之间确实存在数量上的相互依存关系。 (2)现象之间数量依存关系的具体关系值不是固定的。,对于确定性关系,不再需要分析。可以直接应用于生

3、产、管理活动中;而对于模糊非确定相关关系,或者由于观察、测量误差等原因,或者多种影响因素交互作用等于原因,在实际中表现为一种近似于某种确定性相关关系。 对模糊相关关系的研究,是实践活动的重点。在研究模糊相关关系时,常常使用确定性函数关系的形式来近似分析,以便找到模糊相关关系的一般数量表现形式,用于决策分析和实践控制。,(二)相关关系的种类,1相关图,相关图又称散点图,它是将相关表中的观测值在平面直角坐标系中用坐标点描绘出来,以表明相关点的分布状况。通过相关图,可以大致看出两个变量之间有无相关关系以及相关的形态、方向和密切程度。 常见二维坐标系EXCEL绘制相关图如下,(三)相关关系的判定,常见

4、相关图,2、相关表,相关表是一种反映变量之间相关关系的统计表。将某一变量按其取值的大小排列,然后再将与其相关的另一变量的对应值平行排列,便可得到简单的相关表。 例:某地区某企业近8年产品产量与生产费用的相关情况如下表1所示:,表1 产品产量与生产费用相关表,从上表可看出,产品产量与生产费用之间存在一定的正相关关系。,3、 相关系数,相关系数来源于协方差。对于二维随机变量,协方差是判定两变量相互独立的依据。协方差修正后的相关系数是用来说明变量之间在直线相关条件下相关关系密切程度和方向的统计分析指标。其定义公式为: 式中: 表示数据项数, 为自变量, 为因变量。,相关系数公式的涵义理解,(1)两个

5、变量之间的相关程度和方向,取决于两个变量离差乘积之和 , 当它为0时, 为0; 当它为正时, 为正; 当它为负时, 为负。 (2)相关程度的大小与计量单位无关。为了消除积差中两个变量原有计量单位的影响,将各变量的离差除以该变量数列的标准差,使之成为相对积差, 即 ,所以相关系数是无量纲的数量。,相关系数判定准则:,(四)相关分析内容,(五)相关系数的计算,1、相关系数定义的公式 例以表1为例,用EXCEL计算相关系数见表2。,产品产量与生产费用相关图,表2 相关系数计算表,于是: =0.9697,2、利用EXCEL计算相关系数,以表8-1的资料为例,处理的简要步骤与结果如下: 在EXCEL主页

6、面中,从工具数据分析相关关系进入相关关系窗口做相应处理得以下结果:,(六)相关系数的意义,相关系数一般可以从正负符号和绝对数值的大小两个层面理解。正负说明现象之间是正相关还是负相关。绝对数值的大小说明两现象之间线性相关的密切程度。,(1)r的取值在-1到+1之间。 (2)r=+1,为完全正相关;r=-1为完全负相关。表明变量之间为完全线性相关,即函数关系。 (3)r=0,表明两变量无线性相关关系。 (4)r0,表明变量之间为正相关;r0,表明变量之间为负相关。 (5)r的绝对值越接近于1,表明线性相关关系越密切;r越接近于0,表明线性相关关系越不密切。,(七)相关系数的显著性检验,相关系数是根

7、据样本数据计算的,具有一定随机性,能否真实地表现变量总体的相关情况受到随机因素和样本容量大小的影响。故需要对其进行检验。 样本相关系数的检验包括两类检验: (1)对总体相关系数是否等于0进行检验; (2)对总体相关系数是否等于某一给定的不为0的数值进行检验。,对总体相关系数是否等于0的检验,总体相关系数的检验统计上用t检验。其步骤如下: 第一步,提出原假设和备择假设。假设样本相关系数r是抽自具有零相关的总体,即 第二步,规定显著性水平,并依据自由度(n-2)确定临界值 ; 第三步,计算检验的统计量:,第四步,做出判断。将计算的统计量与临界值对比,若统计量大于或等于临界值,表明变量间线性相关在统

8、计上是显著的,若统计量小于临界值,则说明相关关系在统计上并不显著。,例:对表1中产品产量与生产费用之间的相关系数检验,提出原假设和备择假设。 取显著性水平 ,根据自由度 查 分布表得 =2.4469 计算检验的统计量: =9.7236,由于 ,则拒绝 ,表明变量间线性相关在统计上是显著的。即产品产量与生产费用之间的相关系数是显著的。,二、一元线性回归分析,(一)回归分析的概念和特点 1回归分析的概念 回归分析就是对具有相关关系的变量之间数量变化的一般关系进行测定,确定一个相关的数学表达式,以便于进行估计或预测的统计方法。,2回归分析的特点 (1)在变量之间,必须根据研究目的具体确定哪些是自变量

9、,哪个是因变量。 (2)回归方程的作用在于,在给定自变量的数值情况下来估计因变量的可能值。一个回归方程只能做一种推算。推算的结果表明变量之间具体的变动关系。,(3)直线回归方程中,自变量的系数为回归系数。回归系数的符号为正时,表示正相关;回归系数的符号为负时,表示负相关。 (4)确定回归方程时,只要求因变量是随机的,而自变量是给定的数值。,3回归分析的类型,(二)一元线性回归分析,1一元线性回归模型的确定 设有两个变量 和 ,变量 的取值随变量 取值的变化而变化,我们称 为因变量, 为自变量;反之亦然。一般来说,对于具有线性相关关系的两个变量,可以用一条直线方程来表示它们之间的关系,即: 倚

10、回归方程: 倚 回归方程:,例:以表1的资料,建立一元线性回归模型,3回归方程的显著性检验,对于回归方程进行显著性检验基于以下两点: 第一,在根据样本数据拟合回归方程时,我们首先假设变量 与 之间存在着线性关系,但这种假设是否成立?就必须通过检验才能证实; 第二,样本回归方程 中的 b0 是对总体回归方程中参数 的最小二乘估计值,样本回归系数 能否作为总体回归系数 的估计值,还需要对总体回归系数 的显著性进行检验。,回归方程的检验一般包括两个方面的内容: 一是回归系数是否为0的检验 二是回归方程显著性检验,(1)回归系数的T检验,根据给定的显著性水平a(通常a0.05)和自由度df=n-2,查

11、t 分布表,得到临界值ta/2,若|tb|ta/2拒绝H0。 若a=0.05,则表明回归系数O 的可能性小于5,可得出0的结论。 若|tb|ta/2不能拒绝H0,回归系数有可能为零,说明与0 的差异是不显著的。因而只有接受H0 的结论。,(2)回归方程的F检验,所以,可以通过SSR和SSE两部分误差的显著性比较,来判定回归模型的有效性。 具体方法是将回归离差平方和(SSR)同剩余离差平方和(SSE)加以比较,应用F检验来分析二者之间的差别是否显著,检验统计量F,可以证明,在原假设成立的情况下,F统计量服从 分布,即F,显著性水平以及临界值,F 检验的步骤,例:以表1为例,对回归模型做检验,以表

12、3的资料为例的回归模型F检验计算,由于 在 拒绝 ,表明回归方程是显著的,生产费用与产品产量之间确实存在着上述线性关系,产品产量是影响生产费用的显著因素。,(三)回归分析的两个简化判定指标,估计标准误 判定系数,1、估计标准误(standard error of estimate),2、判决系数(可决系数),相关系数、判决系数、估计标准误间的关系,(四)利用回归方程进行预测,1.点预测 将自变量的预测值Xt 代入回归模型所得到的因变量Yt 的值,作为与Xt 相对应的Yt 的预测,就是点预测,2.区间预测 对于与Xt 相对应的值Yt,YtabXt 可以作为Yta+bXt+的一个点估计值。 但不同

13、的样本会得到不同的0、0 因此 与 真值之间总存在一定的抽样误差。,以表1的资料为例,处理的简要步骤与结果如下: 在EXCEL主页面中,从工具数据分析回归 进入回归分析的窗口做相应处理得如下图所示结果。,3一元线性回归问题的EXCEL处理,由上图可知:相关系数R=0.9697,F检验回归方程显著,t检验回归系数P值小于0.05,说明回归系数是显著的,于是有可预测的回归方程:,4回归预测,例5:以表1所建的回归方程为例,取产量为10千吨,试计算生产费用在95%的预测区间,于是,值的预测区间为: 1802.832.446985.87 即: 1518.32 2087.35 以上预测区间说明,我们可以

14、95%的概率保证,当产量为10千吨时,生产费用在1518.32到2087.35千元之间。,三、多元线性回归的数学模型,一元线性回归将影响因变量的自变量限制为一个,这在现实的大量社会经济现象中并不易做到。因而,实际应用回归分析法时,常需要有更一般的模型,把两个或更多个解释变量的影响分别估计在内。这就是多元回归亦称多重回归。 当影响变量Y 的主要因素有k 个时,可以建立起的总体回归模型为 这是Y 对X1,X2,Xk 的多元回归,也称多重回归或复回归。b1,b2,bk称为偏回归系数。,1、模型的建立,模型的基本假设大致与一元线性回归模型相同,只是自变量X1,X2,Xk之间不能有较强的线性关系。 利用

15、变量Y 与X 的n 组样本数据,依照一定准则,可以得到回归系数b0,b1,bk 的估计值b0,b1,bk;建立起样本回归模型,2、参数的最小二乘估计,上页式中参数b0,b1,bk 可以利用变量Y 与X1,X2,Xk 的n 组样本数据,依照最小二乘准则得到,它们可以采用求解正规方程组计算得到。 式中:,当自变量的数目k 较大时,求解正规方程组很复杂,需应用软件,因而通常将多元线性回归模型表述为矩阵形式。,则多元线性方程式可以写成矩阵形式 依据最小二乘准则,回归系数阵B 为 式中:X是矩阵X 的转置阵; (XX)-1 是(XX)阵的逆阵。 由最小二乘准则得到的回归系数bj(j=1,2,k)表明在其他自变量保持不变的情况下,自变量Xj(j=1,2,k)变动一个单位所引起的因变量Y 的平均变动量。,可化为线性的回归,常见曲线的函数变换表,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号