第六章相关分析与回归分析

上传人:汽*** 文档编号:569480412 上传时间:2024-07-29 格式:PPT 页数:91 大小:1.89MB
返回 下载 相关 举报
第六章相关分析与回归分析_第1页
第1页 / 共91页
第六章相关分析与回归分析_第2页
第2页 / 共91页
第六章相关分析与回归分析_第3页
第3页 / 共91页
第六章相关分析与回归分析_第4页
第4页 / 共91页
第六章相关分析与回归分析_第5页
第5页 / 共91页
点击查看更多>>
资源描述

《第六章相关分析与回归分析》由会员分享,可在线阅读,更多相关《第六章相关分析与回归分析(91页珍藏版)》请在金锄头文库上搜索。

1、STAT第六章第六章 相关分析与回归分析相关分析与回归分析第六章第六章 相关分析与回归分析相关分析与回归分析6.16.1相关分析与回归分析概述相关分析与回归分析概述6.26.2线性回归分析线性回归分析STAT第六章第六章 相关分析与回归分析相关分析与回归分析一、变量间的相互关系一、变量间的相互关系二、相关关系的种类二、相关关系的种类三、相关表和相关图三、相关表和相关图四、相关系数四、相关系数五、相关分析与回归分析五、相关分析与回归分析6.16.1相关分析与回归分析概述相关分析与回归分析概述返回STAT第六章第六章 相关分析与回归分析相关分析与回归分析一、变量间的相互关系一、变量间的相互关系(一

2、)(一)函数关系函数关系(二)(二)相关关系相关关系(三)(三)相关关系与函数关系的关系相关关系与函数关系的关系返回STAT第六章第六章 相关分析与回归分析相关分析与回归分析函数关系函数关系 指变量之间具有的严格的确定性的指变量之间具有的严格的确定性的依存关系。依存关系。 函数关系可以用一个数学表达式来表示。函数关系可以用一个数学表达式来表示。 STAT第六章第六章 相关分析与回归分析相关分析与回归分析相关关系相关关系 指客观现象间确实存在,但数量上不指客观现象间确实存在,但数量上不是严格对应的依存关系。是严格对应的依存关系。如:家庭收入与消费支出:如:家庭收入与消费支出: 家庭收入增加,则消

3、费支出也家庭收入增加,则消费支出也相应增加。相应增加。STAT第六章第六章 相关分析与回归分析相关分析与回归分析相关关系与函数关系的关系相关关系与函数关系的关系区别区别(1 1 1 1)函数关系)函数关系)函数关系)函数关系完全确定的关系;完全确定的关系;完全确定的关系;完全确定的关系; 相关关系相关关系相关关系相关关系不完全确定的关系。不完全确定的关系。不完全确定的关系。不完全确定的关系。(2 2 2 2)函数关系)函数关系)函数关系)函数关系可以用数学公式准确表达;可以用数学公式准确表达;可以用数学公式准确表达;可以用数学公式准确表达; 相关关系相关关系相关关系相关关系不能用一定的方程准确

4、表达。不能用一定的方程准确表达。不能用一定的方程准确表达。不能用一定的方程准确表达。STAT第六章第六章 相关分析与回归分析相关分析与回归分析联系联系(1 1)有函数关系的变量间,由于有测)有函数关系的变量间,由于有测量误差及各种随机因素的干扰,可表量误差及各种随机因素的干扰,可表现为相关关系;现为相关关系;(2 2)对具有相关关系的变量有深刻了)对具有相关关系的变量有深刻了解之后,相关关系有可能转化为或借解之后,相关关系有可能转化为或借助函数关系来描述。助函数关系来描述。STAT第六章第六章 相关分析与回归分析相关分析与回归分析例:判断下列关系是什么关系?例:判断下列关系是什么关系?1)物体

5、体积随温度升高而膨胀,随压力加大而)物体体积随温度升高而膨胀,随压力加大而压缩;压缩;2)测量次数愈多,其平均长度愈接近实际值;)测量次数愈多,其平均长度愈接近实际值;3)家庭收入愈多,其消费支出也有增长趋势;)家庭收入愈多,其消费支出也有增长趋势;4)秤砣的误差愈大,权衡的误差愈大;)秤砣的误差愈大,权衡的误差愈大;5)物价愈上涨,商品的需求量愈小;)物价愈上涨,商品的需求量愈小;6)文化程度愈高,人口平均寿命也愈长;)文化程度愈高,人口平均寿命也愈长;7)园的半径愈长,园的周长也愈长;)园的半径愈长,园的周长也愈长;8)农作物产量与雨量、施肥量等有密切关系。)农作物产量与雨量、施肥量等有密

6、切关系。STAT第六章第六章 相关分析与回归分析相关分析与回归分析二、相关关系的种类二、相关关系的种类(一)按相关的程度不同,分为(一)按相关的程度不同,分为完全相关、完全相关、不相关和不完全相关不相关和不完全相关 (二)按相关的形式不同,分为(二)按相关的形式不同,分为线性相关与线性相关与非线性相关非线性相关(三)按相关的性质不同,分为(三)按相关的性质不同,分为正相关和负正相关和负相关相关(四)按相关关系所涉及因素的多少,分为(四)按相关关系所涉及因素的多少,分为单相关、复相关和偏相关单相关、复相关和偏相关返回STAT第六章第六章 相关分析与回归分析相关分析与回归分析完全相关完全相关 一个

7、变量的变量值完全由另一个或另一个变量的变量值完全由另一个或另一组变量值所决定。一组变量值所决定。 不相关不相关 两个变量的变量值互不影响,其数量两个变量的变量值互不影响,其数量变化各自独立。变化各自独立。 不完全相关不完全相关 两个现象之间的关系介于完全相关和两个现象之间的关系介于完全相关和不相关之间。不相关之间。STAT第六章第六章 相关分析与回归分析相关分析与回归分析线性相关线性相关 当一个变量变动时,另一个变当一个变量变动时,另一个变量也相应发生大致均等的变动。量也相应发生大致均等的变动。非线性相关非线性相关 当一个变量变动时,另一个变当一个变量变动时,另一个变量也相应发生变动,但这种变

8、动是量也相应发生变动,但这种变动是不均等的。不均等的。STAT第六章第六章 相关分析与回归分析相关分析与回归分析正相关正相关 两个变量之间的变化方向一致。两个变量之间的变化方向一致。 负相关负相关 两个变量变化趋势相反。两个变量变化趋势相反。STAT第六章第六章 相关分析与回归分析相关分析与回归分析单相关单相关两个变量之间的相关关系。两个变量之间的相关关系。复相关复相关 三个或三个以上变量之间的相关关系。三个或三个以上变量之间的相关关系。偏相关偏相关 在某一变量与多个变量相关时,当假定其他在某一变量与多个变量相关时,当假定其他变量不变,其中两个变量之间的相关关系。变量不变,其中两个变量之间的相

9、关关系。STAT第六章第六章 相关分析与回归分析相关分析与回归分析三、相关表和相关图三、相关表和相关图将某一变量将某一变量x x按其数值大小顺序排按其数值大小顺序排列,然后再将与其相关的另一个变量列,然后再将与其相关的另一个变量y y对应值平行排列,观察对应值平行排列,观察x x由小到大变化由小到大变化时,时,y y的变化情况的变化情况。相关表相关表STAT第六章第六章 相关分析与回归分析相关分析与回归分析企业编号企业编号月产量(千吨)月产量(千吨)X X生产费用(万元)生产费用(万元)Y Y1 12 23 34 45 56 67 78 81.21.22.02.03.13.13.83.85.0

10、5.06.16.17.27.28.08.0626286868080110110115115132132135135160160八个同类工业企业的月产量与生产费用八个同类工业企业的月产量与生产费用正正 相相 关关负负 相相 关关曲线相关曲线相关不不 相相 关关xyxyxyxy又称又称散点图散点图,用直角坐标系的横轴代表变量,用直角坐标系的横轴代表变量x ,纵轴代表变量,纵轴代表变量y ,将两个变量间相对应的变,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相量值用坐标点的形式描绘出来,用以表明相关点分布状况的图形。关点分布状况的图形。相关图相关图返回STAT第六章第六章 相关分析与回

11、归分析相关分析与回归分析 测定测定两个变量两个变量之间之间线性相关线性相关的密切程度和的密切程度和相关方向的统计指标,相关方向的统计指标,用用r表示。表示。四、相关系数四、相关系数STAT第六章第六章 相关分析与回归分析相关分析与回归分析以两个变量与各自均值的离差为基础,通过两个离差相乘来反映变量之间相关程度。 (一)积差法(一)积差法STAT第六章第六章 相关分析与回归分析相关分析与回归分析基本公式基本公式其中,其中,为为x x和和y y的协方差;的协方差;为为x x的标准差;的标准差;为为y y的标准差;的标准差;STAT第六章第六章 相关分析与回归分析相关分析与回归分析1、协方差的意义、

12、协方差的意义 协方差反映了两个变量协方差反映了两个变量x x和和y y的的共变性共变性。STAT第六章第六章 相关分析与回归分析相关分析与回归分析说明x和y的变动方向相同;说明x和y的变动方向相反;说明x和y的共变性平均来说是均衡的。STAT第六章第六章 相关分析与回归分析相关分析与回归分析xy0+-+-STAT第六章第六章 相关分析与回归分析相关分析与回归分析则r0,说明x和y之间为正线性相关;则r0 为为正相关正相关,r 0 为为负相关负相关;|r|=0 表示不存在表示不存在线性线性关系;关系;|r|1 表示表示完全完全线性线性相关相关;|r|1 ,说明,说明x与与y线性相关度越高;线性相

13、关度越高;|r|0 ,说明,说明x与与y线性相关度越低。线性相关度越低。(三)相关系数相关程度(三)相关系数相关程度STAT第六章第六章 相关分析与回归分析相关分析与回归分析0|r|10|r|1表示存在表示存在不同程度线性相关不同程度线性相关:|r|r| 0.3 0.3 微弱线性相关;微弱线性相关;0.30.3|r|r|0.5 0.5 低度线性相关;低度线性相关;0.50.5|r|r|0.8 0.8 显著线性相关;显著线性相关;0.80.8|r|r|1.0 1.0 高度高度线性相关。线性相关。STAT第六章第六章 相关分析与回归分析相关分析与回归分析例:例:例:例:江苏省历年江苏省历年江苏省历

14、年江苏省历年GDPGDP与海洋产业总产值资料如下:与海洋产业总产值资料如下:与海洋产业总产值资料如下:与海洋产业总产值资料如下:试计算简单相关系数,并说明两变量相关的密切程度。试计算简单相关系数,并说明两变量相关的密切程度。试计算简单相关系数,并说明两变量相关的密切程度。试计算简单相关系数,并说明两变量相关的密切程度。 年份年份江苏省江苏省GDPGDP(亿元)(亿元)X X江苏省海洋产业总产值(亿元)江苏省海洋产业总产值(亿元)Y Y199819987199.957199.95171.24171.24199919997697.827697.82142.46142.46200020008582.

15、738582.73146.04146.04200120019514.69514.6171.98171.982002200210631.7510631.75211.54211.542003200312460.8312460.83453.61453.612004200415403.1715403.17565.22565.222005200518305.6618305.66739.58739.582006200621645.0821645.08128712872007200725741.1525741.151873.51873.5STAT第六章第六章 相关分析与回归分析相关分析与回归分析STAT第六

16、章第六章 相关分析与回归分析相关分析与回归分析解:解: 说明江苏省海洋产业总产值和江说明江苏省海洋产业总产值和江苏省地区经济之间存在苏省地区经济之间存在正的高度线性正的高度线性相关关系相关关系。 返回STAT第六章第六章 相关分析与回归分析相关分析与回归分析应用EXCEL的结果:回归统计回归统计Multiple RMultiple R0.9687530.968753R SquareR Square0.9384820.938482Adjusted R SquareAdjusted R Square0.9307920.930792标准误差标准误差153.4877153.4877观测值观测值1010

17、STAT第六章第六章 相关分析与回归分析相关分析与回归分析计算计算值:值:给定的显著性水平和自由度(给定的显著性水平和自由度(n n-2-2),查找),查找分布表中相应的临界值分布表中相应的临界值t t/2/2。若若t tt t/2/2,表明,表明在统计上是显著的。在统计上是显著的。若若t tt t/2/2,表明,表明在统计上是不显著在统计上是不显著的。(四)相关系数的检验(四)相关系数的检验STAT第六章第六章 相关分析与回归分析相关分析与回归分析目的:虚假相关目的:虚假相关是指当是指当r r趋近于趋近于1 1时,理论上认为变量之间具有高度时,理论上认为变量之间具有高度的相关关系,但实际上这

18、两个变量的相关关系,但实际上这两个变量之间毫无因果关系。之间毫无因果关系。如:印度的粮食产量与美国的啤酒如:印度的粮食产量与美国的啤酒价格理论上价格理论上r r趋近于趋近于1 1。STAT第六章第六章 相关分析与回归分析相关分析与回归分析【例】假设根据对样本观测数据计算假设根据对样本观测数据计算出某公司的股票价格与气温的样本相关出某公司的股票价格与气温的样本相关系数系数r=0.5,试问是否可以根据的显,试问是否可以根据的显著水平认为该公司的股票与气温之间存著水平认为该公司的股票与气温之间存在一定程度的线性相关关系在一定程度的线性相关关系?STAT第六章第六章 相关分析与回归分析相关分析与回归分

19、析解:解: 查表可知:显著水平为,临界值查表可知:显著水平为,临界值t/2 t/2 (4) =2.776 .(4) =2.776 . 因为因为t t值小于值小于2.7762.776,所以,所以,不能通过显不能通过显著性检验。著性检验。STAT第六章第六章 相关分析与回归分析相关分析与回归分析解:解: 查表可知:显著水平为,临界值查表可知:显著水平为,临界值t/2 t/2 (8) =2.306 .(8) =2.306 . 因为因为t t值大于值大于2.3062.306,所以,所以,能通过显著能通过显著性检验。性检验。接上例:接上例:STAT第六章第六章 相关分析与回归分析相关分析与回归分析五、相

20、关分析与回归分析五、相关分析与回归分析 用相关图表和相关系数研究两个或两个以上变用相关图表和相关系数研究两个或两个以上变量之间相关程度的方法。量之间相关程度的方法。 相关分析相关分析回归分析回归分析 对具有相关关系的两个或两个以上变量之间数对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确定一个相应的数学量变化的一般关系进行测定,确定一个相应的数学表达式,以便从一个已知量来推测另一个未知量,表达式,以便从一个已知量来推测另一个未知量,为估计预测提供一个重要的方法。为估计预测提供一个重要的方法。 回归分析与相关分析回归分析与相关分析q理论和方法具有一致性;理论和方法具有一致性;

21、q无相关就无回归,相关程度越高,回无相关就无回归,相关程度越高,回归越好;归越好;q 相关系数和回归系数方向一致,可相关系数和回归系数方向一致,可以互相推算。以互相推算。联系:联系:q相关分析中相关分析中x与与y对等,回归分析中对等,回归分析中x与与y要要确定自变量和因变量;确定自变量和因变量;q相关分析中相关分析中x、y均为随机变量,回归分析均为随机变量,回归分析中只有中只有y为随机变量;为随机变量;q相关分析测定相关程度和方向,回归分析相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。用回归模型进行预测和控制。回归分析与相关分析回归分析与相关分析区别:区别:返回STAT第六章第

22、六章 相关分析与回归分析相关分析与回归分析一、简单线性回归方程的建立一、简单线性回归方程的建立二、估计标准误二、估计标准误三、简单线性回归模型预测三、简单线性回归模型预测四、二元线性回归方程四、二元线性回归方程6.26.2 线性回归分析线性回归分析返回回归分析的种类回归分析的种类一元回归一元回归(简单回归)(简单回归)多元回归多元回归(复回归复回归)线性回归线性回归非线性回归非线性回归一一 元元线线性性回回归归Simple Linear regression按自变量的按自变量的 个数分个数分按回归曲线按回归曲线的形态分的形态分STAT第六章第六章 相关分析与回归分析相关分析与回归分析一、简单线

23、性回归方程的建立一、简单线性回归方程的建立对于经判断具有线性关系的两个变量对于经判断具有线性关系的两个变量y y与与x x,在它们的相关图的散点中引出一,在它们的相关图的散点中引出一条模拟的回归直线,以表明两变量的条模拟的回归直线,以表明两变量的关系,我们称它为估计回归线。配合关系,我们称它为估计回归线。配合回归线相应方程式称为回归方程,即:回归线相应方程式称为回归方程,即:简单线性回归方程的几何意义简单线性回归方程的几何意义截距截距斜率斜率一元线性回归方程的可能形态一元线性回归方程的可能形态为正为正 为负为负 为为0简单线性回归方程建立的步骤简单线性回归方程建立的步骤2 2、确定简单线性回归

24、方程:、确定简单线性回归方程:回归系数回归系数 的意义:的意义:表明自变量表明自变量x x每变动一每变动一个单位,因变量个单位,因变量y y平均变动平均变动 个单位。个单位。1 1、确定自变量、因变量;在两个变量之间,、确定自变量、因变量;在两个变量之间,必须确定哪个是自变量,哪个是因变量。必须确定哪个是自变量,哪个是因变量。式中:式中: 是是y y的估计值,的估计值, 为直线在为直线在y y轴上的截轴上的截距,距, 为斜率,又称为回归系数。为斜率,又称为回归系数。 STAT第六章第六章 相关分析与回归分析相关分析与回归分析随机干扰:随机干扰:各种偶然各种偶然因素、观察误差和其因素、观察误差和

25、其他被忽视因素的影响他被忽视因素的影响X对对y的线性影响而形的线性影响而形成的系统部分,反映两成的系统部分,反映两变量的平均变动关系,变量的平均变动关系,即本质特征。即本质特征。残差残差(Residual):e3 3、确定待定参数、确定待定参数普通最小二乘法(普通最小二乘法(OLS)基本数学要求:基本数学要求:整理得到以下正规方程组:整理得到以下正规方程组:进一步整理,有:进一步整理,有:STAT第六章第六章 相关分析与回归分析相关分析与回归分析【例例例例】某企业上半年产品产量与单位成本资料如下:某企业上半年产品产量与单位成本资料如下:要求:要求:计算相关系数,说明两个变量相关的密切计算相关系

26、数,说明两个变量相关的密切程度。程度。配合回归方程,指出产量每增加配合回归方程,指出产量每增加10001000件时,件时,单位成本平均变动多少?单位成本平均变动多少?假定产量为假定产量为60006000件时,件时,单位成本为多少元?单位成本为多少元? 月份月份 产量(千件)产量(千件)单位成本(元)单位成本(元)1 12 273732 23 372723 34 471714 43 373735 54 469696 65 56868解:解:计算相关系数计算相关系数 说明产量和单位成本之间存在高说明产量和单位成本之间存在高度线性负相关关系。度线性负相关关系。 即即线性回归方程为:线性回归方程为:(

27、2 2)设回归方程为:)设回归方程为: 当产量为当产量为60006000件时,即件时,即x x6 6,代入回归方程:,代入回归方程: y y77.3777.371.821.826 666.4566.45(元)(元) 返回回归系数回归系数 的经济意义:它表示当的经济意义:它表示当x x每变动一个每变动一个单位时,单位时,y y平均来说变动多少。即:产量平均来说变动多少。即:产量x x每增每增加加10001000件,单位成本平均下降件,单位成本平均下降1.821.82元。元。 STAT第六章第六章 相关分析与回归分析相关分析与回归分析应用应用EXCELEXCEL的结果:的结果:回归统计回归统计Mu

28、ltiple RMultiple R0.9090910.909091R SquareR Square0.8264460.826446Adjusted R Adjusted R SquareSquare0.7830580.783058标准误差标准误差0.9770080.977008观测值观测值6 6CoefficCoefficientsients标准标准误差误差t Statt StatIntercept77.3677.361.51171.5117 51.17851.178XVariable11.8181.8180.41660.4166- -4.36444.3644STAT第六章第六章 相关分析与

29、回归分析相关分析与回归分析【例例】已知某局下10 个企业销售收入与销售利润的数据资料如下:试求两者的回归直线方程。(单位是万元)STAT第六章第六章 相关分析与回归分析相关分析与回归分析解:散点图为:STAT第六章第六章 相关分析与回归分析相关分析与回归分析计算表格:STAT第六章第六章 相关分析与回归分析相关分析与回归分析代入公式计算得:则方程为:STAT第六章第六章 相关分析与回归分析相关分析与回归分析应用应用EXCELEXCEL的结果:的结果:回归统计回归统计Multiple RMultiple R0.9518120.951812R SquareR Square0.9059460.905

30、946Adjusted R Adjusted R SquareSquare0.8941890.894189标准误差标准误差0.2691130.269113观测值观测值1010CoeffiCoefficientscients标准标准误差误差 t t StatStatInterceptIntercept0.4250.4250.2090.209 2.0342.034X VariableX Variable0.0880.0880.0100.010 8.7788.778STAT第六章第六章 相关分析与回归分析相关分析与回归分析二、估计标准误二、估计标准误 估计标准误是衡量因变量的估估计标准误是衡量因变量

31、的估计值计值 与观测值与观测值 之间离差的平之间离差的平均水平指标。均水平指标。 概念概念它可以说明回归方程的代表性。它可以说明回归方程的代表性。 计算公式计算公式其中:其中: :估计标准误;:估计标准误; :估计:估计值;值; :实际值;:实际值;n-2n-2:回归估计:回归估计自由度。自由度。 STAT第六章第六章 相关分析与回归分析相关分析与回归分析回归系数的区间估计回归系数的区间估计STAT第六章第六章 相关分析与回归分析相关分析与回归分析书上例题的书上例题的EXCEL结果:结果:回归统计回归统计Multiple RMultiple R0.945860.94586R SquareR S

32、quare0.894650.89465Adjusted R SquareAdjusted R Square0.882940.88294标准误差标准误差2.351882.35188观测值观测值1111CoefficiCoefficientsents标准误差标准误差t Statt StatLower Lower 95%95%UpperUpper95%95%InterceptIntercept0.8059220.8059222.1298442.1298440.3783950.378395-4.01212-4.012125.6239655.623965X Variable 1X Variable 10

33、.3031940.3031940.0346810.0346818.7424478.7424470.2247410.2247410.3816480.381648STAT第六章第六章 相关分析与回归分析相关分析与回归分析回答以下问题:回答以下问题:1 1、相关系数:、相关系数:2 2、回归方程:、回归方程:3 3、估计标准误差:、估计标准误差:4 4、回归系数的、回归系数的95%95%置信区间:置信区间:【例例】根据某部门根据某部门8 8个企业产品销售额个企业产品销售额x x(十万元)(十万元)和销售利润和销售利润y y(万元)的资料得出以下计算结果:(万元)的资料得出以下计算结果: 要求要求:

34、:(1 1)计算产品销售额与利润额的相关关系;)计算产品销售额与利润额的相关关系;(2 2)建立以利润额为因变量的直线回归方程)建立以利润额为因变量的直线回归方程并说明回归系数的经济意义;并说明回归系数的经济意义;(3 3)计算估计标准误。)计算估计标准误。 返回STAT第六章第六章 相关分析与回归分析相关分析与回归分析解:STAT第六章第六章 相关分析与回归分析相关分析与回归分析STAT第六章第六章 相关分析与回归分析相关分析与回归分析三、拟合程度的评价三、拟合程度的评价总离差平方和的分解总离差平方和的分解对上式两边取平方、求和、数学处理后,得到:对上式两边取平方、求和、数学处理后,得到:S

35、TAT第六章第六章 相关分析与回归分析相关分析与回归分析误差平方和误差平方和回归回归平方和平方和总离差平方和总离差平方和STAT第六章第六章 相关分析与回归分析相关分析与回归分析 各自的意义:各自的意义: 总变差(总变差(SSTSST) 剩余变差(剩余变差(SSESSE) 回归变差(回归变差(SSRSSR) 说明了各观察说明了各观察 表示实际值围表示实际值围 表示估计值与表示估计值与 值与平均值的值与平均值的 绕回归直线的绕回归直线的 平均值的离差平均值的离差 离差平方和。离差平方和。 变动程度。它变动程度。它 平方和。说明平方和。说明 是除了是除了x x对对y y的的 了了x x变动引起变动

36、引起 线性影响外其线性影响外其 估计值变动的估计值变动的 它随机因素所它随机因素所 程度。程度。 引起引起y y的变动。的变动。是可以由回归直线是可以由回归直线作出解释的部分作出解释的部分是回归直线是回归直线不能解释的不能解释的部分。部分。STAT第六章第六章 相关分析与回归分析相关分析与回归分析决定(可决)系数,即有:决定(可决)系数,即有:决定系数是对回归模型拟合程度的综合决定系数是对回归模型拟合程度的综合度量,决定系数越大,模型拟合程度越度量,决定系数越大,模型拟合程度越高;高;决定系数越小,则模型对样本的拟合程决定系数越小,则模型对样本的拟合程度越差。度越差。 STAT第六章第六章 相

37、关分析与回归分析相关分析与回归分析决定系数决定系数r r2 2具有如下特性:具有如下特性:1 1决定系数决定系数r r2 2具有非负性。具有非负性。 2 2决定系数的取值范围为决定系数的取值范围为 r r2 2 。3 3决定系数是样本观测值的函数,它决定系数是样本观测值的函数,它也是一个统计量。也是一个统计量。决定系数与相关系数的区别与联系:决定系数与相关系数的区别与联系:区别区别:适用范围不同。:适用范围不同。联系联系:在一元线性回归中,相关系数是:在一元线性回归中,相关系数是可决系数的平方根。可决系数的平方根。STAT第六章第六章 相关分析与回归分析相关分析与回归分析上例:dfdfSSSS

38、回归分析(回归分析(R R)1 128751292875129残差(残差(E E)8 8188467.7188467.7总计(总计(T T)9 930635973063597已知,n=10,r=1。在江苏省海洋产业总产值的变动中,有在江苏省海洋产业总产值的变动中,有93.85%93.85%是由江苏省的是由江苏省的GDPGDP所决定的。所决定的。STAT第六章第六章 相关分析与回归分析相关分析与回归分析四、显著性检验四、显著性检验1 1、回归模型检验的种类、回归模型检验的种类 1)1)、理论意义检验、理论意义检验 2)2)、一级检验又称统计学检验:利用统计学、一级检验又称统计学检验:利用统计学中

39、的抽样理论来检验样本回归方程的可靠性,中的抽样理论来检验样本回归方程的可靠性,又可分为拟合程度评价和显著性检验。又可分为拟合程度评价和显著性检验。 3)3)、二级检验又称计量经济学检验、二级检验又称计量经济学检验STAT第六章第六章 相关分析与回归分析相关分析与回归分析2 2、T T检验检验1)1)提出假设:提出假设:2)2)确定显著水平:确定显著水平:3)3)确定检验统计量并计算其值:确定检验统计量并计算其值:4)4)查查T T分布表,得:分布表,得:5)5)判断判断STAT第六章第六章 相关分析与回归分析相关分析与回归分析CoefficientsCoefficients标准误差标准误差t

40、Statt StatInterceptIntercept0.8059220.8059222.1298442.129844 0.3783950.378395X Variable 1X Variable 10.3031940.3031940.0346810.034681 8.7424478.742447书上例题的书上例题的EXCELEXCEL结果:结果:2)2)确定显著水平:确定显著水平:3)3)计算检验统计量的值:计算检验统计量的值:1)1)提出假设:提出假设:STAT第六章第六章 相关分析与回归分析相关分析与回归分析4)4)查查T T分布表,得:分布表,得:5)5)结论:结论:STAT第六章第

41、六章 相关分析与回归分析相关分析与回归分析3 3、F F检验检验1)1)提出假设:提出假设:2)2)确定显著水平:确定显著水平:3)3)确定检验统计量并计算其值:确定检验统计量并计算其值:4)4)查查F F分布表,得:分布表,得:5)5)判断判断STAT第六章第六章 相关分析与回归分析相关分析与回归分析书上例题的书上例题的EXCELEXCEL结果:结果:2)2)确定显著水平:确定显著水平:3)3)计算检验统计量的值:计算检验统计量的值:1)1)提出假设:提出假设:dfdfSSSSMSMSF F回归分析回归分析1 1422.7633422.7633422.7633422.763376.43038

42、76.43038残差残差9 949.7821649.782165.5313515.531351总计总计1010472.5455472.5455 STAT第六章第六章 相关分析与回归分析相关分析与回归分析4)4)查查F F分布表,得:分布表,得:5)5)结论:结论:STAT第六章第六章 相关分析与回归分析相关分析与回归分析五、简单线性回归模型预测五、简单线性回归模型预测点估计点估计对于给定的对于给定的 X X 值,求出值,求出 Y Y 预测值。预测值。区间估计区间估计对于给定的对于给定的 X X 值,求出值,求出 Y Y 的的置信区间置信区间。区间估计步骤区间估计步骤(1 1)计算点预测值)计算

43、点预测值 ;(2 2)计算估计标准误)计算估计标准误 ;(3 3)给定显著性水平)给定显著性水平 ,查标准正,查标准正态分布表,得临界值态分布表,得临界值 ;(4 4)下限)下限= = 上限上限= =STAT第六章第六章 相关分析与回归分析相关分析与回归分析实际情况,一般会有一个修正系数:实际情况,一般会有一个修正系数:STAT第六章第六章 相关分析与回归分析相关分析与回归分析【例例】接上例,当产品销售额接上例,当产品销售额x x为为70007000万元万元时,试以时,试以95.45%95.45%的概率保证程度估计销售利的概率保证程度估计销售利润润y y的置信区间。的置信区间。返回STAT第六

44、章第六章 相关分析与回归分析相关分析与回归分析解:STAT第六章第六章 相关分析与回归分析相关分析与回归分析四、二元线性回归方程四、二元线性回归方程 , 称为偏回归系数。称为偏回归系数。 :当取固定值时,每变动一个单位所:当取固定值时,每变动一个单位所引起引起y y的平均变动量。的平均变动量。 :当取固定值时,每变动一个单位所:当取固定值时,每变动一个单位所引起引起y y的平均变动量。的平均变动量。 基本模型:基本模型:返回STAT第六章第六章 相关分析与回归分析相关分析与回归分析练习练习假设某地区住宅建筑面积与建造成假设某地区住宅建筑面积与建造成本的有关资料如下:本的有关资料如下:建筑地编号

45、建筑面积(万平方米)建造成本(万元)1414.82212.83313.34515.45414.36515.9STAT第六章第六章 相关分析与回归分析相关分析与回归分析用EXCEL计算结果如下 Multiple RMultiple R0.972616540.97261654R SquareR Square0.9459829330.945982933Adjusted R SquareAdjusted R Square0.9324786660.932478666标准误差标准误差0.3115656760.311565676观测值观测值6 6STAT第六章第六章 相关分析与回归分析相关分析与回归分析Co

46、efficiCoefficientsents标准误标准误差差Lower Lower 95%95%Upper Upper 95%95%InterceptIntercept10.5926810.59268 0.474260.47426 9.27599.275911.90911.909XVariableXVariable 1 10.9975610.997561 0.119180.11918 0.66660.66661.32841.3284STAT第六章第六章 相关分析与回归分析相关分析与回归分析根据上表资料:根据上表资料:1 1)、建立建筑面积与建造成本的相关系数,并)、建立建筑面积与建造成本的相关

47、系数,并说明二者的相关关系。说明二者的相关关系。2 2)、建立建筑面积与建造成本的回归方程。)、建立建筑面积与建造成本的回归方程。3 3)、解释回归系数的经济意义。)、解释回归系数的经济意义。4 4)、估计标准误差为多少?)、估计标准误差为多少?5 5)、对回归系数进行)、对回归系数进行T T检验。已知。检验。已知。6 6)、写出回归系数)、写出回归系数95%95%的置信区间。的置信区间。7 7)、估计当建筑面积为)、估计当建筑面积为4.54.5万平方米时,建造成万平方米时,建造成本本95%95%置信区间为多少?置信区间为多少?8 8)、最小二乘法的数学依据是什么?)、最小二乘法的数学依据是什么?STAT第六章第六章 相关分析与回归分析相关分析与回归分析解: 1)、相关系数为: 意义:建筑面积和建造成本之间存在正高度线性相关关系。 2)、直线方程为:3)、当建筑面积每增加1万平方米时,建造成本平均上升0.9976万元。 STAT第六章第六章 相关分析与回归分析相关分析与回归分析4)、估计标准误: 5)、T检验 所以拒绝原假设接受备择假设即二者之间线性关系确实成立。STAT第六章第六章 相关分析与回归分析相关分析与回归分析6)、回归系数的95%区间为7)、预测即(14.22,15.95)8)、OLS的依据是残差平方和最小,即:

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号