第12章 相关与回归分析课件

上传人:我*** 文档编号:140640313 上传时间:2020-07-31 格式:PPT 页数:79 大小:475KB
返回 下载 相关 举报
第12章 相关与回归分析课件_第1页
第1页 / 共79页
第12章 相关与回归分析课件_第2页
第2页 / 共79页
第12章 相关与回归分析课件_第3页
第3页 / 共79页
第12章 相关与回归分析课件_第4页
第4页 / 共79页
第12章 相关与回归分析课件_第5页
第5页 / 共79页
点击查看更多>>
资源描述

《第12章 相关与回归分析课件》由会员分享,可在线阅读,更多相关《第12章 相关与回归分析课件(79页珍藏版)》请在金锄头文库上搜索。

1、1,第七章 相关与回归分析,第一节 相关与回归分析的基本概念 第二节 简单线性相关与回归分析 第三节 多元线性相关与回归分析 第四节 Excel在相关与回归分析中的应用,2,第一节 相关与回归分析的基本概念,一、函数关系与相关关系 二、相关关系的种类 三、相关分析与回归分析 四、相关图,3,一、函数关系与相关关系,当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,我们称这种关系为确定性的函数关系。例如,商品的销售收入与该商品的销售量以及该商品价格之间的关系。 当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。 变量间的这种

2、相互关系,称为具有不确定性的相关关系。例如,劳动生产率与工资水平的关系。,4,变量之间的函数关系和相关关系,在一定条件下是可以互相转化的。 本来具有函数关系的变量,当存在观测误差时,其函数关系往往以相关的形式表现出来。 而具有相关关系的变量之间的联系,如果我们对它们有了深刻的规律性认识,并且能够把影响因变量变动的因素全部纳入方程,这时的相关关系也可能转化为函数关系。,5,相关关系也具有某种变动规律性,所以,相关关系经常可以用一定的函数形式去近似地描述。客观现象的函数关系可以用数学分析的方法去研究,而研究客观现象的相关关系必须借助于统计学中的相关与回归分析方法。,6,二、相关关系的种类,按相关的

3、程度可分为完全相关、不完全相关和不相关。 当一种现象的数量变化完全由另一个现象的数量变化所确定时,称这两种现象间的关系为完全相关。在这种场合,相关关系便成为函数关系。因此也可以说函数关系是相关关系的一个特例。 当两个现象彼此互不影响,其数量变化各自独立时,称为不相关现象。 两个现象之间的关系介于完全相关和不相关之间,称为不完全相关,一般的相关现象都是指这种不完全相关。,7,按相关的方向可分为正相关和负相关。 当一个现象的数量增加(或减少),另一个现象的数量也随之增加(或减少)时,称为正相关。例如,消费水平随收入的增加而提高。 当一个现象的数量增加(或减少),而另一个现象的数量向相反方向变动时,

4、称为负相关。例如商品流转的规模愈大,流通费用水平则愈低。,8,按相关的形式可分为线性相关和非线性相关。 按所研究的变量多少可分为单相关、复相关和偏相关。 两个变量之间的相关,称为单相关。 当所研究的是一个变量对两个或两个以上其他变量的相关关系时,称为复相关。 在某一现象与多种现象相关的场合,假定其他变量不变,专门考察其中两个变量的相关关系称为偏相关。例如,在假定人们的收入水平不变的条件下,某种商品的需求与其价格水平的关系就是一种偏相关。,9,三、相关分析与回归分析,相关分析是用一个指标来表明现象间相互依存关系的密切程度。 回归分析是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变

5、量间的平均变化关系。 相关分析和回归分析有着密切的联系,它们不仅具有共同的研究对象,而且在具体应用时,常常必须互相补充。,10,相关分析与回归分析之间在研究目的和方法上是有明显区别的。 相关分析研究变量之间相关的方向和相关的程度。回归分析则是研究变量之间相互关系的具体形式,它对具有相关关系的变量之间的数量联系进行测定,确定一个相关的数学表达式,根据这个数学方程式可以从已知量来推测未知量,从而为估算和预测提供一个重要的方法。 相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。可以不必确定变量中哪个是自变量,哪个是因变量,其所涉及的变量可以都是随机变量。而

6、回归分析则必须事先研究确定具有相关关系的变量中哪个为自变量,哪个为因变量。一般地说,回归分析中因变量是随机的,而把自变量作为研究时给定的非随机变量。 在应用项关于回归分析方法对客观现象进行研究时,一定要始终注意把定性分析和定量分析结合起来,在定性分析的基础上开展定量分析。,11,【例7-1】教堂数与监狱服刑人数同步增长。(引自吴柏林现代统计学,吴南图书出版有限公司,年版。) 美国印第安纳州的地区教会想要筹款兴建新教堂,提出教堂能洁净人们的心灵,减少犯罪,降低监狱服刑人数的口号。为了增进民众参与的热诚和信心,教会的神父收集了近年的教堂数与在监狱服刑的人数进行统计分析。结果却令教会大吃一惊。最近年

7、教堂数与监狱服刑人数呈显著的正相关。那么是否可以由此得出,教堂建得越多,就可能带来更多的犯罪呢?经过统计学家和教会神父深入讨论,并进一步收集近年的当地人口变动资料和犯罪率等资料作进一步分析,发现监狱服刑人数的增加和教堂数的增加都与人口的增加有关。教堂数的增加并非监狱服刑人数增加的原因。至此,教会人士总算松了一口气。,12,四、相关图,相关图又称散点图。它是以直角坐标系的横轴代表变量X,纵轴代表变量Y,将两个变量间相对应的变量值用坐标点的形式描绘出来,用来反映两变量之间相关关系的图形。,13,第二节 简单线性相关与回归分析,一、相关系数及其检验 二、标准的一元线性回归模型 三、一元线性回归模型的

8、估计 四、一元线性回归模型的检验 五、一元线性回归模型预测,14,一、相关系数及其检验,(一)相关系数的定义 总体相关系数的定义式是 总体相关系数是反映两变量之间线性相关程度的一种特征值,表现为一个常数。 样本相关系数的定义公式是 上式中, 和 分别是和的样本平均数。 样本相关系数是根据样本观测值计算的,抽取的样本不同,其具体的数值也会有所差异。样本相关系数是总体相关系数的一致估计量。,15,(二)相关系数的特点 r的取值介于-1与1之间。 当r=0时,与的样本观测值之间没有线性关系。 在大多数情况下,00时,与为正相关,当r0时,与为负相关。 如果r=1,则表明与完全线性相关,当r=1时,称

9、为完全正相关,而-1时,称为完全负相关。 是对变量之间线性相关关系的度量。r=0只是表明两个变量之间不存在线性关系,它并不意味着与之间不存在其他类型的关系。对于二者之间可能存在的非线性相关关系,需要利用其他指标去进行分析。,16,(三)相关系数的计算 具体计算样本相关系数时,通常利用以下公式:,17,【例7-2】表7-1是 1992年-2003年我国城镇居民人均年消费性支出和人均年可支配收入的有关资料,试计算消费性支出与可支配收入的样本相关系数。,18,(四)相关系数的检验 对总体相关系数 是否等于进行检验。 计算相关系数r的值: 根据给定的显著性水平和自由度(n-2),查找分布表中相应的临界

10、值t/2。若tt/2,表明在统计上是显著的。 若tt/2,表明在统计上是不显著的。,19,【例7-3】假设根据对样本观测数据计算出某公司的股票价格与气温的样本相关系数r=0.5,试问是否可以根据的显著水平认为该公司的股票与气温之间存在一定程度的线性相关关系? 解: 0:;1: 的检验值 查表可知:显著水平为,自由度为的临界值t/2=2.776 ,上式中的t值小于2.776,因此,不能通过显著性检验。这就是说,尽管根据样本观测值计算的达到0.5,但是由于样本单位过少,这一结论并不可靠,它不足以证明该公司的股票与气温之间存在一定程度的线性相关关系。,20,二、标准的一元线性回归模型,(一)总体回归

11、函数 上式被称为总体回归函数。式中的1和2是未知的参数,又叫回归系数。t和t分别是和的第个观测值。u t是随机误差项,又称随机干扰项,它是一个特殊的随机变量,反映未列入方程式的其他各种因素对的影响。,21,(二)样本回归函数 在现实问题研究中,由于所要研究的现象的总体单位数一般是很多的,在许多场合甚至是无限的,因此无法掌握因变量总体的全部取值。也就是说,总体回归函数事实上是未知的,需要利用样本的信息对其进行估计。 一元线性回归模型的样本回归线可表示为: 式中 的是样本回归线上与t相对应的值,可视为(t)的估计; 是样本回归函数的截距系数, 是样本回归函数的斜率系数,它们是对总体回归系数1和2的

12、估计。,22,实际观测到的因变量t值,并不完全等于 ,如果用t表示二者之差(), 则有: (,.) 上式称为样本回归函数。式中t称为残差。,23,样本回归函数与总体回归函数之间的间的区别。 总体回归线是未知的,它只有一条。而样本回归线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归线。 总体回归函数中的1和2是未知的参数,表现为常数。而样本回归函数中的 和 是随机变量,其具体数值随所抽取的样本观测值不同而变动。 总体回归函数中的ut是t与未知的总体回归线之间的纵向距离,它是不可直接观测的。而样本回归函数中的t是t与样本回归线之间的纵向距离,当根据样本观测值拟合出样本回归线之后,可

13、以计算出t的具体数值。,24,(三)误差项的标准假定 假定:误差项的期望值为,即对所有的总有 假定:误差项的方差为常数,即对所有的总有 假定:误差项之间不存在序列相关关系,其协方差为零,即当时有: 假定:自变量是给定的变量,与随机误差项线性无关。 假定:随机误差项服从正态分布。 满足以上标准假定的一元线性模型,称为标准的一元线性回归模型。,25,三、一元线性回归模型的估计,(一)回归系数的点估计 所谓最小二乘法就是根据这一思路,是通过使残差平方和为最小来估计回归系数的一种方法。,加以整理后有,以上方程组称为正规方程组或标准方程组,式中的是样本容量。求解这一方程组可得:,26,【例7-】我们利用

14、例7-2的表7-1中已给出我国历年城镇居民人均消费支出和人均可支配收入的数据,来估计我国城镇居民的边际消费倾向和基础消费水平。 解:t12tut =50.07312-0.751162.976120.2310 样本回归方程为: 上式中:0.7511是边际消费倾向,表示人均可支配收入每增加1千元,人均消费支出会增加0.7511千元;0.2310是基本消费水平,即与收入无关最基本的人均消费为0.2310千元。,27,(二)总体方差的估计 数学上可以证明,2的无偏估计S2可由下式给出: 式中,分子是残差平方和,分母是自由度,其中是样本观测值的个数,是一元线性回归方程中回归系数的个数。S2的正平方根又叫

15、做回归估计的标准误差。 一般采用以下公式计算残差平方和: 上式的推导过程如下:,28,【例7-】根据例7-中给出的有关数据和例7-中已得到的回归系数估计值,计算我国城镇居民消费函数的总体方差S2和回归估计标准差S。 解:根据例7-中给出的有关数据和例7-中已得到的回归系数估计值,可得: =232.772-0.23150.073-0.751 294.454 =0.041 S2=0.041/(12-2)=0.0041 进而有:S=0.064,29,(三)最小二乘估计量的性质 按照最小二乘法求得的估计总体回归系数的数学公式是样本观测值的函数,通常称之为最小二乘估计量。 可以证明,在标准假定能够得到满

16、足的条件下,回归系数的最小二乘估计量的期望值等于其真值,即有: 其方差为: 和 的期望值与方差的推导过程基本类似。这里只就 进行证明。,30,为了便于讨论,将Yt12Xtut代入 估计量,并作以下变形: 为了推导上式,利用了以下恒等式: 这样,回归系数的最小二乘估计量可以表现为所要估计的参数的真值与随机误差项的线性组合。由于我们已假定t是给定的变量(不是随机变量),因此,同各期误差项相乘的权数也都是确定量。为了叙述的方便,令,31,利用前面所述的关于随机误差项的标准假定和期望值运算的规则,可以证明 的期望值和方差分别为:,根据标准假定,根据标准假定,根据标准假定、3,根据标准假定2,根据标准假定,证毕。,32,由以上推导过程可知,最小二乘估计量是因变量观测值t的线性函数,其期望值等于总体回归系数的真值。因此,最小二乘估计量是总体回归系数的线性无偏估计量。数学上还可以进一步证明,在所有的线性无偏估计量中,回归系数的最小二乘估计量的方差最小

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号