《双变量线性回归》PPT课件

上传人:xian****812 文档编号:304939652 上传时间:2022-06-06 格式:PPT 页数:140 大小:1.76MB
返回 下载 相关 举报
《双变量线性回归》PPT课件_第1页
第1页 / 共140页
《双变量线性回归》PPT课件_第2页
第2页 / 共140页
《双变量线性回归》PPT课件_第3页
第3页 / 共140页
《双变量线性回归》PPT课件_第4页
第4页 / 共140页
《双变量线性回归》PPT课件_第5页
第5页 / 共140页
点击查看更多>>
资源描述

《《双变量线性回归》PPT课件》由会员分享,可在线阅读,更多相关《《双变量线性回归》PPT课件(140页珍藏版)》请在金锄头文库上搜索。

1、第二章第二章 双变量线性回归双变量线性回归1回归分析概述回归分析概述 模型的基本假设模型的基本假设 模型的参数估计模型的参数估计 模型的统计检验模型的统计检验 模型的预测模型的预测 实例实例主要内容主要内容22.1 回归分析概述回归分析概述 变量间的关系及回归分析的基本概念变量间的关系及回归分析的基本概念 总体回归函数(总体回归函数(PRF) 随机扰动项随机扰动项 样本回归函数(样本回归函数(SRF)3 确定性关系或函数关系:研究的是确定确定性关系或函数关系:研究的是确定 现象非随机变量间的关系。现象非随机变量间的关系。统计依赖或相关关系:研究的是非确定统计依赖或相关关系:研究的是非确定现象随

2、机变量间的关系。现象随机变量间的关系。一、变量间的关系及回归分析的基本概念一、变量间的关系及回归分析的基本概念变量间的关系包括:变量间的关系包括:4对变量间统计依赖关系的考察主要是通过相关对变量间统计依赖关系的考察主要是通过相关分析分析(correlation analysis)或回归分析或回归分析(regression analysis)来完成的。来完成的。相关分析对称地对待任何(两个)变量,两个相关分析对称地对待任何(两个)变量,两个变量都被看作是随机的。回归分析对变量的处变量都被看作是随机的。回归分析对变量的处理方法存在不对称性,即区分因变量(被解释理方法存在不对称性,即区分因变量(被解

3、释变量)和自变量(解释变量):前者是随机变变量)和自变量(解释变量):前者是随机变量,后者不是。量,后者不是。5回归分析的基本概念回归分析的基本概念回归分析回归分析(regression analysis)是研究一个变量是研究一个变量关于另一个(些)变量的具体依赖关系的计关于另一个(些)变量的具体依赖关系的计算方法和理论。算方法和理论。其目的在于通过后者的已知或设定值,去估其目的在于通过后者的已知或设定值,去估计和(或)预测前者的(总体)均值。计和(或)预测前者的(总体)均值。被解释变量被解释变量(Explained Variable)或因变量或因变量(Dependent Variable)。

4、解释变量解释变量(Explanatory Variable)或自变量或自变量(Independent Variable)。6 回归分析构成计量经济学的方法论回归分析构成计量经济学的方法论基础,其主要内容包括:基础,其主要内容包括:根据样本观察值对经济计量模型参数进根据样本观察值对经济计量模型参数进行估计,求得回归方程;行估计,求得回归方程;对回归方程、参数估计值进行显著性检对回归方程、参数估计值进行显著性检验;验;利用回归方程进行分析、评价及预测利用回归方程进行分析、评价及预测。7二、总体回归函数(二、总体回归函数(PRF)回归分析关心的是根据解释变量的已知或给回归分析关心的是根据解释变量的已

5、知或给定值,考察被解释变量的总体均值,即当解定值,考察被解释变量的总体均值,即当解释变量取某个确定值时,与之统计相关的被释变量取某个确定值时,与之统计相关的被解释变量所有可能出现的对应值的平均值。解释变量所有可能出现的对应值的平均值。8例:例:一个假想的社区有一个假想的社区有100户家庭组成,要研户家庭组成,要研究该社区每月家庭消费支出究该社区每月家庭消费支出Y 与每月家庭可支与每月家庭可支配收入配收入X 的关系。的关系。 即如果知道了家庭的月收入,即如果知道了家庭的月收入,能否预测该社区家庭的平均月消费支出水平。能否预测该社区家庭的平均月消费支出水平。 为达到此目的,将该为达到此目的,将该1

6、00户家庭划分为组内收户家庭划分为组内收入差不多的入差不多的10组,以分析每一收入组的家庭消组,以分析每一收入组的家庭消费支出。费支出。910由于不确定性因素的影响,对同一收入水平由于不确定性因素的影响,对同一收入水平 X,不,不同家庭的消费支出并不完全相同;同家庭的消费支出并不完全相同;但由于调查的完备性,给定收入水平但由于调查的完备性,给定收入水平 X 的消费支的消费支出出 Y 的分布是确定的,即以的分布是确定的,即以 X 的给定值为条件的的给定值为条件的 Y 的条件分布(的条件分布(Conditional distribution)是已知)是已知的,例如:的,例如:P(Y=561|X=8

7、00)=1/4。11因此,给定收入因此,给定收入 X 的值的值 Xi ,可以得到消费支出,可以得到消费支出Y的的条件均值条件均值(conditional mean)或或条件期望条件期望(conditional expectation):):E( Y | X = Xi )。该例中:该例中:E(Y | X = 800) = 605描出散点图发现:随着收入的增加,消费描出散点图发现:随着收入的增加,消费“平均平均地说地说”也在增加,且也在增加,且 Y 的条件均值均落在一条的条件均值均落在一条正斜率的直线上。这条直线称为正斜率的直线上。这条直线称为总体回归线总体回归线。1205001000150020

8、002500300035005001000150020002500300035004000每月可支配收入X(元)每月消费支出Y(元)13在给定解释变量在给定解释变量 Xi 条件下被解释变量条件下被解释变量 Yi 的期望轨的期望轨迹称为迹称为总体回归线总体回归线(population regression line),),或更一般地称为总体回归曲线(或更一般地称为总体回归曲线(population regression curve)。)。相应的函数:相应的函数:称为(双变量)称为(双变量)总体回归函数总体回归函数(population regression function, PRF)。)。 1

9、4含义:总体回归函数含义:总体回归函数(PRF)说明被解释变量说明被解释变量 Y Y 的平均状态(总体条件期望)随解释变量的平均状态(总体条件期望)随解释变量 X X 变变化的规律。化的规律。函数形式:可以是线性或非线性的。函数形式:可以是线性或非线性的。例例子子中,将居民消费支出看成是其可支配收入的中,将居民消费支出看成是其可支配收入的线性函数时线性函数时: : 为一线性函数。其中,为一线性函数。其中, 0 0, 1 1是未知参数,称为是未知参数,称为回归系数回归系数(regression coefficients)。)。15 “线性线性”一词的含义(有两种解释)一词的含义(有两种解释)1、

10、模型就、模型就变量变量而言是线性的而言是线性的2、模型就、模型就参数参数而言是线性的而言是线性的例例例如:例如:注:在计量经济学中,从回归理论的发展、注:在计量经济学中,从回归理论的发展、参数的估计方法来说,主要考虑的是模型就参数的估计方法来说,主要考虑的是模型就参数参数而言是线性的情形。而言是线性的情形。16三、随机扰动项三、随机扰动项w总体回归函数说明在给定的收入水平总体回归函数说明在给定的收入水平 Xi 下,该社区家下,该社区家庭庭平均的平均的消费支出水平。消费支出水平。w但对某一个别的家庭,其消费支出可能与该平均水平存但对某一个别的家庭,其消费支出可能与该平均水平存在偏差。在偏差。w

11、称为观察值围绕它的期望值的称为观察值围绕它的期望值的离差离差(deviation),它是一个不可观测的随机变量,又称为),它是一个不可观测的随机变量,又称为随机扰动项随机扰动项(stochastic disturbance)或)或随机误差项随机误差项(stochastic error)。)。17 上例中,给定收入水平上例中,给定收入水平 Xi ,个别家庭的支出可表示为个别家庭的支出可表示为两部分之和:两部分之和:w该收入水平下所有家庭的平均消费支出该收入水平下所有家庭的平均消费支出E(Y | Xi),称为,称为系统性(系统性(systematic)或确定性()或确定性(deterministi

12、c)部分;部分;w其他随机或非确定性(其他随机或非确定性(nonsystematic)部分为部分为 ui 。w 称为总体回归函数称为总体回归函数(PRF)的随机设定形式。表明被解释变量除了受解释)的随机设定形式。表明被解释变量除了受解释变量的系统性影响外,还受其他因素的随机性影响。由变量的系统性影响外,还受其他因素的随机性影响。由于方程中引入了随机项,成为计量经济学模型,因此也于方程中引入了随机项,成为计量经济学模型,因此也称为总体回归模型。称为总体回归模型。18随机误差项的意义随机误差项的意义理论的模糊性理论的模糊性数据的欠缺数据的欠缺核心变量与周边变量核心变量与周边变量人类行为的内在随机性

13、人类行为的内在随机性糟糕的替代变量糟糕的替代变量节省原则节省原则(Occams razor)错误的函数形式错误的函数形式19四、样本回归函数四、样本回归函数(SRF)问题:问题:是否能从一次抽样中获得总体的近似的信息?如果可是否能从一次抽样中获得总体的近似的信息?如果可以,如何从抽样中获得总体的近似信息?以,如何从抽样中获得总体的近似信息?例:例:在上例的总体中有如下一个样本,能否从该样本估计总在上例的总体中有如下一个样本,能否从该样本估计总体回归函数体回归函数PRF? 回答:能回答:能20该样本的散点图(该样本的散点图(scatter diagram)如下:如下: 画一条直线以尽好地拟合该散

14、点图,由于样本取自总体,画一条直线以尽好地拟合该散点图,由于样本取自总体,可以将该直线近似地代表总体回归线。该直线称为可以将该直线近似地代表总体回归线。该直线称为样本回归线样本回归线(sample regression lines)。)。21w样本回归线可以看成总体回归线的近似替代。样本回归线可以看成总体回归线的近似替代。w样本回归线的函数形式为:样本回归线的函数形式为: 即为即为样本回归函数样本回归函数(sample regression function,SRF)。)。 为为 E(Y |Xi ) 的的估计量;估计量; 为为 i 的估计量,的估计量,(i = 0,1)。22样本回归函数的随机

15、形式样本回归函数的随机形式/ /样本回归模型:样本回归模型:同样地,样本回归函数也有如下的随机形式:同样地,样本回归函数也有如下的随机形式: 由于方程中引入了随机项,成为计量经济模由于方程中引入了随机项,成为计量经济模型,因此也称为型,因此也称为样本回归模型样本回归模型(sample regression model)。 23 回归分析的主要目的:根据样本回归函数回归分析的主要目的:根据样本回归函数SRF,估计总体回归函数,估计总体回归函数PRF。即,根据即,根据估计估计242.2 模型的基本假设模型的基本假设 仍以家庭收入仍以家庭收入X X与消费支出与消费支出Y Y之间的关系为例,之间的关系

16、为例,每个家庭的消费支出每个家庭的消费支出Y Y主要取决于该家庭的收入主要取决于该家庭的收入X X,但是也受其他因素的影响。但是也受其他因素的影响。高收入家庭,消费支出的离散性比较大高收入家庭,消费支出的离散性比较大( (方差较大方差较大) )低收入家庭,消费支出的离散性比较小低收入家庭,消费支出的离散性比较小( (方差较小方差较小) ) 通常,消费支出通常,消费支出Y Y 的分布函数是多种多样的,的分布函数是多种多样的,不一定是正态分布,也不一定是相同的分布。分布不一定是正态分布,也不一定是相同的分布。分布函数的方差、均值都不相同,分布函数的形式也不函数的方差、均值都不相同,分布函数的形式也不同。同。25家庭消费支出家庭消费支出Y是家庭收入是家庭收入X的条件概率函数的条件概率函数P(Y |Xi)。这个概率函数有三个明显特征:这个概率函数有三个明显特征: 对于不同的对于不同的X,条件概率条件概率P(Y|Xi)的分布函数形式不同的分布函数形式不同 对于不同的对于不同的X,条件概率条件概率P(Y|Xi)的方差不同的方差不同 对于不同的对于不同的X,条件概率条件概率P(Y|Xi)的均值的均值

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号