一元线性回归模型new

上传人:艾力 文档编号:51704510 上传时间:2018-08-16 格式:PPT 页数:99 大小:1.70MB
返回 下载 相关 举报
一元线性回归模型new_第1页
第1页 / 共99页
一元线性回归模型new_第2页
第2页 / 共99页
一元线性回归模型new_第3页
第3页 / 共99页
一元线性回归模型new_第4页
第4页 / 共99页
一元线性回归模型new_第5页
第5页 / 共99页
点击查看更多>>
资源描述

《一元线性回归模型new》由会员分享,可在线阅读,更多相关《一元线性回归模型new(99页珍藏版)》请在金锄头文库上搜索。

1、1第二章 经典单方程计量经济学模型: 一元线性回归模型 回归分析概述 一元线性回归模型的参数估计 一元线性回归模型检验 一元线性回归模型预测 实例分析2 授课目标与要求: 经典单方程计量经济学模型的一元线性回归模型,是 课程最基础的内容。通过教学,要求学生达到: 理解经典线性单方程计量经济学模型的数理统计学基 础,包括回归分析、假设检验和区间估计; 熟练掌握经典线性单方程计量经济学模型的理论与方 法,包括基本假设、模型估计和统计检验; 理解最小二乘原理和最大或然原理,以及在模型估计 中的应用。 本章重点和难点: 第二节:一元线性回归模型的参数估计 第三节:一元线性回归模型的统计检验 32.1

2、回归分析概述一、回归分析的基本概念二、简单线性相关分析三、总体回归函数(PRF)四、随机扰动项五、样本回归函数(SRF)4一、回归分析的基本概念 变量间的关系 相关分析的基本概念 回归分析的基本概念 几点注意事项 51. 变量间的关系确定性关系或函数关系:研究的是确定现象非随机 变量间的关系。统计依赖或相关关系:研究的是随机变量间的非确 定关系。又分为简单相关(存在于两个变量之间的相 关关系)和多重相关(存在于三个及以上变量之间的 相关关系)。 模糊关系(随机变量的似有似无)62、相关分析的基本概念相关关系,是指两个或两个以上的变量,其样本序列观测 值之间表现出来的随机数学关系,常用相关系数来

3、衡量, 主要用来判断变量间是否相关。如果两个变量样本序列观 测值之间的相关系数的绝对值为1,则二者之间具有完全的 相关关系。 偏相关关系,是指一个变量与其他两个或两个以上变量的 线性组合之间的相关关系。该变量与每一个变量间的相关 系数又称偏相关系数。 因果关系,是指两个或两个以上的变量,在行为机制等方 面上的依赖性。因果关系有单向因果关系和双向因果关系 之分。如:价格与供给,价格与需求,投资与GDP等。 具有因果关系的变量之间一定具有数学上的相关关系;而 具有相关关系的变量之间并不一定就具有因果关系。如: GDP与一棵小树的生长速度,中国GDP与印度人口的关系。 相关分析,是判断变量之间是否具

4、有相关关系的一种数学 分析方法,一般是通过计算变量之间的相关系数来实现。7对变量间统计依赖关系的考察主要是通过相关分析( correlation)或回归分析(regression)来完成的。 相关分析是讨论变量之间相关程度的一种统计分析方法。 在相关分析中,通常假设两个变量:对其是同等看待的 ,不考虑其因果关系,对自变量和因变量不加区别, 两个变量均是随机变量。 正相关线性相关不相关 相关系数 (-11)统计依赖关系负相关有因果关系回归分析正相关无因果关系相关分析非线性相关不相关负相关83、回归分析的基本概念回归分析,回归分析也是判断变量间是否相关的一种数学 分析方法,他着重判断一个随机变量与

5、一个或几个可控变 量之间是否具有依赖关系的计算方法和理论。 其目的在于通过后者的已知或设定值,去估计和(或)预 测前者的(总体)均值。 因果分析,是分析变量之间的原因和结果。由于回归分析 的特定功能,回归分析也通常被用来进行变量之间的因果 分析。但仅靠回归分析还不能对变量间的因果关系做出最 后的判断,必须与经济行为的定性分析等相结合。 回归分析是计量经济学的方法论基础,其主要内容包括: 根据样本观察值对经济计量模型参数进行估计,求得回归 方程; 对回归方程、参数估计值进行显著性检验; 利用回归方程进行分析、评价及预测。94、注意事项不线性相关并不意味着不相关。 有相关关系并不意味着一定有因果关

6、系。 回归分析和相关分析:都是研究随机变量间的统计 依赖关系,并能测度线性依赖程度的大小,不关注 具体的依赖关系。但它们并不意味着一定有因果关 系。 相关分析:仅仅从统计数据上测度变量间的相关程 度,无需考察两者间的因果关系,对称地对待任何 (两个)变量,两个变量都被看作是随机的。 回归分析:更注重变量间的因果关系和具体的依赖 关系,对变量的处理方法存在不对称性,即区分应 变量(被解释变量)和自变量(解释变量),前者 是随机变量,后者不是。10二、简单线性相关分析 总体相关系数 样本相关系数 样本相关系数的取值范围 相关系数的显著性检验 线性相关理论的局限性111、总体相关系数 总体相关系数。

7、通过观察散点图只能得到两个变量之 间相关关系的一个粗略概念。要想精确刻画他们之间 的相关程度,需要采用一个数量指标相关系数来描 述。大致进行分析判断。两个变量X、Y之间真实的相 关程度,使用总体相关系数来表示的,即: =Cov(X,Y)/ (Var(X)Var(Y) 1/2=XY/(X2Y2)1/2 可以证明总体相关系数的取值范围定义为-1到1之间, 即:-1,1,当其取不同值时,两变量间的相关 关系也就确定了。 122、样本相关系数样本相关系数。由于两个变量X、Y之间的总体相关系数一般无 法获得,因此经常用某个特定的样本相关系数r作为总体相关系 数的一个估计值(或替代值)。假定:有一个样本容

8、量为n的 样本,在X、Y平面上的散点图如下: 今令均值为:X=Xi/n,Y=Yi/n; 令离差变量为:xi=Xi-X,yi=Yi-Y。 Yi 在散点图上作均值X、Y的直线。 . . xi、yi表示第i个观测点与均值 . . . (X、Y)偏离的远近和方向。 . . . . 在散点图上:在散点图上:当(Xi,Yi) 落在 Y . . . . 、象限时,xi、yi同号, . yi . . . 即xiyi0;否则xiyi0;否则xiyi r时,则X,Y显著线性相关,否 则不显著。165、线性相关理论的局限性 上述线性相关理论,只适应于两个变量间的线性关系,当 r=0时,只表示X,Y线性无关,并不意味

9、着X,Y相互独立 。 线性相关理论,只能反映变量之间相互关系的密切程度, 并不意味着任何函数关系。 X,Y间的高度相关可能源于以下几种情况:、X,Y间 存在因果关系;、X,Y同时受到某个因素的影响,但并 无因果关系,如时间;、X,Y间的相关关系纯属偶然, 称之为假相关、伪相关或偶然相关。 线性相关系数r是用来衡量所有观测值的点(Xi,Yi)围绕直 线的密集程度,但它不能确定直线方程及其任何形式,不 能给出该直线的函数式及其参数值。 不同斜率的直线,其相关系数可能是相同的。 17三、总体回归函数 回归分析 案例分析 总体回归函数181、回归分析回归分析:相关关系的特征是不确定性,一个变量不能依

10、据其他有关变量的数值,精确地、一一对应地求出其数值 。但是,我们可以根据大量的统计数据,找出变量之间在 数量变化方面的统计规律,这种统计规律所表现出来的数 量关系就叫做回归关系,描述这种回归关系的数学公式就 称为回归方程; 有关回归关系的计算方法和理论称为回归分析。又分为: 一元回归分析(方程)、多元回归分析(方程);线性回 归分析(方程)、非线性回归分析(方程)。 回归分析关心的是根据解释变量的已知或给定值,考察被 解释变量的总体均值,即当解释变量取某个确定值时,与 之统计相关的被解释变量所有可能出现的对应值的平均值对应值的平均值 回归分析的主要目的有三点:、根据样本观测值,对模 型参数进行

11、估计,求得回归方程;、对回归方程、模型 参数估计值进行显著性检验;、利用回归方程进行预测 和控制。192、案例分析: 案例2.1.2:一个假想的社区有100户家庭组成,要研究 该社区每月家庭消费支出Y与每月家庭可支配收入X的关 系。 即如果知道了家庭的月收入,能否预测该社区家 庭的平均月消费支出水平? 为达到此目的,将该100户家庭划分为组内收入差不大 (可支配收入水平)的10组,以分析每一可支配收入组 的家庭消费支出。 由于不确定因素的影响,对同一收入水平X,不同家庭 的消费支出可能不完全相同;见下表:21但由于调查的完备性,给定收入水平X的消费支出Y的 分布是确定的,即以X的给定值为条件的

12、Y的条件分布 (Conditional distribution)是已知的,例如: P(Y=561|X=800)=1/4。 因此,给定收入X的某一个值Xi,可得消费支出Y的条件 均值(conditional mean)或条件期望值( conditional expectation):E(Y|X=Xi)。 该例中:E(Y | Xi=800)=605 描出散点图发现:虽然不同的家庭其消费支出存在差 异,但是,随着收入的增加,消费“平均地说”也在增 加,且Y的条件均值均落在一根正斜率的直线上。这条 直线称为总体回归线。05001000150020002500300035005001000150020

13、002500300035004000每月可支配收入X(元)每月消费支出 Y(元)233、总体回归函数在给定解释变量Xi条件下被解释变量Yi的期望轨迹称为总体 回归线(population regression line),或更一般地称为总 体回归曲线(population regression curve)。 相应的函数: 称为(双变量)总体回归函数(population regression function, PRF)。 含义:回归函数(PRF)说明被解释变量Y的平均状态( 总体条件期望)随解释变量X变化的规律。函数形式:可 以是线性或非线性的。 案例中,将居民消费支出看成是其可支配收入的

14、线性函数 时,为一线性函数: 其中,0,1是未知参数,称为总体回归系数(regression coefficients)。24四、随机扰动项 随机扰动项 总体回归模型 引入随机误差项的主要原因251、随机扰动项 在案例2.1.2中,总体回归函数说明在给定的收入水平 Xi下,该社区家庭平均的消费支出水平Y 。 但对某一个别的家庭,其消费支出Yi可能与该平均水 平Y有偏差,并且聚集在平均水平Y 的周围。 对任何个别家庭,记: 称i为观察值Yi围绕它的期望值的离差(deviation), 它是一个不可观测的随机变量,又称为随机干扰项( stochastic disturbance)或随机误差项(st

15、ochastic error)。 观测值点的散布情况表明了经济行为间的真实关系,直 线仅仅表示了这种真实关系的理论部分,观测值的点 与直线的偏离程度离差i,表示了这种真实关系的 随机成分。262、总体回归模型在例2.1.2中,给定收入水平Xi ,个别家庭的支出可表示为两 部分之和:Yi=E(Y|Xi )+ i= 0+1Xi + i 该收入水平下所有家庭的平均消费支出E(Y|Xi),称为系 统性(systematic)或确定性(deterministic)部分; 其他称为随机或非确定性(nonsystematic)部分i。 上式又称为总体回归函数(PRF)的随机设定形式。表明被 解释变量除了受解释变量的系统性影响外,还受其他因素 的随机性影响, 就成为这些随机影响因素的综合代表。 由于方程中引入了随机项,成为计量经济学模型,因此也 称其为总体回归模型。随机扰动项 i=Yi -E(Yi) 不难证明,对应于Xi值的条件下,Yi的期望值即:E(Yi)。那 么Yi的期望值E(Yi)的轨

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号