计量经济学-第2章一元线性回归模型1课件

上传人:F****n 文档编号:88292362 上传时间:2019-04-23 格式:PPT 页数:181 大小:1.66MB
返回 下载 相关 举报
计量经济学-第2章一元线性回归模型1课件_第1页
第1页 / 共181页
计量经济学-第2章一元线性回归模型1课件_第2页
第2页 / 共181页
计量经济学-第2章一元线性回归模型1课件_第3页
第3页 / 共181页
计量经济学-第2章一元线性回归模型1课件_第4页
第4页 / 共181页
计量经济学-第2章一元线性回归模型1课件_第5页
第5页 / 共181页
点击查看更多>>
资源描述

《计量经济学-第2章一元线性回归模型1课件》由会员分享,可在线阅读,更多相关《计量经济学-第2章一元线性回归模型1课件(181页珍藏版)》请在金锄头文库上搜索。

1、1,第二章 经典单方程计量经济学模型: 一元线性回归模型,2.1回归分析概述 2.2一元线性回归模型的参数估计 2.3一元线性回归模型检验 2.4一元线性回归模型预测 2.5实例,2,2.1 回归分析概述,一、变量间的关系及回归分析的基本概念 二、总体回归函数(PRF) 三、随机扰动项(随机干扰项) 四、样本回归函数(SRF),3,一、变量间的关系及回归分析的基本概念,1. 变量间的关系 (1)确定性关系或函数关系:研究的是确定现象非随机变量间的关系。,(2)统计依赖或相关关系:研究的是非确定现象随机变量间的关系。,4,函数关系,是一一对应的确定关系 设有两个变量 x 和 y ,变量 y 随变

2、量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量 各观测点落在一条线上,5,函数关系 (几个例子), 函数关系的例子 某种商品的销售额(y)与销售量(x)之间的关系可表示为 y = px (p 为单价) 圆的面积(S)与半径之间的关系可表示为S=R2 企业的原材料消耗额(y)与产量(x1) 、单位产量消耗(x2) 、原材料价格(x3)之间的关系可表示为y = x1 x2 x3,6,相关关系 (correlation),变量间关系不能用函数关系精确表达 一个变量的

3、取值不能由另一个变量唯一确定 当变量 x 取某个值时,变量 y 的取值可能有几个 各观测点分布在直线周围,7,对变量间统计依赖关系的考察主要是通过相关分析(correlation analysis)或回归分析(regression analysis)来完成的,8,相关关系(几个例子), 相关关系的例子 父亲身高(y)与子女身高(x)之间的关系 收入水平(y)与受教育程度(x)之间的关系 粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温度(x3)之间的关系 商品的消费量(y)与居民收入(x)之间的关系 商品销售额(y)与广告费支出(x)之间的关系,9,相关关系(类型),10,相关关系的描

4、述与测度 (散点图),11,散点图 (scatter diagram),12,散点图(例题分析),【例】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。下面是该银行所属的25家分行2002年的有关业务数据,13,散点图(例题分析),14,散点图(例题分析),15,相关系数 (correlation coefficient),对变量之间关系密切程

5、度的度量 对两个变量(xi, yi) , i = 1, 2, , n 之间线性相关程度及方向的度量称为简单相关系数 若相关系数是根据总体全部数据计算的,称为总体相关系数,记为 若是根据样本数据计算的,则称为样本相关系数,记为 r,16,相关系数 (计算公式), 样本相关系数的计算公式,或化简为,17,(xi, yi) , i = 1, 2, , n 其平均数与标准差分别为sX,sY 则样本相关系数r定义为:,相关系数 (计算公式),18,相关系数(取值及其意义),r 的取值范围是 -1,1 r =1,为完全正相关 r =-1,为完全负相关 r = 0,不存在线性相关关系 |r|越趋于1表示关系

6、越密切;|r|越趋于0表示关系越不密切,19,相关系数的特性,相关系数中,两变量并不区分解释变量或被解释变量。 相关系数的计算以数值型变量为主,此公式不适用于类别变量。 相关系数的计算使用标准化值,与各数值型变量的度量单位无关。,20,相关系数(例题分析),21,线性关系的不同强度之r,22,练习1,下表中的数据列出了某市2005年18月的月平均气温X和每户平均啤酒消费量Y。 (1)画出散点图 (2)计算相关系数R,23,练习,将某年21家企业的广告预算与这些企业产品的观看者每周保留的印象次数相联系。 以印象数为纵轴、以广告支出为横轴画散点图。 你认为这两个变量之间的关系具有什么样的性质? 看

7、一下你的图,你认为值得作广告吗?,25,26,验证:配第克拉克法则,随着人均GDP的增加,或者说随着一个国家经济的发展,就业结构也会发生相应的变化,第一产业中就业人数的比例会下降,而第二和第三产业的就业比例会上升。,27,回归分析,28,“回归”一次的历史渊源,回归这个术语是由英国著名统计学家Francis Galton在19世纪末期研究孩子及他们的父母的身高时提出来的。 孩子的身高会趋向平均发展。 当双亲的身高都很高(矮)时,他们的孩子身高虽然会高(矮)于一般人,却往往比父母亲矮(高)。 高尔顿的普遍回归定律。(law of universal regression),相关文献,29,回归的

8、现代释义,回归分析是关于研究一个叫做因变量的变量对另一个或多个叫做解释变量的变量的依赖关系,其用意在于通过后者(在重复抽样中)的已知或设定值,取估计或预测前者的(总体)均值。,30,举例,高尔顿的普遍回归定律。高尔顿的兴趣在于发现为什么人口的身高分布有一种稳定性。但现代观点关心的则是给定父辈身高的情形下找出儿辈平均身高的变化。即关心一旦知道了父辈的身高,怎样预测儿辈的平均身高。,60,70,65,75,60,65,70,75,父辈身高,英寸,儿辈身高,英寸,对应于给定父亲身高的儿子身高的假想分布,31,什么是回归分析?(Regression),从一组样本数据出发,确定变量之间的数学关系式 对这

9、些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著(即确定因果关系及影响大小) 利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度,32,回归与因果关系,肯德尔(Kendall)和斯图尔特(Stuart)说“一个统计关系式,不管多强也不管多么有启发性,却永远不能确立因果方面的联系;对因果关系的理念,必须来自于统计学以外,最终来自这种或那种理论。” 虽然回归分析研究一个变量对另一(些)变量的依赖关系,但它并不一定意味着因果关系。,33,相关关系和回归分析,注意 相关分析测度两个变量之间的线

10、性关联力度。相关系数就是测度关联强度的。 相关分析对称地对待任何(两个)变量,两个变量都被看作是随机的。回归分析对变量的处理方法存在不对称性,即区分应变量(被解释变量)和自变量(解释变量):前者是随机变量,后者是固定的。 相关关系关心两个变量间关系的紧密程度;回归分析感兴趣的则是试图根据其他变量的设定值来估计或预测某一变量的平均值。,34,回归分析构成计量经济学的方法论基础,其主要内容包括: (1)根据样本观察值对经济计量模型参数进行估计,求得回归方程; (2)对回归方程、参数估计值进行显著性检验; (3)利用回归方程进行分析、评价及预测。,35,回归模型的类型,36,二、总体回归函数,回归分

11、析关心的是根据解释变量的已知或给定值,估计或预测被解释变量的总体均值。 回归分析的原理 目的在于找出一个最能够代表所有观测资料的函数(回归估计式) 用此函数代表因变量和自变量之间的关系。,37,例:一个假想的社区有100户家庭组成,要研究该社区每月家庭消费支出Y与每月家庭可支配收入X的关系。 即如果知道了家庭的月收入,能否预测该社区家庭的平均月消费支出水平。 为达到此目的,将该100户家庭划分为组内收入差不多的10组,以分析每一收入组的家庭消费支出。,描出散点图发现:随着收入的增加,消费“平均地说”也在增加,且Y的条件均值均落在一根正斜率的直线上。这条直线称为总体回归线。,40,在给定解释变量

12、Xi条件下被解释变量Yi的期望轨迹称为总体回归线。(population regression line),或更一般地称为总体回归曲线(population regression curve),就是Y对X的回归。,总体回归线,800,1400,1100,605,825,1045,E(YXi),41,含义:回归函数(PRF)说明被解释变量Y的平均状态(总体条件期望)随解释变量X变化的规律。,总体回归函数的概念,42,函数形式:可以是线性或非线性的。,例2.1中,根据刚才的例子,一位经济学家可能提出消除支出与收入有线性关系,作为一个暂行的假设,:,为一线性函数。其中,0,1是未知参数,称为回归系数

13、(regression coefficients)。,43,回归线的系数的图形表示,X1,X2,X,Y,斜率1,44,线性的含义 对变量而言 对参数而言,“线性”一词的含义,指数,二次方、立方等,本书中的“线性”是对参数而言,45,三、随机扰动项,一个例子 凯恩斯绝对收入假设消费理论:消费(Y)是由收入(X)唯一决定的,是收入的线性函数: Y = + X (2.2.1) 但实际上上述等式不能准确实现。 原因 消费除受收入影响外,还受其他因素的影响; 线性关系只是一个近似描述; 收入变量观测值的近似性:收入数据本身并不绝对准确地反映收入水平。,46,因此,一个更符合实际的数学描述为: Y = +

14、 X+ (2.2.2) 其中: 是一个随机误差项,是其他影响因素的“综合体”,是不可控的。 这个式子由于引进了随机误差项,成为计量经济学模型,所以被称为总体回归模型。,48,随机扰动项,该偏差称为观察值围绕它的期望值的离差(deviation),是一个不可观测的随机变量,又称为随机干扰项(stochastic disturbance)或随机误差项(stochastic error)。,或,49,例2.1中,给定收入水平Xi ,个别家庭的支出可表示为两部分之和: (1)该收入水平下所有家庭的平均消费支出E(Y|Xi),称为系统性(systematic)或确定性(deterministic)部分;

15、 (2)其他随机或非确定性(nonsystematic)部分i。,50,随机误差项的意义,随机误差项是从模型中省略下来的而又集体地影响着Y的全部变量的替代物,那么为什么不把这些变量明显地引进到模型中来?即为什么不构造一个含有尽可能多个变量的多元回归模型? 随机误差项主要包括下列因素: 在解释变量中被忽略的因素的影响; 变量观测值的观测误差的影响; 模型关系的设定误差的影响; 其他随机因素的影响。,51,例,令Y表示一名妇女生育孩子的生育率,X表示该妇女接受过教育的年数。生育率对教育年数的简单回归模型为: 随机干扰项可能包含什么样的因素?,52,四、样本回归函数(SRF),例2.2:在例2.1的

16、总体中有如下一个样本,能否从该样本估计总体回归函数PRF?,53,该样本的散点图(scatter diagram):,画一条直线以尽好地拟合该散点图,由于样本取自总体,可以该直线近似地代表总体回归线。该直线称为样本回归线(sample regression lines)。,54,55,记样本回归线的函数形式为:,称为样本回归函数(sample regression function,SRF)。,56,样本回归函数的随机形式/样本回归模型:,同样地,样本回归函数也有如下的随机形式:,由于方程中引入了随机项,成为计量经济模型,因此也称为样本回归模型(sample regression model)。,57,回归分析的主要目的,根据样本回归函数SRF,估计总体回归函数PRF。,58,59,2.2 一元线性回归模型的参数估计,一、一元线性回归模型的基本假设 二、参数的普

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号