计量经济学第二章一元线性回归模型(1)(肖)ppt培训课件

上传人:aa****6 文档编号:54554172 上传时间:2018-09-14 格式:PPT 页数:138 大小:753KB
返回 下载 相关 举报
计量经济学第二章一元线性回归模型(1)(肖)ppt培训课件_第1页
第1页 / 共138页
计量经济学第二章一元线性回归模型(1)(肖)ppt培训课件_第2页
第2页 / 共138页
计量经济学第二章一元线性回归模型(1)(肖)ppt培训课件_第3页
第3页 / 共138页
计量经济学第二章一元线性回归模型(1)(肖)ppt培训课件_第4页
第4页 / 共138页
计量经济学第二章一元线性回归模型(1)(肖)ppt培训课件_第5页
第5页 / 共138页
点击查看更多>>
资源描述

《计量经济学第二章一元线性回归模型(1)(肖)ppt培训课件》由会员分享,可在线阅读,更多相关《计量经济学第二章一元线性回归模型(1)(肖)ppt培训课件(138页珍藏版)》请在金锄头文库上搜索。

1、计量经济学,第 二 章 一元线性回归模型,2,第二章 一元线性回归模型,第一节 回归分析的相关概念 第二节 一元线性回归模型 第三节 最小二乘估计 第四节 置信区间与假设检验 第五节 回归分析结果的报告与评价 第六节 回归分析的应用-预测 第七节 应用案例,3,本章介绍一元线性回归模型的概念及一元线性回归模型所依据的理论与应用。一元线性回归模型只包含一个解释变量和一个被解释变量,是最简单的线性回归模型。通过一元线性回归模型的学习,可较容易地理解回归分析的基本理论与应用。,4,第一节 回归分析的相关概念,一、回归的含义,回归一词最早由F高尔顿(Francis Galton)提出。在一篇研究父母身

2、高与子女身高相互关系的论文中,高尔顿发现,虽然有一个趋势,父母高,子女也高;父母矮,子女也矮,但给定父母的身高,子女的平均身高却趋向于或者回归到全体人口的平均身高。,5,也就是说,当父母双亲都异常高或异常矮,则子女的身高有趋向于人口总体平均身高的趋势。这种现象被称为高尔顿普遍回归定律。这就是回归一词的原始含义。,6,在现代,回归一词已演变为一种新的概念。回归分析就是研究被解释变量对解释变量的依赖关系,其目的就是通过解释变量的已知或设定值,去估计或预测被解释变量的总体均值。在下面的几个例子中,我们可以清晰地看到回归分析的实际意义。,7,1高尔顿普遍回归定律。高尔顿的目的在于发现为什么人口的身高分

3、布有一种稳定性。在现代,我们并不关心这种解释,我们关心的是:在给定父辈身高的情形下,找到儿辈平均身高的变化规律。,8,就是说,我们如果知道了父辈的身高,就可预测儿辈的平均身高。假设我们得到了一组父亲、儿子身高的数据,制成如下的散点图。图中按统计分组的方法将父亲身高分为若干组。,9,图4.1,给定父亲身高儿子身高的分布,总体回归线,10,图2.1中对应于设定的父亲身高,儿子身高有一个分布范围。随着父亲身高的增加,儿子的平均身高也在增加,画一条通过儿子平均身高的线,说明儿子的平均身高是如何随着父亲身高的增加而增加的,这条线就是回归线。,11,2在经济学中,经济学家要研究个人消费支出与个人可支配收入

4、的依赖关系。这种分析有助于估计边际消费倾向,就是可支配收入每增加一元引起消费支出的平均变化。,12,3在企业中,我们很想知道人们对企业产品的需求与广告费开支的关系。这种研究有助于估计出相对于广告费支出的需求弹性,即广告费支出每变化百分之一的需求变化百分比,这有助于制定最优广告策略。,13,4农业工作需要预计粮食产量,需要研究粮食产量与播种面积、施肥量、降雨量之间的依赖关系。这种一个变量依赖于另一个或多个变量的事例在经济系统中普遍存在。回归分析就是要研究这种变量之间的依存关系。,14,二、统计关系与确定性关系,经济变量间的相互关系分为: 确定性的函数关系 Y=f (X)不确定性的统计关系相关关系

5、 Y= f(X)+u (u为随机变量),15,如,在经典物理学中,给定电阻,电流I 和电压V 之间的关系即为函数关系,即。这种典型的变量关系就是确定性关系。,16,在经济系统中, 这种变量之间的函数关系或确定性关系就很少见 。常见的是变量之间是一种不确定的关系,既使变量X 是变量Y 的原因, 给定变量X 的值也不能具体确定变量Y的值, 而只能确定变量Y 的统计特征,通常称变量X 与Y 之间的这种关系为统计关系。,17,例如,企业总产出Y 与企业的资本投入K 、劳动力投入L 之间的关系就是统计关系。虽然资本K 和劳动力L 是影响产出Y 的两大核心要素,但是给定K 、L 的值并不能确定产出Y 的值

6、。因为,总产出Y 除了受资本投入K、劳动力投入L 的影响外,还要受到技术进步、自然条件等其它因素的影响。,18,三、回归分析与相关分析,与回归分析密切相联的是相关分析。相关分析主要测度两个变量之间的线性关联度,相关系数就是用来测度两个变量之间的线性关联程度的。例如,吸烟与肺癌、统计学成绩与数学成绩、身高与体重等等之间的相关程度,就可用相关系数来测度。,19,而在回归分析中,我们的主要目的在于根据其它变量的给定值来估计或预测某一变量的平均值。例如,我们想知道能否从一个学生的数学成绩去预测他的统计学平均成绩。,20,在回归分析中,被解释变量Y 被当作是随机变量,而解释变量X 则被看作非随机变量。而

7、在相关分析中,我们把两个变量都看作是随机变量。,21,例如 ,在学生的数学成绩与统计学成绩的分析中,如为回归分析,则统计学成绩是随机变量,数学成绩是非随机变量,即数学成绩被固定在给定的水平上,以此求得统计学的平均成绩。而在相关分析中,两者处于平等地位,不存在谁为解释变量,谁为被解释变量的问题,两者均为随机变量。,22,第二节 一元线性回归模型,在进入正式的回归理论之前,先斟酌一下变量y与变量x可以互换的不同名称、术语。,23,第二节 一元线性回归模型,一、引例,假定我们要研究一个局部区域的居民消费问题,该区域共有80户家庭组成,将这80户家庭视为一个统计总体。,24,我们研究每月家庭消费支出Y

8、 与每月可支配收入X 的关系。就是说,已知家庭每月可支配收入,要预测家庭每月消费支出的总体平均水平。为此,将80户家庭分为10组。表2.1给出了人为数据。,25,表2.1 居民收入、消费数据(10组),26,从表2.1中可以看出,对于每月1000元收入的7户家庭,每月消费支出为700元到940元不等。同样,当X=3000元时,9户家庭的每月消费支出在2180元到2660元之间。,表2.1给出了以X 的给定值为条件的Y 的条件分布。,对于Y 的每一条件分布,我们能计算出它的条件期望,记为E(Y/X=Xi),即在X取特定Xi 值时Y 的期望值。例如,X=1000时,Y 的期望值为:,将表2.1中的

9、数据在直角坐标系中描出,则得到图2.2的散点图。,28,收入、消费散点图,图2.2,总体回归线,注意:总体回归线是观测不到的,29,该图表明了对应于各X 值的Y 的条件分布。虽然每个个别家庭的消费支出都有异,但图2.2清楚地表明随着收入的增加,消费支出平均地说也在增加。图2.2中那些代表Y 的各个条件均值的粗圆点,则表明这些条件平均值落在一根有正斜率的直线上。我们称这根直线叫做总体回归线,它是Y 对X 的回归。,30,总体回归线就是当解释变量取给定值时,被解释变量的条件均值或期望值的轨迹。图2.2表明,对每一Xi 都有Y 值的一个总体和一个相应的均值。而回归线是穿过这些条件均值的线。,E(Y/

10、Xi)= f (Xi) (2.1),31,式(2.1)就是总体回归函数,简称总体回归。它表明在给定Xi 下Y 的分布的总体均值与Xi有函数关系,就是说它给出了Y 的均值是怎样随X 值的变化而变化的。,32,二、总体回归函数,条件均值E(Y/Xi)是Xi 的函数,即:,其中,f (Xi)表示解释变量Xi 的某个函数。在我们的引例中,E(Y/Xi)是Xi 的一个线性函数。,33,函数f (Xi)采取什么函数形式,是一个需要解决的重要问题。在实际经济系统中,我们不会得到总体的全部数据,因而就无法据已知数据确定总体回归函数的函数形式。同时,对总体回归函数的形式只能据经济理论与经验去推断。,34,例如,

11、我们可以假定消费支出与收入有线性关系。则总体回归函数为,(2.2),其中, 和 为未知而固定的参数,称为回归系数; 为截距系数, 为斜率系数。式(2.2)为线性总体回归函数。,注意:总体回归函数是固定而又未知的,35,三、线性的含义,1对变量为线性,对线性的第一种解释是指Y 的条件期望是Xi 的线性函数,例如式(2.2) 就是线性回归函数,该回归线是一条直线。,36,按这种解释 就不是线性的,因为 对 的一阶导数不是常数。,37,2对参数为线性,对线性的第二种解释是指Y 的条件期望 是参数 的一个线性函数。它可以是也可以不是变量的X 的线性函数。,38,此时, 就是线性回归函数。但 则不是线性

12、回归函数,而是非线性回归函数。,39,在本课中,主要考虑的是对参数为线性的回归模型,线性回归是指对参数为线性的一种回归(即参数只以它的1次方出现);对解释变量X则可以不是线性的。,就变量而言是线性的Y的条件均值是X的线性函数 就参数而言是线性的Y的条件均值是参数的线性函数 判断: 变量、参数均”线性” 参数“线性”,变量”非线性”变量“线性”,参数”非线性”计量经济学中线性回归模型主要指就参数是“线性”,对线性回归模型“线性” 的两种解释(小结),41,从图2.2可清楚地看到,随着家庭收入Xi的增加,家庭平均消费支出E(Y/Xi )也在增加,这表明了Xi与Y的平均水平的关系。我们想知道对于具体

13、家庭而言,消费支出Y与它的收入水平Xi的关系。,四、总体回归函数的随机设定,就个别家庭而言,收入水平增加,消费支出不一定会增加。,从图2.2可以看到,给定收入水平Xi 的个别家庭的消费支出处于在该收入水平的家庭平均消费支出左右,也就是围绕着它的条件均值。我们把个别的Yi 围绕它的期望值的离差表示如下:,其中,离差ui 是一个不可观测的可正可负的随机变量,在专业术语中,把ui 称为随机干扰项或随机误差项。,想想:结合表2.1的资料 ,怎样理解式(2.3),给定x水平,个别家庭支出可表示为两部分之和: 相同收入水平的所有家庭的平均消费支出,这一部分称为系统性成分; 影响个别家庭消费支出的随机因素部

14、分,也即非系统性成分,是为包含到模型中而对Y有影响的被忽略变量的替代变量。,44,假设 对 Xi 为线性的,则:,(2.4),注意: 式(2.4)表示一个家庭(个别yi )的消费支出线性地依赖于它的收入加干扰项,例如,给定X =1000,各家庭的消费支出可表达为,46,五、 随机误差项u 的意义,1理论的欠缺。虽然有决定Y 的行为的理论,但常常是不能完全确定的,理论常常有一定的含糊性。我们可以肯定每月收入X 影响每月消费支出Y。但不能确定是否有其它变量影响Y,只好用ui 作为模型所忽略的全部变量的替代变量。,2数据的欠缺。即使能确定某些变量对Y 有显著影响,但由于不能得到这些变量的数据信息而不

15、能引入该变量。例如,从经济理论分析,家庭财富量是影响家庭消费的重要因素,应该引入该变量作为解释变量。但是,通常我们得不到有关家庭财富的信息。因此,我们只得把这个很重要的解释变量舍弃掉。,3核心变量与非核心变量。例如,在引例的居民消费模型中,除了收入X1 外,家庭的人口数X2 、户主宗教信仰X3、户主受教育水平X4也影响家庭消费支出。但很可能X2、X3、X4合起来的影响也是很微弱的,是一种非系统的或随机的影响。从效果与成本角度来看,引入它们是不合算的。所以,人们把它们的联合效用当作一个随机变量来看待。,4人类行为的内在随机性。即使我们成功地把所有有关的变量都引进到模型中来,在个别的Y 中仍不免有一些“内在”的随机性,无论我们花了多少力气都解释不了的。随机误差项ui 能很好地反映这种随机性。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号