第二章简单线性回归模型.doc

上传人:夏** 文档编号:560754253 上传时间:2023-06-06 格式:DOC 页数:50 大小:1.28MB
返回 下载 相关 举报
第二章简单线性回归模型.doc_第1页
第1页 / 共50页
第二章简单线性回归模型.doc_第2页
第2页 / 共50页
第二章简单线性回归模型.doc_第3页
第3页 / 共50页
第二章简单线性回归模型.doc_第4页
第4页 / 共50页
第二章简单线性回归模型.doc_第5页
第5页 / 共50页
点击查看更多>>
资源描述

《第二章简单线性回归模型.doc》由会员分享,可在线阅读,更多相关《第二章简单线性回归模型.doc(50页珍藏版)》请在金锄头文库上搜索。

1、第二章 简单线性回归第一节 概述一 两个变量之间的关系让我们在给定一个变量的条件下,研究另一个变量与给定变量的关系。在给定变量条件下,变量Y与给定变量X的关系主要有两种关系:一种是变量Y与变量X由方程所决定的确定性函数关系。对于变量X的定义域中的任一给定值,在变量Y的值域中都有一个唯一确定的值与给定值相对应。这种关系是我们在数学中早已研究过的函数关系,而且我们在宏观经济学和微观经济学中的研究的变量之间的关系在形式上往往以函数关系的形式出现。另一种关系是在变量X的值给定的条件下,变量Y的值并不是完全确定的,而是以某个值为中心的一个完整的概率分布,而这个中心与给定变量X的关系则是完全确定的。我们称

2、这种关系为随机性关系。显然,这两种关系是全然不同的。为了明确这两种关系的区别我们通过一个假想的例子来说明。假设我们在课堂上进行一系列实验以决定某种玩具在不同价格的需求量。用表示该种玩具在时刻t的价格,表示该种玩具在时刻t的需求量.首先,我们假设经过实验得到如下结果。25120315510759上述结果表示在价格为25的任何时刻,需求量都为1,在价格为20的任何时刻,需求量都为3,在价格为15的任何时刻,需求量都为5,等等。这些结果所表明的需求量与价格之间的关系就是确定性关系。这种关系可用下列线性方程表示: (2.1)其次,我们假设经过实验得到下列结果。表2.125205上述结果表示在价格为25

3、的时刻中,有25%的需求量为0,50%的需求量为1,25%的需求量为2;在价格为20的时刻中,有25%的需求量为2,50%的需求量为3,25%的需求量为4;在价格为5的时刻中,有25%的需求量为8,50%的需求量为9,25%的需求量为10。这些结果所表明的需求量与价格之间的关系就是随机性关系。这种关系可用下列含随机变量的方程表示: (2.2)其中是一个随机变量,它有如下概率分布:-10.2500.5010.251称为随机扰动项,而则是随机扰动项的概率密度函数。而对于的一个给定值,也是一个随机变量,它的分布中心即数学期望是。 上述两种实验结果所代表的两个变量间确定性关系和随机性关系可用下图表示。

4、5810 15 20 252461005810 15 20 25246100图2.1 确定性关系与随机性关系 在宏观与微观经济学中,变量之间的关系都是以确定性关系的形式来陈述的,但这并不意味着经济变量之间的关系确是如此。事实上,经济变量之间的关系往往是随机性关系,但这些随机性关系往往可以分成两个部分:一部分是非随机的部分如(2.2)式中的就是的非随机部分可称之为系统部分,而另一部分是均值为零的随机部分即随机扰动项。宏观与微观经济学中之所以用形式上的确定性关系来陈述经济变量之间的关系,是因为经济学家相信他们所陈述的经济变量中的相互关系的随机扰动项部分满足一些较为良好的性质如其均值为零,方差较小等

5、,以至于在经济变量间相互关系中取决定性作用的是其中的系统性关系。那么事实究竟为何?这就需要计量经济学来证实或证伪。二 简单线性回归模型的基本假定 在计量经济学中,我们专门研究变量间的随机性关系。在非随机变量X一定的条件下,随机变量Y的系统性部分为X的线性函数,而其随机部分是均值为零的随机扰动项,这样随机变量Y的系统性部分实际上就是随机变量Y的在非随机变量X一定的条件下的数学期望即条件数学期望。最为简单的随机性关系是在两个变量之间的线性回归模型。当随机变量Y的系统性部分或Y的条件数学期望是非随机变量X的线性函数,并且其随机扰动项部分满足下面将要陈述的经济假设时,我们称这时的Y与X的关系模型为简单

6、线性回归模型。 设随机变量Y与给定变量之间的关系如下: (2.3)其中为当给定变量取值时随机变量Y的可能值。我们称Y或为应变量或被解释变量,给定变量称为解释变量,称为线性回归模型(2.3)的回归系数(它们也是总体参数),当解释变量取值为时的随机扰动项。回归模型(2.3)满足如下经典假设: 假设1 随机扰动项的数学期望(均值)为零。即 (2.4)假设1的意思是说当解释变量取值时,应变量的值可能大于或小于,但平均来看,它还是与其系统部分相等的,即 (2.4) 假设2 随机扰动项的方差相等。即 (2.5)假设2的意思是说无论当解释变量在其可行范围内取何值,随机扰动项的方差都是相同的,或者更实际地说,

7、对所有的观测随机扰动项的方差都是相同的。我们把这个假设称为随机扰动项的同方差性假设。假设3 不同的扰动项(即当解释变量取不同值时的扰动项)之间不存在相关关系。即 (2.6)假设3的意思是说不同观测点的扰动项之间不存在相关关系。往往称之为不存在序列相关。假设4 随机扰动项和解释变量不相关,即和的协方差为零,用数学式子可表示为 (2.7)在是非随机变量的情况下,(2.7)式是自动成立的,但为了一般起见,即使为随机变量,只要(2.7)式成立,那么对为非随机变量情况下的结论,可以直接推广到为随机变量的情形。假设4是一个非常重要的假设,它说明,随机变量Y中能够用解释的部分完全从随机扰动项中分离了出来,因

8、而,在随机扰动项中不再包括与解释变量有任何相关的因素了。假设5 随机扰动项为服从正态分布的随机变量,即 (2.8)在样本容量足够大时,由数理统计学中的中心极限定理,假设5是近似成立的,此外,如果我们只是为为估计回归系数的值,假设5就是一个不必要的假设。上述5个假设是针对作为总体的简单线性回归模型(2.3)而言的。但是在对实际经济变量的观测中,在解释变量的取值为某一个具体的值时或者在解释变量的值控制在一个水平时,我们往往只能观测到应变量或者说解释变量的一个或几个取值,而不可能观测到应变量的一个完整的分布,这就是说,在解释变量给定时,我们只能观测到应变量的少量的样本值,这就要求我们在理解经济变量的

9、计量经济学模型时,有必要区别总体回归模型与样本回归模型。三 总体回归模型与样本回归模型对于给定的解释变量的值,应变量的条件均值是解释变量的函数,用符号表示为: (2.9)其中表示解释变量的某个函数。方程称为总体回归函数(PRF)或简称总体回归(PR)。它表明在给定下Y的条件分布的(总体)均值与有函数关系。换句话说,它说出Y的均值或平均响应是怎样地随X而变的。 对于简单线性回归模型而言函数采取线性形式。即假定PRF是的线性函数,其形式是:。但为了在形式上与后文的多元线性回归模型相一致,所以对于简单线性回归模型中的解释变量,我们用符号(i=1,2,n)表示,所以简单线性回归模型的总体回归函数(也称

10、总体回归线)可以表示为 (2.4)其中和为未知然而固定的参数,如前所述,称为回归系数(regression coefficients);和也分别称为截距和斜率系数。相应地,模型 (2.3)称为总体回归模型。 由于在给定解释变量的值的条件下,应变量所取的值,从总体上看,其个数在一般是无穷大,即使从理论下看是有限个,但从实际上讲,我们是不可能全部获得的,尤其对经济变量,在给定解释变量一个值的条件下,应变量的值往往只能被研究者获得一个或少量几个值,所以作为经济变量的应变量的真实条件均值是不可能确切知道的,从而总体参数和的真实值是不可能确切知道的,我们所能做的工作就是根据有限个样本点的值对总体参数进行

11、估计,为了区别起见,我们表达总体参数的字母的上面打上符号,以表示相应参数的估计值,如用表示总体参数的估计值,用表示总体参数的估计值。这样应变量的条件均值可用其估计值 (2.10)来估计,我们也称由(2.10)决定的值为的预测值,而称(2.10)所表示的方程为样本回归方程或样本回归函数或样本回归线。如果我们定义应变量的样本观测值与其观测值的差为残差,并用符号来表示,即 (2.11)那么,我们可得如下式子: (2.12)称(2.12)式为样本回归模型。计量经济学的首要任务之一就是要估计总体参数和的值,或者说,计算样本回归模型中的系数和的值。为了使样本回归系数的值能够被计算出来,我们还必须补充一条假

12、设,即假设6 解释变量必须有足够的变异。也就是说解释变量的不同观测值的个数必须足够大,从而使我们能够用一定的方法计算出回归系数的估计值。显然假设6纯属于对样本性质的假设,它与前面的5条基本假设是不同的,假设1假设5是属于总体范畴的。第二节 简单线性回归模型的参数估计一 最小二乘估计在简单线性样本回归模型中,使残差平方和最小的回归系数的估计称为最小二乘估计(LSE或OLS)。即使 (2.13)最小的和。其中,在(2.13)中的各个符号的意义与第一节相同。下面推导最小二乘估计的表达式或计算公式。 为求使(2.13)式最小的和,可将看成是和的函数,则其关于和的一阶偏导数必须为零,即 (2.14)即

13、(2.15)化简,得 (2.16) 一般称方程组(2.16)中的每一个方程为最小二乘正规方程,而称方程组(2.15)为最小二乘正规方程组。 方程组(2.15)在形式上也可以看成由残差与模型中的解释变量的乘积和为零而得到,在这里可把原回归方程的截距项看成是仅取值1的解释变量。 这条件规则可应用于多元线性回归系数的最小二乘估计。 (2.15) 解正规方程组(2.16),得 (2.17) (2.18)其中,分别表示解释变量和应变量的样本均值。用样本观测值的离差形式表示公式(2.17)将是很有用的。由于 (2.19) (2.20)所以令,则 (2.21)在后面的叙述中,如无特别声明,我们将用小写字母代表相应变量的离差形式。 例2.1 表2.2是某超市某种苹果的价格(元/千克)与每天销量在过去12天的记录,用X表示价格,Y表示需求量(千克),设在任意价格水平上超市有满足任意需求的能力。那么,这12天的数据就是需求函数的表现。若假设需求量平均来看是价格的线性函数。试估计该需求函数。表2.2价格(元/千克)销售量1055970890710079071057806.5110612561155.51305130解 设需求量关于价格的线性回归模型为根据表2.2的样本资料,计算得所以参数的估计值为参数的估计值为所以样本回归线为上式即为需求函数的线性估计式,据此,可计算出苹果在其样本

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号