第二章条件期望及现代观点下计量经济的

上传人:工**** 文档编号:501022551 上传时间:2023-05-20 格式:DOC 页数:11 大小:504.50KB
返回 下载 相关 举报
第二章条件期望及现代观点下计量经济的_第1页
第1页 / 共11页
第二章条件期望及现代观点下计量经济的_第2页
第2页 / 共11页
第二章条件期望及现代观点下计量经济的_第3页
第3页 / 共11页
第二章条件期望及现代观点下计量经济的_第4页
第4页 / 共11页
第二章条件期望及现代观点下计量经济的_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《第二章条件期望及现代观点下计量经济的》由会员分享,可在线阅读,更多相关《第二章条件期望及现代观点下计量经济的(11页珍藏版)》请在金锄头文库上搜索。

1、Chapter2 条件期望及现代观点下计量经济的基本理念和理论基础Chapter2 条件期望及现代观点下计量经济的 基本理念和理论基础1 问题的提出1、 从数据谈起模型、数据哪个是第一位的?传统观点是模型第一位,现代观点认为数据是第一位的,我们不应当假设数据满足模型的条件,而应当要求模型适应数据的特点,这是现代观点下计量经济的出发点。a、 如果手头有一些数据,它能告诉你什么?什么也没有!因为我们不知道数据来源背景,从而不知道数据所表达的含义。b、 如果该数据是某人历次考试成绩的记录,它能告诉你什么?可以认为,X是某人的学习能力,称为总体(population),是学习能力的反映,它是取自总体X

2、中的样本,可建立模型:,a是真值,是客观存在的能力,但不可观测。于是,就反映了该学生的学习能力水平,就反映了该生学习能力的稳定性。还可以用来预测考试的成绩,等等。c、但是,如果该数据是某企业的股票价格,那么就没有理由认为是相互独立的,而是一个与时间有关联的序列,那么就有可能不再有一个稳定的极限,例如,随机游走。则,从而显得不可预测,这样的数据可以认为是没有用的,但在现在的随机过程理论和计算机技术下,我们仍能从中捕捉到“股票价值”X的某些信息。这里,我们看到,经济中数据的来源是非常复杂的,有的可以看成是服从某一分布的随机变量,有的则是某一特定的随机过程,甚至是不平稳过程。d、对于有相互关联的多组

3、数据,同样我们首先要知道数据的来源,知道有关的知识,这一点与传统观点是一致的,但传统观点的局限是,解释变量是确定性的,与误差项无关。而这种要求的数据一般只在实验室中才能做到,大量经济数据一般事前无法安排,并且解释变量之间也存在关联性,解释变量与误差项之间也有关联性,另外,数据是不可重复的。为此,现实经济要求我们把对数据的要求放宽。假设:(1)我们关注的结果Y是一个随机变量(视为一个总体)。 (2)我们认为影响结果Y的原因是一个K维随机变量,。 (3)的联合分布存在,且存在期望和方差。 (4)可以从随机抽取观测样本(random sampling)。注:(1)的联合分布、期望、方差存在,并不意味

4、着已知。(2)的因果关系中,X的分量对Y的影响既有轻重之分,又有可观测和不可观测之分,甚至有半不可观测,即Y与X的因果关系可以更加随意的设定。例如,我们关注的是工资与教育的关系,但是影响工资的因素除了教育之外,根据劳动经济学的知识,还有工作经验和能力。其中,工作经验可用工作年限表示,又由于工作经验有正外部性,故可设计工作经验的平方作为另一个解释变量,而能力则是不可观测,如chapter1的例1,虽仍可以放在因果关系中,但需要有特殊的处理。(3)因果关系不一定是线性关系,从平均意义或期望意义上讲,我们要关注的是条件期望,含义是如果知道X,平均意义上看Y是什么?它包含有比从全体平均意义上看Y是什么

5、即更多的信息。并且希望能把表达出来,建立一个模型,称为总体模型(population model)。(4)随机抽取样本的最基本形式是截面数据(cross section data),含义是给定一个固定的时间点或是时间段上,解释变量与因变量的数据是从母体中随机发生的,而是实验数据(experimental data)的含义是实验者预先设定解释变量的实验值,然后观测因变量的结果值,传统观点下的样本设定为实验数据,是与实验数据无关的一切其他环境对结果的随机影响,数据与误差是分开的。(5)随即样本的另外几种形式Pooled cross section data 在不同时间点样本独立,但不同分布(混同样

6、本)。Spatial correlation 在不同地区样本有相关性,不独立(空间相关性)。Cluster sample 串样本,时间数据有分段特征(群集数据)。Panel data 面板数据,数据有二元特征,特别是有时间特征,但时间不太长,有限。这些特殊样本的处理,我们在后面的模型中再联系模型进行分析、介绍。2 有关理论现在提出的问题是,如果现实的数据来源是一类随机样本,假设是客观存在,但是未知或者部分未知,那么获取数据资料,就应当反映这种客观存在的关系,进一步,如果的函数关系不清楚,找一个什么样的函数关系是合理的?合理性的准确含义是什么?下面着手建立解决上述问题的一套基本理论,着手解决两个

7、问题:1、合理性按均方误差标准,X的什么关系g (X)来表达Y是最优的,即:,记成MSE(mean square error)。2、如果用线性关系,具备什么条件才能满足1、的,即与等价。定理1:用条件期望来表达Y,则MSE最小,即:, arg表示满足最小值条件的g(X)。首先复习一下条件期望的概念及性质。随机变量(X,Y)有联合分布F(x,y)和联合分布密度f(x,y),不妨设f(x,y)0。则:X的边际分布密度Y的边际分布密度给定X的条件下,Y的条件分布密度给定X的条件下,Y的条件数学期望:性质1:,直观含义是分段平均再平均等于直接平均。又由定义,做变量代换,则:性质2:,见书上2.19式。

8、的直观含义更明显,当X=x给定,它是常数的期望值等于常数的推广。证明:设:注:这个定理很重要,它奠定了条件期望在均方误标准下的最优地位,问题是当Y与X的联合分布很复杂,E(Y|X)实质上仍然是不清楚的。例:随机参数过程设,其中与X独立,且,则,注:我们也可以将模型看成,但是,于是u就与X相关,从而E(X | u)0,也与X相关,大量的计量经济模型都是由于环境既影响结果又影响原因,从而内生性往往是不可避免的,传统观点假定X与u无关的要求不符合实际。一般情况下,E(Y|X)很复杂,甚至是未知的,所以,尽管我们知道E(Y|X)在均方误标准下表达Y是最优的,但是我们需要一种方法,用其他的合理方式来取代

9、E(Y|X),取代的方式取决于不同的目的,这就是问题(2)。如果目的是预测、是趋势、可采用非参数估计方法,这超出本书的范围,请参阅相关非参数估计的书。如果目的是政策评价,验证理论是否正确,一般采用参数估计方法,参数估计方法就是线性投影。设是影响Y的一切原因集,是一个k+1维的参数空间,是未知的。是取自X中的k+1维向量,并且线性无关,例如定义:注:我们只要求g(X)关于是线性的,对X不做任何要求,A的直观含义是从母体X中提取部分外加常数构成k+1维向量X,把X与做内积,构成的线性函数集A,于是我们可以把求的问题转化为求未知参数向量的问题,即:当然,A中的函数要比F中的少,A包含于F,但是限制在

10、A中,却使问题变得可以求解了。定理:若且E(XX)存在、非奇异,那么A中的最小二乘解。证明:由一阶条件得:由E(XX)非奇异,E(XY) (施瓦茨不等式)故E(XY),所以 注:一般,下面考虑设定(specification)称为Y的(关于线性)模型,其中u为回归误差。定理:设则当且仅当垂直条件成立,有成立。证明:必要性:如果,那么由,充分性:注:1)特别取2)这里没有考虑,仅是说明当Y写成的线性投影形式时,当时,u要满足的条件,它比=0要弱。下面要解决的问题是,把Y写成与把Y写成在什么条件下是一致的,这个条件也就是现代观点下的多元现行回归模型的前提假定。定义:线性回归模型称为正确设定的(co

11、rrect model specification)如果存在某一,使得从母体中有否则,如果对所有的,则称线性回归模型不是正确设定的。定理4:线性模型是正确设定的,那么:1) 存在某一,使得2)3)证明:由定义,由定理1的性质知, (1)成立在由定理3,(2)(3)成立。注:1)由,故当模型是正确设定时,参数的经济含义是边际效果,(,i=1,2,),否则的含义是误导的。2)此时,若采用最小二乘法估计参数,会产生有偏、不一致的后果。注:上述推导,X和Y都是总体,没有抽样。等式是严格成立的。模型是关于随机变量Y与X关系的认识。3渐进理论基础现代回归模型的估计和检验由于样本N不再固定,更注重一致性,基

12、本原则是保证一致性成立,现代回归模型的估计和检验由于样本N不固定,更注重一致性。基本原则是,保证一致性成立,降低有偏性,提高有效性,从而,样本的极限理论具有基本的重要性。1、收敛性的亥年概念:a) 序列收敛,记为b) 随机变量序列依概率收敛,c) 随机变量序列分布收敛,d) 连续映照定理(Slutskys Thoery)2、随会样本的极限定理定理1 :是一列独立同分布G维随机向量序列,且,g=1,G,那么,其中,称为向量序列的弱大数定律。定理2:是一列独立同分布G维随机向量序列,且,g=1,G, ,那么,是一半正定矩阵。称为向量序列的中心极限定理。定义1:(一致性)是一个P1维的样本函数的序列

13、,N是样本容量,如果,对任意的成立,则称的一致估计,其中是未知参数空间的定义域。定义2:是一个P1维的样本函数的序列,如果,其中V是半正定阵,则称是渐进正态的,且V是渐进方差,记作。因此,故也称的渐进方差为,记成一般而言, V未知,我们有许多关于V的一致估计,因此的渐进方差估计就是,记成。注:因为0,(N),所以0,故当N充分大,无意义。我们说是的渐进方差估计,意义是的渐进方差估计是,而不是0,这一点很重要。定义3:如果,V正定,且主对角线元素用表示,又有,那么的第j个分量的渐进标准差记为。定义4:和是的一致估计,即,且,如果D-V是正半定矩阵,则称比是渐进有效的。又,则称和是等价的。定义5

14、:如果,若,且相应的,有有渐进方差,有渐进方差,则称估计和是渐进独立的。关于统计检验的渐进理论:定义6:对假设检验H0,如果它的备择假设H1为真,且,则称检验是渐进一致的。引理:线性变换下的渐进正态性:如果,V正定,又R是QP矩阵,QP,秩(R)=Q,则:,又二次型,此外如果有,那么Wald统计量即二次型:注:此引理可推广到非线性,利用Wald统计量,我们可以解决有线性约束的检验问题。H0 :,H1 :(为保持与书中符号一致性,R相当经典模型中的C,r相当于q)。又当有约束条件下的参数估计易证,如部分系数为零,那么采取拉格朗日乘数检验更为方便,特别在异方差假定下,可以取代F检验。本章小结1、现

15、代观点:数据本位,模型要适应数据的要求。2、现代观点基本理念:(1)关注的目标Y是一个随机变量,它与影响它的因素X,X是一个多维随机向量,存在联合分布,且X中某些因素不一定可观测,X和Y的期望和方差均存在、有限,并且可以随机抽样。(2)用X表达Y,Y=g(X),在均方误差最小(MSE)的意义下,g*(X)=E(Y|X)是最优的,且令Y=E(Y|X)+U,则E(U|X)=0。(3)线性投影(参数估计方法),在X中抽取l个变量,(lk),把Y投影到k+1维向量Rk+1上,,用的线性函数表达Y,即令,当E(XX)非奇异,且EY2 ,则最小二乘估计*,在MSE意义下是最优的,且E(Xu)=0,(4)定义模型是设定的,如果存在,使得E(Y|X)=X0 ,于是可知,E(Xu)=0,反之模型不是正确设定的,则E(Xu)不等于0,从而,称模型存在内生性问题,即X与U相关。要特别强调的是,“正确设定”只是一个强制性的假设,当E(Y|X)本质上是非线性的,如:,则任何有限的线性表达都不可能是正确设定的。又如,E(Y|X)是分段的阶梯函数,用线性表达和加入虚拟变量显然留下了更多人为的痕迹。非

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号