第二章条件期望及现代观点下计量经济的

资源描述

《第二章条件期望及现代观点下计量经济的》由会员分享，可在线阅读，更多相关《第二章条件期望及现代观点下计量经济的（11页珍藏版）》请在金锄头文库上搜索。

1、Chapter2 条件期望及现代观点下计量经济的基本理念和理论基础Chapter2 条件期望及现代观点下计量经济的基本理念和理论基础1 问题的提出1、从数据谈起模型、数据哪个是第一位的？传统观点是模型第一位，现代观点认为数据是第一位的，我们不应当假设数据满足模型的条件，而应当要求模型适应数据的特点，这是现代观点下计量经济的出发点。a、如果手头有一些数据，它能告诉你什么？什么也没有！因为我们不知道数据来源背景，从而不知道数据所表达的含义。b、如果该数据是某人历次考试成绩的记录，它能告诉你什么？可以认为，X是某人的学习能力，称为总体（population），是学习能力的反映，它是取自总体X

2、中的样本，可建立模型：，a是真值，是客观存在的能力，但不可观测。于是，就反映了该学生的学习能力水平，就反映了该生学习能力的稳定性。还可以用来预测考试的成绩，等等。c、但是，如果该数据是某企业的股票价格，那么就没有理由认为是相互独立的，而是一个与时间有关联的序列，那么就有可能不再有一个稳定的极限，例如，随机游走。则，从而显得不可预测，这样的数据可以认为是没有用的，但在现在的随机过程理论和计算机技术下，我们仍能从中捕捉到“股票价值”X的某些信息。这里，我们看到，经济中数据的来源是非常复杂的，有的可以看成是服从某一分布的随机变量，有的则是某一特定的随机过程，甚至是不平稳过程。d、对于有相互关联的多组

3、数据，同样我们首先要知道数据的来源，知道有关的知识，这一点与传统观点是一致的，但传统观点的局限是，解释变量是确定性的，与误差项无关。而这种要求的数据一般只在实验室中才能做到，大量经济数据一般事前无法安排，并且解释变量之间也存在关联性，解释变量与误差项之间也有关联性，另外，数据是不可重复的。为此，现实经济要求我们把对数据的要求放宽。假设：（1）我们关注的结果Y是一个随机变量（视为一个总体）。（2）我们认为影响结果Y的原因是一个K维随机变量，。（3）的联合分布存在，且存在期望和方差。（4）可以从随机抽取观测样本（random sampling）。注：（1）的联合分布、期望、方差存在，并不意味

4、着已知。（2）的因果关系中，X的分量对Y的影响既有轻重之分，又有可观测和不可观测之分，甚至有半不可观测，即Y与X的因果关系可以更加随意的设定。例如，我们关注的是工资与教育的关系，但是影响工资的因素除了教育之外，根据劳动经济学的知识，还有工作经验和能力。其中，工作经验可用工作年限表示，又由于工作经验有正外部性，故可设计工作经验的平方作为另一个解释变量，而能力则是不可观测，如chapter1的例1，虽仍可以放在因果关系中，但需要有特殊的处理。（3）因果关系不一定是线性关系，从平均意义或期望意义上讲，我们要关注的是条件期望，含义是如果知道X，平均意义上看Y是什么？它包含有比从全体平均意义上看Y是什么

5、即更多的信息。并且希望能把表达出来，建立一个模型，称为总体模型（population model）。（4）随机抽取样本的最基本形式是截面数据（cross section data），含义是给定一个固定的时间点或是时间段上，解释变量与因变量的数据是从母体中随机发生的，而是实验数据（experimental data）的含义是实验者预先设定解释变量的实验值，然后观测因变量的结果值，传统观点下的样本设定为实验数据，是与实验数据无关的一切其他环境对结果的随机影响，数据与误差是分开的。（5）随即样本的另外几种形式Pooled cross section data 在不同时间点样本独立，但不同分布（混同样

6、本）。Spatial correlation 在不同地区样本有相关性，不独立（空间相关性）。Cluster sample 串样本，时间数据有分段特征（群集数据）。Panel data 面板数据，数据有二元特征，特别是有时间特征，但时间不太长，有限。这些特殊样本的处理，我们在后面的模型中再联系模型进行分析、介绍。2 有关理论现在提出的问题是，如果现实的数据来源是一类随机样本，假设是客观存在，但是未知或者部分未知，那么获取数据资料，就应当反映这种客观存在的关系，进一步，如果的函数关系不清楚，找一个什么样的函数关系是合理的？合理性的准确含义是什么？下面着手建立解决上述问题的一套基本理论，着手解决两个

7、问题：1、合理性按均方误差标准，X的什么关系g (X)来表达Y是最优的，即：，记成MSE(mean square error)。2、如果用线性关系，具备什么条件才能满足1、的，即与等价。定理1：用条件期望来表达Y，则MSE最小，即：， arg表示满足最小值条件的g(X)。首先复习一下条件期望的概念及性质。随机变量（X，Y）有联合分布F(x，y)和联合分布密度f（x，y），不妨设f（x，y）0。则：X的边际分布密度Y的边际分布密度给定X的条件下，Y的条件分布密度给定X的条件下，Y的条件数学期望：性质1：，直观含义是分段平均再平均等于直接平均。又由定义，做变量代换，则：性质2：，见书上2.19式。

8、的直观含义更明显，当X=x给定，它是常数的期望值等于常数的推广。证明：设：注：这个定理很重要，它奠定了条件期望在均方误标准下的最优地位，问题是当Y与X的联合分布很复杂，E(Y|X)实质上仍然是不清楚的。例：随机参数过程设，其中与X独立，且，则，注：我们也可以将模型看成，但是，于是u就与X相关，从而E(X | u)0，也与X相关，大量的计量经济模型都是由于环境既影响结果又影响原因，从而内生性往往是不可避免的，传统观点假定X与u无关的要求不符合实际。一般情况下，E(Y|X)很复杂，甚至是未知的，所以，尽管我们知道E(Y|X)在均方误标准下表达Y是最优的，但是我们需要一种方法，用其他的合理方式来取代

9、E(Y|X)，取代的方式取决于不同的目的，这就是问题（2）。如果目的是预测、是趋势、可采用非参数估计方法，这超出本书的范围，请参阅相关非参数估计的书。如果目的是政策评价，验证理论是否正确，一般采用参数估计方法，参数估计方法就是线性投影。设是影响Y的一切原因集，是一个k+1维的参数空间，是未知的。是取自X中的k+1维向量，并且线性无关，例如定义：注：我们只要求g(X)关于是线性的，对X不做任何要求，A的直观含义是从母体X中提取部分外加常数构成k+1维向量X，把X与做内积，构成的线性函数集A，于是我们可以把求的问题转化为求未知参数向量的问题，即：当然，A中的函数要比F中的少，A包含于F，但是限制在

10、A中，却使问题变得可以求解了。定理：若且E(XX)存在、非奇异，那么A中的最小二乘解。证明：由一阶条件得：由E(XX)非奇异，E(XY) (施瓦茨不等式)故E(XY)，所以注：一般，下面考虑设定（specification）称为Y的（关于线性）模型，其中u为回归误差。定理：设则当且仅当垂直条件成立，有成立。证明：必要性：如果，那么由，充分性：注：1）特别取2）这里没有考虑，仅是说明当Y写成的线性投影形式时，当时，u要满足的条件，它比=0要弱。下面要解决的问题是，把Y写成与把Y写成在什么条件下是一致的，这个条件也就是现代观点下的多元现行回归模型的前提假定。定义：线性回归模型称为正确设定的（co

11、rrect model specification）如果存在某一，使得从母体中有否则，如果对所有的，则称线性回归模型不是正确设定的。定理4：线性模型是正确设定的，那么：1）存在某一，使得2）3）证明：由定义，由定理1的性质知，（1）成立在由定理3，（2）（3）成立。注：1）由，故当模型是正确设定时，参数的经济含义是边际效果，（，i=1，2，），否则的含义是误导的。2）此时，若采用最小二乘法估计参数，会产生有偏、不一致的后果。注：上述推导，X和Y都是总体，没有抽样。等式是严格成立的。模型是关于随机变量Y与X关系的认识。3渐进理论基础现代回归模型的估计和检验由于样本N不再固定，更注重一致性，基

12、本原则是保证一致性成立，现代回归模型的估计和检验由于样本N不固定，更注重一致性。基本原则是，保证一致性成立，降低有偏性，提高有效性，从而，样本的极限理论具有基本的重要性。1、收敛性的亥年概念：a) 序列收敛，记为b) 随机变量序列依概率收敛，c) 随机变量序列分布收敛，d) 连续映照定理（Slutskys Thoery）2、随会样本的极限定理定理1 ：是一列独立同分布G维随机向量序列，且，g=1,G，那么，其中，称为向量序列的弱大数定律。定理2：是一列独立同分布G维随机向量序列，且，g=1,G，，那么，是一半正定矩阵。称为向量序列的中心极限定理。定义1：（一致性）是一个P1维的样本函数的序列

13、，N是样本容量，如果，对任意的成立，则称的一致估计，其中是未知参数空间的定义域。定义2：是一个P1维的样本函数的序列，如果，其中V是半正定阵，则称是渐进正态的，且V是渐进方差，记作。因此，故也称的渐进方差为，记成一般而言， V未知，我们有许多关于V的一致估计，因此的渐进方差估计就是，记成。注：因为0，（N），所以0，故当N充分大，无意义。我们说是的渐进方差估计，意义是的渐进方差估计是，而不是0，这一点很重要。定义3：如果，V正定，且主对角线元素用表示，又有，那么的第j个分量的渐进标准差记为。定义4：和是的一致估计，即，且，如果D-V是正半定矩阵，则称比是渐进有效的。又，则称和是等价的。定义5

14、：如果，若，且相应的，有有渐进方差，有渐进方差，则称估计和是渐进独立的。关于统计检验的渐进理论：定义6：对假设检验H0，如果它的备择假设H1为真，且，则称检验是渐进一致的。引理：线性变换下的渐进正态性：如果，V正定，又R是QP矩阵，QP，秩（R）=Q，则：，又二次型，此外如果有，那么Wald统计量即二次型：注：此引理可推广到非线性，利用Wald统计量，我们可以解决有线性约束的检验问题。H0 ：，H1 ：（为保持与书中符号一致性，R相当经典模型中的C，r相当于q）。又当有约束条件下的参数估计易证，如部分系数为零，那么采取拉格朗日乘数检验更为方便，特别在异方差假定下，可以取代F检验。本章小结1、现

15、代观点：数据本位，模型要适应数据的要求。2、现代观点基本理念：（1）关注的目标Y是一个随机变量，它与影响它的因素X，X是一个多维随机向量，存在联合分布，且X中某些因素不一定可观测，X和Y的期望和方差均存在、有限，并且可以随机抽样。（2）用X表达Y，Y=g(X)，在均方误差最小(MSE)的意义下，g*(X)=E(Y|X)是最优的，且令Y=E(Y|X)+U，则E(U|X)=0。（3）线性投影（参数估计方法），在X中抽取l个变量，（lk），把Y投影到k+1维向量Rk+1上,，用的线性函数表达Y，即令，当E(XX)非奇异，且EY2 ，则最小二乘估计*，在MSE意义下是最优的，且E(Xu)=0，（4）定义模型是设定的，如果存在，使得E(Y|X)=X0 ，于是可知，E(Xu)=0，反之模型不是正确设定的，则E(Xu)不等于0，从而，称模型存在内生性问题，即X与U相关。要特别强调的是，“正确设定”只是一个强制性的假设，当E(Y|X)本质上是非线性的，如：，则任何有限的线性表达都不可能是正确设定的。又如，E(Y|X)是分段的阶梯函数，用线性表达和加入虚拟变量显然留下了更多人为的痕迹。非

展开阅读全文