计量经济学讲稿王贻志教材:经济计量学精要〔Essentials of Econometrics〕 Damodar N. Gujarti,1999, 2nd Edition 张涛等译, 机械工业出版社,2000年5月经济预测〔Elements of Forecasting〕Francis X. Diebold, 2nd Edition, 2001 张涛译,中信出版社,2003年9月 第一讲序言: 用计量经济学方法研究经济问题的步骤:(1) 理论或假说的陈述(2) 收集数据(3) 建立数学模型(4) 建立统计或计量经济模型(5) 经济计量模型参数的估计(6) 检验模型的准确性:模型的假设检验(7) 检验来自模型的假说(8) 运用模型进行预测或结构分析第一局部 概率与统计根底 随机试验→样本空间→随机变量→概率密度函数→数字特征→正态分布→中心极限定理→其他重要分布→统计推断:估计〔无偏/有效/一致〕+假设检验第一章 根本统计概念回忆1.1 试验 随机试验〔或统计试验〕:至少有两个以上的可能结果,但不确定哪一个结果会出现的过程例如:抛一枚硬币〔隐含条件该硬币是正规的〕,出现正面朝上或朝下是一个随机试验。
1.2 样本空间或总体 样本空间:随机试验所有可能的结果的集合 例如:在以上这个随机试验中,样本空间为:{硬币正面朝上,硬币正面朝下}1.3 事件 事件:随机试验的可能结果组成的集合,它是样本空间的一个子集 例如:抛两枚同样的硬币H代表正面朝上, T代表正面朝下样本空间{HH,HT,TH,TT}事件A表示:抛两枚硬币,一枚朝上,一枚朝下HT,TH属于事件A事件A是样本空间的一个子集 事件的互斥性:如果两个事件不可能同时发生1.4 随机变量 随机变量:取值由试验结果断定的变量例如,在上例中,我们不以HH,HT,TH,TT来描述试验结果,如果“变量〞表示抛两枚硬币正面朝上的个数, 第一枚硬币 第二枚硬币 正面朝上的次数 T T 0 T H 1 H T 1 H H 2变量“正面朝上的个数〞为一个随机变量。
随机变量实际上是样本空间到实数集的一个对应关系〔映射〕 随机变量可以是离散型的或连续型的1. 5概率1、 古典〔先验〕概率:如果一个随机试验共有n个结果,它们是互斥的且每个结果等可能发生事件A有m个根本结果,那么m/n为事件A的发生概率记着 P(A)=(有利于事件A的根本结果)/〔所有根本结果的总数〕 =m/n例如,抛一枚硬币,正面朝上的概率为1/2 古典概率定义有局限性如果试验的结果不是有限的,或不是等可能发生的,例如明年国民生产总值的概率为多少?古典概率无法答复类似问题2、 概率的频率定义(经验定义)例. 表1给出了200个学生经济学考试成绩的分布表1分数 区间均值点 频数〔1〕 频率〔1〕/200 0-9 5 0 010-19 15 0 020-29 25 0 090-99 95 10 我们能够将频率当概率吗?如果观察的次数足够多〔技术上讲是有限的〕,频率可以很好地侧度真实的概率。
须注意的是,这里无需要求试验结果是互斥的,也不要求每种结果是等可能发生的 概率的性质:(1) 事件的概率在0-1之间,即事件A的概率满足0≤P(A)≤1(2) 可加性:假设事件A,B,C,为互斥事件,那么事件和的概率等于事件概率之和即P(A+B+C+……)=P(A)+P(B)+P(C)+……(3) 完备性:假设事件A,B,C,为互斥事件,且为一个完备事件组,那么事件和的概率为1即P(A+B+C+……)=P(A)+P(B)+P(C)+……=13、 一些其他常用的性质事件积的概率:A, B事件为互斥事件,事件同时发生的概率等于事件概率的积, P(AB)=P(A)P(B) 例如同时抛两枚硬币,两枚硬币正面同时朝上的概率为〔1/2〕〔1/2〕=1/4 事件和的概率:A, B事件不是互斥事件,那末,P(A+B)=P(A)+P(B)--P(AB),其中P(AB)为事件A, B同时发生的联合概率 例如从一副扑克牌中任意抽取一张,这张牌是红心或是皇后的概率为多少?〔13/52+4/52—1/52=4/52〕条件概率:假设有事件A,B在事件B发生的情况下,事件A发生的概率,称为事件B发生条件下事件A发生的条件概率。
记作P〔A|B〕可以用以下公式进行计算: 即给定事件B前提下,事件A发生的条件概率等于事件A、B的联合概率与事件B的边缘密度之比4、 随机变量的概率:前面我们给出了样本结果或样本空间中事件的概率,而在本书中我们主要关心的是随机变量〔比方GNP、货币供应、价格、工资等〕的概率1) 离散型随机变量的概率密度函数:继续以上面抛硬币为例,考虑表2正面朝上的次数 PDF X f(X) 0 1/4 1 1/2 2 1/4 累积 1 上表给出了变量X可能值以及与之相对应的概率值用函数f(X)表示概率分布或者叫概率密度函数〔PDF〕——它给出了变量X取不同值的概率这个表中的PDF称为离散型随机变量地概率密度函数标准描述 其中, 表示离散型随机变量X取时的概率值2) 连续型随机变量的概率密度函数:连续性随机变量密度函数与离散型类似,不同的是连续型度量的是随机变量在某特定区间范围内的概率。
一个定义在实数集上的函数要满足以下三个条件,就能成为某连续随机变量地概率密度函数:i 对于所有的有 ;ii iii 对于任意两个实数有 (3) 累积分布函数:称为随机变量X的累积分布函数(CDF),表示随机变量取小于或者等于X的概率表3 抛币四次,求随机变量正面朝上次数的概率密度和累积分布函数: PDF CDF 正面朝上的次数 X f(x) X F(x)0 1/16 1/161 4/16 5/162 6/16 11/163 4/16 15/164 1/16 1 根据累积分布函数定义,它是X的值小于或者等于某一给定x时的概率函数的求和或者积分。
对于一个离散的随机变量X,累积分布函数为对于一个连续随机变量X,累积分布函数为 如果随机变量是离散型的,累积函数是非连续的〔为分段函数〕如随机变量是连续的,那么其累积分布函数是一条连续的曲线累积分布函数是实数域上的单调递增函数且有如下性质:5、 多元随机变量的概率函数〔1〕概率密度函数与累积分布函数当我们用不止一个随机变量来描述一个试验的结果的情况下,对应的概率密度函数成为多元〔多维〕概率密度函数最简单的多元概率密度函数是双变量概率密度函数表4给出了50支债券的债权等级(X)及收益率〔Y〕数据,其中X有三个不同水平:X=1(Bbb) X=2(Bb) X=3(B) 分别代表不同的信用等级表4等级(X)收益(Y)%1〔Bbb〕2(Bb)3(B)总计135018214218011314合计15201550表5等级(X)收益(Y)%1〔Bbb〕2(Bb)3(B)总计合计把表4的每一个数值除以50,将频数转化为频率,结果见表5这样表5就提供了一个双变量或联合概率密度函数表中每一个数值均为联合概率——即变量X取一给定值同时变量Y也取一给定值时的概率通常用表示联合密度函数如果X、Y是两个离散型随机变量,那么函数: =0, 当X≠x, Y≠y时 为离散型联合概率密度函数。
如果这个函数满足离散随机变量的联合累积分布函数为:如果X、Y是两个连续型随机变量,那么联合概率密度函数满足: i ii 任意有iii 相应地〔2〕边缘概率密度函数 在联合概率分布中,当其中一个变量X取某给定值,无论其他变量取值如何时的概率称为这个变量X的边缘概率,其概率密度就叫X的边缘密度函数〔3〕条件概率密度函数概率P称为条件概率,它代表随机变量X在给定条件Y=y下的概率分布计算条件分布概率密度的简单方法为:在回归分析中,我们经常要关注研究一个变量在给定另一个(或者多个)变量取值条件下的行为因此,条件概率密度函数的知识对于建立回归分析非常重要第二讲(4) 统计独立性在回归分析中,另一个非常重要的概念是独立随机变量两个变量X和Y称为统计独立的,当且仅当它们的联合概率密度函数可以表示为其边缘概率密度函数之积用符号表示:例:在上文的例子中,债券等级与债券收益是独立的随机变量吗?由表5可知,f(x=1,y=8.5)=0.26,f(x=1)=0.30,f(y=8.5)=0.36, f(x=1,y=8.5)≠f(x=1)f(y=8.5)因此,债券等级与债券收益不是独立的随机变量。
6、 概率密度的特征(1) 期望值:集中趋势的度量离散随机变量的期望值用符号E(X)表示,其定义为,随机变量的期望值也称均值,更准确地讲应称为总体均值期望的性质:i 常数的期望值是其本身 ii 两随机变量和的期望值等于两变量期望值之和iii 两随机变量的期望值之积或比,不一定等于积或比的期望值iv 随机变量得常数倍的期。