本科生金融计量经济学讲义

上传人:w****i 文档编号:109929067 上传时间:2019-10-28 格式:PDF 页数:35 大小:1.16MB
返回 下载 相关 举报
本科生金融计量经济学讲义_第1页
第1页 / 共35页
本科生金融计量经济学讲义_第2页
第2页 / 共35页
本科生金融计量经济学讲义_第3页
第3页 / 共35页
本科生金融计量经济学讲义_第4页
第4页 / 共35页
本科生金融计量经济学讲义_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《本科生金融计量经济学讲义》由会员分享,可在线阅读,更多相关《本科生金融计量经济学讲义(35页珍藏版)》请在金锄头文库上搜索。

1、北京大学光华管理学院 金融计量经济学讲义 1 第第四四章章 异常情况下的多元回归分析异常情况下的多元回归分析 在前面一章的讨论中给出了最小二乘估计是最优无偏估计所需要满足的六个假设条件, 这六个假设条件都是从统计角度给出的,是一种理想状况的条件;在实际的模型应用中,我 们所获得的数据通常很难同时满足这些条件; 有时是非常明显地偏离了所需要的条件, 这时 我们就不得不考虑结果的可信度和模型给出结果的现实价值了。 正因为这方面的考虑, 本章 将集中讨论面对这些假设条件不成立或偏离时, 如何调整或改造我们前面的 OLS 估计方法, 从而使模型给出的结果得到修正或在一定程度上得到改善。 我们将对 6

2、个假设条件不成立的 情形分别进行讨论, 按照模型假设条件对结果影响程度的大小, 从第六个假设条件到第一个 假设条件逆向逐步展开。 4 41 1包含虚拟变量的回归分析包含虚拟变量的回归分析 4 42 2异方差异方差(Heteroscedasticity)(Heteroscedasticity) 4 43 3模型的多重共线性问题模型的多重共线性问题 在回归模型中, 假设 4 限定了自变量之间不存在完全共线性。 假设 4 并不是不允许自变 量之间存在相关性,而只是限制不能完全相关。模型中容许自变量之间存在相关性,当相关 性太高时将给 OLS 估计和估计的方差带来问题。当一个或几个自变量之间具有比较高

3、的相 关性时,称为多重共线性(multicollinearity) 。假设 4 可以从两个方面来看,一个是从 OLS 估计的方差: )1 ( ) ( 2 2 jj j RSST Var ,kj, 2 , 1。如果使用向量的形式,假设 4 可以 表示为由自变量构成的矩阵 XX是可逆的, 或是满秩的。 多重共线性是 2 j R比较接近 1 或 XX 虽然可逆, 但由于其部分主子式取值比较小, 使得逆矩阵 1 ) ( XX的对应主子式数值非常大, 它们虽然没有否定假设 4,但作为分母的数非常小。它没有一个明确的意义和界限。尽管多 重共线性问题没有明确的定义, 在应用中人们仍然提出了一些可供参考的评判

4、指标和处理方 式。 431 多重共线性的影响多重共线性的影响 由于一个或几个自变量之间具有比较高的相关性而产生多重共线性时,OLS 模型估计 的方差将比较大,尽管此时的 OLS 估计仍然是无偏的,但由于估计的标准差比较大,很难 给出估计系数偏效应的合理估计,估计可以偏离真实值很远。因为比较大的标准差,使得 t 统计量不容易达到显著水平, 也很难给出对估计系数的推断。 而且对结果的影响可能是成对 的,数据的极小变动就可能使估计的结果发生比较大的改变。容易高估(overestimates)或低 估(underestimates)该变量所具有的真实偏效应。一种比较直接的考察模型是否存在共线性的 方法

5、是看 OLS 估计的标准差,是否有一些系数的估计标准差比较大。比较正规的处理方法 是考察自变量的方差-协方差矩阵。 432 多重共线性的判断多重共线性的判断 当两个变量之间或多个变量之间存在太高的相关性时, 由于共线性问题使得模型的参数 估计具有比较大的标准差,从而不能有效地给出变量的偏效应。应用中,很少有自变量之间 不存在相关性的问题,只要变量之间存在相关性就会增大参数估计的标准差,因此,共线性 的问题实际上是一个程度的问题。 如何来判断模型中是否存在共线性的问题?研究者已经提 北京大学光华管理学院 金融计量经济学讲义 2 出了很多种表明共线性是否存在的判别指标。但所有的判别指标基本上都是围

6、绕着 2 j R和 1 ) ( XX而给出的,下面是一些常用的判别共线性的方法。 1)当模型中存在共线性的问题时,数据很小的变化可能就会带来估计系数比较大的变 动。 2)模型的系数具有非预期的符号,或者是有不成比例的系数。都是模型可能存在共线 性的信号。 3)一个模型有相对比较高的 R 方,但具体变量的 t 统计量显著程度不高,是模型存在 多重共线性的一个信号;或者是模型的检验统计量 F 比较显著,但具体变量的 t 统计量都不 显著或显著程度较低。 4) 自变量两两之间的相关系数 ij 也是考察一个回归模型是否存在共线性的重要指标, 因此在有的文献中, 给出了自变量之间的相关系数矩阵。 然而仅

7、根据一组或几组变量之间存 在比较高的相关性来判断回归模型是否有共线性问题还需注意以下两点。 首先, 有些数据集, 特别是在包含时间序列数据的模型中, 一些变量组之间存在强相关, 同样还能保证合理区分 具体的自变量的偏效应。 其次, 简单的两两相关系数矩阵不能反映多个变量联合后存在的共 线性问题。 5)在过去些年,文献中提出了多种对回归模型中是否存在多重共线性的问题进行检验 的方法,但没有一种方法是得到广泛接受的。自变量的特征根也是判断共线性的重要指标。 比较常用的一种是 Belsley et al (1980)提出的条件数(condition number),条件数是矩阵 )(XX的最大特征根

8、与最小特征根的比值的平方根,即: min max (428) 一般来说,条件数大于 20 或 30 被认为是存在共线性的特征。还有把矩阵)(XX进行 方差分解来判断具体某个自变量的共线性程度的方差因子(variance inflation factors (VIF)) 或单一变量的容忍度(tolerances for individual variables) 。事实上,容忍度就是 1- 2 j R,VIF 就是)1/(1 2 j R。这在大部分的计量软件中都有报告。当这一自变量与其他自变量无关时, 即 2 j R=0,VIF=1 为最小值;当这一自变量与其他自变量相关性增加时, 2 j R逐

9、渐接近 1,此 时 VIF 将趋向无穷大。前面我们已经知道,VIF 所反映的只是 OLS 估计的方差的一部分。 OLS 估计的方差大小还与 j SST有关。 当样本量比较大时, 模型可以承受的 VIF 值就比较大, 反之则不然。因此对共线性指标的使用还需要根据具体的情况。 例 418,在 CEO 年薪的例子中,采用 2007 年的数据,只考虑公司的盈利和股东持股 情况回归模型为: firstholdeachearnincomeassetthreeceo231. 0106. 0ln029. 0ln292. 0835. 2)log( (0.181) (0.024) (0.012) (0.020)

10、(0.072) thirdholdondhold566. 0sec190. 0 (0.148) (0.378) n=1054, SSR=560.04, 2 R=0.274。 各变量的 VIF 分别为:1.73,1.61,1.26,1.26,1.37; 最大的特征为: 0.809, 最小的特征根为0.001; 由此可以计算出模型的条件系数为65.896。 北京大学光华管理学院 金融计量经济学讲义 3 模型存在比较严重的共线性问题。 433 多重共线性的处理方式多重共线性的处理方式 对共线性模型的处理方式有多种, 比较简单直接的方法是直接从模型中删除产生问题的 变量,例如在上一节中 VIF 比较大

11、的自变量,但这又涉及到模型设定的问题。当模型可能 存在共线性问题的时候,OLS 估计给出的仍然是无偏估计,但最优的说法已经不太合适了。 一种改进模型的可能方式是寻找稍微有偏的估计方法, 但估计的方差可以更小。 这类估计会 有更小的均方误差,但估计的分布通常依赖于未知参数,因此又带来了统计推断的问题,需 要在可以推断的前提下来权衡无偏估计和有偏估计。 文献中有两种专门针对可能存在共线性时标准差估计太大的处理方法:岭回归估计 (Ridge regression estimator)和主成分(principal components)分析方法。下面我们分别对两种方 法给出一个简单介绍。 A) 岭回归

12、估计方法。 岭回归估计方法实际上就是在普通的 OLS 估计上再加上一个对角阵而使分母离开零 点。估计可以表示为: YXrDXX r )( 1 (429) 其中 D 为由矩阵)(XX的对角线上的元素组成的对角阵,r 为任意选取的一个刻度。 在应用中通常选取 r 使得它的微小变化不会带来估计参数的改变,即一个能使估计稳定的 值。例如从 0.01 开始,逐渐增加到估计参数稳定。虽然岭回归估计是有偏的,但可以验证 其估计的方差: 112 )()()( rDXXXXrDXXVar r (430) 要比 OLS 估计的方差小。 B). 主成份分析方法 主成份分析方法实际上就是对自变量进行重新组织, 使用自

13、变量的组合来作为新的自变 量。构造组合的方法是通过自变量的方差协方差矩阵。 主成分分析的基本思想就是在不损失太多信息的前提下用尽量少的变量来反映协方差 矩阵;在因素选择中就是通过降维用 k 个因素来反映 N 种资产的收益。把主要的成分作为 因素, 第一个主成分就是所有资产线性组合中具有最大方差的组合, 第二个主成分就是所有 资产的线性组合中与第一个主成分正交且具有最大方差的组合,依此类推。 第一个样本主成分为 t Rw 1 , 1 w为下列优化问题的 N 维向量解: 11 1 wwMaxw, 约束条件为:1 11 ww (431) 为样本收益的协方差矩阵, 1 w就是 的最大特征根所对应的特征

14、向量。把 1 w标准 化使其和为 1 即:)/( 11 * 1 wlww , 第一个因素即为 t Rw * 1 。 第二个因素为把上述优化中的 1 w 换为 2 w,再附加一个约束条件0 2 * 1 ww所得到的解向量。依此类推可以得到其它主成分: * j w,j=3,k。 另一种主成分分析方法是由 Connor 等在 1986 年提出的, 他们建议使用资产横截面的中 心化收益的 TT 矩阵的前 K 个最大的特征向量来代替 NN 样本协方差矩阵的主成分。这 一方法的一个好处就是它可以表达时变的风险回报因素;另一方面它还有简化计算的作用。 当市场中资产的数目或种类比较多时, 资产数目 N 通常要

15、比样本观测量 T 大得多, 使用这一 北京大学光华管理学院 金融计量经济学讲义 4 方法可以把处理高阶的 NN 矩阵变成为处理阶数较低的 TT 矩阵。 4 44 4有关模型设定和数据的问题有关模型设定和数据的问题 前一节讨论了 GM 假设不成立时的一些处理方法,误差项存在异方差时是模型设定不 当的一种表现。存在异方差不会导致估计有偏,但会影响估计的有效性。通过适当的调整可 以给出置信区间、t 检验和 F 检验,甚至可以通过 WLS 得到更为有效的估计。因此存在异 方差并不是模型设定不适当的主要问题。下面我们将要讨论模型设定不适当的一个重要问 题:干扰项与其中的一个或多个自变量有关,即假设 3 不成立。当 不论什么原因与自变量 j x相关时,我们称 j x为一个内生的变量,并讨论三种可能产生内生变量的原因。 441 函数形式设定不当(函数形式设定不当(Functional form misspecification) 当建立模型时没有正确考虑自变量和因变量之间的关系时, 就可能会使回归模型产生函 数形式设定不当。例如,在小时工资的例子中,模型应该为: 2 3210

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号