上海财经大学金融计量学讲义

上传人:ni****g 文档编号:568613047 上传时间:2024-07-25 格式:PPT 页数:519 大小:2.05MB
返回 下载 相关 举报
上海财经大学金融计量学讲义_第1页
第1页 / 共519页
上海财经大学金融计量学讲义_第2页
第2页 / 共519页
上海财经大学金融计量学讲义_第3页
第3页 / 共519页
上海财经大学金融计量学讲义_第4页
第4页 / 共519页
上海财经大学金融计量学讲义_第5页
第5页 / 共519页
点击查看更多>>
资源描述

《上海财经大学金融计量学讲义》由会员分享,可在线阅读,更多相关《上海财经大学金融计量学讲义(519页珍藏版)》请在金锄头文库上搜索。

1、上海财经大学金融计量学讲义第一章第一章金融金融计量学介量学介绍2本章要点金融计量学的方法论与应用步骤。金融数据的特点和来源金融计量学软件的使用3第一第一节 金融金融计量学的含量学的含义及建模步及建模步骤一、金融计量学的含义金融计量学就是把计量经济学中的方法和技术应用到金融领域,即应用统计方法和统计技术解决金融问题。4二、金融计量建模的主要步骤经济理论或金融理论建立金融计量模型数据收集模型估计模型检验不通过通过重新建立模型模型的应用5第一步,把需要研究的金融问题模型化;第二步,收集样本数据;第三步,选择合适的估计方法来估计模型;第四步,对模型进行检验;第五步,对模型进行相应的应用。6三、金融数据

2、的主要类型、特点和来源1.金融数据的主要类型时间序列数据(Timeseriesdata)是按照一定的时间间隔对某一变量在不同时间的取值进行观测得到的一组数据,例如每天的股票价格、每月的货币供应量、每季度的GDP、每年用于表示通货膨胀率的GDP平减指数等。7在分析时间序列数据时,应注意以下几点:(1)在利用时间序列数据回归模型时,各变量数据的频率应该是相同的;(2)不同时间的样本点之间的可比性问题;(3)使用时间序列数据回归模型时,往往会导致模型随机误差项产生序列相关;(4)使用时间序列数据回归模型时应特别注意数据序列的平稳性问题。8横截面数据(Cross-sectionaldata)是指对变量

3、在某一时点上收集的数据的集合,例如,某一时间点上海证券交易所所有股票的收益率,2004年世界上发展中国家的外汇储备等。平行数据(Paneldata)是指多个个体同样变量的时间序列数据按照一定顺序排列得到的集合,例如30家蓝筹股过去3年每日的收盘价。9 2.金融数据的特点 与一般宏观经济数据相比,金融数据在频率、准确性、周期性等方面具有自己特有的性质: (1)金融数据可以更频繁地观察到,可用于计量分析的数据观测值个数可以成千上万,数量十分巨大; (2)金融数据一般都能在交易时准确记录下来; (3)金融数据一般也是不平稳的,但难以区分金融数据序列的随机游走、趋势以及其他的一些特征。103.金融数据

4、的主要来源政府部门和国际组织的出版物及网站专业信息数据公司,抽样调查11第二第二节 金融金融计量学量学软件件简介介 一、金融计量学主要软件简介1.金融计量分析的主要任务从反映金融问题的大量数据中提取和归纳金融问题的客观规律性,进行解释和预测,为金融政策和金融实践提供依据。为此,必须合理、科学地组织管理大量的数据信息,并用计量经济学或金融计量学的方法对这些数据进行一系列复杂的数值计算处理。122.分类(按操作的互动性与否分为)菜单模式,如Microfit命令行模式,如Eviews及介于二者之间的中间模式133.主要计量经济学软件Eviews软件GAUSS软件LIMDEP软件Mathematica

5、软件Matlab软件Microfit软件Minitab软件RATS软件SAS软件SHAZMA软件S-PLUS软件SPSS软件STATA软件TSP软件14二、本课程所用软件Microfit4.0和Eviews3.11.Microfit4.0使用简介以Microfit4.0版本为例。1.数据输入、修改及保存15图1-2Microfit4.0主界面16图1-3数据录入设定界面17图1-4变量定义、修改窗口18图1-5 数据录入界面192.命令窗口及绘图图1-6Microfit命令窗口20图1-719621972年辞职率和失业率线性图21图1-819621972年辞职率和失业率散点图223.一个回归分

6、析案例图1-9Microfit单方程回归分析窗口23图1-10 最小二乘估计结果及相关统计量24图1-11四种假设检验的结果25(二)Eviews3.1使用简介1.数据输入、修改及保存图1-12Eviews新工作文件数据设定窗口26图1-13空白新工作文件27(二)Eviews3.1使用简介1.数据输入、修改及保存图1-14新工作文件数据导入窗口28图1-15 数据导入后工作文件29图1-16 察看数据窗口30图1-17 GDP和M1线性图31图1-18 方程设定窗口32图1-19 回归结果33本章小本章小节金融计量学是金融学的一个重要分支,金融问题的数量化研究是金融计量学的目的,包括金融模型

7、的设计、建立、估计、检验及使用模型进行预测和政策策划的系列过程。金融理论的迅速发展、金融模型的不断推出、计算机技术的日益发展和计量软件的多样化都为现代金融的数量化研究提供了有力的工具,这些条件的结合形成了金融计量分析的基础。34本章简要阐述了金融计量学的方法和一般应用步骤,着重介绍了金融数据的类型和特点,简要评述了主要的计量和统计软件包,对常用的Microfit和Eviews计量软件的使用方法进行了详细讲解并举例说明。本章旨在使学生理解金融计量模型思想,了解金融数据的特点与来源,掌握常用的金融计量软件。35第二章第二章 最小二乘法(最小二乘法(OLS)和和线性回性回归模型模型36本章要点最小二

8、乘法的基本原理和计算方法经典线性回归模型的基本假定BLUE统计量的性质t检验和置信区间检验的原理及步骤多变量模型的回归系数的F检验预测的类型及评判预测的标准好模型具有的特征37第一第一节 最小二乘法的基本属性最小二乘法的基本属性一、有关回归的基本介绍金融、经济变量之间的关系,大体上可以分为两种:(1)函数关系:Y=f(X1,X2,.,XP),其中Y的值是由Xi(i=1,2.p)所唯一确定的。(2)相关关系:Y=f(X1,X2,.,XP),这里Y的值不能由Xi(i=1,2.p)精确的唯一确定。38图2-1 货币供应量和GDP散点图39图2-1表示的是我国货币供应量M2(y)与经过季节调整的GDP

9、(x)之间的关系(数据为1995年第一季度到2004年第二季度的季度数据)。40但有时候我们想知道当x变化一单位时,y平均变化多少,可以看到,由于图中所有的点都相对的集中在图中直线周围,因此我们可以以这条直线大致代表x与y之间的关系。如果我们能够确定这条直线,我们就可以用直线的斜率来表示当x变化一单位时y的变化程度,由图中的点确定线的过程就是回归。41对于变量间的相关关系,我们可以根据大量的统计资料,找出它们在数量变化方面的规律(即“平均”的规律),这种统计规律所揭示的关系就是回归关系(regressiverelationship),所表示的数学方程就是回归方程(regressionequat

10、ion)或回归模型(regressionmodel)。42图2-1中的直线可表示为(2.1) 根据上式,在确定、的情况下,给定一个x值,我们就能够得到一个确定的y值,然而根据式(2.1)得到的y值与实际的y值存在一个误差(即图2-1中点到直线的距离)。 43如果我们以表示误差,则方程(2.1)变为:即: 其中t(=1,2,3,.,T)表示观测数。 (2.2)(2.3)式(2.3)即为一个简单的双变量回归模型(因其仅具有两个变量x, y)的基本形式。 44其中yt被称作因变量(dependentvariable)、被解释变量(explainedvariable)、结果变量(effectvaria

11、ble);xt被称作自变量(independentvariable)、解释变量(explanatoryvariable)、原因变量(causalvariable)45、为参数(parameters),或称回归系数(regressioncoefficients);t通常被称为随机误差项(stochasticerrorterm),或随机扰动项(randomdisturbanceterm),简称误差项,在回归模型中它是不确定的,服从随机分布(相应的,yt也是不确定的,服从随机分布)。46为什么将t包含在模型中?(1)有些变量是观测不到的或者是无法度量的,又或者影响因变量yt的因素太多;(2)在yt的

12、度量过程中会发生偏误,这些偏误在模型中是表示不出来的;(3)外界随机因素对yt的影响也很难模型化,比如:恐怖事件、自然灾害、设备故障等。47二、参数的最小二乘估计(一)方法介绍本章所介绍的是普通最小二乘法(ordinaryleastsquares,简记OLS);最小二乘法的基本原则是:最优拟合直线应该使各点到直线的距离的和最小,也可表述为距离的平方和最小。假定根据这一原理得到的、估计值为、,则直线可表示为。48直线上的yt值,记为,称为拟合值(fittedvalue),实际值与拟合值的差,记为,称为残差(residual),可以看作是随机误差项的估计值。根据OLS的基本原则,使直线与各散点的距

13、离的平方和最小,实际上是使残差平方和(residualsumofsquares,简记RSS)最小,即最小化: RSS= = (2.4) 49根据最小化的一阶条件,将式2.4分别对、求偏导,并令其为零,即可求得结果如下:(2.5) (2.6) 50(二)一些基本概念1.总体(thepopulation)和样本(thesle)总体是指待研究变量的所有数据集合,可以是有限的,也可以是无限的;而样本是总体的一个子集。2、总体回归方程(thepopulationregressionfunction,简记PRF),样本回归方程(thesleregressionfunction,简记SRF)。51总体回归方

14、程(PRF)表示变量之间的真实关系,有时也被称为数据生成过程(DGP),PRF中的、值是真实值,方程为:+ (2. 7)样本回归方程(SRF)是根据所选样本估算的变量之间的关系函数,方程为:注意:SRF中没有误差项,根据这一方程得到的是总体因变量的期望值(2.8) 52于是方程(2.7)可以写为:(2.9)总体y值被分解为两部分:模型拟合值()和残差项()。533.线性关系对线性的第一种解释是指:y是x的线性函数,比如,y=。对线性的第二种解释是指:y是参数的一个线性函数,它可以不是变量x的线性函数。比如,y=就是一个线性回归模型,但则不是。在本课程中,线性回归一词总是对指参数为线性的一种回归

15、(即参数只以一次方出现),对解释变量x则可以是或不是线性的。54有些模型看起来不是线性回归,但经过一些基本代数变换可以转换成线性回归模型。例如, (2.10) 可以进行如下变换: (2.11)令、,则方程(2.11)变为:(2.12) 可以看到,模型2.12即为一线性模型。 554.估计量(estimator)和估计值(estimate)估计量是指计算系数的方程;而估计值是指估计出来的系数的数值。56三、最小二乘估计量的性质和分布(一)经典线性回归模型的基本假设(1),即残差具有零均值;(2)var30),并且要求满足条件:观测值的数目至少是参数的二倍;随机项没有自相关并且服从正态分布。统计假

16、设:零假设:是同方差(i=1,2,n)备择假设:具有异方差136Goldfeld-Quandt检验法涉及对两个最小二乘回归直线的计算,一个回归直线采用我们认为随机项方差较小的数据,另一个采用我们认为随机项方差较大的数据。如果各回归直线残差的方差大致相等,则不能拒绝同方差的原假设,但是如果残差的方差增加很多,就可能拒绝原假设。步骤为:137第一步,处理观测值。将某个解释变量的观测值按由小到大的顺序排列,然后将居中的d项观测数据除去,其中d的大小可以选择,比如取样本容量的1/4。再将剩余的(n-d)个数据分为数目相等的二组。138第二步,建立回归方程求残差平方和。拟合两个回归模型,第一个是关于较小

17、x值的那部分数据,第二个是关于较大x值的那部分数据。每一个回归模型都有(n-d)/2个数据以及(n-d)/2-2的自由度。d必须足够小以保证有足够的自由度,从而能够对每一个回归模型进行适当的估计。对每一个回归模型,计算残差平方和:记值较小的一组子样本的残差平方和为=,值较大的一组子样本的残差平方和为=。139第三步,建立统计量。用所得出的两个子样本的残差平方和构成F统计量:若零假设为真,则上式中n为样本容量(观测值总数),d为被去掉的观测值数目,k为模型中自变量的个数。140第四步,得出结论。假设随机项服从正态分布(并且不存在序列相关),则统计量/将服从分子自由度和分母自由度均为()的F分布。

18、对于给定的显著性水平,如果统计量的值大于上述F分布的临界值,我们就拒绝原假设,认为残差具有异方差性。否则,就不能拒绝原假设。141(二)Spearmanrankcorrelation检验法首先引入定义Spearman的等级检验系数: 其中 表示第i个单元或现象的两种不同特性所处的等级之差,而n表示带有级别的单元或现象的个数。在这里,我们假设模型为:142第一步,运用OLS法对原方程进行回归,计算残差 ,i=1,2n。第二步,计算Spearman等级相关系数。将 和解释变量观察值 按从小到大或从大到小的顺序分成等级。等级的大小可以人为规定,一般取大小顺序中的序号。如有两个值相等,则规定这个值的等

19、级取相继等级的算术平均值。 然后,计算 与 的等级差 , 的等级 的等级。最后根据公式计算Spearman等级相关系数。143第三步,对总体等级相关系数 进行显著性检验 : 0, : 0。样本 的显著性可通过t检验按下述方法加以检验:t 对给定的显著水平 ,查t分布表得 的值,若 ,表明样本数据异方差性显著,否则,认为不存在异方差性。对于多元回归模型,可分别计算 与每个解释变量的等级相关系数,再分别进行上述检验。144(三)Park检验法Park检验法就是将残差图法公式化,提出是解释变量的某个函数,然后通过检验这个函数形式是否显著,来判定是否具有异方差性及其异方差性的函数结构。该方法的主要步骤

20、如下:第一步,建立被解释变量y对所有解释变量x的回归方程,然后计算残差(i=1,2,n)第二步,取异方差结构的函数形式为,其中,和是两个未知参数,是随机变量。写成对数形式则为:。145第三步,建立方差结构回归模型,同时用来代替,即。对此模型运用OLS法。对进行t检验,如果不显著,则没有异方差性。否则表明存在异方差。Park检验法的优点是不但能确定有无异方差性,而且还能给出异方差性的具体函数形式。但也有质疑,认为仍可能有异方差性,因而结果的真实性要受到影响。146(四)Glejser检验法这种方法类似于Park检验。首先从OLS回归取得残差之后,用的绝对值对被认为与密切相关的X变量作回归。有如下

21、几种函数形式(其中 是误差项):147Glejser检验方法的优点是允许在更大的范围内寻找异方差性的结构函数。缺点是难于确定的适当的幂次,这往往需要进行大量的计算。从实际方面考虑,该方法可用于大样本,而在小样本中,则仅可作为异方差摸索的一种定性技巧。148(五)Breusch-Pagan检验法该方法的基本思想是构造残差平方序列与解释变量之间的辅助函数,得到回归平方和ESS,从而判断异方差性存在的显著性。设模型为:(3.7)并且(3.8) 在式(3.8)中 表示是某个解释变量或全部。149提出原假设为 , 具体步骤如下:第一步,用OLS方法估计式(3.7)中的未知参数,得(3.9) 和 (n为样

22、本容量) (3.10)第二步,构造辅助回归函数 (3.11) 式中 为随机误差项。 150第三步,用OLS方法估计式(3.11)中的未知参数,计算解释的平方和ESS,可以证明当有同方差性,且n无限增大时有第四步,对于给定显著性水平 ,查 分布表得 ,比较 与 ,如果,则拒绝原假设,表明模型中存在异方差。151(六)White检验White检验的提出避免了Breusch-Pagan检验一定要已知随机误差的方差产生的原因,并且要求随机误差服从正态分布。White检验与Breusch-Pagan检验很相似,但它不需要关于异方差的任何先验知识,只要求在大样本的情况下。下面是White检验的基本步骤:设

23、二元线性回归模型为(3.12)152异方差与解释变量的一般线性关系为第一步,用OLS法估计式3.3的参数。第二步,计算残差序列和。第三步,求对,的线性回归估计式,即构造辅助回归函数。第四步,计算统计量,其中n为样本容量,为辅助回归函数中的决定系数。153第五步,在的原假设下,服从自由度为5的分布,给定显著性水平,查分布表得临界值,比较与,如果前者大于后者,则拒绝原假设,表明式(3.12)中随机误差存在异方差。此外,由于金融问题研究中经常需要处理时间序列数据,当存在异方差性的时候,可考虑用ARCH方法检验。检验异方差的方法多种多样,可以根据所研究问题的需要加以选择,也可以同时选择不同的方法,对检

24、验结果进行分析比较,以求得出更准确的结论。154第三第三节 异方差的修正异方差的修正异方差性虽然不损坏OLS估计量的无偏性和一致性,但却使它们不再是有效的,甚至不是渐近(即在大样本中)有效的。参数的显著性检验失效,降低了预测精度。故而直接运用普通最小二乘法进行估计不再是恰当的,需要采取相应的修正补救办法以克服异方差的不利影响。其基本思路是变异方差为同方差,或者尽量缓解方差变异的程度。在这里,我们将会遇到的情形分为两种:当误差项方差为已知和当为未知。155一、当为已知:加权最小二乘法(weightedleastsquares,WLS在同方差的假定下,对不同的,偏离均值的程度相同,取相同权数的做法

25、是合理的。但在异方差情况下,则是显而易见的错误,因为的方差在不同的上是不同的。比如在递增异方差中,对应于较大的x值的估计值的偏差就比较大,残差所反映的信息应打折扣;而对于较小的x值,偏差较小,应给予重视。156所以在这里我们的办法就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。这样对残差所提供信息的重要程度作一番校正,以提高参数估计的精度。157可以考虑用作为的权数。于是加权最小二乘法可以表述成使加权残差平方和达到最小。158二、当为未知已知真实的可以用WLS得到BLUE估计量。但现实中多数情况下是未知的,所以还要考虑别的方法来消除异方差。一般来讲,可以将异方差的表现分为

26、这样几种类别。我们以为模型。(一)正比于:可对原方程做如下变换:159(二)正比于:就可将原始的模型进行入下变换(三)正比于Y均值的平方:将原模型进行如下变换:160在上述变换中,都可以看到对的形式采取的是一种猜测的态度,即我们也不能肯定采取哪种变换更有效。同时这些变换可能还有其他的一些问题:1.当解释变量多于1个时,也许先验上不知道应选择哪一个X去进行变换;2.当无法直接得知而要从前面讨论的一个或多个变换中做出估计时,所有用到t检验F检验等的检验程序,都只有在大样本中有效。3.谬误相关的问题。161三、模型对数变换法仍以模型为例,变量和分别用和代替,则对模型进行估计,通常可以降低异方差性的影

27、响。原因?162第四第四节 金融金融实例分析例分析例3-1纽约股票交易所(NYSE)与美国证券交易委员会(SEC)关于经济佣金率放松管制的争论,其中异方差的检验与修正在证明规模效应存在与否起着重要的作用。163下面通过一个具体金融案例来讨论异方差的检验与修正过程:根据北京市1978-1998年人均储蓄与人均收入的数据资料,若假定X为人均收入(元),Y为人均储蓄(元),分析人均储蓄受人均收入的线性影响,可建立一元线性回归模型进行分析。设模型为164图3-3Eviews回归结果1用OLS估计法估计参数165图3-4残差图(1)图示法166(2)Goldfeld-Quandt检验按前述检验方法,对1

28、9781985与19911998年时间段的数据进行OLS方法检验,求出F统计量,查表得是否存在异方差167(3)ARCH检验图3-5ARCH检验结果168异方差的修正:WLS法图3-6WLS估计结果169对数变换法图3-7对数变换估计结果170第五第五节 自相关的概念和自相关的概念和产生原因生原因为了能更好地说明自相关问题,我们以一个金融案例来开始本章余下三节的学习,并将在下面反复用到这个例子。例:利率的变化我们将用工业生产指数(IP),货币供应量增长率(GM2),以及通胀率(GPW)的函数来解释国债利率R的变化。171R=3个月期美国国债利率。为年利率的某一百分比IP联邦储备委员会的工业生产

29、指数(1987=100)M2=名义货币供给、以十亿美元为单位PW所有商品的生产价格指数(1982=100)172用于回归模型的货币与价格变量是:回归方程是:(括号中为t统计量)(2.84)(8.89)(3.91)(6.15)=0.22DW=0.18S=2.458Mean=6.07173一、滞后值与自相关的概念在阐释自相关概念之前,先介绍滞后值的概念。一个变量的滞后值是这个变量在一段时间前的取值。举个例子:滞后一期的取值,记为。y的一阶差分,记为,是用y的当期值减去前一期的值:,以此类推,可以得到滞后二期,滞后三期值。174表3-1当期值、滞后值、差分的关系 1990.10.81990.21.3

30、0.80.51990.3-0.91.3-2.21990.40.2-0.91.11990.5-1.70.2-1.91990.62.3-1.74.01990.70.12.3-2.21990.80.00.1-0.1175回到自相关问题,在回归模型: 经典线性回归模型(CLRM)的基本假设第三条是: 若此假设被破坏,即,随机误差项u的取值与它的前一期或前几期的取值(滞后值)有关,则称误差项存在序列相关或自相关。自相关有正相关和负相关之分。实证表明:在经济数据中,常见的是正自相关。176(a)正自相关177(b)负自相关178(c)无自相关179二、自相关产生的原因1.经济数据的固有的惯性(inerti

31、a)带来的相关2.模型设定误差带来的相关3.数据的加工带来的相关180第六第六节 自相关的度量与后果自相关的度量与后果一、自相关的度量假定存在自相关,若的取值仅与前一期有关,即=f(),则称这种自相关为一阶自相关。对于一般经济现象而言,两个随机项在时间上相隔越远,前者对后者的影响越小。如果存在自相关的话,最强的自相关应该是一阶自相关。这里,我们只讨论一阶自相关,并且假定这是一种线性自相关,具有一阶线性自回归AR(1)的形式:181式中为常数,称为自相关系数。是一个新随机项,它满足经典回归的全部假定。上式可以看成是一个一元回归模型。是因变量,是自变量,是回归系数。可用OLS法估计:182当0时,

32、为正相关,0.8),或F检验值显著,但单个解释变量系数估计值却不显著;或从金融理论知某个解释变量对因变量有重要影响,但其估计值却不显著,则可以认为存在严重的多重共线性问题。若两个解释变量之间的相关系数高,比如说大于0.8,则可以认为存在严重的多重共线性。216判断多重共线性的存在范围要确定多重共线性是由哪些主要变量引起的,可以采用辅助回归法(auxiliaryregressionmethod)。所谓辅助回归是指某一解释变量对其余解释变量的回归,区别于因变量对所有解释变量回归的主回归(mainregression)。辅助回归法构造的检验统计量定义如下:服从自由度为k-1与n-k的F分布其中(i=

33、1,2,k)为第i个解释变量关于其余解释变量的辅助回归的拟和优度,k为解释变量的个数,n代表样本容量。217检验多重共线性的表现形式当确定多重共线性是由哪些主要变量引起后,若要找出与主要变量有共线性的解释变量,即确定多重共线性的表现形式,可采用偏相关系数法。解释变量与偏相关系数即是在其它的解释变量固定的情况下它们之间的相关系数。偏相关系数法构造的检验统计量定义如下:,服从自由度为n-k-1的t分布其中n为样本容量,k为解释变量的个数,为与的偏相关系数。若显著不为零,则认为、是引起多重共线性的原因,否则不是。218多重共多重共线性的修正性的修正如前所述,多重共线性在金融数据中是普遍存在的,是否对

34、多重共线性采取修正措施取决于多重共线性的严重程度。若多重共线性程度较轻微,并不严重影响系数估计值(符号正确,t值显著),则可以忽略多重共线性问题。若多重共线性对重要因素的系数估计值有严重的影响,则必须进行补救。采取何种补救措施,则取决于多重共线性因素的重要性、其它数据来源的可用性、所估计模型的目的以及其它需要考虑的事项。以下将介绍几种补救措施。219多重共多重共线性的修正性的修正一、删除不必要的变量如果在产生多重共线性的因素中有相对不重要的变量,则可试着将其删除,这是解决多重共线性最简单的方法,但删除变量也可能会导致新问题的产生:(1)被删除变量对因变量的影响将被其它解释变量和随机误差项所吸收

35、,这可能一方面解决了一部分变量的多重共线性问题,但另一方面却又同时增强了另一部分变量的多重共线性问题,而且,还可能使随机误差项的自相关程度增强。(2)删除某个变量可能会导致模型设定误差(specificationerror)。所谓模型设定误差,指的是在建立回归模型的过程中,因为错误设定模型结构而产生的误差。错误的删除解释变量将会导致最小二乘估计值是有偏的。220二、改变解释变量的形式。1、差分法对于时间序列数据而言,若原始变量存在严重的多重共线性,则可以考虑对变量取差分形式,可在一定程度上降低多重共线性的程度。例如对于模型,可把变量变换为差分形式:2、指数增长率方法例如研究三种指数关系时,可用

36、如下模型:2213、以比率代替高度相关的变量若模型中存在高度相关的变量,在不违反金融理论的前提下,可以求得两者之间的比率,并以此比率代替相应变量出现在模型中。例如对于模型,若与之间高度相关,且模型的目的是用于预测,则可令,则可在一定程度上消除多重共线性此外,当模型中有较多解释变量的滞后值,并存在严重多重共线性时,可以考虑用被解释变量的滞后值代替解释变量的滞后值;以人均形式的变量代替总体变量在某些状况下也可以在一定程度上降低多重共线性的程度。222多重共多重共线性的修正性的修正三、补充新数据。由于多重共线性是一样本特征,故有可能在关于同样变量的另一样本中共线性没有第一个样本那么严重。Christ

37、(1966)认为:解释变量之间的相关程度与样本容量成反比,即样本容量越小,相关程度越高;样本容量越大,相关程度越小。因此,收集更多观测值,增加样本容量,就可以避免或减轻多重共线性的危害。223多重共多重共线性的修正性的修正四、利用先验信息法。这里的先验信息,包括从金融理论以及实际统计资料所获得的解释变量或所估计参数之间的关系。若发生多重共线性的那些解释变量之间的关系可由先验信息得到,则在所研究的模型中利用这种关系,便可以减轻多重共线性的程度。224金融数据的多重共金融数据的多重共线性性处理理:示例示例理论上,股票代表着对公司未来现金流的所有权,因此,公司未来的收益以及利息是股票价格的决定因素。

38、而宏观经济形势能够影响到公司未来的收益,进而对股票价格产生影响。同时宏观经济形势也能够通过其它的一些渠道直接对股票价格产生影响。我们将以整个股票市场为研究对象,来考虑影响股票价格指数的宏观经济因素以及它们的影响程度。我们将采取从一般到特别的建模方式,即首先将模型中包含尽可能多的变量,然后通过各种检验逐步剔出对因变量没有解释能力的变量。225对影响股票价格指数宏影响股票价格指数宏观经济因素因素的的实证分析分析我们选择上证综指(以Y表示)作为股票价格指数的代表。对于影响股票价格指数的宏观经济因素,初步选定如下的十个宏观变量:居民消费物价指数、商品零售物价指数、企业商品价格指数、工业增加值、固定资产

39、投资、社会消费品零售总额、股市成交量、外汇市场交易量、汇率、货币供应量m1、进出口额。分别以至代表。其中前三个价格指数从不同侧面反映了我国的市场环境,而则从不同侧面反映了整体经济状况,反映了我国金融环境的影响,股市成交量从一个侧面反映了股市状况。我们采用的数据是从2000.12004.9月的月度数据,对于价格指数变量以及汇率,我们以原变量形式进入模型,而对于其它变量,我们取其对数形势进入模型。226在对数据调整后,我们建立如下的模型:利用普通最小二乘法回归方程,得到如下的结果:去掉不显著的变量,对模型重新回归得到:227在10%的显著性水平下,变量系数估计值的t值都是显著的,模型的=0.78,

40、=0.75,总体上看模型是不错的。尽管估计值的t值是显著的,我们仍来检验该模型解释变量之间是否存在多重共线性,因为若两个变量之间存在高度相关并且符号相反,他们的作用就会相互抵消,从而有可能两个变量都是显著的。首先,根据和t值,我们无法发现多重共线性,因此我们将利用变量之间的相关系数来判断。228在Eviews软件中,要获得检验解释变量两两之间的相关系数矩阵是很容易的,我们只需在命令窗口中键入“COR”命令以及相应的解释变量。图4-1相关系数矩阵229分别删除、再进行回归得到的结果如下:图4-2删除后的回归结果230图4-3删除后的回归结果231分别删除X6、X10后得到的结果如下:图 4-4

41、删除X6 后的回归结果232图4-5删除X10后的回归结果233最后得到的模型是:我们之所以在原回归方程系数估计值都显著的情况下仍进行多重共线性检验,并删除一些变量,是因为在金融计量学中,在保证模型一定解释能力的情况下,尽可能的使模型简洁,是我们应该始终坚持的一个原则。在这个例子中,我们仅考虑了对模型解释变量的多重共线性检验,在实际建模以及估计过程中,还应该考虑模型的自相关性、异方差性等的检验。234虚虚拟变量模型量模型在本章余下的四节中,我们将讨论虚拟变量在回归分析中的应用。虚拟变量既可以作为解释变量出现在模型中,也可以作为因变量出现在模型中,我们统称这类含虚拟变量的经济计量模型为虚拟变量模

42、型。235虚拟变量的性质在金融计量学中,所考虑的变量除了可以直接度量的数量变量(如价格、收益、收入等)之外,还有实质上是定性性质的变量,如性别、国家、战争及政府经济政策的变动等。这类定性变量常指某一性质、属性出现或不出现,例如男性或女性,中国人或外国人,战争期间或非战争期间等。由于其不能直接度量,为研究方便,可构造一个变量,令其取值为1或为0,取值为0时表示某一性质出现(不出现),取值为1时表示某性质不出现(出现),该变量即为虚拟变量(dummyvariables)。236一般的,在虚拟变量的设置中,基础类型、否定类型取值为“0”,称为基底(base)类、基准(benchmark)类或参考(r

43、eference)类;而比较类型、肯定类型取值“1”。虚拟变量和定量变量在回归模型中的应用是一样的。若一个模型中的解释变量全部都是虚拟变量,则此模型被称为方差分析模型(AnalysisofVarianceModel);若解释变量中既有定量变量,又有虚拟变量,则该线性回归模型可称为协方差分析模型(AnalysisofCovarianceModel)。237例子在我国上市公司中,个人做第一大股东的现象还非常少,主要是国家或法人作为公司的第一大股东。而国家作为第一大股东与法人相比,除了公司业绩,还有其它考虑,例如就业、形象工程、负责人升迁、上缴利税等,这些目标都或多或少有悖于公司利润最大化的目标。另

44、外,国家控股的公司由国家选择代理人,而这些代理人往往是行政人员或官僚出身,没有经营管理的特长,进一步制约上市公司绩效的发挥。因此,总体而言,国家作为第一大股东的上市公司的绩效要低于法人做第一大股东的上市公司的绩效。为验证上述结论,我们建立如下的模型:238其中为每股收益,用以代表公司绩效。的定义方式如下:1,国家是公司i的第一大股东=0,法人是公司i的第一大股东由模型可以得到:国家为第一大股东平均每股收益:=法人为第一大股东平均每股收益:=0)=239虚拟变量的设置原则许多金融现象表明,金融数据特别是时间序列数据常因某些非正常因素(如战争、自然灾害等)而产生较大的波动,这种波动使得被解释变量与

45、解释变量之间的数量依存关系在某一期或暑期内同其它各期相比具有显著的差异。这种差异表现为描述变量之间关系的回归线(面)在不同时期内或截距项移动,或斜率移动,或截距项和斜率同时移动。240相应的,为表述这种移动,虚拟变量的引入方式也有如下的三种:(1)加法方式:(2)乘法方式:(3)同时以加法方式及乘法方式引入:在同一个模型中,可以引入多个虚拟变量,但其设置必须遵循如下的原则:如果一个定性变量有m个类别,则仅要引入m-1个虚拟变量。241虚拟变量模型的运用1、虚拟变量模型在调整季节波动中的运用许多按月度或季度数据表示的金融时间序列,常呈现出季节变化的规律性,如公司销售额、通货膨胀率、节假日储蓄额等

46、。在研究中,有时需要消除季节性因素的影响,即需要进行季节调整(seasonaladjustment)。进行季节调整有多种方法,而利用虚拟变量进行季节调整是较为简单的一种。原模型:引入虚拟变量:2422、虚拟变量模型在分段线性回归中的应用在金融理论中,常常会出现一种情况:当某影响因素越过某一临界值,或时间过了某一临界点之后,因变量对影响因素的变化率将发生变化,在图形中就表现为斜率不同的两段连续折线。对构成折线的数据的回归即为分段线性回归。例如:利用虚拟变量,我们可以建立如下的回归模型:243图4-6有两个转折点的联系折线2443、利用虚拟变量模型对平行数据进行混合回归假定要研究某一类型上市公司资

47、本结构与影响因素之间的关系,我们以总负债率(以Y表示)代表资本结构,其影响因素假设只有股权结构(以表示)、公司治理结构(以表示)、成长性(以表示)三个因素;遗憾的是,假设这一类型的上市公司只有两家,而每家也只有从1991-2004年共14年的年度数据。很明显,对每一年利用横截面数据回归是不能的(观测值个数小于待估参数的个数)。245而对每家公司利用时间序列数据回归,尽管可以得到系数估计值,但实际上由于两家公司类型相同,可能受某些相同因素的影响,所以两方程的随机误差项可能是同期相关的,对每个方程分别应用普通最小二乘回归是不合适的。在此情况下,我们可以利用虚拟变量模型对时间序列和横截面数据的混合数

48、据做出回归:246回回归模型的模型的结构构稳定性定性检验邹氏氏检验一、邹氏检验的过程:邹氏检验所依据的理论前提包括:在可能发生的结构变化前后,随机误差项具有相同的方差;随机误差项满足独立正态分布。在这些假定下,可按如下的步骤进行邹氏检验:1、将数据以可能发生结构变化的点为界分为两部分。分别利用全部数据、两分样本对模型进行回归,并获得三次回归的残差平方和。2472、此时,对全部数据进行回归得到的模型是一个受约束的模型(假定模型在整段数据中不发生结构性变化,即假定系数估计值在整个样本期间是稳定的),而对两分段数据的回归则是不受约束的模型(利用两个分样本分别得到的系数估计值可以是不同的),因此对整段

49、数据回归得到的残差平方和大于对两分样本进行回归得到的残差平方和之和,可建立如下的F检验:它服从F(k,T-2k)分布2483、查表求得在一定显著性水平下的F临界值。如果第二步计算出的F值大于临界F值,则拒绝模型结构稳定的假设;如果小于临界F值,则不能拒绝模型结构稳定性假设。应用邹氏检验的过程中应注意以下几点:必须满足前提假设条件。邹氏检验仅仅告诉我们模型结构是否稳定,而不能告诉我们如果结构不稳定,到底是截距还是斜率抑或两者都发生了变化,在下一节中我们将引入虚拟变量来解决这个问题。邹氏检验需要知道结构可能发生的时间点,如果不知道,则需要使用其它方法。249在Eviews软件中如何做邹氏检验货币政

50、策往往根据宏观经济形势的变化而发生变化,这就会导致货币供应量等货币政策的中间目标可能在某个时间点发生结构性变化。例如,以我国为例,1995-1997货币政策的主要目标是抑制通货膨胀,而1998年后由于亚洲金融危机的冲击等我国反而出现了通货紧缩,这时的货币政策也转变为“稳健的货币政策”,主要目标变为防止通货紧缩,刺激经济增长,因此货币供应量的增长在1998年可能会发生结构性的变化。为检验上述猜想,我们利用1995年第一季度到2004年第二季度的季度数据,以M2代表货币供应量,通过对GDP进行回归(因GDP增长相对稳定),并选定1998年第二季度为可能发生结构变化的转折点,来进行邹氏检验。250在

51、Eviews中对下面模型进行回归其中、分别表示广义货币供应量M2和GDP.图4-7回归方程设定,251图4-8回归结果252图4-9选择邹氏检验253图4-10确定邹氏检验转折点图4-11邹氏检验结果254回回归模型的模型的结构构稳定性定性检验虚虚拟变量法量法邹氏检验只能告诉我们结构是否发生变化,而不能告诉我们到底是截距还是斜率发生了变化,虚拟变量法则能有效地解决这一问题。下面我们将通过一个例子来说明如何运用虚拟变量法对模型进行结构稳定性检验。对于一元线形模型,假定在时刻,由于外部事件的冲击,我们怀疑模型的结构可能发生了变化。为验证这一观点,我们可以建立如下的虚拟变量模型2551其中=0可见,

52、=0,)=,表示的是发生结构变化前的关系;=1,)=表示的是可能的结构变化发生后的关系。利用全部数据对上述虚拟变量模型进行最小二乘回归,并对参数估计值进行显著性检验。256可见,与邹氏检验相比,在检验模型结构稳定性方面虚拟变量法具有如下的优点:(1)较之邹氏检验的三次回归,虚拟变量法只需作一次总的回归,因而显得简单。(2)能够清楚表明是截距或斜率抑或两者都发生了变化。(3)由于合并两个回归而减少了虚拟变量的个数,增加了自由度,从而参数估计的准确性也有所改进。257实例例虚虚拟变量在金融数据量在金融数据处理中的作用理中的作用根据Fama的有效市场理论,在有效市场中,由于股票价格能够及时地反映所有

53、的信息,因此股价将会呈现出随机波动的特征。并且,在有效市场中,由于投资者能够随时获取所需要的信息,因此将不存在套利的机会,股票的价格将反映价值。按照有效市场理论,一周内每天的收益率将是随机波动、没有规律的。因为如果假设某天的收益率比其他各天的收益率高或者低,由于投资者可随时掌握所需要的信息,并且做出理性的选择,因此他们将充分利用这个套利机会来获取超额收益率。而随着套利过程的进行,超额收益率也会逐渐减少直至消失,从而每天的收益率又将会呈现出无规律的波动。258下面我们将利用虚拟变量模型对这一现象进行实证检验:数据描述:我们利用的是上海股票市场上证指数1997年1月1日到2004年12月31日的日

54、收盘价数据,共1926个观测值。收益率的计算我们采用的是连续收益率法,计算公式如下我们建立如下的虚拟变量模型:259图4-12上证指数日收益线性图260使用Eviews3.1软件对上述模型进行OLS回归,得到如下结果(括号内为相应的t值):对模型各系数估计值进行联合F检验,看各系数值是否同时为零,结果的到F值为1.03,其概率值为0.39,因此不能拒绝各系数值同时为零的假设,则可以得出结论,上海股票市场不存在周内效应。261本章小本章小结本章主要分为两部分,在第一部分中我们主要讨论了金融数据中存在的多重共线性现象。第二部分我们主要介绍了虚拟变量的应用。在接下来的部分中,我们主要介绍了如何进行模

55、型的结构稳定性检验的两种方法:邹氏检验和虚拟变量法。262第五章第五章时间序列数据的平序列数据的平稳性性检验263本章要点本章要点平稳性的定义平稳性的检验方法(ADF检验)伪回归的定义协整的定义及检验方法(AEG方法)误差修正模型的含义及表示形式264第一第一节 随机随机过程和平程和平稳性原理性原理一、随机过程一般称依赖于参数时间t的随机变量集合为随机过程。例如,假设样本观察值y1,y2,yt是来自无穷随机变量序列y-2,y-1,y0,y1,y2的一部分,则这个无穷随机序列称为随机过程。265随机过程中有一特殊情况叫白噪音,其定义如下:如果随机过程服从的分布不随时间改变,且(对所有t) (对所

56、有t) ( )那么,这一随机过程称为白噪声。 266二、平稳性原理如果一个随机过程的均值和方差在时间过程上都是常数,并且在任何两时期的协方差值仅依赖于该两时期间的距离或滞后,而不依赖于计算这个协方差的实际时间,就称它为平稳的。267平稳随机过程的性质:均值(对所有t)方差(对所有t)协方差(对所有t)其中即滞后k的协方差或自(身)协方差,是和,也就是相隔k期的两值之间的协方差。268三、伪回归现象将一个随机游走变量(即非平稳数据)对另一个随机游走变量进行回归可能导致荒谬的结果,传统的显著性检验将告知我们变量之间的关系是不存在的。有时候时间序列的高度相关仅仅是因为二者同时随时间有向上或向下变动的

57、趋势,并没有真正的联系。这种情况就称为“伪回归”(Spurious Regression)。269第二第二节 平平稳性性检验的具体方法的具体方法一、单位根检验(一)单位根检验的基本原理DavidDickey和WayneFuller的单位根检验(unitroottest)即迪基富勒(DF)检验,是在对数据进行平稳性检验中比较经常用到的一种方法。270DF检验的基本思想:从考虑如下模型开始:(5.1) 其中 即前面提到的白噪音(零均值、恒定方差、非自相关)的随机误差项。271由式(5.1),我们可以得到: (5.2) (5.3) (5.4) 272依次将式(5.4)(5.3)、(5.2)代入相邻的

58、上式,并整理,可得: (5.5)根据 值的不同,可以分三种情况考虑:(1)若 1,则当T时, 0,即对序列的冲击将随着时间的推移其影响逐渐减弱,此时序列是稳定的。273(2)若1,则当T时,即对序列的冲击随着时间的推移其影响反而是逐渐增大的,很显然,此时序列是不稳定的。(3)若=1,则当T时,=1,即对序列的冲击随着时间的推移其影响是不变的,很显然,序列也是不稳定的。274对于式(5.1),DF检验相当于对其系数的显著性检验,所建立的零假设是:H0:如果拒绝零假设,则称Yt没有单位根,此时Yt是平稳的;如果不能拒绝零假设,我们就说Yt具有单位根,此时Yt被称为随机游走序列(randomwalk

59、series)是不稳定的。275方程(5.1)也可以表达成:(5.6) 其中 = - , 是一阶差分运算因子。此时的零假设变为:H0: =0。注意到如果不能拒绝H0,则 = 是一个平稳序列,即 一阶差分后是一个平稳序列,此时我们称一阶单整过程(integrated of order 1)序列,记为I (1)。 276I(1)过程在金融、经济时间序列数据中是最普遍的,而I(0)则表示平稳时间序列。从理论与应用的角度,DF检验的检验模型有如下的三个: (5.7) (5.8) (5.9)277其中t是时间或趋势变量,在每一种形式中,建立的零假设都是:H0:或H0:,即存在一单位根。(5.7)和另外两

60、个回归模型的差别在于是否包含有常数(截距)和趋势项。如果误差项是自相关的,就把(5.9)修改如下:(5.10) 278式(5.10)中增加了的滞后项,建立在式(5.10)基础上的DF检验又被称为增广的DF检验(augmentedDickey-Fuller,简记ADF)。ADF检验统计量和DF统计量有同样的渐近分布,使用相同的临界值。279(二)ADF检验模型的确定首先,我们来看如何判断检验模型是否应该包含常数项和时间趋势项。解决这一问题的经验做法是:考察数据图形其次,我们来看如何判断滞后项数m。在实证中,常用的方法有两种:280(1)渐进t检验。该种方法是首先选择一个较大的m值,然后用t检验确

61、定系数是否显著,如果是显著的,则选择滞后项数为m;如果不显著,则减少m直到对应的系数值是显著的。(2)信息准则。常用的信息准则有AIC信息准则、SC信息准则,一般而言,我们选择给出了最小信息准则值的m值281二、非平稳性数据的处理一般是通过差分处理来消除数据的不平稳性。即对时间序列进行差分,然后对差分序列进行回归。对于金融数据做一阶差分后,即由总量数据变为增长率,一般会平稳。但这样会让我们丢失总量数据的长期信息,而这些信息对分析问题来说又是必要的。这就是通常我们所说的时间序列检验的两难问题。282第三第三节 协整的概念和整的概念和检验一、协整的概念和原理有时虽然两个变量都是随机游走的,但它们的

62、某个线形组合却可能是平稳的。在这种情况下,我们称这两个变量是协整的。比如:变量Xt和Yt是随机游走的,但变量Zt=Xt+Yt可能是平稳的。在这种情况下,我们称Xt和Yt是协整的,其中称为协整参数(cointegratingparameter)。283为什么会有协整关系存在呢?这是因为虽然很多金融、经济时间序列数据都是不平稳的,但它们可能受某些共同因素的影响,从而在时间上表现出共同的趋势,即变量之间存在一种稳定的关系,它们的变化受到这种关系的制约,因此它们的某种线性组合可能是平稳的,即存在协整关系。284假如有序列Xt和Yt,一般有如下性质存在:(1)如果XtI(0),即Xt是平稳序列,则a+b

63、Xt也是I(0);(2)如果XtI(1),这表示Xt只需经过一次差分就可变成平稳序列。那么a+bXt也是I(1);(3)如果Xt和Yt都是I(0),则aXt+bYt是I(0);285(4)如果XtI(0),YtI(1),则aXt+bYt是I(1),即I(1)具有占优势的性质。(5)如果Xt和Yt都是I(1),则aXt+bYt一般情况下是I(1),但不保证一定是I(1)。如果该线性组合是I(0),Xt和Yt就是协整的,a、b就是协整参数。286二、协整检验的具体方法(一)EG检验和CRDW检验假如Xt和Yt都是I(1),如何检验它们之间是否存在协整关系,我们可以遵循以下思路:首先用OLS对协整回

64、归方程进行估计。然后,检验残差是否是平稳的。因为如果Xt和Yt没有协整关系,那么它们的任一线性组合都是非平稳的,残差也将是非平稳的。287检验是否平稳可以采用前文提到的单位根检验,但需要注意的是,此时的临界值不能再用(A)DF检验的临界值,而是要用恩格尔和格兰杰(EngleandGranger)提供的临界值,故这种协整检验又称为(扩展的)恩格尔格兰杰检验(简记(A)EG检验)。288此外,也可以用协整回归的Durbin-Watson统计检验(CointegrationregressionDurbin-Watsontest,简记CRDW)进行。CRDW检验构造的统计量是:对应的零假设是:DW=0

65、289若是随机游走的,则的数学期望为0,所以Durbin-Watson统计量应接近于0,即不能拒绝零假设;如果拒绝零假设,我们就可以认为变量间存在协整关系。上述两种方法存在如下的缺点:(1)CRDW检验对于带常数项或时间趋势加上常数项的随机游走是不适合的,因此这一检验一般仅作为大致判断是否存在协整的标准。(2)对于EG检验,它主要有如下的缺点:290当一个系统中有两个以上的变量时,除非我们知道该系统中存在的协整关系的个数,否则是很难用EG法来估计和检验的。因此,一般而言,EG检验仅适用于包含两个变量、即存在单一协整关系的系统。仿真试验结果表明,即使在样本长度为100时,协整向量的OLS估计仍然

66、是有偏的,这将会导致犯第二类错误的可能性增加,因此在小样本下EG检验结论是不可靠的。291(二)Johansen协整检验。(1)Johansen协整检验的基本思想其基本思想是基于VAR模型将一个求极大似然函数的问题转化为一个求特征根和对应的特征向量的问题。下面我们简要介绍一下Johansen协整检验的基本思想和内容:292对于如下的包含g个变量,k阶滞后项的VAR模型:(5.11)假定所有的g个变量都是I(1)即一阶单整过程。其中,yt、yt-1yt-k为g1列向量,12k为gg系数矩阵, 为白噪音过程的随机误差项组成的g1列向量。 293对式5.11做适当的变换,可以得到如下的以VECM形式

67、表示的模型:(5.12)其中 ,Ig为g阶单位矩阵,294我们所感兴趣的是系数矩阵,它可以看作是一个代表变量间长期关系的系数矩阵。因为在长期达到均衡时,式5.12所有的差分变量都是零向量,中随机误差项的期望值为零,因此我们有=0,表示的是长期均衡时变量间的关系。295对变量之间协整关系的检验可以通过计算系数矩阵的秩及特征值来判断。将系数矩阵的特征值按照从大到小的顺序排列,即:。如果变量间不存在协整关系(即长期关系),则的秩就为零。296Johansen协整检验有两个检验统计量:迹检验统计量:,其中r为假设的协整关系的个数,为的第i个特征值的估计值(下同)。对应的零假设是:H0:协整关系个数小于

68、等于r;被择假设:H1:协整关系个数大于r。最大特征值检验统计量:对应的零假设:H0:协整关系个数等于r;相应的被择假设:H1:协整关系个数为r+1。297首先看,迹检验实际上是一个联合检验:,因为当时,也为零,且在范围内,越大,越小,越大。如果大于临界值,则拒绝零假设,说明存在的协整个数大于r,这时应继续检验新的零假设:协整关系个数小于等于r+1直至小于临界值。298再来看。当大于临界值时,我们拒绝协整关系个数等于r的原假设,然后继续检验新的假设:协整关系个数为r+1,直到小于临界值。nJohansen协整检验的临界值已由Johansen给出。在实际应用中,上述两个检验可以同时使用,一般而言

69、,两种检验给出的结果是相同的,但也可能会给出不同的结论。 299(2)Johansen协整检验模型形式的确定。Johansen协整检验方程形式的确定包括两部分:一是确定VECM模型和是否应包含常数项和时间趋势项;二是确定滞后项数(即k值)。对于前者,我们可以根据变量的数据图形来检验(同ADF检验);对于后者,我们可以利用前面ADF检验中提到的渐进t检验和信息准则法。300(3)如何在Eviews软件中做Johansen协整检验下面我们通过一个例子说明如何在Eviews软件中做Johansen协整检验。例5.1:对我国货币政策传导机制信贷渠道的实证检验301利用我国的数据对信贷渠道进行实证分析,

70、来看变量之间是否存在长期稳定的关系,即协整关系。我们以货币供应量M1和M2作为货币政策的起始变量,以金融机构贷款余额(DEBT)表示信贷量,以其作为中间变量,以GDP和零售物价指数(CPI)作为货币政策的效果变量。3021、对原始数据进行适当的处理,如季节调整、对数化等。2、对变量进行平稳性检验。3、如果变量水平值是不平稳的,我们就要对它的一阶差分进行平稳性检验。4、进行协整检验,并进行济济学意义上的分析。303第四第四节 误差修正模型差修正模型Engle和Granger于1987年提出了误差修正模型的完整定义并加以推广。假设Yt和Xt之间的长期关系式为:(5.13) 式中,K和 为估计常量。

71、例如,Y可以是商品的需求量,X则是价格。 就是Y对X的长期弹性。 304对式(5.13)两边取对数可得:所以当y不处在均衡值的时候,等式两边就会有一个差额存在,即 (5.15)来衡量两个变量之间的偏离程度。当X、Y处于均衡的时候,这时误差值为零。(5.14)我们用小写字母表示对数,其中 =ln(K)。但是这种均衡情况在经济体系中是很少存在的。 305由于X和Y通常处于非均衡状态,可以建立一个包含X和Y滞后项的短期或非均衡关系,假设采取如下形式: (5.16)(5.16)式是基础的形式,只包括一阶滞后项,说明对于变量X的变化,变量Y需要一段时间进行调整。306在对(5.16)进行估计的时候,其中

72、的变量可能是不平稳的,不能运用OLS估计,否则将出现伪回归现象。对此,重新进行转化。两边分别减去yt-1:得并进一步进行变化:即,(5.18) (5.17)307并进一步进行变化:,即: (5.18)在这里 。我们对上式进行重新整理,得到: 308 在这里 。我们对上式进行重新整理,得到: (5.19) 其中定义新变量1=(b1+b2)/ ,并进一步进行变换得到: (5.20)其中定义第二个新变量0=b0/ 。 309根据式(5.20),Y的当前变化决定于X的变换以及前期的非均衡程度,也就是说前期的误差项对当期的Y值进行调整。所以(5.20)就是一阶误差修正模型,也是最简单的形式。表示系统对均

73、衡状态的偏离程度,可以称之为“均衡误差”。在模型(5.20)中,描述了对均衡关系偏离的一种长期调解。这样在误差修正模型中,长期调节和短期调节的过程同样被考虑进去。因而,误差修正模型的优点在于它提供了解释长期关系和短期调节的途径。310当且的时候,后者意味着比均衡值高出太多。由于,那么,因此。换句话说,如果高于均衡值水平,那么在下一个时间段,会开始下降,误差值就会被慢慢修正,这就是所说的误差修正模型。当,则是完全相反的情况,整个机制是相同的。311误差修正模型包含了长期和短期的信息。长期的信息包含在项里,因为仍然是长期乘数,且误差项来自x和y的回归方程。短期信息一部分显示在均衡误差项中,即当y处

74、于非均衡状态时,在下一期里会由于误差项的调整慢慢向均衡值靠拢;另一部分信息来自Xt,解释变量的概括。这一项表明,当x发生变化,y也会相应的发生变化。312第五第五节 因果因果检验因果关系检验主要有两种:格兰杰(Granger)因果检验和希姆斯(Sims)检验一、格兰杰因果检验该理论的基本思想是:变量x和y,如果x的变化引起了y的变化,x的变化应当发生在y的变化之前。即如果说“x是引起y变化的原因”,则必须满足两个条件:313第一,x应该有助于预测y,即在y关于y的过去值的回归中,添加x的过去值作为独立变量应当显著的增加回归的解释能力。第二,y不应当有助于预测x,其原因是如果x有助于预测y,y也

75、有助于预测x,则很可能存在一个或几个其他的变量,它们既是引起x变化的原因,也是引起y变化的原因。314要检验这两个条件是否成立,我们需要检验一个变量对预测另一个变量没有帮助的原假设。首先,检验“x不是引起y变化的原因”的原假设,对下列两个回归模型进行估计:无假设条件回归:有假设条件回归: (5.21) (5.22)315 然后用各回归的残差平方和计算F统计值,检验系数1,2,m是否同时显著的不为0。如果是这样,我们就拒绝“x不是引起y变化的原因”的原假设。 316其中F统计值的构成为: (5.23)其中 和 分别为有限制条件回归和无限制条件回归的残差平方和;N是观察个数;K是无限制条件回归参数

76、个数;q是参数限制个数。该统计量服从F(q, N-K)分布。317显然,如果F统计值大于临界值,我们就拒绝原假设,得到x是引起y变化的原因。反之,接受原假设。接下来,检验“y不是引起x变化的原因”的原假设,做同样的回归估计,但是交换x与y,检验y的滞后项是否显著的不为0。要得到x是引起y变化的原因的结论,我们必须拒绝原假设“x不是引起y变化的原因”,同时接受原假设“y不是引起x变化的原因”。318需要注意的是,格兰杰因果检验的结果对式(5.21)中滞后项数m是非常敏感的,m值不同,得到的结果也有可能不同。为保证结果的正确性,一般来说,最好多试验几个不同的m值,以保证结果不受m选择的影响。还要注

77、意这个因果关系检验的一个不足之处是第三个变量z也可能是引起y变化的原因,而且同时又与x相关。319二希姆斯检验希姆斯检验的思想是认为未来发生的变化不能影响现在。和格兰杰检验一样,有着比较直观的解释。其非限制性方程如下: (5.24)注意上式中X是因变量而非自变量。其中零假设是Y不是X的原因,采用了,若Y是X的原因,则不成立。希姆斯检验方法的缺点在于m的确定,m多增加一个,自由度就会相应减少一个。320第六第六节 实例例金融数据的平金融数据的平稳性性检验下面我们借用Eviews来分析一下上海证券市场A股成份指数(简记SHA)和深圳证券市场A股成份指数(简记AZA)之间的关系,同时也通过这个实例来

78、回顾一下Eviews的使用。321步骤如下:1、对数据进行平稳性检验2、协整检验3、因果检验4、误差纠正机制ECM(errorcorrectionmechanism)5、经济学分析322本章小本章小节本章主要介绍了经济时间序列存在的不平稳性,并提供了DF和ADF两种检验平稳性的方法。不平稳的序列容易导致伪回归问题,为解决伪回归问题引出了协整检验,详细介绍了协整的概念和具体的协整检验过程。协整描述了变量之间的长期关系,为了进一步研究变量之间的短期均衡的存在,介绍了误差纠正模型。在讨论变量之间的因果关系的时候,介绍了格兰杰和希姆斯因果检验两种方法。323第六章第六章 动态模型模型324本章要点AR

79、DL模型的概念、优点、结构与构造ARIMA类模型的概念AR模型稳定性的条件,AR模型和MA模型的相互转化AR模型、MA模型、ARMA模型自相关函数、偏自相关函数的特点信息准则的基本原理VAR模型的概念、构造及格兰杰因果检验、脉冲响应GARCH类模型的概念ARCH效应的检验325第一第一节ARDL模型的概念和构造模型的概念和构造326ARDLARDL模型的概念模型的概念ARDL(autoregressive distributed lag)称为自回归分布滞后模型。计量软件Microfit,可用来对ARDL模型进行方便的估计.ARDL模型的优点 相比于标准的协整检验,不论变量是否同为过程,或同为过

80、程,既不需要变量同阶单整,都可以用ARDL模型来检验变量之间的长期关系。327ARDL模型的的模型的的结构构一个典型的 模型的结构如下: 其中 表示 滞后的阶数, 表示第i个自变量 滞后的阶数, 。L是滞后算子(lag operator),它可用下式定义: , 是s行、1列的确定向量328ARDL建模的基本方法建模的基本方法ARDL建模的方法包括两个阶段:第一阶段,建立与该ARDL模型相对应的误差修正模型(ECM),并计算出ECM模型中的F统计量。以此判断变量间是否存在长期稳定的关系。第二阶段,运用ARDL模型,估计变量之间长期关系的系数。329实例例ARDL模型在金融数据中的模型在金融数据中

81、的应用用研究对象 美国非耐用消费品支出LC与真实可支配收入LY,通胀率DP之间的关系数据 1960年1季度到1994年1季度的季度数据330首先,我们调用Microfit软件读入该数据文件。对原始数据进行取对数作差分的处理。对应于ARDL(4,4,4)中变量LC,LY和DP的误差修正模型(ECM)如下:原假设:变量间不存在稳定的长期关系,即:择备假设:或或331图6-3假设检验的结果计算F统计量,检验三者之间是否具有长期关系332图6-5ARDL(1,2,0)估计结果用Microfit软件中的ARDL选项来估计变量间的长期系数以及相应的误差修正模型ECM333图6-6ARDL(2,2,3)估计

82、结果334图6-8 AIC准则选定的误差修正模型结果335图6-10 预测结果336第二第二节ARIMA模型的概念和构造模型的概念和构造337ARIMA模型的概念模型的概念所谓ARIMA模型,是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。ARIMA模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA)、自回归过程(AR)、自回归移动平均过程(ARMA)以及ARIMA过程。338移移动平均平均过程程一个q阶的移动平均(MA)过程可用下式表示:其中u为常数项, 为白噪音过程引入滞后算子L,原式可以写成: 或者

83、其中 339MA(q)过程的特征程的特征1、2、3、自协方差当kq时0当kq时,ACF(j)=0,此现象为截尾,是MA(q)过程的一个特征如下图:354图6-11MA(2)过程355 AR(p)过程的偏自相关函数 时,偏自相关函数的取值不为0 时,偏自相关函数的取值为0AR(p)过程的偏自相关函数p阶截尾如下图:356图6-12AR(1)过程357图6-13AR(1)过程358AR(p)过程的自相关函数以及MA(q)过程的偏自相关函数平稳的AR(p)过程可以转化为一个MA()过程,则AR(p)过程的自相关函数是拖尾的一个可逆的MA(q)过程可转化为一个AR()过程,因此其偏自相关函数是拖尾的。

84、359图6-14ARMA(1,1)过程ARMA(p,q)过程的自相关函数和偏自相关函数ARMA过程的自相关函数和偏自相关函数都是拖尾的360利用自相关函数、偏自相关函数利用自相关函数、偏自相关函数对ARIMAARIMA模型模型进行行识别对ARIMA(p,d,q)过程进行识别,我们首先要确定的是该过程是否是平稳的,如果不是,通过几次差分可以得到平稳序列,即首先我们需要确定d的值。对此,我们可以用前面一章提到的ADF检验,也可以通过自相关函数来判断。如果d次差分后的序列其自相关函数很快下降为0,则说明差分后的序列是平稳的,反之则不平稳。361在确定d的值后,接下来我们利用自相关函数、偏自相关函数以

85、及它们的图形来确定p,q的值。一般而言,可遵循如下的经验准则:(1)如果某序列的自相关函数是截尾的,即过了某一滞后项数(设为q)后,自相关函数值变得不显著,接近于0,并且偏自相关函数是拖尾的,则我们可以把该序列设为MA(q)过程。362(2)如果某序列的偏自相关函数是截尾的,即过了某一滞后项数(设为p)后,偏自相关函数值变得不显著,接近于0,并且自相关函数是拖尾的,则我们可以把该序列设为AR(P)过程。(3)如果某序列的自相关函数、偏自相关函数都是拖尾的,则可以把该序列设为ARMA(p,q)过程。而关于p,q的值需要不断地从低阶试探,但一般而言,ARMA(1,1)过程在文献中是最常见的。363

86、ARIMA模型的估模型的估计矩估计 这种方法就是利用样本自协方差函数和 样本自相关函数,对模型的参数作估计。极大似然估计 它又包括无条件极大似然估计、条件极大似然估计、精确似然估计等方法。非线性估计 它主要是利用了迭代搜索的思想。 最小二乘估计 对于不包含MA部分的ARIMA模型(即AR模型),我们可以利用普通最小二乘法对参数进行估计。364ARIMA模型的模型的诊断断在对模型参数进行估计后,下一步我们要对所估计的模型是否很好的拟合了数据进行诊断。如果模型很好的拟合了数据,那么残差应该是一个白噪音过程,即不同时期的残差是不相关的。为检验残差是否各期不相关,我们可以求得残差各阶的自相关系数 、

87、, 然后对联合假设: 进行检验。如果不能拒绝原假设,说明残差是各期不相关的;如果拒绝原假设,则说明残差存在自相关,原模型没有很好的拟合数据。365在上述检验中,经常用到的一个检验统计量是Box和Pierce提出的Q统计量,它的定义如下:,近似服从(大样本中)分布其中n为样本容量,m为滞后长度。需要注意的是,Box和Pierce提出的Q统计量具有不佳的小样本性质,于是Ljung和Box(1978)提出了一个具有更好小样本性质的统计量,称之为LB统计量。定义如下:服从分布,其中n为样本容量,m为滞后长度。366对ARIMA模型的诊断还有另一方面,即尽管现在的模型能够很好的拟合数据,但我们想知道是否

88、还存在一个更好的模型,能够更好的拟合数据和进行预测。一般的做法是在模型中增加滞后项(因为我们是从低阶试起的),然后根据信息准则(informationcriteria)来判断。367常用的信息准则有以下几个:Akaike信息准则Schwarz信息准则Hannan-Quinn信息准则其中为残差平方,是所有估计参数的个数,T为样本容量。368ARIMA模型的模型的预测以平稳的AR(2)过程为例:其中 为零均值白噪音过程由模型的平稳性,我们有: 369在t时刻,预测的值:=在t时刻,预测的值:同理: 可以看到,在应用AR(2)模型进行预测时,除向前一步预测是无条件预测外,其它的预测都要用到前期的预测

89、值。另外,我们不加证明的给出下面的结论:随着预测时间的增大,AR过程的预测值将趋向于序列的均值。370下面我们再来看利用MA过程进行的预测。以一个MA(2)过程为例:我们可以求得:可以看到,对于MA(2)过程,2期以后的预测值都是常数项,即MA(2)过程仅有2期的记忆力。而如果常数项为0的话,那么2期之后的预测都将为0。371利用ARMA过程进行预测利用ARMA过程进行预测的过程,实际上相当于对AR过程和MA过程进行预测的结合,方法与分别利用AR过程和MA过程进行预测是相同的,我们不再介绍。由于ARMA(p,q)过程中MA(q)过程仅有q期的记忆力,因此利用ARMA(p,q)向前进行q期以外的

90、预测,结果与利用AR(p)过程预测的结果是一样的。随着预测期数的增加,预测值将趋向于均值。因此,ARMA模型一般用于短期预测(即预测期数不大于p+q太多)。而对于ARIMA模型,只需将平稳序列ARMA过程的预测结果进行反向d次(差分次数)求和,就可以得到原序列的预测值。372实例:例:ARIMA模型在金融数据中的模型在金融数据中的应用用数据数据:1991年1月到2005年1月的我国货币供应量(广义货币M2)的月度时间序列数据目的目的:说明在Eviews3.1软件中利用B-J方法论建立合适的ARIMA(p,d,q)模型373第三第三节VAR模型的概念和构造模型的概念和构造374VAR模型的起源巨

91、大的模型均未预测到20世纪70年代早期由于石油危机而引发的世界经济的衰退和随之而来的滞胀,也未能就治理滞胀开出有效的“药方”。由此导致了对结构模型的批判,其中最具影响的便是著名的“卢卡斯批判(theLucascritique)”。卢卡斯指出:使用计量经济模型(结构模型)预测未来经济政策的变化所产生的效用是不可信的。他认为,如果一个模型的某些参数所反映的是私人行为对以前的经济政策的反应函数的适应性,如果政策反应函数被改变,则私人行为对新的反应函数将再适应,其结果是,所估计的参数将不再描述这种适应。卢卡斯批判所隐含的是,如果政策反应函数出现变化,这种变化也将改变模型的参数,于是,联立方程的简约形式

92、也将随之发生变化。375此外,在联立方程模型设定过程中,必须人为的假定一些外生变量,并且假定外生变量事先给定,不受模型中内生变量的影响;为达到识别的目的,常常假定某些前定变量仅仅出现在某些方程中,这些假定也招致了希姆斯(C.A.Sims)的严厉批判。希姆斯认为,为使结构模型可识别而施加了许多约束,这种约束是不可信的。他认为,如果在一组变量之间有真实的联立性,那么就应该对这些变量平等的加以对待,而不应事先区分内生变量和外生变量。本着这一精神,希姆斯提出了VAR(VectorAutoregressive)模型。在VAR模型中,没有内生变量和外生变量之分,而是所有的变量都被看作内生变量,初始对模型系

93、数不施加任何约束,即每个方程都有相同的解释变量所有被解释变量若干期的滞后值。376VAR模型的形式和特点模型的形式和特点在一个含有n个方程(被解释变量)的VAR模型中,每个被解释变量都对自身以及其它被解释变量的若干期滞后值回归,若令滞后阶数为k,则VAR模型的一般形式可用下式表示:其中,表示由第t期观测值构成的n维列向量,为n*n系数矩阵,是由随机误差项构成的n维列向量,其中随机误差项(i=1,2,n)为白噪音过程,且满足(i,j=1,2,n,且ij)。377为便于直观理解,我们假定n=2,k=2,则VAR模型可写成:即被解释变量分别对自身以及对方的2阶滞后值回归378VAR模型的识别、估计、

94、检验和预测(一)VAR模型的识别前面提到,建立VAR模型的一个难点就是确定滞后项数。通常,金融理论知识给出滞后项数的一个大致范围,例如货币政策的时滞一般为6-12个月,因此若应用VAR模型对货币政策效应进行分析时,如果是月度数据我们就可以确定滞后阶数应小于12。如果要具体得确定滞后项数,就需要用到其它的一些方法,下面我们将介绍其中的几种方法:379VAR模型的识别似然比检验法(likelihoodratiotest)似然比检验构造的检验统计量如下:它服从自由度为m的分布。其中,表示的是有约束回归模型估计残差的方差-协方差矩阵的行列式,表示的是无约束回归模型估计残差的方差-协方差矩阵的行列式;自

95、由度m等于所加约束的个数,例如,如果某VAR模型有a个方程,要检验所有方程最后b个滞后项系数是否为0,则一共有个约束。380信息准则法Akaike信息准则:AIC=Schwartz信息准则:SC=其中,代表由估计残差的方差和协方差组成的矩阵的行列式,T代表样本容量,表示的是所有方程中回归项的个数(包括常数项)。例如,对于一个含有a个方程,滞后项数为b的VAR模型,。381(二)VAR模型的估计前面我们提到,如果VAR模型中变量是平稳的,并且方程右边包含相同的解释变量,随机误差项满足基本假定,则我们可以分别应用普通最小二乘法对单个方程予以估计,所得到的估计值是一致的、渐进有效的。当上述条件不满足

96、时,我们需要用到估计联立方程模型的其它方法。由于所用到的数学知识已经超出了本书的范围,并且在Eviews软件中可以方便的实现对VAR模型的估计(我们会在例子中予以介绍),在此我们不再多做介绍。382(三)VAR模型的检验前面已经提到,VAR模型是缺乏理论依据的。在VAR模型中,很难逐一解释各个变量系数的意义,特别是在很多情况下,解释变量系数会随滞后期数的变化而改变符号,同时模型内部不同方程之间也存在联系,因此很难判断当某个变量发生变化时,其他变量的未来值会有什么样的变化。为弥补上述VAR模型的缺陷,发挥VAR模型的作用,应用中一般做如下的检验:3831、对某变量全部滞后项系数的联合检验在VAR

97、模型中,单个变量系数的意义是很难确认的,但有时我们会对如下的问题感兴趣:即对于模型内的某一方程,某变量的全部滞后值是否对被解释变量有显著的解释作用。我们可以发现,如果VAR模型仅包含两个方程,这实际上就是我们在第五章提到的因果检验:如果该变量的所有滞后值对被解释变量有显著的解释作用,则就说该变量是被解释变量的“格兰杰原因”,反之则不是。3842、脉冲响应脉冲响应度量的是被解释变量对单位冲击的响应。例如假定某误差项仅在第t期发生突变,而后各期重新恢复平静,脉冲响应测量的是各期(t,t+1,t+2)的被解释变量对该冲击的反应。通过测量脉冲响应,我们能够清楚地看到某一时期的冲击对未来各期被解释变量的

98、影响。在实际中,对于拥有多个方程、滞后项数较多的VAR模型,一般采用的是将VAR模型转变为VMA(vectormovingaverage,向量移动平均)模型,并得出脉冲响应函数。385(四)VAR模型的预测前面提到,一个较小的VAR模型产生的预测结果甚至要好于一个大的联立方程模型产生的预测结果,因此VAR模型的一个主要作用就是预测,下面通过一个例子说明如何在VAR模型中进行预测。386考虑一个含有两个方程、滞后阶数为2的VAR模型:首先我们来考虑一步向前预测(one-step-ahead-forecast)。如果我们要在第n期预测、,由于在第n期,所有的解释变量的值已经知道,所以这是一个无条件

99、预测:接下来我们来考虑多步向前预测,由于在第n期,有些解释变量的值是未知的,因此预测为有条件预测,我们可以以解释变量的预测值来代表未知解释变量的条件期望。387同理,可得出在第n期的预测值为可以看到,在向前两步预测时要用到我们在向前一步预测时得到的预测值,这与前一节中我们用AR模型预测是一样的。类似的,我们可以利用前一期的预测值进行向前三步、四步预测。388VARVAR模型的模型的补充充说明明VARVAR模型的模型的发展展(一)结构VAR模型即模型中方程左边不仅包括内生变量,也包括一些仅作为解释变量的外生变量;不仅包括内生变量的滞后值,也包括内生变量的当期值。(二)VECM模型即模型内方程的右

100、边不仅包括变量的差分项,也包括变量之间的协整关系项,从而使模型能够同时反映系统内变量间的长期均衡关系和短期动态特征,保持信息的完整性。389实例例VAR模型在金融数据中的运用模型在金融数据中的运用VAR模型的一个经典应用是检验货币政策的有效性。即研究货币供应量与产出、物价水平之间的关系。下面,我们就在Eviews软件中利用VAR模型对我国货币政策的有效性进行检验。我们的样本取我国1994年第一季度到2004年第二季度的季度数据,变量包括狭义货币供应量M1,商品零售物价指数P,以及代表产出水平的国内生产总值GDP。所有的数据我们都取它们的增长率,以保证序列的平稳性。390图 6-24 VAR模型

101、设定391图6-25 VAR模型估计结果392图6-26 VAR脉冲响应设定393第四第四节(G)ARCH模型的概念和构造模型的概念和构造394(G)ARCH模型的概念模型的概念自回归条件异方差(autoregressiveconditionalheteroscedasticity,简称ARCH)模型是近年来新发展起来的时间序列模型,它反映了随机过程的一种特殊特性:即方差随时间变化而变化,且具有丛集性、波动性。ARCH模型已广泛地应用于金融领域的建模及研究过程中。395一、一、ARCH模型模型由均值方程和条件方差方程给出: 表示t-1时刻所有可得信息的集合, 为条件方差用极大似然估计法对方程进

102、行估计396二、二、GARCH模型模型一般的GARCH(p,q)模型如下表示可用极大似然估计法估计GARCH(p,q)的推广397(G)ARCH模型的模型的识别、估、估计、类型和型和预测一、一、 ARCH效效应的的识别ARCH LM Test1. ARCH效效应的的识别的含的含义通常是对于残差项中是否存在自回归条件异方差现象的拉格朗日乘数检验(Lagrangemultipliertest,Engle1982)2. ARCH LM Test 中的中的统计量量F统计量Obs*R-squared统计量398(一)(一)ARCH效效应的的识别原假原假设:辅助回助回归方程方程其中e是残差ARCHLMTe

103、st对最小二乘法,两阶段最小二乘法,非线性最小二乘法都适用399(二)(二)(G)ARCH模型的估模型的估计方法方法:最大似然估计法(以建立对数似然方程来实现,见下例)400(G)ARCH模型的估模型的估计(例)(例)对于于AR(1)- GARCH (1,1)模型模型:可以通过最大化下述对数函数来估计模型参数401(三)(三)(G)ARCH模型的模型的类型型 1. GARCH-M模型模型 2. TARCH模型模型 3. EGARCH模型模型402(四)(四)(G)ARCH模型的模型的预测1. 主要作用主要作用预测时间序列的方差,从而研究时间序列的波动性结合动态模型组成方程组来模拟一些金融问题的

104、特性,例如ARMA-EGARCH(1,1)-M模型403实例例 (G)ARCH模型在金融数据中的模型在金融数据中的应用用研究研究对象象我国股市收益的波动性、波动的非对称性以及溢出效应样本范本范围1997年1月2日到2002年12月31日每个交易日上证指数和深证成份指数的,共计6年1444个观察值数据表示数据表示收盘价以表示收益率定义为:,沪市收益率用rh表示,深市收益率为rz。404(一)沪深股市收益率的波(一)沪深股市收益率的波动性研究性研究1.收益率的描述性统计2.的平稳性检验405沪深股市收益率的波沪深股市收益率的波动性研究性研究3.均均值方程的确定及残差序列自相关方程的确定及残差序列自

105、相关检验406沪深股市收益率的波沪深股市收益率的波动性研究性研究4.GARCH类模型建模模型建模对两市收益率序列分别用GARCH(1,1),和GARCH-M(1,1)建模407图6-31EquationSpecification窗口408(二)股市收益波(二)股市收益波动非非对称性的研究称性的研究使用TARCH和EGARCH模型度量非对称性问题409(三)沪深股市波(三)沪深股市波动溢出效溢出效应的研究的研究溢出效溢出效应的涵的涵义当某个资本市场出现大幅波动而引起投资者在另外的资本市场的投资行为的改变,既所谓的“溢出效应”410实例例结论沪深股市收益率都存在明显的GARCH效应沪深股市都存在明

106、显的GARCH-M效应,而且沪市的正向风险溢价要高于深市深股市都存在明显的杠杆效应沪深股市之间波动存在溢出效应,而且是单向的,深市的波动将引起沪市的波动411本章小节本章介绍了在处理金融时间序列数据时构造动态模型的方法。首先第一节介绍ARDL模型的概念、优点及构造过程,着重介绍了AEDL模型检验不同阶变量之间长期关系的方法。在第二节中我们主要介绍了如何利用B-J建模方法建立ARIMA模型,并介绍了ARIMA模型的一些特点。我们可以看到,ARIMA模型可广泛的应用于时间序列数据,并在预测方面有独特的优势。我们在第三节中主要介绍了VAR模型,它是一种不同于结构联立方程组的多方程模型,同ARIMA模

107、型一样,它也是缺乏理论依据的,主要用于预测,VAR模型的出现使得现在的文献中已经很少看到利用联立方程模型建模。最后一节介绍了(G)ARCH模型,(G)ARCH模型在金融领域的应用极为广泛,本书中介绍了(G)ARCH模型多种形式,着重以实例说明(G)ARCH模型的作用。412第七章第七章联立方程模型的概念和构造立方程模型的概念和构造413本章要点联立性偏误的定义识别的定义及识别的阶条件和秩条件内生变量和外生变量的定义及联立性检验的步骤联立方程模型的估计方法(单一方程法和系统方程法)递归模型的特点及普通最小二乘估计方法414第一第一节联立方程模型的基本概念立方程模型的基本概念415首先考虑一个由三

108、个方程组成的简单的市场供需模型(假定市场总是出清): 供给方程: 需求方程: 均衡方程:其中 、 分别表示t期、t-1期某商品的价格, 、 分别表示t期该商品的供给量和需求量, 代表t期的收入。按照经济理论,对于一般商品,应满足 0, 0。以下将利用该模型说明联立方程模型的几组概念。416内生变量、外生变量、前定变量(一) 内生变量 由模型系统决定其取值的变量称为内生变量(endogenous variables) 。内生变量受模型中其它变量的影响,也可能影响其它内生变量,即内生变量既可以是被解释变量,也可以是解释变量。内生变量受模型内随机误差项的影响,是随机变量。 在模型7.1中, 、 、

109、的值是由模型决定的,因而是内生变量。417(二)外生变量由模型系统以外的因素决定其取值的变量称为外生变量(exogenousvariables)。外生变量也可以表述为:独立于该变量所在方程前期、当期、未来各期随机误差项的变量。外生变量只影响系统内的其它变量,而不受其它变量的影响,因此在方程中只能做解释变量,不能做被解释变量。由定义可以看出,外生变量不受模型中随机误差项的影响。在模型7.1中,t期的收入是由模型外的因素决定的,因而在该模型中是外生变量。418(三)前定变量所谓前定变量(predeterminedvariables)是指独立于变量所在方程当期和未来各期随机误差项的变量。由定义可知,

110、外生变量属于前定变量,另外还有一类变量也属于前定变量,即滞后的内生变量,因为滞后的内生变量仅与方程前期的随机误差项相关而与方程当期、未来各期的随机误差项无关。前定变量也只能在现期的方程中做解释变量,并且不受随机误差项的影响。在模型7.1中,作为滞后的内生变量,作为外生变量都属于前定变量。419完备方程组如果一个模型中方程的个数等于内生变量的个数,则称这个模型为完备方程组(completesystemofequations)。我们可以估计完备方程组中的所有参数,但对于非完备方程组,我们不能估计或只能估计它的一部分参数。在上述市场供需模型中,共有、三个内生变量,同时有三个方程,因此该模型是一完备方

111、程组,所有参数均可估计。420随机方程式、非随机方程式联立方程模型中的方程可以分为两类,一类是含有随机误差项和未知参数的方程,称为随机方程式,也即行为方程(behaviorequation),它主要是描述了金融、经济模型中某一部分的行为,随机方程式中的参数需要估计;另一类是不含随机误差项和未知参数的方程,称为非随机方程式,主要是恒等式(identity),非随机方程式不需要估计参数。在模型7.1中,供给方程、需求方程中含有随机误差项和未知参数,并且分别描述了某商品市场供给方和需求方的行为,因此是随机方程式,即行为方程。而均衡方程则属于非随机方程式。421结构式模型、简化式模型联立方程模型有两种

112、形式:结构式模型(structuralformmodel)和简化式模型(reducedformmodel)。所谓结构式模型,是指在一定的经济理论基础上建立的,能够反映经济变量之间结构形式的一类联立方程模型。模型7.1即为结构式模型。结构式模型中的方程称为结构方程(structuralequation),结构方程中变量的系数成为结构参数(structuralparameters),它表示的是结构方程中的解释变量对被解释变量的直接影响。所有的结构参数组成的矩阵成为结构参数矩阵。422对于模型7.1,若将常数项看作变量1的系数,则模型可以表示为:因此结构参数矩阵为:1423对于模型7.1,若以表示t

113、时刻供给量和需求量的均衡值,则模型7.1可表示为供给方程:需求方程:(模型7.2)若将模型7.2中的内生变量、只用模型中的前定变量和随机误差项表示出来,则可得到就是结构式模型所对应的简化式模型: 424一般的,简化式模型就是把结构式模型中的内生变量表示为前定变量和随机误差项的函数的联立方程模型。同结构参数矩阵的表示方法一样,模型7.3中的简化式参数矩阵可表示为:425联立性偏误用普通最小二乘法(OLS)对经典线形回归模型进行回归将得到最优线性无偏估计量。但在结构式模型中,由于内生变量既可作为解释变量又可作为被解释变量,经典线性回归模型的一个基本假设解释变量与随机误差项不相关将得不到满足,因此若

114、仍对结构式模型中的每个结构方程分别运用OLS进行估计,所得到的参数估计值将是有偏和不一致的,即存在联立性偏误(simultaneitybias)或联立方程偏误(simultaneousequationsbias)。426第二第二节联立方程模型的立方程模型的识别427识别问题所谓识别问题,是指结构方程参数的数值估计,是否能够从估计的简化式参数求得。如果能够求得,我们就说此结构方程是可以识别的,特别的,如果能够得到结构参数估计值的唯一解,则称该结构方程是恰好识别的;如果可以得到结构参数估计值的多个解,则称该结构方程是过度识别;如果不能够通过简化式参数估计值求得结构式参数值,则称该结构方程是不可识别

115、的或不足识别的。428不可识别和过度识别对于模型7.2做修改,该商品的供给量仅受当期价格影响,而不再受前一期价格的影响。而该商品的需求量则不仅受当期价格和当期收入的影响,还受前一期价格的影响。于是可以得到以下模型:供给方程:需求方程:(模型7.4)429其所对应的简化式模型根据上述关系式,若已知则可得:无法求得估计值430恰好识别让我们回到模型7.2供给方程:需求方程: 其对应的简化式模型7.3 431分别用OLS估计简化式模型的两个方程,可以得到最优无偏估计值、,则可得一致性估计量、识别性问题对于联立方程模型来说是非常重要的。因为若某个结构方程是不可识别的,则无法对其进行估计求得参数估计值。

116、因此在对联立方程模型进行估计之前,首先要对模型中方程的可识别性进行判断,由此简单有效的判断可识别性的规则或方法就显得必要,我们接下来将介绍识别规则。432识别规则(一)阶条件可识别性的阶条件是一个必要但非充分条件,也即有时方程虽然满足阶条件,但仍有可能是不可识别的。表述1:令G表示模型中结构方程的个数,如果某结构方程中所不包含的内生变量和前定变量的个数为G-1,则该方程是恰好识别的;若不包含的变量个数大于G-1,则该方程是过度识别的;若不包含的变量个数小于G-1,则该方程是不可识别的。433表述2:在一个线性联立方程模型中,某方程可识别的一个必要条件(阶条件)是:该方程所不包含的前定变量的个数

117、必须不少于方程右边所包含的内生变量的个数。若该方程所不包含的前定变量的个数等于方程右边所包含的内生变量的个数,则该方程是恰好识别的;若大于,则该方程是过度识别的。434识别规则(二)秩条件阶条件是判断可识别性的必要但非充分条件,即有时候某方程满足可识别性的阶条件但实际上却是不可识别的,在此情况下,判断可识别性的充分条件就显得必要。而秩条件正是判断可识别性的充分必要条件。秩条件的表述如下:对于一个由G个方程组成的联立方程模型中的某个结构方程而言,如果模型中其他方程所含而该方程不含的诸变量的系数矩阵的秩为G-1,则该结构方程是可识别的,若秩小于G-1,则该结构方程是不可识别的。435对某结构式模型

118、中的第i个方程利用秩条件判断其可识别性,可按以下步骤进行:写出结构模型对应的结构参数矩阵(常数项可看作变量1的系数,不包含在方程中的变量的参数取作0)。删去第i个结构方程对应系数所在的一行。删去第i个结构方程对应系数所在行中非零系数所在的各列。对余下的子矩阵,如果它的秩等于方程个数减去1,则第i个结构方程就是可识别的;如果它的秩小于方程个数减1,则第i个结构方程就是不可识别的。436联立性检验由于某些内生变量作解释变量,从而与随机误差项存在相关性而产生的,因而联立性检验就归结为可能是内生变量的解释变量与随机误差项的相关性检验。通常用Hausman设定误差检验(Hausmanspecificat

119、iontest)检验联立性。437第三第三节联立方程模型的估立方程模型的估计438根据是否同时对所有的结构方程进行估计,可把常用的估计方法分为单一方程法与系统方程法两类。单一方程法又称有限信息法(limitedinformationmethod),是对结构方程逐个进行估计的方法。系统方程法又称为完全信息法,是对整个联立方程模型中的所有结构方程同时进行估计,一次估计出模型全部系数的方法,包括三阶段最小二乘法(简称3SLS)和完全信息极大似然法(简称FIML)等。439单一方程法一方程法单一方程法我们将主要介绍间接最小二乘法、工具变量法、两阶段最小二乘法。前者只适用于恰好识别的结构方程,后两者还可

120、应用于结构方程过度识别的情况。(一)普通最小二乘法在递归模型中的应用。考虑如下的模型:(模型7.9)其中表示内生变量,表示外生变量,假定同期各方程的随机误差项互不相关。440该模型中实际并不存在联立方程系统中各内生变量之间的相互依赖性,而是存在一种单向的因果依赖性,这种模型被称为递归模型或三角模型,也因其单向因果性而被称为因果性模型。(二) 间接最小二乘法间接最小二乘法的基本思想是:尽管不可以直接对结构方程应用普通最小二乘法,但对于由结构式方程导出的简化式方程,可以应用普通最小二乘法得到参数估计值,然后利用简化式参数估计值和参数关系式求得结构参数的估计值。441应用间接最小二乘法的具体步骤如下

121、:第一步:将结构式模型转化为简化式模型。第二步:对每个简化式方程应用普通最小二乘法,得到简化式参数的估计值。第三步:根据简化式参数与结构式参数之间的关系式以及简化式参数估计值求得结构式参数估计值。442(三) 工具变量法工具变量法的基本思想是:用适当的前定变量作为工具变量代替结构方程中作为解释变量的内生变量,从而降低解释变量与随机误差项之间的相关程度,再利用普通最小二乘法进行估计。工具变量法的关键是工具变量的选取,一般而言,工具变量应满足如下的条件: 工具变量与所替代的内生变量之间高度相关。 工具变量是联立方程模型中真正的外生变量,即它与结构方程中的随机误差项不相关。 同一方程使用多个工具变量

122、时,它们之间的多重共线性程度要低。 工具变量与结构方程中其它解释变量的多重共线性程度也要低。443(四)两阶段最小二乘法两阶段最小二乘法的基本思想是:利用简化式模型求得内生变量的拟合值,以消除随机误差项的影响,然后将结构方程右边的内生变量替换为相应的拟合值,并对替换后的结构方程分别运用普通最小二乘法估计参数。应用两阶段最小二乘法应满足如下的条件:所考虑的结构方程是可以识别的。结构方程中的随机误差项满足零均值,方差为常数,序列不相关。前定变量多重共线性程度低。样本容量要足够大,至少要不少于方程中出现的前定变量的个数。444间接最小二乘法、工具变量法、两阶段最小二乘法的比较两阶段最小二乘法实际上是

123、工具变量法的一种特殊形式,在两阶段最小二乘法中,工具变量是第一阶段的拟合值。在恰好识别的情况下,可以证明三种方法是等价的。在过度识别的情况下,间接最小二乘法不能应用;按照工具变量选择的不同,工具变量法可以得到多个估计值;而两阶段最小二乘法则可以充分利用模型信息,得到结构参数的唯一估计值。445系系统方程法方程法系统方程法,其中最重要的一种方法是三阶段最小二乘法,它的基本思想是:两阶段最小二乘法只使用了模型的部分信息,而忽视了模型结构对其它方程的参数值所施加的全部约束条件,特别是当联立方程模型各方程的随机误差项同期相关时,两阶段最小二乘法将不再有效,此时需要引入广义最小二乘法(GLS),以克服各

124、方程之间的联立性偏误。446应用三阶段最小二乘法,应该满足如下的假定:每个结构式方程必须是可识别的。所有的恒等式已通过代换等方式消去。每个结构方程的随机误差项满足零均值、同方差性以及无自相关性。不同结构方程的随机误差项是同期相关的。如果不相关,三阶段最小二乘法将等价于两阶段最小二乘法。447应用三阶段最小二乘法的基本步骤如下:第一阶段:利用普通最小二乘法估计结构式模型对应的简化式模型,并求得各内生变量的拟合值。第二阶段:将结构方程右边的内生变量用其拟合值代替,再利用普通最小二乘法估计替代后的方程,得到结构参数参数估计值。然后计算各方程的残差值,利用残差值求得误差项方差以及跨方程协方差的一致估计

125、值。第三阶段:根据第二阶段得到的误差项方差估计值以及跨方程协方差估计值,应用广义最小二乘法得到三阶段最小二乘估计值。448实例例联立方程模型立方程模型在金融数据中的在金融数据中的应用用一、理论回顾基于理论分析,我们建立如下联立方程模型(模型7.12)449二、实证分析本文采用了从1997年1月到2004年3月各变量的月度数据。我们将分别检验流通中现金、狭义货币、广义货币作为货币量与上证指数的关系。我们将在Eviews3.1中利用两阶段最小二乘法估计上述联立方程模型,这个过程主要分两个步骤:首先利用普通最小二乘法求得内生变量的拟合值,然后用拟合值代替内生变量再利用两阶段最小二乘法求得结构参数估计

126、值。450图 7-1 回归方程设定我们以代表货币量说明模型,打开Eviews3.1,建立相应的工作组并输入数据,然后在菜单中选择“Quick”“Estimate Equation”,在“Method”中选择LS451然后在“Estimationsettings”上方空白处首先输入被解释变量,然后输入作为解释变量的外生变量,然后点“OK”,即可以得到估计结果如下: (7.92) (6.52) (1.93) (-6.64) (0.95)点击“Quick”“Generate Series”, 得到如下窗口(图7-2)452 图7-2 快速生成序列“m0fitted”在“Enter equation”

127、下面的空白栏中键入如图中的方程,就可以得到的拟合值“m0fitted”。453图7-3 选择两阶段最小二乘法估计方程 点击“Quick” “Estimate Equation”,在“Method”中选择“TSLS”,将出现如下的窗口 454在“Instrumentlist”上方的空白栏中按结构式方程输入相应的变量,在其下方的空白栏中输入图示的工具变量,然后点击“OK”,就可以得到结构式方程参数的两阶段最小二乘估计值:(7.39)(-0.04)(1.32)455按照同样的步骤,我们可以求出作货币量时结构式方程参数的两阶段最小二乘估计值:(1.07)(0.85)(7.98)(1.77)(-1.44

128、)同样的,对于狭义货币作为货币量代表,我们可以估计模型得到(11.14)(0.38)(-0.22)(5.44)(-0.93)(0.43)(-0.830)(-0.56)456对于广义货币作为货币量代表,同样可以得到估计模型:(8.49)(1.24)(-1.17) (2.70)(-2.26)(4.06)(-3.06)(-1.76)457三、分析可以看出,无论是流通中现金、狭义货币,还是广义货币,无论是当月值还是过去第6个月的值,在对股票价格的解释中,他们的系数都是不显著的。因此,可以认为货币供应量对股票指数影响微乎其微。另一方面,股票指数在对流通中现金、狭义货币的解释中,其系数也是不显著的,但在对

129、广义货币的解释中,股票指数的系数则是显著的,因此,可以认为,股票指数对流通中现金、狭义货币是没有影响的,而对广义货币量则是有影响的。458本章小本章小结本章中我们介绍了联立方程模型,联立方程模型中变量之间的关系是交错的或双向的因果关系,使得经典线性回归中解释变量与随机误差项不相关的假定遭到破坏,因此在用普通最小二乘法估计结构方程时将会产生联立性偏误。在估计联立方程模型前一个重要的问题是识别问题,利用可识别的阶条件和秩条件来判断。判断完模型是否可以识别,下一步就是选择合适的估计方法对模型进行估计。根据是否同时对所有的方程进行估计,可以把估计的方法分为单一方程法和系统方程法。459第八章第八章 实

130、证性文章的写作性文章的写作460一、一篇典型的实证性文章的框架(1)简要介绍 首先大概地描述研究领域中前人的研究成果,介绍不要用专业性语言,尽量少用统计和经济术语。 (2)文献综述介绍已研究过此方向的专家的研究成果,比较其中的计量模型(3)经济学和金融学原理因为这一部分的目标读者是作者研究领域的专家,因此这一部分中往往包括一些统计与经济金融术语。461(4)数据描述数据,同时详细介绍数据来源。(5)模型介绍在“模型介绍”中要为以后篇幅中使用的检验技术作铺垫,为什么使用这些检验技术,如何使用都在“模型介绍”中要有所铺垫。(6)实证研究结果 这一部分是文章的核心,在本部分中,包含有统计信息与经济金

131、融原理 。(7)结论 简要地概括一下文章讨论的问题,着重强调实证研究发现和结果。 462二、需要特别注意的地方(1)首先,要强调的是事实上没有完全正确或者完全错误的实证研究。实证研究的结果是客观存在的,即使研究结果与我们的期望不一样,但是这不该成为继续研究的障碍。(2)另外,实证结果往往是让人觉得迷茫的。比如,一个统计检验说明了一种情况存在,而另一个统计检验却得出不同的结论。某个解释变量在一个回归中是显著的,而在另一个回归中却是不显著的,463(3)对于统计研究结果的展现方式,简洁明了是毋庸置疑的要求。(4)写作一篇好的研究报告的关键要领是要有选择性。 464三、简单介绍典型的研究课题以下提供

132、了三个可以研究的课题:1、利用协整理论检验购买力平价说(PPP)。 其基本思想是:货币的价值在于其购买力,因此不同货币之间的兑换率取决于其购买力之比。但在实证研究中的一般的结论是:第一,在短期内,高于或低于购买力平价的偏差经常发生,并且偏离幅度很大;第二,从长期来看,没有明显的迹象表明购买力平价的成立;第三,汇率变动非常剧烈,这一变动幅度远远超过价格变动的幅度。 465我们利用1855年-1987年英国市场数据,检验每单位劳动的实际工资(即下文中的WPYE)是否平稳。按照PPP理论,其应该是存在平稳的。利用Microfit自带的数据库中PHILLIPS.FIT数据,文件中给出了英国的就业人数(

133、E)、物价(P)、工资(W)以及实际国民生产总值(Y)的对数值。在PROCESS中,键入:C=1;WP=W-P;YE=Y-E;WPYE=WP-YE;DWPYE=WPYE-WPYE(-1)在本题中,协整关系的零假设检验是:WPYE=W-P-Y+E不存在协整关系,也就是WPYE包含单位根。466图8-1 WPYE的单位根检验结果接着运行:ADFWPYE(4)得到结果如下(图8-3):467图8-2 WPYE线性图从结果可以看出:在带有趋势项的情况下,ADF(1)的检验结果拒绝零假设。我们通过画图:PLOTWPYE得到468 可以看到,在二战之后,WPYE的整体水平上升了,因此WPYE不平稳,即W-

134、P-Y+E之间不存在协整关系。这进一步验证了前人的研究理论。 4692、资本资产定价模型(CAPM)中系数的确定资本资产定价模型的研究对象,是充分组合情况下风险与要求的收益率之间的均衡关系。根据投资理论将风险分为系统风险和非系统风险,知道了在高度分散化的资本市场中只有系统风险,并且会得到相应的回报。470度量一项资产系统风险的指标是系数。它被定义为某个资产的收益率与市场组合之间的相关性。根据数理统计的线性回归原理,系数可以通过同一时期内的资产收益率和市场组合收益率的历史数据,使用线性回归方程预测出来。本文截取了上证指数以及宝钢从2000年12月13日起到2005年3月18日的日收益率,分别作为

135、解释变量与被解释变量,利用Eviews软件进行回归。471其中股指的日收益率为RATE1;个股的日收益率为RATE2。先将个股与股指的数据导入Excel中,因为派息和召开股东大会,都有停盘的规定,因此,个股资料中残缺的部分,利用相隔数据平均处理获得。在Eviews中建立一个新文件,并导入两组数据,进行回归。获得的结果是(图8-3): 472图 8-3 模型回归结果473宝钢作为大盘股,一直走势平稳,基于CAPM模型可知,宝钢股票的系数应该是小于1的。事实也证明了这一点,在中 ,系数为0.851。4743、股价低估之谜投资者和金融家都很想知道股市是如何对一家公司的股票定价的。在这个研究课题中,可

136、以使用以下的数据集来进行实证研究分析。文件集包含了1996年在美国上市的309个公司的交易数据。有些是“季节性发售”有些是“首发”。475样例:一篇关于中国封闭式基金折价的实证文章一、引言封闭式基金折价交易是金融领域的一个不解之谜。封闭式基金困惑(the closed-end fund puzzle )是指:实证研究发现:封闭式基金的市场交易价格通常不等于其持有的资产组合的市场价值(即基金的资产净值)。虽然基金有时会高于资产净值溢价交易,但通常折价10%20%已经成为一种普遍现象. 476资金折价率定义为:其中:D为折价率,price为基金的市场交易价格,NAV(netassetvalue)为

137、基金投资组合的单位资产价值。根据以上公式,D为正值表示折价,为负值表示溢价 根据Lee,Shleifer和Thaler(LST,1991)的总结,封闭式基金的价格波动往往表现为如下四个特征:477(1)当基金首次向投资者公开发行时(IPO),封闭式基金总是会以10%左右溢价交易。在市场上还有其他基金以折价方式交易时,投资者为什么会溢价购买新发行的基金? (2)虽然封闭式基金刚开始时溢价交易,但是从上市交易开始之后约120天内溢价就会下降,其交易的折价超过10%并且通常一直保持折价交易。478(3)随后封闭式基金的交易折价会出现大幅度波动,而且呈现出均值回归(meanreverting)的特点。

138、 (4)当基金封闭期结束,面临清算或者转为开放式基金时,基金价格上升并且折价变小,基金持有者获得正回报。然而,仍有一个小幅度的折价一直持续到最后基金清盘或是转为开放式基金。479二、基于有效市场的研究与基于行为金融学噪音交易理论的研究(即文献综述)(一)基于有效市场的研究现状根据有效市场假说,资产价格应该等于其内在价值,因此也应该等于未来所有现金流经过贴现以后的现值。之所以出现折价交易,是基金公司对基金的净资产值高估的结果。折价是对这种高估的合理调整。其主要有三种解释:代理成本,资产的流动性缺陷,资本利得税假说。480虽然每种假说都有其合理性,可以解释观测到的部分折价现象,但即使把这三种因素综

139、合起来,仍然不能解释基金折价的大部分特征。1、代理成本(Agency Cost) 该观点认为,基金的日常运作需要成本,如基金管理人的报酬,管理费用等。由于这些成本的存在,基金的市场价格应当低于其资产净值。这一观点存在以下几个问题:481(1)基金的管理费用占基金资产净值的比例很小而且相对固定,是一种典型的资产净值固定百分比,而封闭式基金的折价较大而且呈现较大幅度的波动;未来管理费用的现值理论上应该随利率波动,然而,LST证实了基金折价变动和利率波动之间无显著关系。(2)代理成本不能解释为什么当理性的投资者在可以预期到基金发行后将折价交易的情况下,却愿意在初始发行时溢价购买。482(3)代理成本

140、也不能解释折价率在不同类型基金,不同时期的变化。 Malkiel(1977) 证实了基金折价水平和管理费用(以及基金业绩)之间没有显著关系。 Shleifer和Thaler(1991) 证实:在折价水平和未来基金净值之间存在正相关关系。高折价的基金在下一个时期相对于低折价的基金将有更高的净值。这个结果与代理成本理论得出的结果相反。4832、资产的流动性缺陷(1)“限制性股票假说”(restricted stock hypothesis)。 该观点认为,如果基金所持有的资产中有大量是在一定期限内有流通限制的股票,那么由于这些股票的流动性较差,其市值与变现值之间存在着一定的折扣。但事实上,许多封闭

141、式基金持有这类股票非常少,所以即使这种观点对某些特定的基金成立,也不能对广泛存在的大规模基金折价做出合理的解释。 484(2)大宗交易折扣说”(Block Discount Hypothesis) 该观点认为,基金可能过度的持有某一家公司的股票。由于大宗交易的流动性风险,这种股票的变现值必然低于公告的资产净值(NAV),从而基金应当有一定的折价。但问题在于,当封闭式基金转为开放式基金以后,基金仍可能持有较多的这种股票,而这时折价却消失了.4853、资本利得税(Capital Gains Tax Liabilities) 该观点认为,如果投资者购买的基金已经含有了资本升值,当基金将来卖出,实现资

142、本升值时,必须要支付资本利得税。基金净值含有的未实现资本升值越多,则随后交易的潜在折价可能性就越大。但是,当封闭式基金转为开放式基金以后,同样的潜在税赋应该导致相似的折价交易。可是在大量实证中,当封闭式基金转为开放式基金时,折价也随即消失。486综上所述,以上三个理论只能部分的说明为什么存在基金的折价交易(即基金折价的第二个特征)。这些理论不能对基金折价的其它特征提供满意的解释:为什么发行时溢价,为什么折价率不断波动,为什么封闭式基金转为开放时会有巨额的超常收益。最重要的是,即使结合以上所有的理论,也不能对“封闭式基金折价之谜”提供全面解释。487(二)基于行为金融学噪音交易理论的研究噪音交易

143、者理论能对基金折价提供一个更完整,全面的解释,其理论框架如下:(1)居于DSSW模型,市场中存在两类交易者:非理性的噪音交易者和理性的套利者。噪音交易者情绪不可预期的波动将产生出脱离资产基本价值以外的噪音交易风险。由于噪音交易者过多的承担了这种风险,他们可能获得比理性的套利者更高的收益。488(2)基金交易中同样存在噪音交易,噪音交易者也是基金的主要投资者。(3)噪音交易者的情绪波动是随机的,不可预期的,他们乐观时就会大量买入基金,此时折价减小,甚至溢价;悲观时则相反。(4)噪音交易者的情绪波动造成了基金折价率的随机波动,因此投资基金比投资基金持有的基础资产风险更大,需要补偿。489(5)基金

144、折价交易就是对这种噪音交易者的情绪波动风险的补偿。1、投资者情绪和基金折价的四个特征 该观点认为封闭式基金的平均折价仅仅是因为:持有基金的风险比直接持有投资组合的风险大。这一理论与封闭式基金折价的主要特征一致:基金折价交易。这一理论也与折价的其它三个特征一致。 490首先,封闭式基金发行上市时,一方面由于新基金没有可供比较的历史经营纪录;另一方面,为了保证新基金的发行成功,基金发起人通常要做大量的宣传工作,将基金的未来收益描述得非常完美,给投资者以极大的想象空间。噪音交易者对封闭式基金非常乐观,这种乐观的程度远远超过了对基金未来业绩的理性预期,从而导致基金的过渡交易,使基金的交易价格高于其资产

145、净值,产生溢价。491 其次,这一理论意味着:封闭式基金的折价率随着投资者关于基金未来收益预期的波动而不断波动。 最后,这一理论解释了当基金宣布由封闭转开放时,为什么基金的价格会上升。2、 Lee, Shleifer和 Thaler的实证 通过如下关系对金融噪音的间接验证。(1)不同基金折价率变动的同步性 (2)新基金上市的时机选择 (3)小公司股票收益率变动与基金折价率的关系。 492三、数据来源和折价指数的构造 (一)基金数据的来源说明 本文样本分别选取2000年2月以前在上海证券交易所和深圳证券交易所上市交易的封闭式证券投资基金各10只。这些基金的特点是规模大,上市时间早,代表了市场的主

146、力,能反映市场的整体状况。 沪市基金为:基金金泰,基金泰和,基金安信,基金汉盛,基金裕阳,基金景阳,基金兴华,基金安顺,基金金鑫,基金汉兴 493 深市基金为:基金开元,基金普惠,基金同益,基金景宏,基金裕隆,基金普丰,基金景博,基金天元,基金同盛,基金景福 实证分析的数据包括基金每周末的收盘价,每周公布一次的单位资产净值(NAV),基金的持仓结构,管理费用,以及基金的持有人结构,时间跨度从2000年2月至2003年1月。 494(二)折价指数的构造和统计特征在此,我们需要构造一个基金折价指数来代表整个样本所有封闭式基金折价的状态。折价指数的构造有两种方法:基金净值加权平均法(LST用此种方法

147、)和算术平均法。加权平均法VWD它是样本期内样本基金折价率以净值为权数的加权平均:其中:表示在t期折价的加权系数。算术平均法为样本期内样本基金折价率的简单算术平均:495关于构成折价指数中样本个数的选择 1.我们认为样本数量并非越多越好。如果折价指数中包含过多新上市基金,那么在同一个样本期中,折价指数中既包含位于溢价期的新基金,又包含折价的老基金,指数就不能真实反映出基金的折价情况。 2.“24周”的选择方法。 3.在前述沪深股市的20支样本基金中,我们选取12支在1999年7月份以前上市的基金构造折价指数。496四、模型介绍与实证研究结果展示(一)基于有效市场理论的研究 1.传统理论关于封闭

148、式基金折价的解释有三个:代理成本,未实现的资本利得,以及资产的非流动性。 考虑到我国证券市场自身的特征,我们选取了三个可能影响基金折价的因素:管理费用占基金总资产比例,基金的投资集中度,基金的机构投资者占比。497 投资集中度定义为该基金的投资组合中持仓前10位的股票市值之和与基金总资产净值之比。它是衡量基金 流动性的替代指标,预期集中度越高,流动性越差,折价越大。 2.下面,我们列出2000年20只样本基金的周折价均值,管理费用占比,投资集中度,以及机构持有人占比,见表8-1,如下:498表8-12000年样本基金周折价率均值、管理费用占比、投资集中度、机构持有人占比的相关系数499 3.为

149、了检验管理费用,持股集中度等因素能否解释基金折价,我们首先用2000年的数据计算基金周折价均值,管理费用占比,投资集中度,机构持有人占比 这四个指标之间的相关系数。结果表8-2如下:500表8-2 2000年样本基金周折价率均值、管理费用占比、投资集中度、机构持有人占比的相关系数501 从表8-2可见,周折价均值与管理费用之间有正相关关系,但不显著;与预期相反,周折价均值与投资集中度之间存在微弱的负相关关系,但也不显著。这初步表明传统理论无法解释基金折价。我们发现,基金周折价均值与机构持有人占比之间存在正相关关系,而且是显著的。这表明引入机构持有人占比变量的确抓住了我国基金持有人结构的这一特点

150、。 进一步分析,我们构造回归方程:502其中表示折价率,c是截距,jzd表示投资集中度,fee表示管理费用占比,holder表示机构持有人占比。首先,在回归中只加入jzd和fee两个变量,结果如下:表8-3基于传统解释的横截面回归结果503 可见,双因素模型中,两个因素都是不显著的。而且F值很小,整个回归方程都是不显著的。这与上面的相关系数检验相互印证。随后,把holder变量加入回归模型中,得到以下结果见表8-4:表8-4 加入机构持有人占比后的横截面回归结果(2000年)5044、回归方程在不同时间段的检验: 我们用2001年的数据进行了回归,发现结果更显著。虽然相对于2000年,2001

151、年基金的折价率大幅下降,但这两年数据计算的结果都表明:管理费和投资集中度这两个指标无法解释基金折价。而机构投资者占比却有很强的解释能力,并与基金折价正相关。 对此我们的解释是:根据中国的市场情况,其持有基金份额的增加,反而放大了噪音交易者风险,使折价扩大。 505(二)基于行为金融学噪音交易理论的研究 基于有效市场假说的传统理论的确不能解释我国封闭式基金的折价,我们把研究的视角转移到行为金融学,通过验证如下关系间接验证投资者情绪波动对基金折价的影响影响:(1)不同基金折价率变动的同步性 (2)新基金上市的时机选择。如果不存在这种影响,那么不同基金这家的相关性应该很低,反之亦然。下面我们计算12

152、只构成折价指数的样本基金折价率与折价指数之间的相关系数。506表8-5构成折价指数的基金折价率与折价指数的相关系数(2000/02-2003/01)表(8-5)507 表(8-5)给出了12只样本基金及其折价指数之间的相关系数。可以看出各基金折价之间是高度相关的,而且折价指数VWD与构成指数的各基金的折价率也是高度相关的。 这说明折价指数VWD很好的反映了基金折价的总体状态。同时,我们考察了非构成折价指数的8只样本基金折价率与折价指数之间的相关系数,结果如下表(8-6):508表8-6非指数基金折价率与折价指数之间的相关系数(2000/02-2003/01)表(8-6)509 表(8-6)给出

153、了8只非指数基金之间,以及它们与折价指数的相关系数。除基金景博(184695)的相关系数稍低外,其他非指数基金折价率与折价指数VWD是高度相关的,而且各基金折价之间也是高度相关的。 注意这些非指数基金都是上市相对较晚的基金,它们与折价指数VWD的高度相关表明了不同上市时间基金折价率的联动性。5102、新基金上市的时机选择 根据噪音交易者理论,新基金是在噪音交易者对其未来收益持乐观态度时发行。如果噪音交易者情绪波动影响的范围是所有封闭式基金,那么新基金将在投资者情绪比较乐观,即已发行老基金的折价偏低的时候上市 。 一方面,我们考察从2000年2月到2002年9月期间新上市的封闭式基金数量与同期月

154、平均折价指数的关系,来进一步验证噪音交易理论对基金折价的影响。511图8-4新上市的封闭式基金数量与同期月平均折价指数关系(2000/022002/09)512注意图中明显的一个特点-2000年的特殊情况另一方面,我们比较了有基金发行的月份和无基金发行的月份 两者平均折价率的差异,结果见表8-7所示。表8-7有无基金发行的月份平均折价率的比(2000/022002/09) 这个结果也支持假设:新基金是在老基金折价较小的时候发行。513如果我们进一步剔除2000年2月到2002年9月期间所有发行的规模为5亿或8亿的小盘改制基金的影响,那么期间共发行大盘新基金6支,时间段为2001年9月到2002

155、年9月共13个月。如下图8-5:可以看到这6支基金大多是在折价率走势较低时发行的。514图8-5新上市的大盘基金数量与同期月平均折价指数关系(2001/092002/09515我们同样比较了有基金发行的月份和无基金发行的月份 两者平均折价率的差异,结果见表8-8所示:表8-8有无基金发行的月份平均折价率的比(2001/092002/09)516五、研究结论与建议(一)研究结论 1.基金的折价率之间,折价率与折价指数之间高度相关的。 2.新基金大多选择在已发行老基金折价率较低时上市。 以上实证结果支持封闭式基金折价受噪音交易者情绪波动影响的假说。 517(二)建议1.一般认为机构投资者是理性的,

156、能起到稳定市场的作用。但这一结论在中国不一定成立。 在允许保险公司等机构投资者通过持有基金间接入市的2000年以及随后的2001年,机构持有基金比例越高,折价越大。 作为机构主力的证券投资基金也并没有使中国股市的震荡和波动的幅度减少或舒缓,周期性的非理性恐慌反而越来越厉害。5182、关于开放式基金上市时机的把握Malkiel(1977)和LST(1991)的研究都表明,封闭式基金的折价率与开放式基金的净赎回(Net Redemption)成正比。出于对我国证券投资基金现实生存环境的考虑和对投资人利益的保护,我们认为:当前可适当放缓,或是暂停新开放式基金的上市,等封闭式基金折价率降到一个较低且稳定的水平再放松限制。519

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号