基于改进相关系数聚类法的股票投资组合研究

上传人:luoxia****01802 文档编号:56175395 上传时间:2018-10-10 格式:DOC 页数:5 大小:37KB
返回 下载 相关 举报
基于改进相关系数聚类法的股票投资组合研究_第1页
第1页 / 共5页
基于改进相关系数聚类法的股票投资组合研究_第2页
第2页 / 共5页
基于改进相关系数聚类法的股票投资组合研究_第3页
第3页 / 共5页
基于改进相关系数聚类法的股票投资组合研究_第4页
第4页 / 共5页
基于改进相关系数聚类法的股票投资组合研究_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《基于改进相关系数聚类法的股票投资组合研究》由会员分享,可在线阅读,更多相关《基于改进相关系数聚类法的股票投资组合研究(5页珍藏版)》请在金锄头文库上搜索。

1、基于改进相关系数聚类法的股票投资组合研究一、引言最优股票投资组合选择及其风险控制一直是资本市场研究的热点问题。已有文献对 资产组合最优决策理论进行了大量研究,在资产组合选择与最优配置、资产组合规模效应 与影响因素、以及资产组合风险度量与控制等重要问题取得了丰硕成果。但遗憾的是,无 论是理论还是实证研究都很少考虑到金融时间序列的时变性、聚集性、持续性等波动特征 对资产组合风险规避与控制的影响。而本文正是针对目前研究的不足,通过对沪市 A 股的 120 支股票收益率进行拟合使用改进的相关系数法对股票收益波动时间序列相关性进行匹 配,聚类,从而优化了股票投资组合选择的方法。并通过实证研究,证明了在哈

2、里?马柯 威茨证券组合评价标准下,使用该种股票投资组合选择方法,可以获得同等收益水平下, 更低风险的股票投资组合,从而为投资者选择合理的股票投资组合提供了可能的方法。二、文献综述国外文献 马柯威茨于 1952 年最早提出了均值-方差理论,成为现代投资组合理论的 开山鼻祖。自此之后,很多金融学者在前人的研究基础上对该理论进行了补充和发展,如 托宾在提出了著名的两基金分离定律:当存在无风险资产的情况下,有效前沿上的任意一 点都可以表示为和切点的线性组合。此外,大批学者踏上了简化计算,完善模型的征程。 一是尽可能的减少模型计算量,例如:夏普提出了单因素模型,它的主要思想是:市场的 总体因素统一作用于

3、所有股票,市场以外的因素只作用于某一只股票,因此可以通过股票 组合来分散。单因素模型使用 来衡量投资组合的风险。提高了人们对市场行为的了解。 罗斯提出了套利定价理论。该理论认为在市场均衡时没有套利机会,因此承担相同风险因 素的投资组合应该具有相同的期望收益率 。二是开发新的投资组合模型。例如 Mao 提出 了均值-下半方差模型。Speranza 提出半绝对风险偏差函数。 Morgan 提出的基于 Var 的风 险度量系统等,至今这个风险度量系统还在很多金融机构被广泛使用。国内文献 我国对金融市场研究起步较晚是一个现实,这是由于很多客观因素造成的。 近几年中,我国学者也对投资组合理论进行了深入的

4、研究。唐小我针对我国证券市场的卖 空限制情形下的投资组合模型进行了研究。王春峰、屠新曙和厉斌运用了几何方法解决投 资组合问题。徐绪松、杨小青和陈彦斌提出了“半绝对离差风险测量工具”。刘小茂、李楚 林和王建华研究了在正态情形下,风险资产组合的均值-CVaR 边界,并与方差风险下的均 值-方差边界进行了比较。陈金龙和张维分析了投资组合与 CVaR 之间的关系。此外,安起 光、王厚杰,刘庆富 ,荣喜民、武丹丹和张奎廷、刘志东等学者在组合预测和方法领域获 得了显著的理论成果 。三、研究设计研究思路 本文选取了马柯威茨的均值-方差模型作为本文的理论依据,该模型评价 投资组合的标准,是当收益一定时风险最小

5、,或者当风险一定时收益最大。 该模型的思想 是选取相关性低的投资工具进行组合来分散风险,从而得到更好的投资收益。因此如何衡 量股票相关性,并进而筛选出相关性低的投资组合成为该模型的关键。由于之前的研究, 无论是理论还是实证都很少考虑到金融时间序列的时变性、聚集性、持续性等波动特征对 资产组合风险规避与控制的影响。而本文正是针对目前研究的不足,通过使用改进的相关 系数法衡量股票收益波动时间序列的相关性,并据此聚类,优化了股票投资组合选择的方 法。具体的思路如下:股票收益波动性拟合。对于金融时间序列分析,常常会出现某一特征的值成群出现 的情况。如对股票收益率序列建模,其随机扰动项往往在较大幅度波动

6、后紧接着较大幅度 的波动,在较小幅度波动后紧接着较小幅度的波动,这种性质称为波动的集群性。在一般 回归分析中,要求随机波动项是同方差,但这类序列随机扰动项的无条件方差是常量,条件方差是变化的量。所以需要使用自回归条件异方差模型或者广义自回归条件异方差模型。时间序列相似性度量。测量时间序列相似性的方法有很多,最主要使用的是欧式距 离法和相关系数法。欧式距离法的优点是计算简单,易于理解,但是它容易受到序列波动 性的影响,而且当序列长度增加时,其距离也会增加。特别是当时间轴发生伸缩或弯曲时, 就不能够准确测量序列的相似性了。而相关系数法的优点是计算量少,而且即使两个序列 均值不同,也能够准确比较相似

7、性,而在欧式距离法中,如果两个序列均值不同,即使它 们是相似的,计算出来的距离仍然会很大,从而误导了结果。但是相关系数法也存在其局 限性,它只适用于长度相同的序列,因此在比较长度不同的时间序列时,需要改进该方法, 改进的相关系数法如下。设有两只股票 P 和 Q,长度为 m 的收益波动序列分别为 X 和 Y:X= ;Y=。首先要在 X 和 Y 中截取长度相同的两个子序列,设长度为 t,最好从序列 最邻近当前时段开始截取,t 不宜过短,计算子序列 X1=和 Y1=的相关系数 r1:r1=将子 序列的长度向前增加一个,即长度为,计算 X2=和 Y2=的相关系数 :r2=,重复上述步 骤,依次类推,直

8、到子序列包含全部序列的长度 m,计算出的相关系数有个。将计算出的 全部相关系数进行平均,则得到的 为改进的相关系数:=。由于聚类需要使用距离,而 改进的相关系数是属于-1,1,所以要将转化成大于等于零的距离,另 d=|-1|,则d0,2。通过 d 对股票进行聚类。 股票聚类。聚类分析。方法中最常用的是分 层聚类。分层聚类方法是通过一系列或者是相继的合并,分割来进行的。是从单个对象开 始,这样在开始时每一个对象都是一类,将那些最相似的对象首先分组,然后将组与组根 据它们之间的相似性进行合并,最后随着相似性不断下降,所有的组渐渐融合成为一个聚 类。确定最小方差资产组合集合的方法。常用的投资策略优劣

9、评估标准有:收益率分布 形态指标,夏普比率,风险价值,条件尾部期望等。本文将主要使用由马柯威茨于 1952 年 提出的用图像分析法确立风险资产的最小方差组合集合和有效边界的过程。我们以只拥有 三个资产的组合为例。利用图像法建立最小方差资产组合集合的过程,就是在以资产权数 为坐标轴的空间内,绘制反映资产组合各种预期收益和风险状况的线,然后依理性投资者 选择资产和资产组合的原则确定最小方差资产组合集合的过程。我们分析是在允许卖空的 前提下,以便不受限制条件的约束。假设我们对资产 A,B,C 进行组合,已知 E=10%,E=20%,E=30%,设 A,B,C 资产的权数分别由 xA,xB,xC 表示

10、,限制条件 为 xA+xB+xC=1,由于 xC=1-xA-xB,因此只要知道 xA 和 xB 的数据,就可以得到 xC 的 数据。因此,可以在一个二维平面图上显示三个资产的组合情况,同理,可以使用维图显 示 n 种资产的组合。在以 xA,xB 为坐标轴的图形中,直线 AB 的方程式是 xA+xB=1,所 有仅投资 A 和 B 资产,不投资 C 的资产组合都分布在这条线上;不包括 A 的组合都分布 在 B 轴上,同理,不包括 B 的都分布在 A 轴上,分布在 AOB 三角形区域内的各种资产组 合都不含卖空资产,在 AOB 以外的资产都含有一种或者两种资产的卖空。根据具体的限 制条件在坐标图上的

11、某个区域进行查找,以确定最小方差的资产组合。而这个过程可以通 过 EXCEL 线性规划的方式实现。样本选择与数据来源 本文选取的研究对象为 xx 年 1 月 1 日到 2016 年 12 月 31 日在 上交所交易的,代码为 sh600000-sh600120 的 A 股股票,数据来源为国泰安数据库。剔除 掉缺失值,实际得到 102 只股票。分别计算这 102 只股票的日收盘价数据个数,其中最多 的为 488 个数据,以 488 为基准,凡是数据个数小于基准数据 15 个以上的股票都被清除。 这样经过清除后,剩下 83 只股票。然后对这 83 只股票的缺失值进行修补,修补的原则是 以前一天的收

12、盘价代替缺失值,经过修补后,每只股票都有 488 天的数据。计算每只股票 的日对数收益率,公式为:日对数收益率=log-log。经过计算,每只股票都有 487 个日对数收益率,时间序列分析建模过程 首先需要对得到的股票对数收益率进行建模,以单只股票序 列为例,过程如下:做统计图观察判断。单位根检验。序列大致可分为有三种:扩散型序 列,单位根型序列和平稳序列。在实际问题中,时间序列大多并不平稳,而是呈现出各种 趋势性和季节性。由于在实际生活中扩散型序列比较少见,很少作为理论研究的对象,所 以我们判断的基础就建立在单位根型序列和平稳序列上。做单位根检验的目的就是要区分 二者,对单位根型序列做差分处

13、理,去除趋势性因素,从而得到平稳序列。确定时间序列 主模型。对原序列进行差分处理,得到宽平稳序列,求解它的自相关系数,偏自相关系数, 同时观察自相关和偏自相关图像,确定 ARMA 阶数。由计算机程序,生成主模型系数的参 数估计,得到相应的残差序列。根据股票对数收益率数据画散点图,趋势图,观察序列是 否属于平稳序列,是否具备集群性,直观地判断是否可以采用条件异方差模型拟合数据。 ARCH 效应检验。ARCH 模型通常用于回归模型:yt=xt?茁+?着 t。若随机干扰项?着 t 不存在 ARCH 效应,则可以直接对模型作最小二乘估计;若?着 t 存在 ARCH 效应,则应 找到 ARCH 模型的形

14、式,即在上式中附加?着 t=?vt,并确定 q,再进行参数估计。对序 列进行 ARCH 效应检验的最常用方法是拉格朗日乘数法即 LM 检验。假设?着 tARCH, 则可以建立如?着 t=?vt 的辅助回归模型:ht=?琢 0+?琢 1?着 t-12+?琢 q?着 t-q2原假设:H0:?琢 1=?琢 q=0;备择假设:H1 存在?琢 i0,1?燮 i?燮 q; 检验统计量:LM=nR2X2其中,n 为计算辅助回归时的样本数据个数,R2 为辅助回归的未调整可决系数,即 拟合优度。检验标准。根据辅助回归 ht=?琢 0+?琢 1?着 t-12+?琢 q?着 t-q2 的最小 二乘估计,得到拟合优度

15、 R2,由 LM=nR2X2 计算检验统计量 LM,根据给定的显著性 水平?琢和自由度 q 查 x2 分布表,得到相应的临界值 x?琢 2 或原假设成立的概率,则可 得到结论。LMx?琢 2,拒绝 H0,表明序列存在 ARCH 效应;LM四、实证检验分析投资组合收益波动性拟合 根据上文的时间序列分析拟合步骤,使用 S-PLUS 软件中 finmetrics 的模块,Excel 规划求解,VBA,SAS,R 软件共同完成从数据的整理,预处理, 分析到得出结论,并配以图形的表达来完成对投资组合风险的度量。 ARCH 效应检 验及股票再筛选。对收益波动率的估计本文使用动态波动率估计模型。在使用 GA

16、RCH 类 模型对股票收益的波动率进行拟合之前需要再对选入研究的股票做一次筛选。通过 ARCHTEST 对这 83 支股票进行检验。在的显著性水平下通过检验说明该股票的收益率波 动性具有集群性,也就是说收益率是变换的,使用 ARCH 或 GARCH 模型拟合更加合理。 共有 33 支股票的收益率数据经过了 ARCH 效应检验。股票收益波动性拟合。对这 33 支股票分别进行收益波动性拟合。第一次采用 ARMA 模型作为主模型对收益率数据进行建模,然后对残差进行 GARCH 模型拟合,虽然 拟合后残差序列均通过了检验,但在相似性聚类中效果不佳。于是重新选定主模型。将常 系数模型作为主模型,然后对残差进行 GARCH 模型拟合,残差也均通过了检验。在模型 中,条件方差序列就是待求的股票收益波动性序列,最后得到 33 条各 488 个数据的波动率 序列。GARCH 的最简单形式 GARCH。该过程可以表示为:?着 t=?vt;ht=?琢 0+?琢 1?着 t-12+?琢 q?着 t-q2其中,vt独立同分布,且 v

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号