基于短时相关性的股票推荐算法研究 丁小军摘 要:股票市场作为多人参与的复杂系统,具有很大的随机性随着信息技术的普及,如何通过计算的方法来选股是很多股民都感兴趣的本文针对中国股市的股票具有短时政策性、新闻性、概念性、关联性等特点提出用短时相关性来推荐股票的方法通过实际的沪深股市数据,发现这种推荐方法确实能带来较大的利润,且不需要人们去耗费巨大精力选股当然,此方法仍有一些不足,需要改进关键词:股票;推荐;相关性1 引言股票是金融市场中的一个重要组成部分,受到广大投资者的热切关注在股票市场的长期跟踪研究中发现,股票之间也会有明显的相互影响作用,尤其是在地区板块、行业板块内,这种相互影响关联作用更加明显[1]甚至有时候,在不同板块、不同概念及不同行业股票之间也会出现同涨同跌等现象,学者将其称为联动[2]总而言之,某一支股票的价格也会随着其它股票价格的波动而波动,某一支股票价格的波动也会使别的相关股票的价格随之波动[3]这种相互作用也可以称作股票之间的相關性,是许多投资者研究的热点之一本文分析了用原始股票涨跌幅来分析相关性的缺陷,提出了用量化方式来强调涨跌的同步性,弱化涨跌幅度的差异,同时将概念行业相关性加权,得到了适应于股票的相关性计算方式,并以此设计出了一个股票推荐算法,在沪深股市2020年1月到4月的数据上进行了回测,取得了较为满意的效果。
2 方法相关系数最早是由统计学家卡尔皮尔逊提出的用来研究变量之间线性相关程度的量,两个向量x,y的皮尔逊相关系数p(x,y)定义如公式(1)所示其中ux,uy分别为xi,yi的均值皮尔逊相关系数相关系数范围是[-1,1],相关系数不同的值体现了不同的意义当相关系数越等于1时候,表示两个向量完全正相关,当相关系数等于-1时,表示两向量完全负相关当系数接近0时,表示两向量不相关首先本文取股票20日的涨跌幅作为股票的指标x,(x[i]为每一日涨跌幅),计算他们的相关系数,但是发现在这种情况下大涨或大跌的股票相关系数非常高,即直接使用原始涨跌幅的话,相关系数更看着涨跌幅度为此,本文将涨跌幅量化如公式(2)所示在这种量化指标下,涨跌幅度对相关系数影响就没有那么高两只股票具有高相关性更在于他们涨跌的同步性同时我们定义一支全为零向量的股票与其他股票相关性为0,即20日不涨不跌的股票不再关注接下来,本文定义股票所属板块和概念的向量Cx,若股票属于某一概念i,则对应Cx[i]=1,否则Cx[i]=0综合股票行业概念和走势,我们定义了如下相关系数计算公式根据公式(3),我们可以算出任意两只股票20天的相关性。
这种相关性一般能维持一段时间在每日开盘后,每只股票根据自身涨跌幅度对与其相关性排在前十的股票进行推荐(涨)或者反对(跌),推荐力度与自身涨跌幅成正比,然后将推荐票数比较多的股票反馈给投资者如果一支股票得到了较多的推荐,那么可以知道必然有一批围绕此股票的相关性较高的股票都是涨的,这一批股票很可能就反映了当天的热点同时,当一批高度相关的股票有启动的苗头的时候,因为推荐,这种苗头会被放大,从而可以在热点还没有启动的时候就能提醒投资者而在热点概念之外的且自身板块内很多股票是跌的股票,会因为得到较多的反对票,从而提醒投资者放弃3 实验与结论本文以2020年1月到4月的沪市深市的股票为实际数据,进行了回测,发现股票涨跌确实是有联动效应的,即部分大涨的概念股确实具有很高的相关性如图所示万象德农和顺鑫农业两只股票,他们每日涨跌的幅值相差比较大,但是涨跌的同步性较好,所以用本文提出的相关性计算方法可以得到他们是高度相关的因此,本文提出的方法也可以用来研究团体股票的走势,从而可以分析出一群高度相关的股票具备了什么样的走势后,更有可能大涨,提高人们买股的成功率参考文献[1]汪玉环.股票间相关性测量方法的研究及应用[D].哈尔滨工业大学,2017.[2]牛红丽,王军.基于选举模型理论研究股市特性[J].北京交通大学学报,2012,36(3):138-144.[3]陈花.基于复杂网络的股票之间有向相关性研究[D].北京邮电大学,2012.[基金项目]玉林师范学院博士科研项目G2018014 -全文完-。