《长江证券-回归量化选股模型的建立与拓展》由会员分享,可在线阅读,更多相关《长江证券-回归量化选股模型的建立与拓展(29页珍藏版)》请在金锄头文库上搜索。
1、 请阅读最后评级说明和重要声明 1 / 29研究报告量化选股 2012-11-09 金融工程(专题报告) 回归量化选股模型的建立与拓展 回归量化选股模型的建立与拓展 分析师: 范辛亭 021-68751859 执业证书编号: S0490510120008 联系人: 袁继飞 021-68751787 执业证书编号: 联系人: 杨靖凤 (8621)68751636 沪深 300 成分股回溯 22 个月组合表现 资料来源:长江证券研究部 相关研究 量化选股的线性回归体系构建(一) 量化选股的线性回归体系构建(二) 量化选股的线性回归体系构建(三) 量化选股的线性回归体系构建(四) 量化选股的线
2、性回归体系构建(五) 报告要点 线性模型 VS 其他模型 多因子模型可以用多种方法实现,本文研究使用回归方法来建立多因子模型,相比排序分组和打分法建立的模型,回归模型主要有以下优点:在多因子的建立过程中对比信息更方便,因为多因子回归的时候能够控制一个变量来比较其他变量的影响是否显著,这样就能发现在控制某些因子之后一些显著的因子,也可以对比筛选一些比较类似的指标;用线性回归的方法可以避免打分方法带来的给某个因子权重过大的弊端;通过回归的方法构建的组合能容纳更多的因子,这样可以提高超额收益的幅度和稳定性。 从单因子到多因子 我们使用 Fama-MacBeth 来检验单因子的有效性, 然后使用逐步回
3、归的办法来建立多因子模型,剔除掉相关性较高的因子。当然,在做这些回归之前,需要对某些单因子的异常值和缺省值进行处理。 从行业非中性到行业中性 我们按照指定指数的行业权重来对组合进行行业中性处理,这样可以避免行业偏差,并且可以提高超额收益的稳定性。 从全局选股到特定样本 我们除了在全市场进行选股外, 还在沪深300和中证500里面进行同样的选股,最后建立的模型包含的因子会有差异。 从持有一个月到不同持有期 我们首先对单个因子检验其不同持有时间的有效性,然后按照持有 3 个月、6个月、9 个月建立不同的持有时间的模型,持有时间较长的模型表现相对更加稳健,并且可以降低交易成本。 从固定权重到动态改变
4、权重 我们在沪深 300 和中证 500 里面使用滚动回溯回归系数的办法来确定权重, 这样可以加大最新表现较好的因子的权重,并且剔除长时间没有效果的因子。经过检验,我们发现一般回溯 20 个月组合表现会更加稳定,并且附近的参数表现都较为出色。 请阅读最后评级说明和重要声明 2 / 29金融工程(专题报告)目录 一、线性模型 VS 其他模型 . 4一、线性模型 VS 其他模型 . 4 1、排序分组模型 . 4 2、打分模型 . 5 3、回归模型 . 5 二、从单因子到多因子 . 6二、从单因子到多因子 . 6 1、数据预处理 . 6 2、因子有效性检验 . 6 3、构建多因子的流程 . 9 4、
5、全市场组合表现 . 10 三、从行业非中性到行业中性 . 11三、从行业非中性到行业中性 . 11 1行业中性的实现方法 . 11 2行业中性模型表现 . 12 四、从全局选股到特定样本 . 13四、从全局选股到特定样本 . 13 1、沪深 300 成分股的模型 . 13 2、中证 500 成分股的模型 . 15 五、从持有一个月到不同持有期 . 17五、从持有一个月到不同持有期 . 17 1Fama-MacBeth 和 Newey-West . 17 2单变量最佳持有期检验 . 18 3不同持有期模型及其表现 . 21 六、从固定权重到动态改变权重 . 24六、从固定权重到动态改变权重 . 24 图表目录 图 1:SP(市销率倒数)从大到小 . 4 图 2:市销率最大一组超额走势 . 4 图 3:排序分组模型构建多因子组合 . 5 图 4:SP(市销率倒数)从大到小 . 8 图 5:市销率最大一组超额走势 . 8 图 6:ROA 从大到小 . 8 图 7:ROA 最大一组超额走势 . 8 图 8:20 日换手率从大到小 . 9 请阅读最后评级说明和重要声明 3 / 29金融工程(专题报告)图 9:60 日换手率从大到小 .