量化投资与机器学习

上传人:xy****7 文档编号:60512699 上传时间:2018-11-16 格式:PPTX 页数:22 大小:2.82MB
返回 下载 相关 举报
量化投资与机器学习_第1页
第1页 / 共22页
量化投资与机器学习_第2页
第2页 / 共22页
量化投资与机器学习_第3页
第3页 / 共22页
量化投资与机器学习_第4页
第4页 / 共22页
量化投资与机器学习_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《量化投资与机器学习》由会员分享,可在线阅读,更多相关《量化投资与机器学习(22页珍藏版)》请在金锄头文库上搜索。

1、汇添富基金 吴振翔,量化投资与机器学习,2018.5.6,0. 量化投资需要什么技术?,量化投资与机器学习,问题的定义是什么? 需要先定义量化投资,进而才能思考机器学习技术在其中的应用。,我们如何看待量化投资,2018/11/16,汇添富基金,量化投资的应用场景,2018/11/16,汇添富基金,量化投资需要解决的问题,2018/11/16,汇添富基金,传统量化投资技术,2018/11/16,汇添富基金,量化投资需要什么技术?,2018/11/16,汇添富基金,1. 我们感兴趣的机器学习技术,机器学习技术发展日新月异,但在狭义的量化投资领域的应用才刚刚开始。,数据获取与数据处理,2018/11

2、/16,汇添富基金,Source: Big Data and AI Strategies: Machine Learning and Alternative Data Approach to Investing, J.P.Morgan,从海外经验来看,投资领域对于另类数据的使用已经起步,数据使用范围可谓相当多样。 从数据获取来看,主要来源如下:舆情文本、卫星图像、交通信息、物流信息、网络搜索、电商信息等。 对应于这些数据来源,所需要的数据处理技术包括:自然语言处理、计算机视觉等。,自然语言处理技术,2018/11/16,汇添富基金,从数据处理和特征提取角度来看,目前自然语言处理技术已经较为成熟

3、,可以对诸如新闻、公告等文本信息进行大规模处理。 中文分词技术是处理中文文本数据的基础;词向量技术是将高维且正交的one-hot向量,转变为低维且具有几何意义的向量的技术。,自然语言处理技术,2018/11/16,汇添富基金,海外某公司现在已经开始提供实时的Twitter舆情数据,直观来看,Tweet Volume和Sentiment都没有很强的领先性,但也不排除精细化处理后对投资能够起到作用。,Source: http:/ GPU硬件技术的突飞猛进大大提升了CNN的数据处理能力,使得工业界目前已经可以处理大规模的图像和视频数据。,计算机视觉技术,2018/11/16,汇添富基金,海外某公司通

4、过计算机视觉技术,识别卫星图像等原始图像当中的停车场停车数量信息,进而构建零售、餐饮、酒店等场景的高频经营数据。通过这些高频经营数据可以构建相应的交易信号。 该公司提供了一种交易方法:计算每月的停车量同比增速,季度计算累计同比增速,计算过去6个月同比增速的布林带,当季度累计同比增速穿越布林带上下轨时,触发买入卖出交易。,Source: Big Data and AI Strategies: Machine Learning and Alternative Data Approach to Investing, J.P.Morgan,机器学习模型,2018/11/16,汇添富基金,通过对大量非结

5、构化的数据进行处理,成为数字化、向量化的数据集,进而通过机器学习算法进行建模和训练,是目前机器学习领域的主要方法论。 工业界的机器学习模型主要解决以下问题: 分类(classification) 回归/预测(regression) 其他,如生成模型,强化学习模型等,机器学习模型的表述能力,2018/11/16,汇添富基金,以深度神经网络模型为例,早在1993年,就有学术研究从数学上证明:多层神经网络+非线性激励函数可以近似任何函数。 近期实证研究表明,随着神经网络层数的增加,测试集的准确度逐渐提升;此外,在不增加神经网络层数,仅仅增加参数个数的情况下,模型的效果提升不明显;而在不改变参数个数的

6、情况下,将层数从3层增加至11层,则可以显著提升模型效果。,Source: Goodfellow, I. J., Bengio, Y., & Courville, A. (2017). Deep Learning,2. 量化投资与机器学习,我们的实践以及思考,存在的障碍,2018/11/16,汇添富基金,存在的障碍,2018/11/16,汇添富基金,将量化投资和机器学习相提并论是不适合的,机器学习,从入门到放弃?,2018/11/16,汇添富基金,数据少,噪声大,投入还小,只能做toy model? 我们对股票市场有独到的理解!不需要大量数据和大量投入就能搞出好模型! 相比于现有的量化模型,机

7、器学习的模型和方法能够更好克服人为观测的偏差,如: 市值因子为什么是市值取对数? 反转因子为什么是区间收益率? 风险为什么可以用标准差表示? 现有量化投资的模型都是基于简单的人为观测逻辑,进行历史检验,获得较好效果之后进行使用的。 而机器学习方法论是:对更为广泛的数据,基于机器学习的观测逻辑,进行历史检验,获得较好效果之后进行使用。 已有一些成果超越了现有量化模型的效果。我们认为,随着数据量提升、投入资源加大,未来机器学习方法将带来量化投资领域的重大变革!,广阔天地,大有可为,2018/11/16,汇添富基金,我们用机器学习得到的因子的效果: 测试区间:2011年至2017年 样本空间:中证全指 在所有市值分层和行业分类上均有效,且因子强度均比较高,广阔天地,大有可为,2018/11/16,汇添富基金,我们用机器学习得到的高频交易策略: 测试区间:2017年 样本空间:中证全指 交易成本:单边千一 下图为费后的累计收益(简单求和)曲线,平均日收益为0.13%,非常感谢,欢迎交流!,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号