互联网大数据挖掘之六:基于大数据挖掘关联个股投资机会

上传人:ji****en 文档编号:106410126 上传时间:2019-10-15 格式:PDF 页数:27 大小:1.42MB
返回 下载 相关 举报
互联网大数据挖掘之六:基于大数据挖掘关联个股投资机会_第1页
第1页 / 共27页
互联网大数据挖掘之六:基于大数据挖掘关联个股投资机会_第2页
第2页 / 共27页
互联网大数据挖掘之六:基于大数据挖掘关联个股投资机会_第3页
第3页 / 共27页
互联网大数据挖掘之六:基于大数据挖掘关联个股投资机会_第4页
第4页 / 共27页
互联网大数据挖掘之六:基于大数据挖掘关联个股投资机会_第5页
第5页 / 共27页
点击查看更多>>
资源描述

《互联网大数据挖掘之六:基于大数据挖掘关联个股投资机会》由会员分享,可在线阅读,更多相关《互联网大数据挖掘之六:基于大数据挖掘关联个股投资机会(27页珍藏版)》请在金锄头文库上搜索。

1、基于大数据挖掘的关联个股投资机会 史庆盛 S0260513070004 广发证券金融工程 2015年8月 互联网大数据挖掘之六 1 基于大数据挖掘的关联个股投资机会 金融工程|专题报告 2015年08月28日 证券研究报告 2 基于大数据挖掘的关联个股投资机会 大数据挖掘 公告、财报 研究报告 股吧、社交 网络媒体 研报热点挖掘 汇丰PMI前沿挖掘 公告抓取 公告分类监测 个股信息变动挖掘 特定公告内容挖掘 股吧情绪挖掘 微信热股挖掘 雪球热度挖掘 个股新闻热度 财经门户选股 热点题材动向 题材个股 CONTENTS目录 关注度 简介 策略 构建 实证 分析 总结及 未来研究方向 02 03

2、04 01 3 基于大数据挖掘的关联个股投资机会 INTRODUCTION 01 | 关注度简介 | 01 02 03 04 4 基于大数据挖掘的关联个股投资机会 关注度简介用户关注度数据 5 和讯网 百度 基于大数据挖掘的关联个股投资机会 关注度简介用户关注度数据 6 基于大数据挖掘的关联个股投资机会 数据来源:广发证券发展研究中心、百度指数 东方财富关注度走势 中国中车关注度走势 关注度简介用户关注度数据 7 基于大数据挖掘的关联个股投资机会 数据来源:广发证券发展研究中心、百度指数、搜狐网、新浪网、东方财富 关注度简介用户共同关注度 8 基于大数据挖掘的关联个股投资机会 个股 个股 个股

3、 联动 联动 联动 用户共同 关注度 个股的 关注度 关注度变化 个股关注度 之间的强弱 关注度简介个股用户关注度建模 9 基于大数据挖掘的关联个股投资机会 用户关注个股数据 时效性强(每日更新) 消除个体关注偏差(海 量数据) 反应用户的注意力(有 限注意力) 共同关注个股指标 共同关注人数(反映用 户关注绝对量) 共同关注比例(反映用 户关注相对占比,消除 基准影响) 关联个股选股策略 动态考虑基准个 股所在行业与关 联个股所在行业 相关性 考虑基准个股与 关联个股的涨跌 幅、成交量等关 系 关注度简介用户共同关注度 基于大数据挖掘的关联个股投资机会 10 数学定义 假设市场共有 个关注者

4、以及 只个股, 市场关注度矩阵AM如下所示: 其中矩阵中元素为布尔变量, 表示第i个关注者对股票j的关注,关注则为1,否则为0。 关注股票j的总人数为: ,关注股票j同时关注股票k的总人数为: : ,关注股票j同时关 注股票占关注股票j总人数比例为: nm 11121 21222 1 12 m m iij nnnjnm AM ij 1 n ij i 1 * n ijik i 1 1 * n ijik i n ij i 关注度简介用户关注度数据 11 基于大数据挖掘的关联个股投资机会 互联网 MODELLING 02 | 策略构建| 01 02 03 04 12 基于大数据挖掘的关联个股投资机会

5、 策略构建数据抓取平台组件框架 监控系统 监控异常、调整反 监控规则 获取反监控规则、异 常规则、设置代理IP 反监控 管理 反监控规则 异常规则 恢复策略 可视化配置 智能化配置 网页规则识别 获取网页抓取 规则 抓取任务调度 分发器 常 规 抓 取 临 时 抓 取 带优先级抓取 消息 通用可扩展集群 抓取线程池 连接池 批量存储 分配调度服务器 13 基于大数据挖掘的关联个股投资机会 策略构建基准个股与关联个股举例 14 基于大数据挖掘的关联个股投资机会 基准个股 关联个股 共同关注绝对量 共同关注占比 平安银行 民生银行 502457 17.31% 浦发银行 497372 17.14%

6、万科A 476150 16.41% 兴业银行 453587 15.63% 中信证券 452849 15.60% 广发证券 中信证券 415985 22.82% 海通证券 311162 17.07% 中国中车 302324 16.59% 中国平安 263957 14.48% 中国重工 260114 14.27% 东方财富 浦发银行 1005800 5.25% 中国中车 744233 3.89% 乐视网 616784 3.22% 中国重工 593744 3.10% 苏宁云商 574106 3.00% 数据来源:广发证券发展研究中心、互联网 注:数据截止至2015年7月29日 策略构建基准个股与关联

7、个股所在行业占比 15 0% 10% 20% 30% 40% 50% 60% 70% 属于同一行业比率 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 属于不同行业比率 基于大数据挖掘的关联个股投资机会 数据来源:广发证券发展研究中心、互联网 策略构建基准个股与关联个股所在行业(一) 16 基于大数据挖掘的关联个股投资机会 基准行业 共同关注行业 占比最高行业 比例 共同关注行业 占比最高行业 比例 共同关注行业 占比最高行业 比例 银行 银行 67.50% 非银金融 17.50% 房地产 6.25% 房地产 非银金融 17.92% 商业贸易 16.53

8、% 房地产 15.97% 医药生物 传媒 17.51% 非银金融 17.40% 医药生物 16.20% 休闲服务 非银金融 18.86% 商业贸易 18.29% 银行 11.43% 综合 商业贸易 19.62% 非银金融 13.58% 有色金属 10.94% 建筑材料 非银金融 17.68% 商业贸易 17.10% 银行 10.72% 家用电器 商业贸易 18.11% 非银金融 14.34% 银行 12.08% 汽车 商业贸易 16.76% 非银金融 15.48% 汽车 12.02% 食品饮料 非银金融 18.55% 食品饮料 15.94% 商业贸易 13.91% 电子 传媒 22.70% 商

9、业贸易 15.27% 电子 14.73% 计算机 传媒 37.06% 计算机 15.59% 商业贸易 12.79% 交通运输 建筑装饰 21.14% 非银金融 16.59% 商业贸易 12.95% 轻工制造 商业贸易 16.70% 非银金融 14.51% 传媒 9.01% 公用事业 非银金融 18.15% 建筑装饰 12.78% 银行 12.41% 数据来源:广发证券发展研究中心、互联网 策略构建基准个股与关联个股所在行业(二) 17 基于大数据挖掘的关联个股投资机会 基准行业 共同关注行业 占比最高行业 比例 共同关注行业 占比最高行业 比例 共同关注行业 占比最高行业 比例 通信 传媒 2

10、6.56% 商业贸易 16.07% 通信 10.82% 机械设备 机械设备 15.12% 商业贸易 13.68% 非银金融 13.20% 农林牧渔 商业贸易 19.02% 非银金融 17.07% 农林牧渔 10.98% 建筑装饰 建筑装饰 25.00% 非银金融 18.53% 商业贸易 12.35% 商业贸易 商业贸易 20.21% 非银金融 18.96% 银行 17.29% 化工 商业贸易 17.60% 非银金融 14.64% 有色金属 10.08% 有色金属 有色金属 36.53% 非银金融 14.29% 商业贸易 12.86% 传媒 传媒 50.29% 商业贸易 13.53% 非银金融

11、11.18% 纺织服装 商业贸易 19.00% 非银金融 17.50% 银行 9.75% 采掘 非银金融 17.14% 商业贸易 13.33% 银行 13.02% 非银金融 非银金融 55.26% 银行 21.05% 商业贸易 6.84% 电气设备 商业贸易 15.87% 非银金融 14.84% 传媒 11.87% 钢铁 建筑装饰 30.30% 非银金融 16.97% 银行 9.09% 国防军工 国防军工 47.10% 非银金融 11.61% 机械设备 10.97% 数据来源:广发证券发展研究中心、互联网 18 基于大数据挖掘的关联个股投资机会 策略构建基准个股与关联个股所在行业相关性 -1

12、-0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 2013/1/14 2013/3/11 2013/5/6 2013/7/1 2013/8/19 2013/10/14 2013/12/2 2014/1/20 2014/3/17 2014/5/12 2014/7/7 2014/8/25 2014/10/27 2014/12/15 2015/2/2 2015/3/30 2015/5/25 银行与房地产行业相关性 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 2013/1/14 2013/3/4 2013/4/15 2013/6/3 2

13、013/7/22 2013/9/2 2013/10/21 2013/12/2 2014/1/13 2014/3/3 2014/4/21 2014/6/9 2014/7/21 2014/9/1 2014/10/27 2014/12/8 2015/1/19 2015/3/9 2015/4/27 2015/6/8 银行与非银金融行业相关性 数据来源:广发证券发展研究中心、Wind -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 2013/1/14 2013/3/11 2013/5/6 2013/7/1 2013/8/19 2013/10/14 2013/12/2 20

14、14/1/20 2014/3/17 2014/5/12 2014/7/7 2014/8/25 2014/10/27 2014/12/15 2015/2/2 2015/3/30 2015/5/25 医药生物与休闲服务行业相关性 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 2013/1/14 2013/3/11 2013/5/6 2013/7/1 2013/8/19 2013/10/14 2013/12/2 2014/1/20 2014/3/17 2014/5/12 2014/7/7 2014/8/25 2014/10/27 2014/12/15 2015

15、/2/2 2015/3/30 2015/5/25 银行与传媒行业相关性 策略构建策略构建框架 热门网站 雪球、东方财富、 和讯网、腾讯网、 新浪网 Python,Vba爬取 存储个股关注 度数据(共同关 注个股、共同 关注人数、共 同占比等字段) 数据库 形式存储 预 处 理 基准 与关 联个 股对 应 关联个股 共同关注占比 考虑基准个股与关联 个股前期涨跌幅 动态考虑基准个股与 关联个股行业相关性 关联 个股 选股 策略 构建 考虑基准个股与关联 个股成交量变化等 19 共同关注绝对量 基于大数据挖掘的关联个股投资机会 策略构建策略原理 20 基于大数据挖掘的关联个股投资机会 在历史回测期

16、,定期地计算基准个股中共同关注个股的关注人数以及共同关注占 比,选取共同关注的个股中关注度最高的前N只个股,动态地考虑基准个股与对应 的共同关注个股所在的行业的相关性,根据行业之间的相关性以及基准个股与关联 个股前一段时间的涨跌幅等因素,选择满足条件的关联个股为多头组合,同时以基 准个股为空头组合; 基于构建的多空组合,在下一个交易日以开盘价做多多头组合,以开盘价做空空头 组合,考虑涨跌停因素的影响; 初始资金为1,资金等权投资; 周频调仓; EMPIRICAL RESEARCH 03 | 实证分析 | 01 02 03 04 21 基于大数据挖掘的关联个股投资机会 实证分析-数据来源 22 基于大数据挖掘的关联个股投资机会 个股数据:2013年1月1日至今全市场个股开盘价、收盘价、

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 金融/证券 > 金融资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号