r语言期末实验报告预测股票河北钢铁

上传人:第*** 文档编号:31080166 上传时间:2018-02-04 格式:DOC 页数:32 大小:341.39KB
返回 下载 相关 举报
r语言期末实验报告预测股票河北钢铁_第1页
第1页 / 共32页
r语言期末实验报告预测股票河北钢铁_第2页
第2页 / 共32页
r语言期末实验报告预测股票河北钢铁_第3页
第3页 / 共32页
r语言期末实验报告预测股票河北钢铁_第4页
第4页 / 共32页
r语言期末实验报告预测股票河北钢铁_第5页
第5页 / 共32页
点击查看更多>>
资源描述

《r语言期末实验报告预测股票河北钢铁》由会员分享,可在线阅读,更多相关《r语言期末实验报告预测股票河北钢铁(32页珍藏版)》请在金锄头文库上搜索。

1、SAS 与数据分析方法实验课程实验报告实验地点:81008实验时间:2015 年 1 月 11 日成绩: _班级 姓名 学号数学一班 杨燕 2012102184数学一班 胡露霞 2012102175实验成绩评定表优秀(100x90)良好(90x80)中等(80x70)及格(70x60)不及格(x60)项目 分值参考标准 参考标准 参考标准 参考标准 参考标准实验 态度 15实验态度认真,科学作风严谨, 严格保证实验时间并按指导书中规定的进度开展各项工作。实验态度比较认真,科学作风良好,能按期圆满完 成指导书规定的任务。实验态度尚好,遵守组织纪律,保证实验时间,能按期完成各项工作。实验态度尚可,

2、能遵守组织纪律,能按 期完成任务。学习马虎,纪律涣散,工作作风不严谨,不能保证实验时间和进度。实验 准备 20认真预习实验指导书,实验步骤明确,实验准备充分。预习实验指导书,实验步骤较明确,实验准备较充分。预习实验指导书,实验步骤基本明确。预习实验指导书,实验主要步骤基本明确。不预习实验指 导书,实验主要步骤不明确。实验 能力 40实验方法正确,数据处理及数 据符合专业要求,实验数据真实、完整、准确,对相关问题有很强的分析能力和概括能力。实验方法正确,实验数据 真实较完整,个别数据不合格,数据处理及数据较 符合专业要求,对相关问题有较强的分析能力和概括能力。实验方法正确,实验数据基本完整,个别

3、数据不合格,数据处理及数据基本符合专业要求,对相关问题有一定的分析能力和概括能力。实验方法基本正确, 实验数据有较多不合格,但态度端正,能基本按要求操作, 但整体效果不理想, 综合能力很差。实验方法不正确,不能完成实验报告,缺乏对相关问题分析和概况的基本能力。报告 撰写 质量 及规范化25实验报告内容完整,数据处理规范,作图认真细致、表格规范、清晰,字迹工整,完全符合规范化实验报告内容较完整,数据处理较规范,作图较细致、表格较规范,字迹较工整。实验报告内容达到基本要求,数据处理基本规范,作图较细致、表格较规范,字有实验报告,内容不完整。有实验步骤,不详细。实验报告格式欠规范,作图不太规范实验报

4、告数 据记录不完 整,不作图, 不处理数据。 完全抄袭别 人报告等。要求。 迹基本工整。 等。指导教师评定成绩: 指导教师签名: 年 月 日预测股票市场收益问题描述与目标股票交易市场绝对是数据挖掘技术的实战之地,事实上,数据挖掘技术在处理大量历史数据时要比人工检验更加优越,更加高效,另外,研究者声称,市场通过价格调整而发生快速变化,导致很难捕捉到持续盈利的投资方式,这就是所谓的有效市场假说,它表示在一个市场中如果价格能反映所有可获得信息,这种市场就成为有效市。但这一理论很快就被更加松弛的版本取代,因为有效市场并不一定永远是有效的,所以这也为交易机随时留有余地。一般股票交易的目的就是通过买单卖单

5、来维持一组证券资产。长期目标就是通过交易行为获得尽可能多的利润。本章我们的主要内容就限定在这个领域,基于既定的有价证券全要求和初始资本,我们会尽量扩大某一交易方式下未来的交易收益。我们的交易策略就是把数据挖掘的结果作为基本的决策信号,用于指导交易行为。这里的数据挖掘首先是基于历史报价构建模型,然后通过模型预测指数未来的变化趋势。我们的模型会被整合成一个交易系统,用来依据预测结果进行交易决策。另外,我们通过交易系统的表现作为评价准则,简单的说就是系统的交易行为所带来的获利和损失,以及其他一些投资者感兴趣的统计值。因此,通过数据挖掘过程所获得知识进行交易,这些交易获得的最终收益才是我们评价系统的标

6、准,而不仅仅是模型预测的准确性二、从网站上获取数据获取数据的一种方法是使用 Yahoo 财经网站提供的免费服务。数据的结构:交易的日期、开盘价、最高价、最低价、收盘价、交易量、调整的收盘价为简单起见,用的是股票指数的数据处理时间序列的包 zoo,xts,后者是前者的拓展表示的处理时间的类;POSIXct/POSIXIt,date从 CSV 文件读数据从网络读取数据Quantmod 包里的 getSymbols()从数据库读数据:包 RODBC,RMySQL获取数据如下:library(quantmod)library(tseries)YT tgt.margin | x 10)1 ADX.HB.

7、ADX Volat.HB 我们将在我们的模拟尝试中使用这些变量。利用变量重要性信息,我们可以得到最终用于建立模型的数据集: colnames(HB) 0) orders 0)orders = hold.time)orders 0) orders 0)orders positions: init.cap : 1e+06 trans.cost : 5 policy.func : policy.1 policy.pars : summary(t1)结果:= Summary of a Trading Simulation with 500 days =Trading policy function :

8、 policy.1 Policy function parameters:exp.prof = 0.05 bet = 0.2 hold.time = 30 Transaction costs : 5 Initial Equity : 1e+06 Final Equity : 973769.3 Return : -2.62 %Number of trading positions: 49 Use function tradingEvaluation() for further stats on this simulation.函数 tradingEvaluation()用于获得在模拟交易期间的一

9、系列表示交易效果的经济指标:tradingEvaluation(t1)结果:NTrades NProf PercProf PL Ret RetOverBH 49.00 22.00 44.90 -26230.67 -2.62 -11.91 MaxDD SharpeRatio AvgProf AvgLoss AvgPL MaxProf 95834.80 -0.02 4.86 -4.25 -0.16 6.58 MaxLoss -6.35 也可以使用函数 plot(),绘制一个交易效果的概览图:plot(t1,market,theme=white,name=河北钢铁)结果:Rentability =

10、-2.623067 %2.53.03.54.04.5北北北北 2004-12-08/2006-11-07Last 4.47Equity () :973769.328950000100000010500001100000N.Stocks () :-43030.000-50000050000一一一 08 2004 一一 02 2005 一一 03 2005 一一 01 2006 一一 01 2006显然效果不好,收益为负数,因此,采用第二个交易策略,看看下面的代码:t2 -trading.simulator(market,sig,policy.2,list(exp.prof=0.05,bet=0.

11、3)summary(t2)结果:= Summary of a Trading Simulation with 500 days =Trading policy function : policy.2 Policy function parameters:exp.prof = 0.05 bet = 0.3 Transaction costs : 5 Initial Equity : 1e+06 Final Equity : 930562.4 Return : -6.94 %Number of trading positions: 315 Use function tradingEvaluatio

12、n() for further stats on this simulation.tradingEvaluation(t2)结果:NTrades NProf PercProf PL Ret RetOverBH 315.00 179.00 56.83 -69437.60 -6.94 -16.23 MaxDD SharpeRatio AvgProf AvgLoss AvgPL MaxProf 308218.42 -0.01 5.30 -4.72 0.97 39.09 MaxLoss -6.35 使用相同的交易信号,但应用不同的交易策略,收益率不同。让我们用一个不同的训练和测试时间段再做一次实验:s

13、tart - 1500len.tr - 1000len.ts - 500tr - start:(start+len.tr-1)ts - (start+len.tr):(start+len.tr+len.ts-1)s - svm(Tform,Tdata.traintr,cost=10,gamma=0.01)p - predict(s,Tdata.traints,)sig - trading.signals(p,0.1,-0.1)t2 - trading.simulator(market,sig,policy.2,list(exp.prof=0.05,bet=0.3)summary(t2)trad

14、ingEvaluation(t2)这次模拟交易应用了相同的建模技术和相同的交易策略,获得了相当的结果。这里得到的主要经验是:需要可靠的统计估计。不要被少数几次的重复实验结果所愚弄,即使测试期区间为两年也是不够的。我忙呢需要不同条件下更多的重复次数,以确保所得的结果在统计上是可靠的。对于时间序列模型尤其如此,这类模型的不同时期可能有不同的模式。六、模型评价和选择1、蒙特卡罗估计蒙特卡罗方法的基本思想当所求解问题是某种随机事件出现的概率,或者是某个随机变量的期望值时,通过某种“实验”的方法,以这种事件出现的频率估计这一随机事件的概率,或者得到这个随机变量的某些数字特征,并将其作为问题的解。蒙特卡罗

15、方法的工作过程在解决实际问题的时候应用蒙特卡罗方法主要有两部分工作:用蒙特卡罗方法模拟某一过程时,需要产生各种概率分布的随机变量。用统计方法把模型的数字特征估计出来,从而得到实际问题的数值解。蒙特卡罗方法分子模拟计算的步骤使用蒙特卡罗方法进行分子模拟计算是按照以下步骤进行的:使用随机数发生器产生一个随机的分子构型。对此分子构型的其中粒子坐标做无规则的改变,产生一个新的分子构型。计算新的分子构型的能量。比较新的分子构型于改变前的分子构型的能量变化,判断是否接受该构型。若新的分子构型能量低于原分子构型的能量,则接受新的构型,使用这个构型重复再做下一次迭代。若新的分子构型能量高于原分子构型的能量,则计算玻尔兹曼常数,同时产生一个随机数。若这个随机数大于所计算出的玻尔兹曼因子,则放弃这个构型,重新计算。若这个随机数小于所计算出的玻尔兹曼因子,则接受这个构型,使用这个

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号