《R语言商务数据分析实战》教学课件—05金融服务机构资金流量预测

上传人:sat****105 文档编号:290121303 上传时间:2022-05-09 格式:PPT 页数:40 大小:5.65MB
返回 下载 相关 举报
《R语言商务数据分析实战》教学课件—05金融服务机构资金流量预测_第1页
第1页 / 共40页
《R语言商务数据分析实战》教学课件—05金融服务机构资金流量预测_第2页
第2页 / 共40页
《R语言商务数据分析实战》教学课件—05金融服务机构资金流量预测_第3页
第3页 / 共40页
《R语言商务数据分析实战》教学课件—05金融服务机构资金流量预测_第4页
第4页 / 共40页
《R语言商务数据分析实战》教学课件—05金融服务机构资金流量预测_第5页
第5页 / 共40页
点击查看更多>>
资源描述

《《R语言商务数据分析实战》教学课件—05金融服务机构资金流量预测》由会员分享,可在线阅读,更多相关《《R语言商务数据分析实战》教学课件—05金融服务机构资金流量预测(40页珍藏版)》请在金锄头文库上搜索。

1、第第5章章 金融服金融服务务机构机构资资金流量金流量预测预测R语言商务数据分析实战语言商务数据分析实战1检验数据的平稳性目目录录了解金融服务机构现状与资金流量预测2检验数据的纯随机性3建立ARIMA模型4小结5分析金融服分析金融服务务机构机构现现状状金融全球化的浪潮正以一种不可抗拒的趋势席卷全球,而伴随着我国加入WTO(世界贸易组织)以及社会主义市场经济的快速发展,我国的金融市场也随之迅猛发展。一方面,金融活动在将储蓄转化为投资,在疏导社会资金流通,发挥实物资金流量的作用等方面都扮演着重要的角色。另一方面,金融资金流量规模的过快增长,大大地超过实物资金流量的增长,又会给市场带来供不应求,物价上

2、涨等经济不稳定现象。为了更有效地发挥金融活动对于实体经济的意义,资金流量预测成为金融服务机构又一重要任务。了解金融服了解金融服务务机构用机构用户户申申购赎购赎回数据的基本情况回数据的基本情况特征含义示例user_id用户id1234report_date日期20140407tBalance今日余额109004yBalance昨日余额97389total_purchase_amt今日总购买量直接购买收益21876目前该金融服务机构已积累了大量用户资金流入与资金流出的记录,包含2013年7月1日至2014年8月31日的申购和赎回信息,以及所有的子类目信息。数据经过脱敏处理,脱敏之后的数据,基本保持

3、了原数据分布。数据主要包括用户操作时间和操作记录,其中操作记录包括申购和赎回两个部分。申购意味着资金流入,赎回意味着资金流出。金额的单位是分,即0.01元人民币。如果用户今日消费总量为0,即consume_amt=0,则四个子类目为空。数据如表所示。特征含义示例direct_purchase_amt今日直接购买量21863purchase_bal_amt今日支付宝余额购买量0purchase_bank_amt今日银行卡购买量21863total_redeem_amt今日总赎回量消费转出10261consume_amt今日消费总量0transfer_amt今日转出总量10261tftobal_a

4、mt今日转出到支付宝余额总量0tftocard_amt今日转出到银行卡总量10261share_amt今日收益13category1今日类目1消费总额0category2今日类目2消费总额0category3今日类目3消费总额0category4今日类目4消费总额0了解金融服了解金融服务务机构用机构用户户申申购赎购赎回数据的基本情况回数据的基本情况续表基于企业希望精确预测资金流入流出数量的需求,设定目标为:预测该金融服务机构8月每天的申购总额和赎回总额,并与真实值进行对比,得到相对最优模型。案例目案例目标标企业资金流量的预测主要可以从资金流入和资金流出这两方面进行。资金的流入主要包括营业活动、

5、投资活动和筹资活动的资金流入。资金的流出主要包括营业活动、投资活动和筹资活动的资金流出。营业活动的资金流出主要包括期间费用的支付,各种税金的支付等。企业可以通过一定期间内资金的流入和流出来推断出当前企业内部的资金量。企业也可以根据未来可能的资金流入和流出量,并结合自身对于风险偏好程度,来设定一个合理的资金分配计划。认识资认识资金流量金流量预测预测熟悉金融服熟悉金融服务务机构机构资资金流量金流量预测预测的步的步骤骤与流程与流程1检验数据的平稳性目目录录了解金融服务机构现状与资金流量预测2检验数据的纯随机性3建立ARIMA模型4小结5平稳时间序列有两种定义,根据限制条件的严格程度,分为严平稳时间序

6、列和宽平稳时间序列。严平稳:是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才能被认为是平稳的。宽平稳:是使用序列的特征统计量来定义的一种平稳性,它认为序列的统计性质主要由它的低阶矩来决定,所以只要保证序列低阶矩(二阶)平稳,就能保证序列的主要性质近似稳定。检验检验平平稳稳性性1.平稳时间序列的定义严平稳比宽平稳的条件严格。严平稳是对序列联合分布的要求,以保证序列所有的统计特征都相同;而宽平稳只要求序列二阶平稳,对于高于二阶的矩没有任何要求。所以通常情况下,严平稳序列也满足宽平稳条件,而宽平稳序列不能反推严平稳成立。但这不是绝对的,两种情况

7、都有特例。例如,服从柯西分布的严平稳序列就不是宽平稳序列,因为它不存在一、二阶矩。而当序列服从多元正态分布时,二阶平稳可以推出严平稳。检验检验平平稳稳性性严平稳与宽平稳比较检验序列的平稳性有两种方法。一种是根据时序图和自相关图现实的特征做出判断的图检验方法。另一种是构造检验统计量进行假设检验的方法。检验检验平平稳稳性性2.平稳性的检验方法(1)时序图检验根据平稳时间序列均值和方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界的特点。检验检验平平稳稳性性主要介绍采用图检验方法检验资金流入数据的平稳性。(2)自相关图检验在R语言中使用acf函数绘制序

8、列自相关图,其基本使用语法如下。acf(x, lag.max = NULL, .)常用参数如表所示。检验检验平平稳稳性性参数名称说明x接收数据集。无默认。lag.max接收int。表示延迟阶数。若用户不特殊指定的话,系统会根据序列长度自动指定延迟阶数。(2)自相关图检验自相关图是一个平面二维坐标悬垂线图。横坐标表示延迟时期数,纵坐标表示自相关系数,悬垂线表示自相关系数的大小。申购数据的自相关图如图所示。检验检验平平稳稳性性由于模型要求,需要将非平稳的时间序列转化成平稳的时间序列,常用的方法有以下两种。通过时序图截取平稳部分数据。差分运算。处处理非平理非平稳稳序列序列通过数据时序图可以看出,20

9、14年3月后的数据在一个值附近随机波动。本案例的目标是预测资金申购量,前期的资金申购量受新用户人数影响,处于增长状态,后期的数据由于用户数量稳定,表现得更加平稳,有规律。基于探索结果,决定选取2014年3月至7月的数据作为模型训练数据,选取2014年8月的数据作为模型测试数据。截取后的训练数据的时序图如图所示。处处理非平理非平稳稳序列序列1.截取平稳部分数据截取后的训练数据的自相关图如图所示。处处理非平理非平稳稳序列序列1.截取平稳部分数据差分(difference)又名差分函数或差分运算,差分的结果反映了离散量之间的一种变化,是研究离散数学的一种工具。在时间序列分析中,差分可以用来提取序列中

10、蕴含的确定性信息。在R语言中使用diff函数完成各种差分运算,其基本使用语法如下。diff(x, lag = 1, differences = 1, .)常用参数及其说明,如表所示。处处理非平理非平稳稳序列序列2.差分运算参数名称说明x接收数据集。无默认lag接收int。表示差分的步长。默认为1。differences接收int。表示差分的次数。默认为1。对资金申购以7天为周期做一次差分,得到的时序图如图所示。处处理非平理非平稳稳序列序列2.差分运算根据进行差分后的数据绘制自相关图,如图所示。处处理非平理非平稳稳序列序列2.差分运算还可以使用统计检验方法中的单位根检验加以辅助判断序列是否平稳。

11、单位根检验结果如表所示。处处理非平理非平稳稳序列序列2.差分运算检验类型检验函数P值结论平稳性检验adf.test0.01该序列为平稳序列根据单位根检验结果可知,该数据已转化成平稳序列,可进行纯随机性检验。1检验数据的平稳性目目录录了解金融服务机构现状与资金流量预测2检验数据的纯随机性3建立ARIMA模型4小结5纯随机性检验也称为白噪声检验,是专门用来检验序列是否为纯随机序列的一种方法。如果一个序列是纯随机序列,那么它的序列值之间应该没有任何相关关系。在R语言中使用Box.test函数进行纯随机性检验,其基本使用语法如下。Box.test(x, lag = 1, type = c(Box-Pi

12、erce, Ljung-Box), fitdf = 0)常用参数及其说明,如表所示。检验纯检验纯随机性随机性参数名称说明x接收数据集。无默认。lag接收特定int。表示延迟阶数。默认为1。type接收特定character。表示检验统计量的类型,选项Box-Pierce表示输出纯随机性检验的Q统计量,选项Ljung-Box表示输出纯随机性检验的LB统计量。默认为Box-Pierce。对经过差分后达到平稳的数据进行纯随机性检验,得到结果如表所示。检验纯检验纯随机性随机性检验类型检验函数P值结论纯随机性检验Box.test2.631e-07该序列不是纯随机序列根据纯随机性检验的结果可知,因为P值小

13、于显著性水平0.05,所以该序列为非纯随机序列。1检验数据的平稳性目目录录了解金融服务机构现状与资金流量预测2检验数据的纯随机性3建立ARIMA模型4小结5原理:ARIMA模型全称为自回归积分滑动平均模型,其中ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归,p为自回归项;MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。差分运算具有强大的确定性信息提取能力,许多非平稳序列差分后会显示出平稳序列的性质。适用范围:ARIMA模型对绝大多数以时间为变量的序列都有比较好的拟合效果,可广泛运用于气温、股票、降水量、商品价格等的研究之中。优缺点:ARIMA模型的优点

14、在于对许多时间序列都适用,并且在建模过程中有多种方法可以选择,并且在模型的诊断中能够对模型的好坏进行评价,对预测起到很好的作用。但是,ARIMA模型对数据进行预测时,对短期预测效果还是比较好的,但随着时间的延长,其预测误差就比较大了。了解了解ARIMA模型模型识别识别模型模型阶阶数数识别识别模型模型阶阶数数对通过平稳性检验和纯随机性检验的数据建立ARIMA模型。首先识别模型的阶数,在这里将采用BIC准则进行定阶。在R语言中,可以使用TSA包中的armasubsets函数并画出BIC图来进行BIC准则定阶,其基本语法如下。armasubsets(y, nar, nma, y.name = Y,

15、ar.method = ols, .)常用参数及其说明,如表所示。建立建立ARIMA模型模型1.模型定阶参数名称说明y接收时间序列数据。表示需要进行定阶的数据集。无默认。nar接收int。表示AR模型最大阶数,即最大p值。无默认。nma接收int。表示MA模型最大阶数,即最大q值。无默认。原序列的BIC图如图所示。建立建立ARIMA模型模型1.模型定阶周期差分序列的BIC图如图所示。建立建立ARIMA模型模型1.模型定阶模型定阶参数如表所示。建立建立ARIMA模型模型1.模型定阶模型编号pdqPDQ100301120031113003311400401150041116004311710301

16、18103111910331110104011在R语言中,使用Arima函数拟合ARIMA模型,其基本语法如下。Arima(y, order=c(0,0,0), seasonal=c(0,0,0), include.mean=TRUE, method=c(CSS-ML,ML,CSS),.)常用参数及其说明,如表所示。建立建立ARIMA模型模型2.模型建立与模型检验参数名称说明y接收单变量时间序列。表示需要进行拟合的序列。无默认。order接收vector。表示指定模型的阶数。order=c(p,d,q),p、d、q对应p值、d值、q值。默认order=c(0,0,0)。seasonal接收vector。表示指定季节性或周期性模型的阶数。seasonal=c(P,D,Q),P、D、Q对应周期差分后的P值、D值、Q值。默认seasonal=c(0,0,0)。include.mean 接收boolean。表示是否包含常数项。默认为TRUE。method接收指定character。表示指定参数估计方法,CSS-ML表示条件最小二乘与极大似然估计混合方法;ML表示极大似然估计;CSS表示条件最小

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号