时间序列完整教程R

上传人:大米 文档编号:511909021 上传时间:2022-12-17 格式:DOC 页数:19 大小:281KB
返回 下载 相关 举报
时间序列完整教程R_第1页
第1页 / 共19页
时间序列完整教程R_第2页
第2页 / 共19页
时间序列完整教程R_第3页
第3页 / 共19页
时间序列完整教程R_第4页
第4页 / 共19页
时间序列完整教程R_第5页
第5页 / 共19页
点击查看更多>>
资源描述

《时间序列完整教程R》由会员分享,可在线阅读,更多相关《时间序列完整教程R(19页珍藏版)》请在金锄头文库上搜索。

1、word时间序列完整教程(R)简介在商业应用中,时间是最重要的因素,能够提升成功率。然而绝大多数公司很难跟上时间的脚步。但是随着技术的开展,出现了很多有效的方法,能够让我们预测未来。不要担心,本文并不会讨论时间机器,讨论的都是很实用的东西。本文将要讨论关于预测的方法。有一种预测是跟时间相关的,而这种处理与时间相关数据的方法叫做时间序列模型。这个模型能够在与时间相关的数据中,找到一些隐藏的信息来辅助决策。当我们处理时间序列数据的时候,时间序列模型是非常有用的模型。大多数公司都是基于时间序列数据来分析第二年的销售量,流量,竞争地位和更多的东西。然而很多人并不了解时间序列分析这个领域。所以,如果你不

2、了解时间序列模型。这篇文章将会向你介绍时间序列模型的处理步骤以与它的相关技术。本文包含的内容如下所示:目录* 1、时间序列模型介绍* 2、使用R语言来探索时间序列数据* 3、介绍ARMA时间序列模型* 4、ARIMA时间序列模型的框架与应用1、时间序列模型介绍本节包括平稳序列,随机游走,Rho系数,Dickey Fuller检验平稳性。如果这些知识你都不知道,不用担心-接下来这些概念本节都会进展详细的介绍,我敢打赌你很喜欢我的介绍的。平稳序列判断一个序列是不是平稳序列有三个评判标准:1. 均值 ,是与时间t 无关的常数。如下图左满足平稳序列的条件,如下图右很明显具有时间依赖。1. 方差 ,是与

3、时间t 无关的常数。这个特性叫做方差齐性。如下图显示了什么是方差对齐,什么不是方差对齐。注意右图的不同分布。2. 协方差 ,只与时期间隔k有关,与时间t 无关的常数。如如下图右,可以注意到随着时间的增加,曲线变得越来越近。因此红色序列的协方差并不是恒定的。我们为什么要关心平稳时间序列呢?除非你的时间序列是平稳的,否如此不能建立一个时间序列模型。在很多案例中时间平稳条件常常是不满足的,所以首先要做的就是让时间序列变得平稳,然后尝试使用随机模型预测这个时间序列。有很多方法来平稳数据,比如消除长期趋势,差分化。随机游走这是时间序列最根本的概念。你可能很了解这个概念。但是,很多工业界的人仍然将随机游走

4、看作一个平稳序列。在这一节中,我会使用一些数学工具,帮助理解这个概念。我们先看一个例子例子:想想一个女孩在一个巨型棋盘上面随意移动。这里,下一个位置只取决于上一个位置。现在想象一下,你在一个封闭的房间里,不能看见这个女孩。但是你想要预测不同时刻这个女孩的位置。怎么才能预测的准一点?当然随着时间的推移你预测的越来越不准。在t=0时刻,你肯定知道这个女孩在哪里。下一个时刻女孩移动到附件8块方格中的一块,这个时候,你预测到的可能性已经降为1/8。继续往下继续预测,现在我们将这个序列公式化:$X(t) = X(t-1) + Er(t)$这里的$Er_t$代表这这个时间点随机干扰项。这个就是女孩在每一个

5、时间点带来的随机性。现在我们递归所有x时间点,最后我们将得到下面的等式:$X(t) = X(0) +Sum(Er(1),Er(2),Er(3).Er(t)$现在,让我们尝试验证一下随机游走的平稳性假设:1. 是否均值为常数?EX(t) = EX(0) + Sum(EEr(1),EEr(2),EEr(3).EEr(t)我们知道由于随机过程的随机干扰项的期望值为0.到目前为止:EX(t) = EX(0) = 常数2. 是否方差为常数?VarX(t) = VarX(0) + Sum(VarEr(1),VarEr(2),VarEr(3).VarEr(t)VarX(t) = t * Var(Error)

6、 = 时间相关因此,我们推断,随机游走不是一个平稳的过程,因为它有一个时变方差。此外,如果我们检查的协方差,我们看到协方差依赖于时间。我们看一个更有趣的东西我们已经知道一个随机游走是一个非平稳的过程。让我们在方程中引入一个新的系数,看看我们是否能制定一个检查平稳性的公式。Rho系数X(t) = Rho * X(t-1) + Er(t) 1现在,我们将改变Rho看看我们可不可以让这个序列变的平稳。这里我们只是看,并不进展平稳性检验。让我们从一个Rho=0的完全平稳序列开始。这里是时间序列的图:将Rho的值增加到0.5,我们将会得到如如下图:你可能会注意到,我们的周期变长了,但根本上似乎没有一个严

7、重违反平稳性的假设。现在让我们采取更极端的情况下= 0.9我们仍然看到,在一定的时间间隔后,从极端值返回到零。这一系列也不违反非平稳性。现在,让我们用= 1随机游走看看这显然是违反固定条件。是什么使rho= 1变得这么特殊的呢?这种情况并不满足平稳性测试?我们来找找这个数学的原因公式X(t) = Rho * X(t-1) + Er(t)的期望为:EX(t) = Rho *E X(t-1)这个公式很有意义。下一个X(或者时间点t)被拉到Rho*上一个x的值。例如,如果xt1= 1,EXT = 0.5Rho= 0.5。现在,如果从零移动到任何方向下一步想要期望为0。唯一可以让期望变得更大的就是错误

8、率。当Rho变成1呢?下一步没有任何可能下降。Dickey Fuller Test平稳性这里学习的最后一个知识点是Dickey Fuller检验。在统计学里,Dickey-Fuller检验是测试一个自回归模型是否存在单位根。这里根据上面Rho系数有一个调整,将公式转换为Dickey-Fuller检验X(t) = Rho * X(t-1) + Er(t)= X(t) - X(t-1) = (Rho - 1) X(t - 1) + Er(t)我们要测试如果Rho1=0是否差异显著。如果零假设不成立,我们将得到一个平稳时间序列。平稳性测试和将一个序列转换为平稳性序列是时间序列模型中最重要的局部。接下

9、来就看看时间序列的例子。2、使用R探索时间序列本节我们将学习如何使用R处理时间序列。这里我们只是探索时间序列,并不会建立时间序列模型。本节使用的数据是R中的内置数据:AirPassengers。这个数据集是1949-1960年每个月国际航空的乘客数量的数据。载入数据集下面的代码将帮助我们载入数据集并且能够看到一些少量的数据集。 data(AirPassengers)#载入数据 class(AirPassengers) 1 ts#查看AirPassengers数据类型,这里是时间序列数据 start(AirPassengers) 1 19491#这个是Airpassengers数据开始的时间 e

10、nd(AirPassengers) 1 196012#这个是Airpassengers数据完毕的时间 frequency(AirPassengers) 1 12#时间序列的频率是一年12个月 summary(AirPassengers)Min. 1st Qu. MedianMean3rd Qu. Max.矩阵中详细数据#The number of passengers are distributed across the spectrum plot(AirPassengers)#绘制出时间序列abline(reg=lm(AirPassengerstime(AirPassengers)# 拟合一

11、条直线 cycle(AirPassengers) Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec1949 1 2 3 4 5 6 7 8 9 10 11 121950 1 2 3 4 5 6 7 8 9 10 11 121951 1 2 3 4 5 6 7 8 9 10 11 121952 1 2 3 4 5 6 7 8 9 10 11 121953 1 2 3 4 5 6 7 8 9 10 11 121954 1 2 3 4 5 6 7 8 9 10 11 121955 1 2 3 4 5 6 7 8 9 10 11 121956 1 2 3

12、4 5 6 7 8 9 10 11 121957 1 2 3 4 5 6 7 8 9 10 11 121958 1 2 3 4 5 6 7 8 9 10 11 121959 1 2 3 4 5 6 7 8 9 10 11 121960 1 2 3 4 5 6 7 8 9 10 11 12#打印每年的周期 plot(aggregate(AirPassengers,FUN=mean)#绘制 boxplot(AirPassengerscycle(AirPassengers)#绘制盒图重要推论1. 每年的趋势显示旅客的数量每年都在增加;2. 七八月的均值和方差比其他月份要高很多;3. 每个月的平均值并

13、不一样,但是方差差异很小。因此,可以看出具有很强的周期性,一个周期为12个月或更少。查看数据,试探数据是建立时间序列模型最重要的一部-如果没有这一步,你将不知道这个序列是不是平稳序列。就像这个例子一样,我们已经知道了关于这个模型的很多细节。接下来我们会建立一些时间序列模型以与这些模型的特征,也会做一些预测。3、ARMA时间序列模型ARMA也叫自回归移动平均混合模型。ARMA模型经常在时间序列中使用。在ARMA模型中,AR代表自回归,MA代表移动平均。如果这些术语听起来很复杂,不用担心-下面将会用几分钟的时间简单介绍这些概念。我们现在就会介绍这些模型的特点。在开始之前,你首先要记住,AR或者MA

14、并不是应用在非平稳序列上的。在实际应用中可能会得到一个非平稳序列,你首先要做的就是将这个序列变成平稳序列通过差分/转换,然后选择可以使用的时间序列模型。首先,本文将分开介绍两个模型AR&MA。接下来我们看一看这些模型的特点。自回归时间序列模型让我们从下面的例子理解AR模型:假设一个国家的GDPx(t)依赖与去年的GDPx(t-1)。这个假设明确,一个国家今年的GDP总值依赖于去年的GDP总值和今年的新开的工厂和服务。但是GDP的主要依赖于去年的GDP。那么,GDP的公式为:x(t) = alpha * x(t 1) + error (t) 1这个等式就是AR公式。公式1表示下一个点完全依赖与前面一个点。alpha是一个系数,希望能够找到alpha最小化错误率。x(t-1)同样依赖x(t)。例如,x(t)代表一个城市在某一天的果汁的销售量。在冬天,极少的供给商进果汁。突然有一天,温度上升了,果汁的需求猛增到1000.然而过了几天,气温又下降了。但是众所周知,人们在热天会喝果汁,这些人会有50%在冷天仍然喝果汁。在接下来的几天,这个比例降到了25%(50%的50%

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号