时间序列大作业.docx

上传人:大米 文档编号:562392652 上传时间:2023-12-02 格式:DOCX 页数:20 大小:435.72KB
返回 下载 相关 举报
时间序列大作业.docx_第1页
第1页 / 共20页
时间序列大作业.docx_第2页
第2页 / 共20页
时间序列大作业.docx_第3页
第3页 / 共20页
时间序列大作业.docx_第4页
第4页 / 共20页
时间序列大作业.docx_第5页
第5页 / 共20页
点击查看更多>>
资源描述

《时间序列大作业.docx》由会员分享,可在线阅读,更多相关《时间序列大作业.docx(20页珍藏版)》请在金锄头文库上搜索。

1、应用时间序列大作业课题:基于ARIMA模型的全国1980-2013年邮电业务函件数量时间序列分析及预测。姓名:贾县委 学号:1203650055 编号:48基于ARIMA模型全国1980-2013年邮电业务函件数量时间序列分析及预测 一.摘要时间序列就是按照时间的顺序记录的一列有序数据。对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走势。时间序列分析在日常生活中随处可见,有着非常广泛的应用领域。邮政与我们息息相关,他已经成为社会经济生活不可或缺的通信手段。在世界上,函各国都以件量来衡量一个国家的邮政发展水平,而我国的函件量增长却不容乐观,这勾起了我研究的兴趣,加上我本人又有集邮的

2、爱好,因此我选用了函件量进行分析研究。本文用时间序列分析方法,对一段时间序列进行了拟合。通过对1980至2013年全国邮电业务函件量序列进行观察分析,建立合适的ARIMA模型,对未来五个月的全国邮电业务函件量序列进行预测。然后对预测值和真实值进行比较,得出结论,所建立的模型有较好的拟合效果,从而提供了一个行情预测的有效方法。关键词:时间序列 函件量 ARIMA 时间序列分析 预测 二.前言邮政的最初发展史从人们的信函寄送需要开始的,现在邮政的众多业务也是借助经营函件业务而衍生出来的。目前,函件业务的主要包括为用户传递书面通信、文件资料和书籍等。他已经成为社会经济和生活不可缺少的通信手段。如果的

3、函件业务搞不好,邮政其他业务也就失去了赖以生存的基础,这将严重削弱邮政在社会中的地位和作用。 当前,世界各国都以函件量来衡量一个国家邮政发展水平,然而几十年随着经济建设的飞速发展,邮电业务的需求量迅猛增长,唯有函件业务增长不容乐观,与发达国家和甚至一些发展中国家相比还有很大差距。原因何在?因此,本文就以以我国1980-2013年全国邮电业务函件量的数据为研究对象,做时间序列分析。首先,对全国33年来全国邮电业务函件量的发展变化规律,运用SAS软件进行分析其发展趋势。再则,通过检验说明模型拟合效果的好坏,再利用模型对下一年进行预测。最后,从国家经济、政策和社会发展等方面对全国邮电业务函件量变化规

4、律及未来走势进行分析。ARIMA 模型建模思路(一)模型介绍:ARIMA 模型( p, d, q) 又称为自回归移动平均模型。其中AR 指自回归; p 为模型的自回归阶数; MA 为移动平均; q 为模型的移动平均阶数; I 指积分; d 为时间序列成为平稳之前必须取差分的次数。其一般的表达式为:(二) 建模思路:ARIMA 建模思路是: 假设所研究的时间序列是由某个随机过程产生的, 用实际统计序列建立、估计该随机过程的自回归移动平均模型, 并用此模型求出预测值。(三) 建模步骤:1. 观察时间序列。根据时间序的散点图自相关函数( ACF) 图和偏自相关函( PACF) 图以及ADF 单位根检

5、验观察其方差、趋势及其季节性变化规律, 识别该序列的平稳性。2. 对序列进行平稳化处理。如果数据序列是非平稳的, 并存在一定的增长或下降趋势, 则需对数据进行差分处理; 如果数据序列存在异方差性, 则需对数据进行对数转换或者开方处理, 直到处理后数据的自相关函数值和偏相关函数值无显著地异于零。3. 模型识别。若平稳时间序列的偏相关函数是截尾的, 而自相关函数是拖尾的, 则可断定此序列适合AR 模型; 若平稳时间序列的偏相关函数是拖尾的, 而自相关函数是截尾的, 则可断定此序列适合MA 模型; 若平稳时间序列的偏相关函数和自相关函数均是拖尾的, 则此序列适合ARMA 模型。4. 对ARIMA(

6、p, d, q) 模型定阶, 估计参数。5. 模型检验。进行假设检验, 诊断白噪声检验假设模型残差的ACF 值和PACF 值在早期或季节性延迟点处不得大于置信区间, 同时残差应理想化为0 均值。可观察残差的ACF图、PACF 图, 并辅以Dw 值、t 值等检验法。6. 预测分析。时间序列分析包括以下步骤: 分析时间序列的随机特性; 用实际统计序列构造预测模型; 根据所得模型做出最佳的预测值。ARIMA模型建模流程图(四)ARIMA(p,d,q)模型:在ARIMA模型的识别过程中,我们主要用到两个工具:自相关函数(ACF),偏自相关函数(PACF)以及它们各自的相关图。对于一个序列Xt来说,它的

7、第i阶自相关系数定义为它的i阶自协方差除以它的方差,它是关于i的函数,因此我们也称之为自相关函数,通常记ACF(i)。偏自相关函数PACF(i)度量了消除中间滞后项影响后两滞后变量之间的相关关系。 自相关系数和偏自相关系数这两个统计量来识别ARIMA(p,d,q)模型的系数特点和模型的阶数。并用游程检验经过处理的序列是否为平稳化的序列。模型定阶自相关系数偏自相关系数AR(p)拖尾P阶截尾MA(q)q阶截尾拖尾ARMA(p,q)拖尾拖尾三 数据预处理及具体模型(建模)1.数据录入:1980-2013年全国邮电业务函件量时间函件数(亿件)时间函件数(亿件)1980年33.131997年68.551

8、981年33.881998年65.511982年33.941999年60.521983年35.212000年77.711984年39.482001年86.931985年46.782002年106.011986年49.592003年103.841987年54.792004年82.811988年59.772005年73.511989年57.282006年71.311990年54.872007年69.501991年52.112008年73.631992年57.182009年75.321993年68.702010年74.011994年76.502011年73.781995年79.552012年70.7

9、41996年78.682013年63.412绘制时序图程序如下:data a;input a;time=1980+_n_-1;cards;33.1333.8833.9435.2139.4846.7849.5954.7959.7757.2854.8752.1157.1868.7076.5079.5578.6868.5565.5160.5277.7186.93106.01103.8482.8173.5171.3169.5073.6375.3274.0173.7870.7463.41;Proc gplot;plot a*time;symbol1v=star i=join c=black;run;原时

10、序图由时序图可以看出,序列具有有递增长期趋势,为非平稳时间序列。因此,先进性一阶差分,程序如下:data a;input a;difa=dif(a);time=1980+_n_-1;cards;33.1333.8833.9435.2139.4846.7849.5954.7959.7757.2854.8752.1157.1868.7076.5079.5578.6868.5565.5160.5277.7186.93106.01103.8482.8173.5171.3169.5073.6375.3274.0173.7870.7463.41;procgplot;plot a*time difa*tim

11、e;symbol1v=star i=join c=black;run;一阶差分时序图直观检验,一阶仍不具有明显的平稳性,因此再进行二阶差分检验。二阶差分程序如下:data a;input a;difa=dif(dif(a);time=1980+_n_-1;cards;33.1333.8833.9435.2139.4846.7849.5954.7959.7757.2854.8752.1157.1868.7076.5079.5578.6868.5565.5160.5277.7186.93106.01103.8482.8173.5171.3169.5073.6375.3274.0173.7870.7

12、463.41;procgplot;plot a*time difa*time;symbol1v=star i=join c=black;run;二阶差分时序图经过直观检验,二阶差分时序图明显具有平稳性,因此可以进行纯随机性检验。3纯随机性检验程序如下:proc arima;identify var=a(1,1);run;由二阶差分时序图和白噪声检验,可以直观看出,可知P值0.05,该时序图平稳,未通过白噪声检验,故对差分序列进行拟合ARMA模型。4定阶:4.1根据相对最优定阶:程序如下:proc arima;identify var=a(1,1) nalg=8 minic p=(0:5) q=

13、(0:5);run;分析结果如下根据最优模型定阶,BIC最小原则。程序如下:proc arima;identify var=a(1,1) nalg=8 minic p=(0:5) q=(0:5);run;estimate p=3 ;run;p=3,时,分析结果如下:本例有参数不显著,残差的自相关检验通过检验,因此拟合仍然失败。所以排除用此模型的可能。4.2根据自相关图和偏自相关图定阶:由差分后的自相关图和偏自相关图可知偏自相关图具有二阶截尾性,自相关图有一阶截尾性所以可以尝试MA(1),AR(2)进行拟合。4.3拟合MA(1)进行拟合程序如下:proc arima;identify var=a

14、(1,1);estimate q=1;run;本例所有参数常数项不显著,残差的自相关检验都未通过检验,因此,拟合仍然失败。所以排除用此模型的可能。4.4拟合AR(2)进行拟合程序如下:proc arima;identify var=a(1,1);run;estimate p=2;run;有图可以看出残差自相相关显著,但参数检验常数项不显著,所以尝试选择NOINT选项,除去常数项,程序如下:proc arima;identify var=a(1,1);run;estimate p=2 noint;run;由参数的显著性检验可知,参数的T统计量的P0.05,所以拟合模型显著成立。拟合模型的具体形式如下:该输出形式的等价于:xt=(1-1.12892B+0.74178B2)et或记为:xt=et-1.12892et-1+0.74178et-2总结:我们通过最优定阶和自相关图分别选取了ARMA(3,2,0)和ARMA(2

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号