华南农业大学数学建模培训资料 时间序列中常用预测技术 一个时间序列是一组对于某一变量连续时间点或连续时段上的观测值本专题中,我们将介绍时间序列中常用的预测技术预测方法一般可以分为定量和定性两类,我们仅仅讨论定量法 1. 移动平均法 移动平均法是一种简单平滑预测技术, 它的基本思想是: 根据时间序列资料、逐项推移, 依次计算包含一定项数的序时平均值, 以反映长期趋势的方法 因此,当时间序列的数值由于受周期变动和随机波动的影响,起伏较大,不易显示出事件的发展趋势时,使用移动平均法可以消除这些因素的影响,显示出事件的发展方向与趋势(即趋势线) ,然后依趋势线分析预测序列的长期趋势 1.1. 简单移动平均法 设有一时间序列12,ty yy " "则按数据点的顺序逐点推移求出 N 个数的平均数,即可得到一次移动平均数: (1) (1)111,tt tN ttNyy y yyM MtNNN−−+ −−+++ −==+≥ "式中(1)tM 为第 t周期的一次移动平均数;ty 为第 t周期的观测值; N 为移动平均的项数,即求每一移动平均数使用的观察值的个数 这个公式表明当 t向前移动一个时期,就增加一个新近数据,去掉一个远期数据,得到一个新的平均数。
由于它不断地 “吐故纳新 ”,逐期向前移动,所以称为移动平均法 由于移动平均可以平滑数据,消除周期变动和不规则变动的影响,使得长期趋势显示出来,因而可以用于预测其预测公式为:(1)1ˆttyM+=即以第 t 周期的一次移动平均数作为第 t+1 周期的预测值 1.2 趋势移动平均法 当时间序列没有明显的趋势变动时, 使用一次移动平均就能够准确地反映实际情况,直接用第 t周期的一次移动平均数就可预测第 1t + 周期之值但当时间华南农业大学数学建模培训资料 序列出现线性变动趋势时,用一次移动平均数来预测就会出现滞后偏差因此,需要进行修正,修正的方法是在一次移动平均的基础上再做二次移动平均,利用移动平均滞后偏差的规律找出曲线的发展方向和发展趋势, 然后才建立直线趋势的预测模型故称为趋势移动平均法 设一次移动平均数为(1)tM ,则二次移动平均数(2)tM 的计算公式为: (1) (1) (1) (1)(2) (1)111t t tN tNttMM M MNN−−+ −−+++== "再设时间序列12,ty yy " "从某时期开始具有直线趋势,且认为未来时期亦按此直线趋势变化,则可设此直线趋势预测模型为: ˆtT t ty abT+=+式中 t为当前时期数; T 为由当前时期数 t到预测期的时期数,即 t以后模型外推的时间; ˆtTy+为第 tT+ 期的预测值;ta为截距;tb为斜率。
ta,tb又称为平滑系数 根据移动平均值可得截距ta和斜率tb的计算公式为: (1)(2) (1)(2)22,1ttt t ttaMM b MMN=− = −−在实际应用移动平均法时,移动平均项数 N 的选择十分关键,它取决于预测目标和实际数据的变化规律 1.3 应用举例 已知某商场 1978~ 1998 年的年销售额如下表所示, 试预测 1999 年该商场的年销售额 年份 销售额 年份 销售额 1978 32 1989 76 1979 41 1990 73 1980 48 1991 79 1981 53 1992 84 1982 51 1993 86 华南农业大学数学建模培训资料 1983 58 1994 87 1984 57 1995 92 1985 64 1996 95 1986 69 1997 101 1987 67 1998 107 1988 69 下面使用 移动平均 工具进行预测,具体操作步骤如下: 选择 工具 菜单中的 数据分析 命令,此时弹出 数据分析 对话框。
在 分析工具 列表框中,选择 移动平均 工具 这时将弹出 移动平均 对话框,如图 8- 1 所示 在输入框中指定输入参数 在 输入区域 框中指定统计数据所在区域 B1:B22;因指定的输入区域包含标志行,所以选中 标志位于第一行 复选框;在 间隔 框内键入移动平均的项数 5(根据数据的变化规律,本例选取移动平均项数 N=5) 在输出选项框内指定输出选项 可以选择输出到当前工作表的某个单元格区域、新工作表或是新工作簿本例选定 输出区域 ,并键入输出区域左上角单元格地址 C2;选中 图表输出 复选框若需要输出实际值与一次移动平均值之差,还可以选中 标准误差 复选框 单击确定按钮 这时, Excel 给出一次移动平均的计算结果及实际值与一次移动平均值的曲线图,如图 8- 2 所示 图1 华南农业大学数学建模培训资料 图2 从图 8- 2 可以看出,该商场的年销售额具有明显的线性增长趋势因此要进行预测,还必须先作二次移动平均,再建立直线趋势的预测模型而利用 Excel 2000 提供的 移动平均 工具只能作一次移动平均,所 以在一次移动平均的基础上再进行移动平均即可。
二次移动平均的方法同上,求出的二次移动平均值及实际值与二次移动平均值的拟合曲线,如图 8- 3 所示 再利用前面所讲的截距和斜率计算公式可得: (1) (2)21 21 212 1 96.4 88.96 103.84aMM=−=×−= (1) (2)21 21 2122( ) (96.4 88.96) 3.7251 5bMM=−=−=−华南农业大学数学建模培训资料 图3 于是可得 21t = 时的直线趋势预测模型为:21ˆ 103.84 3.72Ty T+=+ 预测 1999 年该商场的年销售额为 : 1999 21 1ˆˆ103.84 3.72 107.56yy+== += 2. 指数平滑法 移动平均法的预测值实质上是以前观测值 的加权和,且对不同时期的数据给予相同的加权这往往不符合实际情况指数平滑法则对移动平均法进行了改进和发展,其应用较为广泛 根据平滑次数不同,指数平滑法分为:一 次指数平滑法、二次指数平滑法和三次指数平滑法等但它们的基本思想都是:预测值是以前观测值的加权和,且对不同的数据给予不同的权,新数据给较大的权,旧数据给较小的权 2.1 一次指数平滑法 设时间序列为12,ty yy " ",则一次指数平滑公式为: (1) (1)1(1 )tt tSy Sαα−=+−式中(1)tS为第 t周期的一次指数平滑值;α为加权系数, 01α>>时,曲线呈现正增长趋势; 当 0, 0, 0abc>> ,则回归系数显著。
⑤回归模型的显著性检验 i 检验假设: :0H 回归方程不显著 , :1H 回归方程显著 ii检验统计量:()()()2ˆˆ22−−−=∑∑nyyyyF ~ ()2,1 −nF 华南农业大学数学建模培训资料 iii 检验规则:给定显著性水平α,若 ()2,1 −> nFFα,则回归方程显著 ⑥得宾—沃森统计量( DW− ) :检验iµ 之间是否存在自相关关系 ()∑∑==−−=−niiniiiWD12221µµµ,其中iiiyy ˆ−=µ 5、进行预测 小样本情况下 ,近似的置信区间的常用公式为:置信区间 = tSEy ±ˆ 5.2 多元线性回归预测法 社会经济现象的变化往往受到多个因素 的影响,因此,一般要进行多元回归分析,我们把包括两个或两个以上自变量的回归成为多元回归多元回归与医院回归类似,可以用最小二乘法估计模型参数也需对模型及模型参数进行统计检验选择合适的自变量是正确进行多元回归预测的前提之一,多元回归模型自变量的选择可以利用变量之间的相关矩阵来解决 1、建立模型—以二元线性回归模型为例 二元线性回归模型:222110 iixbxbby µ+++= 。
类似使用最小二乘法进行参数估计 2、拟合优度指标 ①标准误差:对 y 值与模型估计值之间的离差的一种度量其计算公式为:()3ˆ2−−=∑nyySE ②可决系数:()()∑∑−−−=222ˆ1yyyyR 02=R 意味着回归模型没有对 y的变差做出任何解释;而 12=R 意味着回归模型对 y的全部变差做出解释 3、 置信范围 置信区间的公式为:置信区间 = SEtyp±ˆ ,其中pt 是自由度为 kn − 的 t 统计量数值表中的数值, n是观察值的个数, k 是包括因变量在内的变量的个数 华南农业大学数学建模培训资料 4、自相关和多重共线性问题 ①自相关检验:()∑∑==−−=−niiniiiWD12221µµµ,其中iiiyy ˆ−=µ ②多重共线性检验 由于各个自变量所提供的是各个不同因素的信息, 因此假定各自变量同其他自变量之间是无关的但是实际上两个自变量之间可能存在相关关系,这种关系会导致建立错误的回归模型以及得出使人误解的结论为了避免这个问题,有必要对自变量之间的相关与否进行检验任何两个自变量之间的相关系数为:()()()()∑∑∑−−−−=22yyxxyyxxr , 经验法则认为相关系数的绝对值小于 0.75,或者 0.5,这两个自变量之间不存在多重共线性问题。
5.3 非线性回归预测法 在社会现实经济生活中,很多现象之间的关系并不是线性关系,对这种类型现象的分析预测一般要应用非线性回归预测,通过变量代换,可以将很多的非线性回归转化为线性回归因而,可以用线性回归方法解决非线性回归预测问题 选择合适的曲线类型不是一件轻而易举的工作,主要依靠专业知识和经验常用的曲线类型有幂函数,指数函数,抛物线函数,对数函数和 S 型函数 5.5 应用回归预测法时应注意的问题 应用回归预测法时应首先确定变量之间是否存在相关关系 如果变量之间不存在相关关系,对这些变量应用回归预测法就会得出错误的结果 正确应用回归分析预测时应注意: ①用定性分析判断现象之间的依存关系; ②避免回归预测的任意外推; ③应用合适的数据资料; 华南农业大学数学建模培训资料 6 灰色预测与优化 在灰色理论中,白指信息完全,黑指信息缺乏,灰指信息不完全信息不完全的系统便是灰色系统例如,农牧耦合系统中物质循环和能量流动的信息就是不完全的因此,农牧耦合系统是灰色系统 目前,灰色理论在农牧耦合系统中应用较多的是灰色预测和灰色优化决策 6.1 灰色预测 所谓预测就是根据客观事物的过去和现在的发展规律, 借助于科学的方法和先进的技术手段,对其未来的发展趋势和状况进行描述和分析,并形成科学的假设和判断,对于一个将来出现的、现在没有诞生的未来系统,必然是既有已知信息,又有未知或不完全确知的信息并且处于连续变化的动态之中,所以说“预测未来” 从本质上说是灰色问题, 基于灰色动态 (,)GM n h 模型的预测称为灰色预测。
灰色系统建立的 (,)GM n h 模型是微分方程的时间连续函数模型,n表示微分方程的阶数,h表示变量的个数,灰色预测具有以下特点:①灰色预测需要的数据量较少;②灰色预测方法计算简单虽然 (,)GM n h 模型建立在较深的高等数学基础上,但它的计算步骤却不烦琐,多数可用手工完成,借助数学软件计算则更为迅速;③灰色预测。