数据挖掘原理与SPSS Clementine应用宝典 第6章 预测挖掘及其应用 课件

上传人:E**** 文档编号:89442243 上传时间:2019-05-25 格式:PPT 页数:42 大小:1.48MB
返回 下载 相关 举报
数据挖掘原理与SPSS Clementine应用宝典 第6章 预测挖掘及其应用 课件 _第1页
第1页 / 共42页
数据挖掘原理与SPSS Clementine应用宝典 第6章 预测挖掘及其应用 课件 _第2页
第2页 / 共42页
数据挖掘原理与SPSS Clementine应用宝典 第6章 预测挖掘及其应用 课件 _第3页
第3页 / 共42页
数据挖掘原理与SPSS Clementine应用宝典 第6章 预测挖掘及其应用 课件 _第4页
第4页 / 共42页
数据挖掘原理与SPSS Clementine应用宝典 第6章 预测挖掘及其应用 课件 _第5页
第5页 / 共42页
点击查看更多>>
资源描述

《数据挖掘原理与SPSS Clementine应用宝典 第6章 预测挖掘及其应用 课件 》由会员分享,可在线阅读,更多相关《数据挖掘原理与SPSS Clementine应用宝典 第6章 预测挖掘及其应用 课件 (42页珍藏版)》请在金锄头文库上搜索。

1、第6章 预测挖掘及其应用,6.1,预测概念,6.2,预测挖掘算法,6.3,基于遗传算法的模糊优化算法及其在预测挖掘中的应用,6.1 预测概念,6.1.1概述 1.预测及其特性 预测(prediction)是构造和使用模型评估无标号样本类,或评估给定样本可能具有的属性值或值区间。 预测的特点是: 1) 科学性;2) 近似性;3) 局限性。 2.预测的类别 1)按预测方法分。可分为技术(统计)预测、信息预测和拟合预测。 2)按预测时期分。可分为短期预测、中期预测和长期预测。 3)按预测性质分。可分为定性预测和定量预测。,第6章 预测挖掘及其应用,预测概念,6.1.2预测的步骤 (1)确定预测目的。

2、 (2)收集资料。根据预测目的,尽可能完整、准确地收集有 关原始资料。 (3)分析资料。 (4)评价预测模型。 (5)预测应用。,第6章 预测挖掘及其应用,6.2预测挖掘算法,6.2.1技术(统计)预测 技术(统计)预测主要包括移动平均、指数平滑法、德尔菲法、马尔克夫链、正态分布、泊松分布、残差辩识预测、最小方差预测等。 (1)特尔菲法(Delphi) 特尔菲法是一种应用较广的专家调查法,它用规定程序对专家进行调查,以尽量精确地反映专家们的主观估计能力。特尔菲法分征询专家意见和统计处理专家意见两步进行。对专家意见的统计处理,可以根据调查资料的性质选用适当的统计方法进行处理,处理结果应至少反映半

3、数以上专家的意见。 (2)时间序列法 时间序列预测法是指将过去的历史资料及数据,按时间顺序加以排列构成一个数字系列,根据其动向预测未来趋势。常用的趋势预测技术是移动平均法、趋势延伸法和季节指数法,或由此衍生的其他常规技术指标分析方法。,第6章 预测挖掘及其应用,技术(统计)预测,1)移动平均法 移动平均预测法是指观察期内的数据由远而近按一定跨越期进行平均,取其平均值,然后,随着观察期的推移,根据定跨越期的观察期数据也相应向前移动,每向前移动步,去掉最早期的一个数据,增添原来观察之后期的一个新数据,并依次求得移动平均值,最后将接近预测期的最后一个移动平均值作为确定预测值的依据。 移动平均法是在算

4、术平均数的基础上发展起来的预测方法,它以一组观察序列的平均数为下一时期的预测值,它要求不断根据新得到的观察值,计算出新的数据,去掉远期数据,逐期向前移动,故称移动平均法,移动平均数的计算公式为 本法的特点是简单,适于线性趋势资料的短期预测,对于具有季节性变化的资料,宜用季节指数法。,第6章 预测挖掘及其应用,2)趋势延伸法 根据预测目标的历史时间数列在坐标图上标出分布点,直观地用绘图工具,画出一条最佳直线或曲线,并加以延伸来确定预测值。 3)季节指数法 季节指数法则以加权平均为基础,是对移动平均法的一种改进算法。季节指数法是先用回归分析法描述整个时间序列的变化趋势,再乘以季节指数,就得到了预测

5、模型。季节指数法认为,数据的重要程度按时间上的近远成非线性递减,常用的有一次指数平滑法、二次指数平滑法和三次指数平滑法。 季节指数法用公式表达为 ,若趋势是线性的,则,第6章 预测挖掘及其应用,技术(统计)预测,6.2.2信息预测,主要包括信息预测,模糊预测,灰色预测,基于混沌理论的分析等。 (1)信息预测 信息预测认为预测的哲学思想在于认识论。并将人类的认识体系分为三个体系, 即抽象体系、物理体系、信息体系。 (2)灰色预测 灰色预测通过少量的、不完全的信息,建立灰色微分预测模型,对事物发展规律作出模糊性的长期描述,是模糊预测领域中理论、方法较为完善的预测学分支。 (3)模糊预测 处理模糊预

6、测问题的数学方法是模糊数学。 (4)基于混沌理论的分析预测 混沌理论最令人兴奋的是:一个非常简单的决定论系统能够产生异常复杂的输出结果。,第6章 预测挖掘及其应用,6.2.3拟合预测,拟合预测是建立一个模型去逼近实际数据序列的过程,适用于发展性的体系。建立模型时,通常都要指定一个有明确意义的时间原点和时间单位。而且,当趋向于无穷大时,模型应当仍然有意义。将拟合预测单独作为一类体系研究,其意义在于强调其唯“象”性。一个预测模型的建立,要尽可能符合实际体系,这是拟合的原则。拟合的程度可以用最小二乘方、最大拟然性、最小绝对偏差来衡量。主要方法有,第6章 预测挖掘及其应用,拟合预测,(1)回归预测。主

7、要包括自回归、线形回归、同态线形 回归和多元回归。 (2)“S”模型。主要用来拟合生命总量不受直接限制的 体系从发生发展直到饱、和点这一阶段的形象。 (3)生命旋回。对一事物从零开始,经过成长、兴盛, 达到全盛期后再逐渐衰落,最后又回到零的过程的预测。它 适合于总量有限的体系。 (4)周期拟合模型。当系统的条件未知,而仅对实际发 生的周期因素建立的拟合模型。其准确性取决与模型的合理 性,并经常为预测结果所验证,属于动态预测模型。,第6章 预测挖掘及其应用,6.2.4传统预测方法之比较,(1) 统计预测重点于统计,并且数量增加只会增强数据的统计效果, 并非意味着可以增加预测效果。 (2) 信息预

8、测在突发性事件的研究中具有重大的现实意义。其深刻的 理论内涵,将对预测学产生深远的影响。对随机性的否定把握程度直接 关系到预测的置信水平。信息预测的方法论下,对时间和空间的原点和 单位有明确界定,认为每一事物都有自身适应的原点和单位,并确信原 点和单位的动态性。建立于质数基础上的突变预测理论,对于预测事件 的漏报数量是决定预测置信水平的关键。 (3) 灰色预测是一系统化的预测理论。关联度的引入对预测的量化研 究十分重要,生成数的方法与信息预测中的可公度方法一样意味深远。,第6章 预测挖掘及其应用,传统预测方法之比较,(4) 模糊预测的其他研究方法,目前进展缓慢,对集合的模糊化和模 糊数学的引入

9、只是提供一种研究问题的角度,就预测意义而言,它不会 增加事物的预测效果,而灰色预测中提及的生成数的思维方法则完全不 同。 (5) 混沌意义下的预测,严格来讲,要么不可能,要么很难把握。正 如一种观点所言:“上帝不仅扔骰子,而且有时还把骰子扔得很远”。对 混沌秩序的研究,科学界的成果是丰富的,但站在一定高度的预测角度 来分析混沌现象, (6) 拟合的研究方法,是从实际出发,以解决实际问题为出发点,是 唯“象”论的。它是人类认识自然和社会的简单有效的方法。不同体系 下,拟合模型的建立使预测成为可能。只有当拟合模型所给出的结论与 实际体系相吻合时,才能得出正确的结论。,第6章 预测挖掘及其应用,6.

10、2.5智能预测方法,在过去很长一段时期里,人们都是采用传统的方法进行预测,如时间序列方法、回归分析方法和模式识别方法,这些方法都取得了不同程度的成功。但这些方法如上所述都存在各自的缺陷。 对预测方法的改进可以沿着两个方向进行:一是对原有预测方法加入新的元素,例如引入智能技术以改善预测质量。本文拟让传统回归分析方法结合遗传算法和模糊优化以构造一种智能回归分析方法,使得对于某些模型已知的预测问题的求解精度得以提高、效率得以改进。二是引入新的预测原理,拓展预测范围,使得传统预测方法不能或很难解决的问题迎刃而解。,第6章 预测挖掘及其应用,6.3基于遗传算法的模糊优化算法及其应用,6.3.1模糊优化理

11、论与方法 1.模糊优化基本术语及性质 1)模糊集 2)水平截集 3)凸模糊集 4)模糊数 5)分解原理 6)扩展原理,第6章 预测挖掘及其应用,模糊优化理论与方法,2.模糊优化的相关概念 模糊目标是指模糊环境下的决策目标,包括非精确定义的目标,由模糊函数定义的目标,由隶属函数 来描述。 模糊约束是指模糊环境下的系统约束,包括模糊函数和模糊关系定义的系统约束,由隶属函数 来描述。 模糊决策D是指同时满足模糊目标和模糊约束的由某种算子定义的活动集合,即 ,由隶属函数 来描述, 。,第6章 预测挖掘及其应用,6.3.1.2传统模糊优化问题,1.模糊建模与模糊优化 模糊建模是指从模糊信息的描述到建立一

12、个适当的数学模型的过程。模糊优化是指基于非精确的数学方法求解模糊模型的过程。一般地,对于一个复杂问题,从建立模糊优化模型(模糊建模)到求解模糊优化模型(模糊优化)需要经过以下基本环节。 1)基于对问题本身的理解,分析问题中存在哪些模糊信息,以及出现的形式,如模糊目标,可行集/约束集或参数和方式,如非精确的量化形式或者是含糊不清的语言(ambiguous linguistic)等。,第6章 预测挖掘及其应用,2)模糊描述与表达(Description and formulation)。 3)在(1)(2)的基础上,根据问题的特点和要求, 采用适当的数学工具和方法,建立模糊优化模型。 4)转化为清

13、晰的优化模型。 5)清晰优化模型的求解。 其中环节(1)(3)属于模糊建模阶段,(4)(5) 属于模糊优化阶段。一般地,这两个阶段是相互关联的,没有 明显的界限。,第6章 预测挖掘及其应用,传统模糊优化问题,2.模糊优化问题的一般形式和分类 根据Fedrizzi & Kacprzyk,模糊优化问题可以描述成如下一般形式。 令 是可选取方案的集合,目标函数 其中, 是 的一类模糊子集,可行域 是一个模糊子集, ,模糊优化问题可以表述为一般形式(FOP): 。其中, 是参数,可以是清晰型,也可以是模糊型。(FOP)表示 “属于” ,使得 具有“尽可能大”的值。,第6章 预测挖掘及其应用,传统模糊优

14、化问题,类似于确定型优化问题,一般把模糊优化问题分为两种类 型。 1)模糊极值问题(无约束模糊优化问题) 2)模糊数学规划问题 3.模糊优化方法的基本框架 1)确定可选解集X。 2)构造结果函数。 3)定义由所有可能的结果组成的集合上一个兼容性函数 。 4)构建一个转换函数 。,第6章 预测挖掘及其应用,传统模糊优化问题,4.多目标模糊优化设计方法 模糊目标一般可表示为 其数学模型为 1)目标函数的模糊满意区间 为了描述各目标的模糊趋优,即反映设计决策人员对目标函数不同取值的不同满意程度,构造如下形式的目标函数的模糊满意区间。,第6章 预测挖掘及其应用,传统模糊优化问题,2)对模糊目标的满意度

15、 3)模糊满意域 4)对称型模糊多目标优化问题的模糊判决解法 5)非对称模糊多目标优化问题的最优约束水平解法 6.3.1.3 预测挖掘中的模糊优化问题 1.基于回归方程的模糊优化模型 2.基于神经网络的模糊优化模型,第6章 预测挖掘及其应用,传统模糊优化问题,6.3.2基于遗传算法的模糊优化系统,6.3.2.1遗传算法基本概念 遗传算法的基本过程是:首先采用某种编码方式将解空间映射到编码空间,可以是位串、实数、有序串、树或图等。Holland最初的遗传算法是基于二进制串的,类似于生物染色体结构,易于用生物遗传理论解释,各种遗传操作也易于实现。另外,可以证明,采用二进制编码式,算法处理的模式最多

16、。但是,在具体问题中,直接采用解空间的形式进行编码,可以直接在解的表现型上进行遗传操作,从而易于引入特定领域的启发式信息,可以取得比二进制编码更高的效率。实数编码一般用于数值优化,有序串编码一般用于组合优化。,第6章 预测挖掘及其应用,6.3.2.2基于正交设计的初始化方法,1.正交实验设计 1)正交实验设计的背景 2)正交表 2.正交产生初始群体 根据当前问题所对应的个体,在该个体邻域范围内进行正 交搜索,构造正交表来生成初始种群,其中 为正交试验次 数,在数值上也等同于本文遗传算法的种群大小, 表示要 考虑因素的个数,表示每个因素有种可能取值,通过构造正 交表,并对每个个体进行是否越限的校正,使得初始种群在 可行域内分布均匀,便于全局寻优。,第6章 预测挖掘及其应用,6.3.2.3基于模糊控制系

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号