数据挖掘技术在气象数据中的应用

上传人:jiups****uk12 文档编号:39139321 上传时间:2018-05-12 格式:PDF 页数:61 大小:1.93MB
返回 下载 相关 举报
数据挖掘技术在气象数据中的应用_第1页
第1页 / 共61页
数据挖掘技术在气象数据中的应用_第2页
第2页 / 共61页
数据挖掘技术在气象数据中的应用_第3页
第3页 / 共61页
数据挖掘技术在气象数据中的应用_第4页
第4页 / 共61页
数据挖掘技术在气象数据中的应用_第5页
第5页 / 共61页
点击查看更多>>
资源描述

《数据挖掘技术在气象数据中的应用》由会员分享,可在线阅读,更多相关《数据挖掘技术在气象数据中的应用(61页珍藏版)》请在金锄头文库上搜索。

1、西安电子科技大学硕士学位论文数据挖掘技术在气象数据中的应用姓名:左爱文申请学位级别:硕士专业:计算机应用指导教师:王保保20061001摘要摘要2 1 世纪是信息时代,随着I n t e m e t 的广泛应用,面对数据爆炸的现实,人们提出数据挖掘思想,并将其应用到各个领域。数据挖掘是致力于数据分析和理解、揭示数据内部蕴藏知识的技术,是从数据仓库中提取用户感兴趣的规律,它成为未来信息技术应用的重要目标之一。本文首先描述了数据挖掘、关联规则挖掘、空问数据挖掘以及时间序列数据挖掘的基本概念、技术和方法等,重点研究了关联规则挖掘中的若干技术和常用算法;研究几种空间数据挖掘所能发现的知识类型以及方法;

2、对时间序列的趋势性和相似性进行分析,研究了序列模式的挖掘算法等。给出了一种基于项目序列集的空间关联规则挖掘算法和一种时间序列上升、下降关联规则的挖掘算法,并将它们用于气象数据的关联规则的挖掘,说明算法是有效的和可行的。关键字:数据挖掘关联规则空间关联规则序列模式挖掘气象数据挖掘A b s t r a c tA b s t r a c tI t i sa ne r a o f t h e i n f o r m a t i o n i n t h e2 1 s tc e n t u r y W i t h t h ee x t e n s i v ea p p l i c a t i o n o

3、 f t h eI n t e m e r ta n df a c i n gt h ef a c to f b u r s t i n gd a t a ,d a t am i n i n gh a sb e e np u tf o r w a r da n da p p l i e di nm a n yf i e l d s D a t am i n i n gi sat e c h n i q u ed e v o t et oa n a l y z ea n du n d e r s t a n dl a r g es o u r c ed a t aa n dr e v e a l

4、k n o w l e d g eh i d d e ni nt h ed a t a I tw i t h d r a w st h ec u s t o m e ri n t e r e s t i n gr u l e sf r o mt h ed a t a b a s e ,s u c ha sp a t t e r n sa n dc h a r a c t e r i s t i c s I th a sb e e nv i e w e da sa ni m p o r t a n te v o l u t i o ni ni n f o r m a t i o np r o c

5、 e s s i n g A tf i r s t t h i st h e s i ss t u d i e so nt l l et h e o r i e s t e c h n i q u e sa n dt h er e s e a r c hd i r e c t i o n so fd a t am i n i n g ,a s s o c i a t i o nr u l e sm i n i n g ,s p a t i a ld a t am i n i n ga n ds e r i e sd a t am i n i n g M a i nr e s e a r c h

6、 si n v o l v et h et e c h n i q u eo ft h ea s s o c i a t i o nr u l e sm i n i n g ,s o m ek i n d so fc o m m o nu s ea s s o c i a t i o nr u l em i n i n ga l g o r i t h m sa r ed i s c u s s e dr e s p e c t i v e l y T h ee s s e n t i a lp r o c e s s e so f S D Ma r es t u d i e da n ds

7、e v e r a lt y p e so fS D Mr u l e si nm i n i n ga r ed i s c u s s e d W ea l S Or e s e a r c ht h et i m es e r i e sa n ds e r i e sp a t t e r n sm i n i n g ,a n a l y s i st e n d e n c i e sa n ds i m i l a r i t yo ft h et i m es e r i e s ,s t u d yt h em i n i n ga l g o r i t h m so ft

8、 h et i m es e r i e s T h ec h a r a t e r so fm e t e o r o l o g i c a ld a t aa n dt h ea d v a n t a g e so fa l g o r i t h m so fs p a t i a la s s o c i a t i o nr u l e sa n dt i m es e r i e sa s s o c i a t i o nr u l e sh a v eb e e np r o p o s e dw h i c ha i m e da tt h em e t e o r o

9、 l o g i c a ld a t ao fs h a n n x ip r o v i n c e ,t h r o u g ht h ea n a l y s i so ft h et w oa l g o r i t h m sa n ds p e c i f i ce x p e r i m e n t ,i ti ss h o w nt h a tt h ea l g o r i t h m si nt h i sp a p a ra r ee f f e c t i v ea n df e a s i b l e K e y w o r d s :D a t aM i n i

10、n gA s s o c i a t i o nR u l e sS p a t i a lA s s o c i a t i o nR u l e sT i m eS e r i e sP a t t e r n sM i n i n gM e t e o r o l o g i c a lD a t aM i n i n g独创性( 或创新性) 声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果:也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料

11、。与我同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。本人签名:邀日期:世唑关于论文使用授权的说明本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。本人傈证毕业离校后,发表论文或使用论文工作成果时署名单位仍然为西安电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。( 保密的论文在解密后遵守此规定)本人签名:左垦墨 导师盘名:;燧日期:型:! ! :

12、竺 同期;兰堕: ! 兰!第一章绪论第一章绪论随着科学技术的不断发展,I n t e r n e t 在各行各业的广泛应用,新的数据采集和获取数据技术不断更新,使得数据库中所存储的数据量也随之急剧增长。但目前数据处理技术相对滞后,对数据的处理还停留在相对简单的入库、查询、统计、检索等阶段,缺少有效的技术手段来提取数据仓库中数据之间存在的关系和规则、数据的群体特征、数据集内部蕴涵的规律和趋势等,从而出现所谓的信息爆炸所带来的“数据丰富,信息贫乏”【。如何从历史数据中预测未来的发展趋势,以及从海量数据中快速发现有价值的信息,变被动的数据为主动的知识,都迫使人们去寻找新的、更为有效的数据分析手段对各

13、种“数据矿藏”进行有效的挖掘以发挥其应用潜能。数据挖掘( D a t aM i n i n g ) 正是在这样的需求背景下应运而生。它的出现为智能地把海量数据转化为有用的信息和知识提供了手段。数据挖掘作为一门新兴的边缘学科,是一个多学科交叉研究领域,它融合了数据库技术、人工智能、机器学习、统计学及管理信息系统等各学科的研究成果。多学科的相互交融和相互促进,使得这一学科得以蓬勃发展,而且已初具规模。1 1 数据挖掘的概念关于数据挖掘到目前为止还没有一个确切的定义。从狭义的商业用户角度来看,数据挖掘是一种新的商业信息处理技术,主要是对商业数据库中的大量商业数据进行抽取、转换、分析和模型化处理,从中

14、提取辅助商业决策的关键性数据;从广义的普通用户的角度来看,数据挖掘是从大型数据仓库中,挖掘隐含在其中的人们事先不知道,但又确实存在的、有用的知识的过程。数据挖掘,又被称为数据库中的知识发现( K n o w l e d g eD i s c o v e r yi nD a t a b a s e sK D D ) 。数据库中的知识发现是随着机器学习、人工智能和数据库的快速发展而兴起的。1 9 8 9 年8 月,在美国底特律召开的第1 l 届国际人工智能联合会议的专题讨论会上开始出现K D D 术语,随后的几年中,又相继召开几次知识发现的专题会议,从1 9 9 5 年开始,K D D 发展为国际

15、年会,数据挖掘技术很快发展起来。目前已经被大家认同的的数据挖掘的定义是F a y y a d 等1 2 J 给出的:数据挖掘( D M :D a t a M i n i n g ) 就是从大量的、不完备的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘技术在气象数据中的应用1 2 数据挖掘技术过程剿苫峄Y 牟:一一一一I L I 一一I I L 一一一I L I 一一一I L I 一一_ j 一一一- 一一一一上I 一一一IIIjlo一一一一L 一一L 一一一L 一一一L 一一一l 一一一J 一一一一j 一一一一第一章绪论步骤中,

16、进一步改善挖掘的结果。9 、挖掘结果评价:将发现的知识以用户能理解的方式给用户,包含对知识的一致性检查,修正已有的知识库,并结合用户领域知识得到对挖掘结果的认可。数据挖掘是一个反复的过程,它是通过建立挖掘模型并通过实施合适的算法来完成知识的发现,通过不断地的交互式产生、筛选和验证,才能把有意义的知识集成到智能知识库系统中去。数据挖掘只是整个知识挖掘过程中的一个重要步骤,但由于目前在各行业的研究领域中,“数据挖掘”一词已被广泛使用并被普遍接受【4 】【5 】,因此本文广义地使用“数据挖掘”来表示整个知识挖掘过程。1 3 数据挖掘的任务数据挖掘的任务是发现数据库中隐含的的知识( 或模式) 。数据挖掘的模型本质上可分为预测型( P r e d i c t i v e ) 模式和描述型( D e s c r i p t i v e ) 模式两类【6 J 预测型模式是利用历史数据对未来数据的取值进行预测,以便发现隐含的数据演变规律预测型模式能够完成的数据挖掘任务包括分类、回归、时间序列分析和预测等;描述型模式是对数据中模式或关系进行分析,是一种

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号