基于WEB的数据挖掘系统的研究与开发

上传人:lizhe****0920 文档编号:47024170 上传时间:2018-06-29 格式:PDF 页数:72 大小:1.65MB
返回 下载 相关 举报
基于WEB的数据挖掘系统的研究与开发_第1页
第1页 / 共72页
基于WEB的数据挖掘系统的研究与开发_第2页
第2页 / 共72页
基于WEB的数据挖掘系统的研究与开发_第3页
第3页 / 共72页
基于WEB的数据挖掘系统的研究与开发_第4页
第4页 / 共72页
基于WEB的数据挖掘系统的研究与开发_第5页
第5页 / 共72页
点击查看更多>>
资源描述

《基于WEB的数据挖掘系统的研究与开发》由会员分享,可在线阅读,更多相关《基于WEB的数据挖掘系统的研究与开发(72页珍藏版)》请在金锄头文库上搜索。

1、 III 基于 Web 的数据挖掘系统的研究与开发 摘 要 随着计算机技术和网络技术的发展企业的信息化程度逐渐提高积累了大量数据通过对这些数据进行挖掘与分析可以发现隐藏的规律或模式企业的经营者可以及时地掌握蕴含在信息中的知识从而为快速准确的决策提供有力的协助和支持 随着数据挖掘技术的发展 Web 模式下运行的数据挖掘系统的研究成为数据挖掘领域的研究热点之一通过将 Web 技术与数据挖掘技术相结合用户使用 Web 浏览器进行跨平台挖掘有效的扩展了数据挖掘技术的应用范围我们开发了一个基于 Web 的数据挖掘系统系统采用 B/S(即 Browser/Server 浏览器/服务器)构架通过集成一些挖掘

2、算法从数据仓库中提取隐含的未知的和潜在有用的能被人们理解的规则和模式存储到企业的知识库并建立知识管理模块 系统挖掘出的结果以人们容易理解的图形 图表等直观的表现方式来表示使得非专业人士也可以进行数据挖掘得到理想的挖掘结果让用户参与到数据挖掘过程中通过设置参数来控制挖掘进度和质量能够加深用户对复杂数据信息的理解从而保证数据结果的正确性 提出了一种基于 Web 的数据挖掘算法与数据仓库的接口设计方案解决了算法与数据仓库的接口问题该接口方案的通用性增强了IV 数据挖掘系统的扩展性有利于系统快速添加更多的新算法以满足各种挖掘需求,这是一些成熟的商业挖掘软件比较难做到的建立基于数据挖掘的知识管理模块通过

3、知识树展现知识查询系统知识库的知识维护知识库还提供了增加案例知识的功能最后应用本系统对某企业的现有数据进行了数据挖掘为企业提供决策支持验证了系统的可行性和有效性 关键字Web数据挖掘知识决策支持 知识水坝damdocdamdoc为您倾心整理(小店)(QQ2218108823)V RESEARCH AND DEVELOPMENT OF WEB-BASED DATA MINING SYSTEM ABSTRACT Todays business environment is one of cheap storage and widespread data collection. It is impo

4、rtant to make full use of the precious information. Data mining, a field related to machine learning, is the process of analyzing data from different perspectives and summarizing it into useful information that can be used to support decision-making, increase revenue, cuts costs and so on. The resea

5、rch on the Web-based data mining system has become one of the hot issues in the area of data mining. The Web-based data mining system is one of a number of analytical tools and allows users to analyze data by the Web browsers in the computer. A Web-based data mining system is developed which combine

6、s the web technology with the data mining technology. With a three-tier structure, the system is used to find knowledge in data warehouse by the algorithms integrated in the system. The results of data mining are revealed by means of tables and graphs, so that the unprofessional users can also under

7、stand the results. In the process of data mining, users can set parameters to find the favorite results. An interface is presented in the paper to connect the algorithms and the data warehouse. So the algorithms in the system can be called dynamically according to the need of the users. And also the

8、 new 知识水坝damdocdamdoc为您倾心整理(小店)(QQ2218108823)VI algorithms can be conveniently added in the Web-based data mining system. There is a knowledge management module in the system to manage and reveal the knowledge found by data mining algorithms. Finally, the system is used to find knowledge from the da

9、tum of one Company and show the feasibility of the system. KEY WORDS: Web, Data Mining, Knowledge, Decision-supportI 上海交通大学上海交通大学上海交通大学上海交通大学 学位论文版权使用授权书学位论文版权使用授权书学位论文版权使用授权书学位论文版权使用授权书 本学位论文作者完全了解学校有关保留使用学位论文的规定同意学校保留并向国家有关部门或机构送交论文的复印件和电子版允许论文被查阅和借阅 本人授权上海交通大学可以将本学位论文的全部或部分内容编入有关数据库进行检索可以采用影印缩印或扫

10、描等复制手段保存和汇编本学位论文 保密在 年解密后适用本授权书 本学位论文属于 不保密 请在以上方框内打 学位论文作者签名刘新颖 指导教师签名王丽亚 日期2006 年 2 月 22 日 日期2006 年 2 月 22 日 II 上海交通大学上海交通大学上海交通大学上海交通大学 学位论文原创性声明学位论文原创性声明学位论文原创性声明学位论文原创性声明 本人郑重声明所呈交的学位论文是本人在导师的指导下独立进行研究工作所取得的成果除文中已经注明引用的内容外本论文不包含任何其他个人或集体已经发表或撰写过的作品成果 对本文的研究做出重要贡献的个人和集体均已在文中以明确方式标明本人完全意识到本声明的法律结

11、果由本人承担 学位论文作者签名刘新颖 日期2006 年 2 月 22 日 上海交通大学硕士研究生论文 1 第一章 绪论 1.1 课题的研究背景课题的研究背景课题的研究背景课题的研究背景 近年来 随着数据库技术的发展和数据应用的普及 大量的数据库系统被用于企业决策商业管理科学研究和工程开发等领域企业的数据环境发生了很大改变 主要表现在两个方面 从数量上 积累的数据量大幅度增加 从应用上数据间的关系增多 对数据的操作越来越复杂 这导致在技术上侧重于数据存取的联机事务处理不能满足现有竞争条件下对数据分析的需求:企业希望尽快全面深刻的理解数据从海量的数据中分析和挖掘出有很强指导意义的知识因此数据挖掘技

12、术应运而生并显示出强大的生命力数据挖掘是从大量的不完全的有噪声的模糊的随机的数据中提取隐含在其中的人们事先不知道的但又是潜在有用的信息和知识的过程1它是数据库研究中的一个很有价值的新领域 融合了数据库 人工智能 机器学习 统计学等多个领域的理论和技术 Internet和Intranet技术的迅速发展为企业信息化带来了巨大的变化Internet网是目前全球最大的计算机通信网,它遍及全球几乎所有的国家与地区Intranet是一种企业内部网络,它是以Internet 技术为基础的网络体系它采用Internet的基础软硬件配置及WWW的标准和技术,通过防火墙( Firewall) 与Internet相

13、隔离,使得企业内部用户能方便地进入Intranet Internet/Intranet技术在企业应用系统中的普及使得浏览器/ 服务器模式(简称为B/ S 模式) 的各种应用系统得到了迅速的发展 基于Web 的应用系统,采用B/ S 模式 浏览器和服务器之间通过HTTP交换信息B/ S 模式提供了一个跨平台的简单一致的应用环境,便于用户群的扩展变化及应用系统的管理,大大提高了工作效率2系统构建者可以不受客户端的影响而根据服务器端比较单一的结构进行充分设计和优化 服务器端可以随着系统的扩展成为一个分布式的服务器群集 现代企业管理决策数据分析等领域也开始大量采用基于Web的应用系统将先进的数据仓库技

14、术数据挖掘技术和Web应用相结合这样极大地扩展了数据挖掘技术应用的深度和广度数据仓库用于数据的存储和组织 是用于分析的数据库它从大量的事务型数据库中抽取数据,并将其整理转换为新的存储格式 数据挖掘是从数据中抽取有价值的信息,帮助决策者寻找数据间潜在的知识,发现被忽略的要素 从决策支持的角度看,数据挖掘是一种决策支持的过程,能高度自动地分析企业原有的数据,进行归纳推理,从中挖掘出潜在的模式,预测客户的行为,帮助企业的决策者调整市场策略,从而减少风险,辅助做出正确的决策上海交通大学硕士研究生论文 2 把数据挖掘数据仓库与Web技术结合起来,就可以在Web环境下充分发挥数据挖掘技术的能力 本课题所研

15、究的基于Web的数据挖掘系统就是在Web平台下应用数据挖掘技术对数据仓库的数据进行挖掘所谓基于Web的数据挖掘系统有2个方面的含义(1) 系统的访问模式用户通过Web浏览器访问数据挖掘系统数据挖掘活动在Web模式下进行,以浏览器/ 服务器(B/ S) 模式为平台,将客户端融入统一的Web浏览器,为Internet用户提供使用简单方便的数据挖掘服务 (2) 数据来源用于数据挖掘的数据来自数据仓库 数据仓库中的数据不仅来源于企业内部的管理信息系统ERP系统等也可以来源于企业通过Internet获取的电子商务信息把数据挖掘建立在数据仓库之上能够提高数据仓库系统的决策支持能力由于数据仓库完成了数据的清

16、洗ETL(抽取转换装载)数据挖掘面对的是经过初步处理的数据更加有利于数据挖掘功能的发挥3此外因为数据仓库中的数据来源很广因而保证了数据挖掘中的数据来源的广泛性和完整性 1.2 国内外研究现状国内外研究现状国内外研究现状国内外研究现状 1.2.1 数据数据数据数据挖掘的研究现状挖掘的研究现状挖掘的研究现状挖掘的研究现状 知识发现是一个从大量数据中归纳出特定规律的过程 知识发现的数据对象包括经济工农业商业科学等领域的数据从数据库中发现知识(KDD, knowledge discovery in databases)常被称作数据挖掘 KDD 一词首次出现在 1989 年举行的第十一届国际联合人工智能学术会议上现在美国人工智能协会主办的 KDD 国际研讨会的规模由原来的专题讨论会发展到国际学术大会研究重点也逐渐从发现方法转向系统应用注重多种发现策略和技术的集成 以及多种学科之间的相互渗透 并行计算 计算机网络和信息工程等

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 毕业论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号