基于数据挖掘的政府信息资源.doc

上传人:cl****1 文档编号:560281166 上传时间:2023-03-10 格式:DOC 页数:34 大小:362.50KB
返回 下载 相关 举报
基于数据挖掘的政府信息资源.doc_第1页
第1页 / 共34页
基于数据挖掘的政府信息资源.doc_第2页
第2页 / 共34页
基于数据挖掘的政府信息资源.doc_第3页
第3页 / 共34页
基于数据挖掘的政府信息资源.doc_第4页
第4页 / 共34页
基于数据挖掘的政府信息资源.doc_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《基于数据挖掘的政府信息资源.doc》由会员分享,可在线阅读,更多相关《基于数据挖掘的政府信息资源.doc(34页珍藏版)》请在金锄头文库上搜索。

1、毕业设计 课程设计有相应的资料和CAD图纸,充值下载或购买者将免费赠送。联系QQ号;1620812008.本科毕业论文基于数据挖掘的政府信息资源 学 院_ 管理学院_ _专 业_ 电子商务_年级班别_ 2006级(2)班_ 学 号_ 3106005602_学生姓名_ _指导教师_ _2010年5月 29摘 要随着互联网的发展和政府信息化的推进,电子政务已经成为我国信息化进程的重点,同时政府的信息共享也越来越复杂,随着数据仓库技术、OLAP技术及数据挖掘技术的逐步成熟,为实现决策支持系统提供了技术上的支持,使决策支持系统的发展跃上一个新的台阶,也为决策支持系统开辟了一条新的途径。所以,以数据仓库

2、(Data Warehouse)技术为基础,以联机分析处理(OLAP)和数据挖掘(Data Mining)工具为手段实施政府经济决策系统是当前公认的一整套解决方案。其中,数据仓库直接为联机分析处理和数据挖掘提供数据能力。 针对我国一些地区出现的政务信息公开滞后,网上办事难,本文以广东某市的区域住房情况进一个预测树分析,通过联机处理工具和数据挖掘工具对政务信息提出一些有用的信息关键词:数据挖掘,电子政务,政府信息注:本论文题目来源于基于Web环境广州市政府信息资源分类共享及发布机制研究(09Q23),广州市哲学社会科学发展“十一五”规划课题AbstractWith the development

3、 of the Internet and government information technology to promote e-government has become the focus of Chinas information process, while the governments information sharing have become increasingly complex, with the data warehouse, OLAP technology and data mining technology matures, To achieve decis

4、ion support system provides technical support to the development of decision support system has leapt to a new level, but also for decision support systems has opened up a new way.Therefore, data warehouse (Data Warehouse) technology, on-line analytical processing (OLAP) and data mining (Data Mining

5、) tool as a means of implementing the governments economic policy-making system is currently recognized as a set of solutions. Among them, the data warehouse directly to the online analytical data processing and data mining capabilities.In view of the number of regions lagging behind the government

6、information public, the Internet work hard, this paper, the housing situation in the Guangdong city of the region into a prediction tree analysis, through on-line processing tools and data mining tool for government information some useful informationKey words: Date Mining, E-Government, Government

7、Information目 录第一章 绪论11.1 题目背景和目的11.2信息分析对电子政务的意义21.3国内发展现状21.4 研究思路31.5 论文结构和研究内容4第二章 数据挖掘介绍42.1 数据挖掘基础知识42.1.1数据挖掘42.1.2数据仓库基本概念52.1.3电子政务数据仓库的体系结构62.2 电子政务数据仓库工具72.3.我国电子政务数据挖掘应用情况8第三章 数据挖掘分析方法93.1 数据挖掘方法比较93.2电子政务挖掘对象123.3多维数据分析原理123.3.1维度123.4数据挖掘流程15第四章 基于数据挖掘在某国土资源局的应用分析164.1,目标现状164.2数据挖掘方法的选

8、择174.2.1 国土资源数据特点174.2.2 挖掘工具选择184.3 数据预处理194.3.1数据预处理的一般过程194.4 挖掘过程214.1.1使用决策树方法进行数据挖掘214.1.2 多维分析224.1.3聚集分析234.5 结果分析24小 结25致 谢26参考文献27第一章 绪论1.1 题目背景和目的近年来,随着互联网的发展和计算机在各个部门间的深入应用,大部分单位都投入大量人力物力建立复杂的政务信息系统,随着政府信息共享的深入,面对着宝贵数据的共享和知识技术的不足,加强政府信息开发和利用迫在眉睫。随着政府信息的共享和政务信息化的推进,整合了各级各类信息资源,这些数据在满足政府日常

9、政务需要方面起了重要的作用,同时由于信息量的庞大复杂等原因,未能得到有效的挖掘,因此,在政府信息中开展数据挖掘显得日益重要。随着数据库和计算机网络的广泛应用,加上先进的数据自动生成和采集工具的使用,人们拥有的数据量急剧增大。然而数据的极速增长与数据分析方法的改进并不成正比,一方面人们希望在已有的大量数据的基础上进行科学研究、商业决策、企业管理,另一方面传统的数据分析工具很难令人满意的对数据进行深层次的处理,这样二者之间的矛盾日益突出,正是在这种状况下,数据挖掘应运而生。1信息工作面临着前所未有的挑战,面对着除政府外,公安、教卫、劳动和社会保障等系统及互联网而来的铺天盖地信息,如何发现可供决策的

10、信息,仅仅依靠人力完成变得非常困难,因此选取适当数据挖掘手段,才能发现过去数据之间的潜在联系,进行更高层次的分析,以便更好地做出理想地决策、预测未来地发展趋势。2当前,数据挖掘研究方兴未艾,其研究与开发的总体水平相当于数据库技术在70年代所处的地位,迫切需要类似于关系模式、DBMS系统和SQL查询语言等理论和方法的指导,才能使数据挖掘的应用得以普遍推广。预计在本世纪,数据挖掘的研究还会形成更大的高潮,发现语言的形式化描述,即研究专门用于知识发现的数据挖掘语言,也许会像SQL语言一样走向形式化和标准化;寻求数据挖掘过程中的可视化方法,使知识发现的过程能够被用户理解,也便于在知识发现的过程中进行人

11、机交互。3加强对各种非结构化数据的开采,如对文本数据、图形数据、视频图像数据、声音数据乃至综合多媒体数据的开采; 处理的数据将会涉及到更多的数据类型,这些数据类型或者比较复杂,或者是结构比较独特。为了处理这些复杂的数据,就需要一些新的和更好的分析和建立模型的方法,同时还会涉及到为处理这些复杂或独特数据所做的费时和复杂数据准备的一些工具和软件。1.2信息分析对电子政务的意义在政府的工作中,由于工作的需要建立了庞大的信息收集系统并积累了大量数据。可以说,政务数据资源是电子政务系统的“血液”。政务数据资源的重要性体现在以下几个方面:(1)政务数据的管理制度决定政务创新能力 从我国政府管理与服务职能上

12、来看,政务数据资源管理体制与政府组织机构的业务内容是密切相关的。开放、严谨的政务数据资源管理制度是政府管理方式从经验型管理向科学规范化管理转变的重要一步,也是发挥政府管理与服务创新能力的有力保障。整合政务信息资源、建设政务数据库必须打破政府部门之间对公共信息资源的垄断和封闭,加大政府机构之间、政府与企业、政府与个人之间信息资源的共享程度。 (2)政务数据的存在形式决定电子政务的运行效率 在电子政务活动中,政务数据资源的表现形式多种多样,如文本、图形、图像、报表、音频、视频等,政务数据资源的存在形式包括纸介质、磁介质等不同物化形式。传统介质上存储的政务数据资源编辑、分类、信息抽取等操作较难完成,

13、而电子形式存在的政务数据资源则利用现有信息技术,可以方便地进行报表整理、图形输出、统计分析等。现在利用计算机应用软件和网络通讯技术可以即时地传输、采集、存储、检索和分析所有相关数据,快速把数据挖掘结果、模型分析结果上报作为政府科学决策的重要依据。 (3)政务数据的分析质量决定政府决策效果的好坏 电子政务的决策支持过程是一个从非结构化数据中抽取结构化信息,再提供非结构化决策分析结果的过程。在这个过程中,最为重要的是数据分析环节。虽然量化的数据分析结果不能代替决策本身,但量化的数据分析结果是科学决策的重要依据。采用量化管理方式的政府机构做出的虽然是非结构化的决策,但其决策内容直接来源于数据分析结果

14、,因此其决策准确性和有效性也与数据分析质量相关。41.3国内发展现状经过多年的实践,我国电子政务建设和应用已初见成效。人口基础信息库、法人单位基础信息库、自然资源和空间地理基础数据库、宏观经济数据库的建立产生了海量的空间数据和非空间数据。这些数据中隐藏了丰富的知识和规则,但目前的许多系统只是实现数据的输入、查询、统计等功能,难以发现数据中存在的关联、关系和规则,无法从大量的数据中提取有用信息以预测发展趋势5。因此,电子政务需要一个智能化的辅助决策系统。而数据挖掘是一套具有数据挖掘功能的信息处理技术,主要特点是对数据库中大量的业务数据进行抽取、转化、分析和其他无形化的处理,从中汲取辅助决策的关键

15、数据,为政府重大法规出台提供决策支持。比如在宏观上通过对各种经济数据的挖掘,确定未来经济的走势,制定相应的宏观调整政策;在微观上,对经费拨款 申请中的欺诈行为进行反制,可以根据数据挖掘制定防欺诈的方案,分离出导致欺诈和实际行为的关键因素,制定相应的判据,精准地甄别和标识出最有可能存在欺诈问题的记录和经费的申请文件等。电子政务建设的初衷是形成完善的电子政务网络管理模式,为政府的办公及业务活动的开展提供一个公开、公正、公平的存取信息的平台,这个平台可以使政府办公业务信息从部门和层级的界限中解放出来,成为共享资源。由于体制与部门利益的原因,绝大多数政府信息部门的数字资源系统自成体系,缺乏统一规划,各部门形成相互独立、封闭的数字系统,严重阻碍了部门间的信息流通、更新和共享,从目前世界各国的情况来看,电子政务的发展主要集中在以下五个方向:一是提高事务处理的程度;二是提高政府各

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号