基于数据挖掘的经济普查数据分析

上传人:枫** 文档编号:548897635 上传时间:2023-05-10 格式:DOC 页数:27 大小:141.50KB
返回 下载 相关 举报
基于数据挖掘的经济普查数据分析_第1页
第1页 / 共27页
基于数据挖掘的经济普查数据分析_第2页
第2页 / 共27页
基于数据挖掘的经济普查数据分析_第3页
第3页 / 共27页
基于数据挖掘的经济普查数据分析_第4页
第4页 / 共27页
基于数据挖掘的经济普查数据分析_第5页
第5页 / 共27页
点击查看更多>>
资源描述

《基于数据挖掘的经济普查数据分析》由会员分享,可在线阅读,更多相关《基于数据挖掘的经济普查数据分析(27页珍藏版)》请在金锄头文库上搜索。

1、-莆 田 学 院毕 业 论 文题目基于数据挖掘的经济普查数据分析学生飞跃* 510704339 专业计算机科学与技术班级计算机2班 指导教师黄海二00九年四月二十一日目录第1章 绪论31.1 数据挖掘技术31.2 研究问题分析41.3 国经济普查实践与数据分析现状41.4 本文研究容及方法4第2章 聚类分析算法42.1 数据挖掘过程42.2 聚类分析技术根底52.3 数据挖掘对聚类的要求52.4 聚类方法的分类6第3章 K均值算法63.1 K均值算法思想63.2 K均值算法流程7第4章 K均值算法在经普数据分析上的实现74.1 数据的采集、预处理74.2 算法演示84.3 数据分析8第5章 K

2、均值算法分析系统的设计95.1 开发工具及运行环境简介95.2 主界面105.3 修改密码115.4 运算模块125.5 企业数据管理模块205.6 退出登陆265.7 下一步工作26第6章 完毕语26第7章 致26参考文献27. z-基于数据挖掘的经济普查数据分析飞跃电子信息工程学系 指导教师:黄海摘要:随着全国第二次经济普查数据的上报,面对普查之后的海量数据,如何更好地利用这些数据资料,帮助国家在金融危机下制定更好的经济决策,成为目前社会各界关注的热点。将数据挖掘技术应用于经济普查数据的分析,可以找出隐含在数据中的更深层次的信息,对决策者制定决策是很有参考价值的。关键词:经济普查 数据挖掘

3、 决策树算法 K-均值算法 Abstract: With the countrys second economic census data to report, in the face of the huge amount of data after the survey, how to make better use of these data to help countries in financial crisis to develop better economic decision-making, bee the munitys concern about the hot spots

4、. Data mining technology will be applied to the analysis of economic census data, can be found in the data implied a deeper level of information, decision-making for policy makers is a good reference.keywords: Economic Census Data Mining Decision Tree Algorithm K-means algorithm第一章 绪论计算机技术的开展为工商企业、政

5、府机构和教育科研单位实现信息的数字化处理提供了机遇,数据库和数据仓库已经广泛地应用于企业管理、产品的销售、科学计算和信息效劳等领域。数据收集工具的进步使我们拥有数量庞大的数据。虽然数据库系统可以高效地实现数据的录入、查询和统计等功能,但缺乏挖掘数据背后隐藏的知识的手段,难以发现数据中存在的关系和规则,无法预测未来的趋势。 而传统的数据分析方法已远远不能满足现实对于数据分析的需求, 数据的迅速增加与数据的分析处理方法滞后的矛盾越来越大, 从而导致了大量的数据成为数据丰富,但信息贫乏的“数据坟墓。 而数据挖掘技术(DataMining)正是解决这一课题的重要方法。权威的Ga*toer调查报告显示,

6、数据挖掘将是未来几年全球围重点投资研究的十大新技术之一,它引起了学术界和工业界的广泛关注,是当今数据库系统研究和应用领域的一个热点问题。1.1 数据挖掘技术数据挖掘技术出现于20世纪80年代后期,90年代有了突飞猛进的开展,并在21世纪持续繁荣。还有很多和这一术语相近的术语,如数据库的知识发现(KDD)、数据分析、数据融合(Data Fusion)以及决策支持等。数据挖掘将数据库管理系统和人工智能中机器学习两种技术相结合,用数据库管理系统来存储数据,用机器学习的方法来分析数据,自发发现隐含在大量数据中的知识。它是一个萃取和展现新知识的流程。数据挖掘聚集了统计学、机器学习、数据库、模式识别、人工

7、智能等学科的容,是一门新兴的穿插学科。数据挖掘从一开场就是面向应用的,它不仅是面向特定数据库的简单查询调用,而且要对这些数据进展微观、宏观的统计,分析、综合和推理,以指导实际问题的求解,企图发现事件间的相互关联,甚至利用已有的数据对未来的活动进展预测。数据挖掘更强调的是从海量数据中发现隐含的知道和算法的可伸缩性,是一门很接近使用的技术。目前数据挖掘技术主要运用于商业、医学、科研领域,着眼于海量数据集存储、检索与处理,目标是帮助人们从繁冗复杂的数据中发现有价值的信息,从而挖掘出其潜在的价值,提高其利用率。1.2 研究问题分析我国第二次经济普查自2008年12月31日正式启动以来,现在已根本完成普

8、查数据的收集、处理与上报工作。本次经济普查是我国经济开展进入21世纪后进展的一项重大国情国力调查,是党中央、国务院为正确认识国情、准确把握国力、科学制定国策而采取的一项重要举措。也是在全球金融危机大背景下正确把握我国当前经济状况的重要渠道的。只有通过经济普查,才能比较准确地把握中国经济变化的规律和趋势,正确制定经济政策和社会经济开展规划,进一步控制经济增长,提高经济开展速度,促进经济和社会协调开展,推动可持续开展战略的实施。在这次经济普查中,从国民经济行业分类的具体构成来看,涉及到19个大的行业归类,875个行业小类。可以说这次经济普查提供的数据是非常完整的。面对普查之后的海量数据存储,国家更

9、需要有力的数据分析工具以及方法将丰富的数据转换成有价值的知识,否则大量的数据将成为数据丰富,但信息贫乏的“数据坟墓。数据挖掘技术正是从大型数据库或数据仓库中提取有潜在应用价值的信息或模式,旨在帮助人们从海量数据中发现有价值的信息。如何从普查数据中及时发现有用的信息,从而挖掘出其潜在的价值,提高其利用率,是经济普查数据研究领域的一项重要课题。1.3 国经济普查实践与数据分析现状事实上,经济普查的主要目的就是分析企业的财务信息,也就是财务数据挖掘。财务数据挖掘其实是一类深层次的财务数据分析方法。目前的经济普查系统可以高效地实现数据录入、查询和统计,但却无法发现数据中存在的关系和规则,无法根据现有的

10、经普数据分析结果预测未来经济开展趋势。传统的财务分析只是停留在较浅层次的分析,比方:因素分析、比例分析、趋势分析等,对决策的帮助并不大,究其原因,正式缺乏有效的挖掘知识和手段,导致了“数据爆炸但知识贫乏的现象。而随着数据库技术的迅速开展以及数据库系统的广泛应用,企业积累的数据越来越多,如自身业务运作的数据,资金运作的数据,对外投资的数据和整个市场相关行业状况的各种数据,激增的数据背后隐藏着许多重要的信息。这些数据不再是为了编制财务经济报表、分析财务状况而收集,分析这些数据也不再单纯为了了解企业各种状况,更主要的是为决策者提供真正有价值的信息,也可帮助企业提供竞争力,在这种情况下,数据挖掘技术就

11、显得至关重要。1.4 本文研究容及方法本文认真分析了数据挖掘的根本原理和一般方法,选择了合理的数据挖掘工具。通过将数据挖掘技术应用到经济普查的数据分析中去,实现经济普查数据的充分开发以及利用。同时在数据挖掘技术应用研究的过程中,利用全国经济普查数据,分析我市*区经济普查数据中假设干企业的经济指标间关系,并对结果进展评价,为相关部门制定决策提供依据。第二章 聚类分析算法2.1数据挖掘过程在实施数据挖掘之前先制定采取什么样的步骤,每一步做什么,到达什么样的目标,是非常必要的。有了好的方案才能保证数据挖掘有条不紊的实施,并取得成功。现在,通用的数据挖掘是从数据集中识别出以模式来表示知识。它包含多个处

12、理步骤,各个步骤之间互相影响并反复调整,形成一种螺旋上升的过程。其过程包括以下几个步骤:(1) 确定挖掘目标。了解应用领域和相关知识,从用户的观点出发确定数据挖掘的目标。这是实现数据挖掘的重要因素。相当于系统分析。这个过程要考虑的因素有:该领域的瓶颈是什么,目标是什么,挖掘模型的可理解性是否重要等。(2) 建立目标数据集。从现有的数据中,确定哪些数据是与本次数据分析任务相关的。根据挖掘目标从原始数据中选择相关数据集,并将不同数据源中的数据集中起来,在这一阶段需要解决数据挖掘平台,操作系统和数据源数据类型等不同所产生的数据格式差异。(3) 数据预处理。对选择数据,需要进展数据清洗工作,将数据变成干净的数据。目标数据集中不可防止的存在着不完整,不一致,不准确和冗余的数据,这些数据被称为“脏数据。数据抽取之后通常采用基于规则的方法分析多数据源之间的关系,然后再对他们实施相应的处理。(4) 数据挖掘算法。使用适宜的数据挖掘算法进展数据分析

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号