管理工程决策方法结课论文-地级市地区生产总值数据分析

上传人:龙*** 文档编号:2049579 上传时间:2017-07-19 格式:DOCX 页数:23 大小:1.04MB
返回 下载 相关 举报
管理工程决策方法结课论文-地级市地区生产总值数据分析_第1页
第1页 / 共23页
管理工程决策方法结课论文-地级市地区生产总值数据分析_第2页
第2页 / 共23页
管理工程决策方法结课论文-地级市地区生产总值数据分析_第3页
第3页 / 共23页
管理工程决策方法结课论文-地级市地区生产总值数据分析_第4页
第4页 / 共23页
管理工程决策方法结课论文-地级市地区生产总值数据分析_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《管理工程决策方法结课论文-地级市地区生产总值数据分析》由会员分享,可在线阅读,更多相关《管理工程决策方法结课论文-地级市地区生产总值数据分析(23页珍藏版)》请在金锄头文库上搜索。

1、I管理工程决策方法课程论文院 系 物流学院 专 业 物流工程 班 级 物工一班 II目录关键词 .1第 1 章 绪论 .11.1 研究目的 .11.2 数据来源 .11.3 研究思路 .2第 2 章 数据挖掘与处理 .32.1 数据挖掘简介 .32.1.1 数据挖掘的定义 .32.1.2 挖掘数据的类型 .32.1.3 数据挖掘的任务 .32.1.4 数据挖掘的步骤 .42.2 数据处理 .42.2 时间序列数据准备 .52.3 聚类分析和回归数据准备 .6第 3 章 地区生产总值数据分析 .63.1 2012-2017 年时间序列分析 .63.1.1 时间序列分析简介 .63.1.2 数据分

2、析 .73.2 2008-2011 年各地区生产总值聚类分析 .113.2.1 聚类分析及算法简介 .113.2.2 数据分析 .123.3 2008 年 -2011 年各城市地区生产总值回归分析 .163.3.1 线性回归介绍 .163.3.2 数据分析 .17第 4 章 总结 .201地级市地区生产总值数据分析关键词:地区生产总值;时间序列;聚类分析;回归分析第 1 章 绪论1.1 研究目的地区生产总值(地区 GDP)是一个地区的所有常住单位在一定时期内所生产的全部最终产品和服务的价值总和是反映经济总体状况最重要的指标,GDP就像天气的卫星云图一样,能够提供经济状况的完整图像,能够帮助领导

3、者判断经济是在萎缩还是在膨胀,是需要刺激还是需要控制,是处于严重衰退还是处于通胀威胁之中。如果没有像 GDP 这样的总量指标,政策制定者就会陷入杂乱无章的数字海洋而不知所措。 ,地区 GDP 可以反映一个地区的经济发展规模,判断其经济总体实力和经济发展的快慢,还可以用来进行经济结构分析,是宏观经济决策的重要依据。所以通过研究各地区的生产总值,可以让我们了解全国各地区的经济发展水平并将同一级别的城市进行聚类,同时也有利于进行相应的政策支持。1.2 数据来源此数据来自 2009-2011 年中国城市统计年鉴的地级市地区生产总值(如下图)2图 1- 1 数据来源1.3 研究思路数 据 收 集与 整

4、理运 用 时 间 序 列 分析 进 行 预 测 分 析 2008年 -2011年 各 地 区 生产 总 值 回 归 分 析2008-2011年 中 国 各 地区 生 产 总 值 数 据 搜 集2012年 -2017年 北 京 地 区生 产 总 值 预 测2008-2011年 每 年 各 地 区生 产 总 值 聚 类 分 析2008-2011年 每 年 各 地 区生 产 总 值 相 似 水 平 2008-2011年 各 地 区全 市 与 市 辖 区 关 系中 国 各 城 市 发 展 水 平 及相 关 政 策 支 持图 1- 2 研究思路3第 2 章 数据挖掘与处理2.1 数据挖掘简介2.1.1

5、数据挖掘的定义数据挖掘是从大量的原始数据中采用多种方法去寻找数据间隐含的有趣模式和知识的过程。如果数据挖掘的过程可形象的比喻成从黄金矿山中幵釆黄金(如图 2-1 所示 ),那么原始数据具的大容量、含噪音和异质数据就像是矿山上的废渔一样; 挖掘算法好比肝釆工具一样具有多样化特点;数据间隐藏的模式和知识就如黄金一样事先人们是看不到的、但是对人们又非常有用。 12.1.2 挖掘数据的类型数掘挖掘足一种通用的技术,它可以挖掘任何对目标应用有意义的数据。这些数据大致可分以下四类:(1)数据库数据作为数据挖掘研究中最主要的数据形式,关系数据库拥有丰富的数据源。它是许多表的汇集, 每个表都包含许多字段,并且

6、存放大量的记录。每一个记录代表一个对象,被唯一的关键字所标识,并且被其它字段描述它的属性。(2)数据仓库数据仓库是按照某一主题组织的、经过清理加工和整理的、能够反映历史各阶段信息的、相对较稳定的数据的累积。(3)事务数据事务数据库中的每一个记录表示一个事务,每个事务拥有唯一的标识号 ,以及组成事务的项的列表。(4)其它类型的数据除了上述三种数据以外,还有很多其它数据也可以作为数据挖掘的数据源。例如工程设计数据(如集成电路) 、多媒体和文本数据 (如音频、视频)、数据流(如视频监控)、空间数据(如导航地图) 等等。2.1.3 数据挖掘的任务数据的挖掘任务包括两类,第一类任务用于刻画目标数据中数据

7、的性质 ,第二4类任务用于在当前数据上分析判断,然后做出预测。前者属于描述性任务 ,而后者属于预测性任务。一般而言,数据的挖掘任务有如下 6 种任务:(1)数据特征化与区分(2)关联分析 (3)分类(4)聚类分析 (5)离群点分析 (6)序列模式2.1.4 数据挖掘的步骤(1)确定问题明确数据挖掘任务的具体需求和确定挖掘釆用的具体方法(如关联、分类、聚类等)。(2)数据收集和预处理此步骤主要包括数据的选择、预处理以及转换。1 数据选择就是确定挖掘任务的目标数据,依据任务要求, 从相关数据源中选取任务相关数据。2、数据预处理一般包括空缺处理、平滑噪声、数据规约、数据类型转换、数据集成等处理。3、

8、数据转换是指从对象的初始属性中选取挖掘任务相关的属性,来提高挖掘的整体效率。(3)数据挖掘根据所选定的挖掘方法,对上面步骤处理好的数据,选择合适的挖掘算法进行数据挖掘得出模型。(4)分析和评估对上面步骤中挖掘所得的模型进行评估分析。需要注意的是整个数据挖掘的过程是需要不断反馈和修正的。当在挖掘的过程中发现由于数据不合适或者挖掘方法不恰当, 造成挖掘的结果不够理想,那么需要重复挖掘过程,如果有需要的话, 可以从头重新开始。(5)知识的应用将最后确定的有用挖掘结果(知识) 应用到问题中去。2.2 数据处理在数据挖掘整体过程中,海量的原始数据中存在着大量杂乱的、重复的、不完整的数据,严重影响到数据挖

9、掘算法的执行效率,甚至可能导致挖掘结果的偏差。为此,在数据挖掘算法执行之前,必须对收集到的原始数据进行预处理,以改进数据的质量,提高数据挖掘过程的效率、精度和性能。数据预处理主要5包括数据清理、数据集成、数据变换与数据归约等技术图 2- 1 剔除各省名称和空值2.2 时间序列数据准备选取各城市地区生产总值的全市数值列汇总到时间序列原数据表格图 2- 262.3 聚类分析和回归数据准备将 2008-2011 年数据整理图 2- 3第 3 章 地区生产总值数据分析3.1 2012-2017 年时间序列分析3.1.1 时间序列分析简介时间序列:是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列。时间序列法是一种定量预测方法,亦称简单外延方法。在统计学中作为一种常用的预测手段被广泛应用。时间序列分析在第二次世界大战前应用于经济预测。二次大战中和战后,在军事科学、空间科学、气象预报和工业自动化等部门的应用更加广泛。时间序列分析(Time series analysis)是一种动态数据处理的统计方法。该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题。时间序列分析方法:它包括一

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 大学论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号