大数据Hadoop平台下数据存储的研究与实现-邵婉莹-汪陈伍-通信工程

上传人:206****923 文档编号:41840922 上传时间:2018-05-31 格式:DOC 页数:35 大小:5.54MB
返回 下载 相关 举报
大数据Hadoop平台下数据存储的研究与实现-邵婉莹-汪陈伍-通信工程_第1页
第1页 / 共35页
大数据Hadoop平台下数据存储的研究与实现-邵婉莹-汪陈伍-通信工程_第2页
第2页 / 共35页
大数据Hadoop平台下数据存储的研究与实现-邵婉莹-汪陈伍-通信工程_第3页
第3页 / 共35页
大数据Hadoop平台下数据存储的研究与实现-邵婉莹-汪陈伍-通信工程_第4页
第4页 / 共35页
大数据Hadoop平台下数据存储的研究与实现-邵婉莹-汪陈伍-通信工程_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《大数据Hadoop平台下数据存储的研究与实现-邵婉莹-汪陈伍-通信工程》由会员分享,可在线阅读,更多相关《大数据Hadoop平台下数据存储的研究与实现-邵婉莹-汪陈伍-通信工程(35页珍藏版)》请在金锄头文库上搜索。

1、西西 安安 邮邮 电电 大大 学学毕毕 业业 设设 计(论计(论 文)文)题 目:大数据 Hadoop 平台下数据存储的研究与实现 学 院: 通信与信息工程学院 专 业: 通信工程 班 级: 通工 1108 班 学生姓名: 邵婉莹 导师姓名: 汪陈伍 职称: 高工 起止时间: 2015 年 3 月 2 日至 2015 年 6 月 19 日毕业设计(论文)诚信声明书毕业设计(论文)诚信声明书本人声明:本人所提交的毕业论文大数据 Hadoop 平台下数据存储的研究与实现是本人在指导教师指导下独立研究、写作的成果,论文中所引用他人的文献、数据、图件、资料均已明确标注;对本文的研究做出重要贡献的个人和

2、集体,均已在文中以明确方式注明并表示感谢。本人完全意识到本声明的法律后果由本人承担。论文作者: (签字)时间:2015 年 6 月 5 日指导教师已阅: (签字) 时间:2015 年 6 月 5 日西安邮电大学毕业设计(论文)开题报告通信与信息工程 学院 通信工程 专业 11 级 08 班课题名称:大数据 Hadoop 平台下数据存储的研究与实现学生姓名: 邵婉莹 学号:03111318指导教师: 汪陈伍 报告日期: 2015 年 3 月 26 日 西安邮电大学本科毕业设计(论文)开题报告学号 03111318 姓名 邵婉莹 导师 汪陈伍 题目 大数据 Hadoop 平台下数据存储的研究与实现

3、选题目的(为什么选该课题) 这是一个信息爆炸的时代,互联网上的信息正在以几何级数的速度增长着。在这个大背景下,消耗 CPU 最多的计算逐渐从“提升软件本身性能”方面转移到了信息处理方面,从而各大厂商不得不面临着极大地挑战他们需要从 TB 乃至 PB 级的数据中挖掘出有用的信息,并对这些海量数据进行快捷、高效的处理。而数据存储是数据管理工作的基石,所以如何进行大数据的有效存储成为一个重要的研究课题,为此选择了这个课题,以便更多地了解大数据和云计算方面的知识并且锻炼对 linux 系统的操作能力和搭建工作环境的能力,更为了以后工作和发展方向做下基础。 前期基础(已学课程、掌握的工具,资料积累、软硬

4、件条件等)1、在校期间学习过计算机网络和数据库等相关学科,为做本题打下基础,具备了一定的计算机网络和数据库等的基础知识;2、通过网络和相关书籍查阅资料,了解了云计算和大数据的相关概念; 3、已经安装了 linux 操作系统,对处理大数据的 Hadoop 也进行了进一步的了解;4、对于大数据的分布式存储的工作原理进行了初步的了解和掌握。要解决的问题(做什么)1、了解云计算和大数据的相关知识,理解大数据存储方面的原理;2、安装 linux 系统,能在 linux 上进行熟练的操作; 3、在 linux 上安装 Hadoop,进行 Hadoop 分布式平台的搭建,掌握 HDFS 分布式存储的工作原理

5、并对其提出改进,对一组样本数据进行存储;4、了解分布式编程模型 MapReduce 的原理并能进行简单的使用; 5、撰写毕业论文,能熟练掌握 Hadoop 下大数据存储的相关知识并进行答辩等环节。工作思路和方案(怎么做)1、通过查阅大量资料理解并熟悉云计算和大数据的相关知识,尤其是大数据存储的分布式原理和使用;2、在 Windows 系统上利用 VMware 安装虚拟机,装载 linux 系统,配置好 vmtools 等所需的常用软件及其设置,进一步熟悉 linux 操作环境; 3、在 Windows 和 linux 之间的共享文件夹中下载 linux 版本的 Java 和 Hadoop 的安

6、装包,在 linux 中安装、调配运行环境等至可以正常使用; 4、根据资料学习和了解相关概念和使用方法并进行 Hadoop 分布式平台的搭建,包括运行环境和开发环境的搭建直到能熟练使用; 5、在搭建环境的过程中体会和掌握 HDFS 分布式存储的工作原理,并分析其优缺点,查阅资料,提出一些改进的方案或想法; 6、理解开源的非关系型分布式数据库 HBase 的工作原理和使用方法; 7、下载或者编辑一组样本数据,以样本数据为例,在 hadoop 平台下进行大数据的存储实例; 8、解决完存储问题后,对大数据分析方面的分布式编程模型 MapReduce 的原理、使用方法和使用环境做一了解。 9.通过对毕

7、业设计中所涉及的知识的学习与理解,针对设计中遇见的问题及时与老师进行讨论,找到解决问题的方法,从而撰写毕业论文,最后结合所掌握的知识不断完善论文。指导教师意见签字: 2015 年 3 月 30 日西西安安邮邮电电大大学学毕毕业业设设计计 ( (论论文文) )成成绩绩评评定定表表学生姓名邵婉莹性别女学号03111318专 业 班 级通信工程 通工 1108课题名称大数据 Hadoop 平台下数据存储的研究与实现指导教师意见评分(百分制): 指导教师( (签字) ): 年 月 日评阅教师意见评分(百分制): 评阅教师(签字): 年 月 日验收小组意见评分(百分制): 验收教师(组长)(签字): 年

8、 月 日答辩小组意见评分(百分制): 答辩小组组长(签字): 年 月 日评分比例指导教师评分 20() 评阅教师评分 30() 验收小组评分 30() 答辩小组评分 20()学生总评成绩百分制成绩等级制成绩答辩委员会意见毕业论文(设计)最终成绩(等级): 学院答辩委员会主任( (签字) ): 年 月 日目录目录目录目录 .I摘要摘要 .IABSTRACT.II引言引言.11 绪论绪论.21.1 大数据简介.21.2 HADOOP简介.31.2.1 Hadoop 的优点.31.2.2 Hadoop 的架构.41.2.3 Hadoop 的组成.52 虚拟机下虚拟机下 CENTOS7.0 的装载和配置的装载和配置.73 HADOOP 平台的搭建和基本配置平台的搭建和基本配置 .113.1 安装 JDK.113.2 SSH 免密码登陆.123.2 安装配置 HADOOP.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号