hadoop的安装配置

上传人:re****.1 文档编号:479507 上传时间:2017-03-10 格式:DOC 页数:11 大小:1.50MB
返回 下载 相关 举报
hadoop的安装配置_第1页
第1页 / 共11页
hadoop的安装配置_第2页
第2页 / 共11页
hadoop的安装配置_第3页
第3页 / 共11页
hadoop的安装配置_第4页
第4页 / 共11页
hadoop的安装配置_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《hadoop的安装配置》由会员分享,可在线阅读,更多相关《hadoop的安装配置(11页珍藏版)》请在金锄头文库上搜索。

1、安装部署上海理工大学前言:对于云计算的概念,世界知名的几大如软的他们都是商业平台,不适合广大对云计算有兴趣的研究者,而且是完全免费的。一个分布式系统基础架构,是中,两个最基础最重要的成员。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。简单地说来,单的一句话解释务的分解与结果的汇总”。缩写,为分布式计算存储提供了底层支持。它名字上来看就大致可以看出个缘由,两个动词 “开) ”就是将一个任务分解成为多个任务, “是将分解后多任务处理的结果汇总起来,得出最后的分析结果。这不是什么新思想,其实在前面提到的多线程,多任务的设计就可以找到这种思想的影子。不论是现

2、实社会,还是在程序设计中,一项工作往往可以被拆分成为多个任务,任务之间的关系可以分为两种:一种是不相关的任务,可以并行执行;另一种是任务之间有相互的依赖,先后顺序不能够颠倒,这类任务是无法并行处理的。回到大学时期,教授上课时让大家去分析关键路径,无非就是找最省时的任务分解执行方式。在分布式系统中,机器集群就可以看作硬件资源池,将并行的任务拆分,然后交由每一个空闲机器资源去处理,能够极大地提高计算效率,同时这种资源无关性,对于计算集群的扩展无疑提供了最好的设计保证。 (其实我一直认为 卡通图标不应该是一个小象,应该是蚂蚁,分布式计算就好比蚂蚁吃大象,廉价的机器群可以匹敌任何高性能的计算机,纵向扩

3、展的曲线始终敌不过横向扩展的斜线) 。任务分解处理以后,那就需要将处理以后的结果再汇总起来,这就是 做的工作。如下图:布式文件系统基本的几个特点:1. 对于整个集群有单一的命名空间。2. 数据一致性。适合一次写入多次读取的模型,客户端在文件没有被成功创建之前无法看到文件存在。3. 文件会被分割成多个文件块,每个文件块被分配存储到数据节点上,而且根据配置会由复制文件块来保证数据的安全性。就以下一些特点:1. 认不配置。一个份放在定的一份放在与指定同一后一份放在与指定份无非就是为了数据安全,考虑同一. 心跳检测健康状况,如果发现问题就采取数据备份的方式来保证数据的安全性。3. 数据复制(场景为要平

4、衡这里先说一下,使用以配置一个如设置了 那么执行先统计所有磁盘利用率的均值,然后判断如果某一个上,那么将会把这个 这对于新节点的加入来说十分有用。4. 数据交验:采用文件入的时候除了写入数据还会写入交验信息,在读取的时候需要交验后再读入。5. 果失败的话,任务处理信息将会纪录在本地文件系统和远端的文件系统中。6. 数据管道性的写入:当客户端要写入文件到先客户端读取一个,然后由第一个 直到所有需要写入这个户端才会继续开始写下一个. 安全模式:在分布式文件系统启动的时候,开始的时候会有安全模式,当分布式文件系统处于安全模式的情况下,文件系统中的内容不允许修改也不允许删除,直到安全模式结束。安全模式

5、主要是为了系统启动的时候检查各个时根据策略必要的复制或者删除部分数据块。运行期通过命令也可以进入安全模式。在实践过程中,系统启动的时候去修改和删除文件也会有安全模式不允许修改的出错提示,只需要等待一会儿即可。部署:前期准备:1、 安装 拟机使用的是 且安装 务,这样方便物理机与虚拟机的使用。1) 装命令如下:#*#./务的安装配置如下:#:为 is 点击运行,输入 虚拟机 ip能访问到共享文件夹。2、 行时需要管理远端的 护进程,所以需要安装 用如下命令:#安装 用 本。安装 :#/解压 装包,实验使用 件放在 件夹中,解压到/录中。#、编辑解压出来的 件夹中的/件,把 置为安装路径如 #可以对 行测试。群有三种运行模式:单机模式、伪分布式模式和完全分布式模式。1、 默认情况下为单机模式,方便调试工作:#“ “ 可以看到与原先输入 件的内容词数相符合。当再次用其他的实例进行测试时:# +提示 件夹已经存在的错误,如图:所以进行以上操作之前需要先删除原先的输出文件夹 +#查看结果为:2、 伪分布式模式:对 录中的 行相应的配置:配置文件后,进行免密码 置:#录,执行如下命令:#cp 前,需要格式化分布式文件系统:#护进程:#:# +把输出文件从分布式文件系统中复制到本地文件系统中并查看:# 或者直接查看分布式系统中的输出文件:# 都完成以后就可以关闭守护进程:# 例:

展开阅读全文
相关资源
相关搜索

当前位置:首页 > IT计算机/网络 > 云计算/并行计算

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号