ClouderaManager大数据平台部署指南资料教程

上传人:youn****329 文档编号:132913250 上传时间:2020-05-21 格式:DOCX 页数:17 大小:279.60KB
返回 下载 相关 举报
ClouderaManager大数据平台部署指南资料教程_第1页
第1页 / 共17页
ClouderaManager大数据平台部署指南资料教程_第2页
第2页 / 共17页
ClouderaManager大数据平台部署指南资料教程_第3页
第3页 / 共17页
ClouderaManager大数据平台部署指南资料教程_第4页
第4页 / 共17页
ClouderaManager大数据平台部署指南资料教程_第5页
第5页 / 共17页
点击查看更多>>
资源描述

《ClouderaManager大数据平台部署指南资料教程》由会员分享,可在线阅读,更多相关《ClouderaManager大数据平台部署指南资料教程(17页珍藏版)》请在金锄头文库上搜索。

1、部署指南 Cloudera Manager CDH官方共给出了3中安装方式。第一种方法必须要求所有机器都能连网,由于各种网络超时错误,基本没法用。第二种方法使用CM的在线yum源,在线下载很多包,同样是超时严重。第三种方法是全离线方式,实际情况是也只能用这个。1、Cloudera Manager的部署条件 CDH不支持在容器中部署。 支持Oracle JDK7,目前可使用的最新版本为1.7u80,C5.3.x及以上版本也支持使用oracle JDK8,同一个CDH集群中的所有节点使用的JDK版本必须一致。 使用Python2.4及以上,不支持Python3 仅支持IPv4,且IPv6必须要di

2、sabled 基于tar压缩包的离线安装方式,会在6.0.0中停止支持该方式。 支持selinux,但如果不熟悉使用方法,建议关闭。 管理端口为7180,此外还有很多基础应用使用的端口,可以运行iptables,需要确认有恰当的授权控制,例如至少要对同网段的访问放开全部端口。2、Cloudera Manager部署的几个阶段和可选择的方式注:因为Cloudera Manager的官方yum源位于国外,受网速影响而无法正常使用。所以上述部署方式中,一般是使用PATH C,或者在预先下载好相关RPM包的条件下参照PATH B方式。3、 主机节点信息和基础配置(1)主机信息本次部署使用以下主机,前两

3、个作为NameNode使用。后四个主机,分别额外挂载一块1TB的磁盘到本地的/dfs/dn目录下。注1:用于大数据平台的数据磁盘不要配置RAID,直接祼盘即可。如果有RAID控制器,则直接对每块盘设置一个单独的RAID0,仍然当作单盘使用。注2:在有第二块数据盘的情况下,继续挂载到/dfs/dn2,更多的数据盘则按命名规则和挂盘规则扩展即可。注3:对于生产环境而言,NameNode所在的节点一般不要同时做数据节点使用。而且NameNode所在主机的磁盘需要配置适当的RAID保护级别,以提高可靠性。注4:对于DataNode所在的主机节点,建议系统盘和数据盘完全隔离开,然后系统盘使用两磁盘配置为

4、RAID1以提高可靠性。虽然数据节点是冗余的,挂一个也不影响CDH平台运行,但修起来还是很麻烦啊。172.17.10.70 cluster-70172.17.10.71 cluster-71172.17.10.72 cluster-72172.17.10.73 cluster-73172.17.10.74 cluster-74172.17.10.75 cluster-75操作系统全部使用CentOS 6.9 Minimal安装。将全部主机的主机名设置好,并将以上映射关系写到每个主机的/etc/hosts文件中。(2)免密登录在cluster-70节点上制作ssh密钥:ssh-keygen将该密

5、钥分发至其它各节点,以实现免密钥登录,如:ssh-copy-id cluster-71(3)selinux和iptables所有节点配置为关闭selinux。所有节点的iptables设置为对同网段地址放开全部端口的访问权限。(4)系统性能参数调整中即可。cat /etc/sysctl.confvm.swappiness = 0net.ipv6.conf.all.disable_ipv6 = 1net.ipv6.conf.default.disable_ipv6 = 1net.ipv4.ip_local_port_range = 1024 65000EOFsysctl -pecho never

6、 /sys/kernel/mm/transparent_hugepage/defragecho never /sys/kernel/mm/transparent_hugepage/enabledcat /etc/rc.localecho never /sys/kernel/mm/transparent_hugepage/defragecho never /sys/kernel/mm/transparent_hugepage/enabledEOF4、安装JDK下载并分发Oracle JDK安装包至所有节点,执行安装和配置命令。rpm -ivh jdk-7u80-linux-x64.rpm直接刷下

7、面脚本完成配置:cat /etc/profileJAVA_HOME=/usr/java/jdk1.7.0_80PATH=$JAVA_HOME/bin:$PATH:.CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jarexport JAVA_HOMEexport PATHexport CLASSPATHEOFsource /etc/profile以上JDK配置,需要在每个节点上都处理。5、安装和配置数据库主要有以下业务会使用到数据库服务: Cloudera Manager,存放各种服务、配置数据,空间大约100MB,很重要,应经常备

8、份 ; Oozie Server - Contains Oozie workflow, coordinator, and bundle data. Can grow very large. Sqoop Server - Contains entities such as the connector, driver, links and jobs. Relatively small. Activity Monitor - Contains information about past activities. In large clusters, this database can grow la

9、rge. Configuring an Activity Monitor database is only necessary if a MapReduce service is deployed. Reports Manager - Tracks disk utilization and processing activities over time. Medium-sized. Hive Metastore Server - Contains Hive metadata. Relatively small. Hue Server - Contains user account inform

10、ation, job submissions, and Hive queries. Relatively small. Sentry Server - Contains authorization metadata. Relatively small. Cloudera Navigator Audit Server - Contains auditing information. In large clusters, this database can grow large. Cloudera Navigator Metadata Server - Contains authorization

11、, policies, and audit report metadata. Relatively small.(1)因为准备使用cluster-70作为NameNode Master,所以把mysql数据库安装在cluster-71上面,以分散下风险。登录cluster-71,然后使用任一种自己熟悉的方式把mysql数据库安装好即可:yum install mysql-server mysqlchkconfig mysqld onservice mysqld start完成数据库初始化:/usr/bin/mysql_secure_installation(2)优化数据库配置service m

12、ysqld stop将旧的InnoDB log文件移走:/var/lib/mysql/ib_logfile0 and /var/lib/mysql/ib_logfile1 out of /var/lib/mysql/参照下面调整f参数,以更适合CDH服务使用:mysqlddatadir=/var/lib/mysqlsocket=/var/lib/mysql/mysql.sockuser=mysql# Disabling symbolic-links is recommended to prevent assorted security riskssymbolic-links=0transact

13、ion-isolation = READ-COMMITTEDkey_buffer_size = 32Mmax_allowed_packet = 32Mthread_stack = 256Kthread_cache_size = 64query_cache_limit = 8Mquery_cache_size = 64Mquery_cache_type = 1max_connections = 550#binlog_format = mixedread_buffer_size = 2Mread_rnd_buffer_size = 16Msort_buffer_size = 8Mjoin_buff

14、er_size = 8M# InnoDB settingsinnodb_file_per_table = 1innodb_flush_log_at_trx_commit = 2innodb_log_buffer_size = 64Minnodb_buffer_pool_size = 2Ginnodb_thread_concurrency = 8innodb_flush_method = O_DIRECTinnodb_log_file_size = 512Mmysqld_safelog-error=/var/log/mysqld.logpid-file=/var/run/mysqld/mysql

15、d.pidsql_mode=STRICT_ALL_TABLES启动mysql,如果有报错,可根据日志信息排查。(3)创建需要使用的几个库create database database DEFAULT CHARACTER SET utf8;grant all on database.* TO user% IDENTIFIED BY password;注:在部署中发现hive,oozie使用的库需要使用latin字符集,否则在启动服务时日志中会报错创建索引时超长度限制。(4)安装程序驱动包mysql jdbc driver总计有以下角色所在的主机需要安装这个驱动包。如果你把以下角色都部署在一个主机节点上,那就只需要安装一个节点的驱动,否则就需要各节点都部署一下。Cloudera Manager Server host,Activity Monitor, Reports

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号