数据库GreenPlum 集群环境配置与搭建

上传人:枫** 文档编号:564980592 上传时间:2023-12-09 格式:DOCX 页数:42 大小:173.29KB
返回 下载 相关 举报
数据库GreenPlum 集群环境配置与搭建_第1页
第1页 / 共42页
数据库GreenPlum 集群环境配置与搭建_第2页
第2页 / 共42页
数据库GreenPlum 集群环境配置与搭建_第3页
第3页 / 共42页
数据库GreenPlum 集群环境配置与搭建_第4页
第4页 / 共42页
数据库GreenPlum 集群环境配置与搭建_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《数据库GreenPlum 集群环境配置与搭建》由会员分享,可在线阅读,更多相关《数据库GreenPlum 集群环境配置与搭建(42页珍藏版)》请在金锄头文库上搜索。

1、GreenPlum 集群环境搭建1、简介环境搭建准备:greenplum-43821.1 greenplum 介绍简单的说它就是一个与ORACLE, DB2 样面向对象的关系型数据库。我们通过标准 的SQL可以对GP中的数据进行访问存取。GREENPLUM与其它普通的关系型数据库的区别?本质上讲GREENPLUM是一个关系型数据库集群.它实际上是由数个独立的数据库服务 组合成的逻辑数据库。与RAC不同,这种数据库集群采取的是MPP架构。如下图所示Master 节恵生成兰询卄轨N址发它的组件分成三个部分MASTER/SEGMENT以及MASTER与SEGMENT之间的高效互联技 术GNETo其中

2、MASTER和SEGMENT本身就是独立的数据库SERVER。不同之处在于,MASTER 只负责应用的连接,生成并拆分执行计划,把执行计划分配给SEGMENT节点,以及返回最 终结果给应用,它只存储一些数据库的元数据,不负责运算,因此不会成为系统性能的瓶颈。 这也是GREENPLUM与传统MPP架构数据库的一个重要区别。SEGMENT节点存储用户的业 务数据,并根据得到执行计划,负责处理业务数据。也就是用户关系表的数据会打散分布到 每个SEGMENGT节点。当进行数据访问时,首先所有SEGMENT并行处理与自己有关的数据, 如果需要segment可以通过进行interconnect进行彼此的数

3、据交互。segment节点越多, 数据就会打的越散,处理速度就越快。因此与SHARE ALL数据库集群不同,通过增加SEGMENT 节点服务器的数量,GREENPLUM的性能会成线性增长。GREENPLUM适用场景?GREENPLUM虽然是关系型数据库产品,它的特点主要就是查询速度快,数据装载速度 快,批量DML处理快。而且性能可以随着硬件的添加,呈线性增加,拥有非常良好的可扩 展性。因此,它主要适用于面向分析的应用。比如构建企业级ODS/EDW,或者数据集市等GREENPLUM运行的平台?GREENPLUM运行在X86架构的硬件平台上,目前支持的操作系统包括32/64位的 LINUX(RED

4、HAT/SUSE)/SOLARIS/MAC OSGREENPLUM 的前景?GREENPLUM 诞生于 2003 年硅谷,2010/07 EMC 收购了 GREENPLUM,并把 GREENPLUM 作为EMC面向分析云的战略核心产品,加以大力发展。该产品不仅在国际市场发展很快, 在国内市场发展也很快。最著名的案例就是阿里巴巴集团,经过多种产品的精心选型,最终 选择GREENPLUM作为它们的数据仓库平台存放数百TB的业务数据去高效支持各种分析应 用。如何学习GREENPLUM?正是由于产品发展速度很快,但是在相关人才上存在很大缺口。因此,我个人认为对于 各位有兴趣的技术人员来说,是一个很好的

5、职业发展机会。以个人经验来说,只要有其它关 系型数据库的基础,尤其是POSTGRESQL或者INFORMIX基础的(因为GREENPLUM是在 POSTGRESQL基础上开发出来的),很容就可以上手学习并掌握GREENPLUM。GREENPLUM的手册写的非常好,完全可以作为入门的教材使用。其软件本身也是软性 LICENSE,用于学习研究完全免费,而且与生产环境并无不同,这与ORACLE完全一样。2、GreenPlum 的 HAGP提供了几个选择性的功能来保证最大正常运行时间和高可用。包括:1. Segment Mirroring -segment 镜像2. Master Mirroring

6、-master 镜像3. Fault Detection & Recovery -错误检测和恢复Segment MirroringPrimary Segment 和 Mirror Segment放在不同主机上。在数据库操作过程中,只有primary segment是活跃的,mirror仅仅做复制处理(file block replication process)Segment挂了后系统操作流程:1. 当segment挂了,文件复制进程停止,mirror segment自动的成为活跃的segment instance. 所有数据库操作则继续使用mirror。2. 此时记录事务的模式发生改变,系统

7、状态为Change Tracking模式。3. 当管理员把失败segment重新启动后,恢复进程将把2个之间的差异数据同步。此时系统状态为Resynchronizing模式4. 一旦所有的mirror和primary都再次同步完成,系统状态将变更为Synchronized模式。1石iLnWH VXHil MI1啣話二.I 第yi tMaster Mirroring-你可以选择性的部署额外一台机器作为Standby Master。gpsyncagent-复制进程,用来做master和standby之间的数据同步。Master挂了后系统操作流程:1. 如果primary master失败后,复制进

8、程将被关闭,并且standby master能够被激活,以替 换 primary。2. 于是激活的standby master被作为GP数据库master,接收和原master相同端口的连接(replicated log是用来恢复最后成功提交事务时间点的master host的状态) 注: master是不包含用户数据,只是包含system catalog表。这些表不经常更新,如果有更新的话,会自动同步到standby。故master和standby始 终都保持一致。primary master hoststandby master hostynchronisabonprices $-错误检测

9、和恢复-ftsprobe- GP中用来做错误检测的,GP Sever(postgres)的子进程。该进程根据配置时间间隔监控GP队列、扫描所有segment和数据库进程。gprecoverseg -检测宕掉的segment是否有效,并且和当前活跃segment比较,找出哪些改 变丢失。它将只把差异部分做同步,然后把segment设成online。该进程在GP启动和运行 的时候会被执行。(如果mirror没开,segment不可用,GP自动shutdown。必须做手工恢复。)3、greenplum4382分布式的安装部署Centos6.5 系统: 64 位31系统设置1. 编辑/etc/sysc

10、tl.co nf 文件n et.ipv4.ip_forward = 0n et.ipv4.c on f.default.accept_source_route = 0kern el.sysrq = 1kern el.core_uses_pid = 1n et.ipv4.tcp_s yn cookies = 1kern el.msg mnb = 65536kern el.msgmax = 65536kernel.sem = 250 64000 100 512kernel.shmmax = 500000000kernel.shm mni = 4096kernel.shmall = 40000000

11、00kernel.sem = 250 64000 100 512n et.ipv4.tcp_tw_recycle=1n et.ipv4.tcp_max_s yn _backlog=4096n et.core .n etdev_max_backlog=10000vm.overcommit_memory=2n et.ipv4.co nf.all.arp_filter = 1对于练习环境来说,这个配置是没有问题的。但是在生产环境中,整个系统中有大量 SEGMENT实例和镜像实例时,这样的配置可能导致无法启动服务。所以,请加大 kernel.sem = 250 64000 100 512中最后一位的配

12、置,比如把512改成1024,2048这样的 值。另外,可以加大共享内存相关的配置,比如kernel.shmmax和kernel.shmall。完成编辑之后,以root身份执行命令sysctl -p或者重启系统,使其配置生效。2. 在/etc/security/limits. conf配置文件末尾处增加如下内容:* soft nofile 65536 #nofile - 打开文件的最大数目* hard nofile 65536* soft nproc 131072 # noproc- 进程的最大数目* hard nproc 131072* soft core unlimited # core-

13、 限制内核文件的大小注意:对于 RedHat6.x 系统,还需要将/etc/security/limits.d/9Onproc.conf 文件中 的 1024 修改为 131072。3 格式化磁盘 安装所需要的文件系统。GREENPLUM只能使用文件系统存放数据,不支持裸设备。出于性 能考虑,EMC官方建议在LINUX上使用XFS文件系统,SOLARIS上使用ZFS文件系统。如果 是练习环境则无所谓,只要相应操作系统可以支持的文件系统即可。对于LINUX来说,SUSE 的安装介质上就带有XFS文件系统。REHL 6.0以下/CENTOS 6.0以下版本则需要到相关网站 单独下载XFS文件系统安

14、装。XFS 文件系统安装:64bit:rpm -ivh kmod-xfs-0.4-2.x86_64.rpmrpm -ivh xfsprogs-2.9.4-1.el5.centos.x86_64.rpm32bit:rpm -ivh kmod-xfs-0.4-2.i686.rpmrpm -ivh xfsprogs-2.9.4-1.el5.centos.i386.rpm先用fdisk -I查看要格式化的设备,然后使用命令mkfs弋xfs /dev/sdc,创建mount点, 比如 mkdir -p /data/voll为了保证系统重启后,可以自动mount磁盘,以root身份编辑/etc/fstab

15、,添加条目device file /data xfs logbufs=8 ,no atime ,no diratime 1 1也可以每次系统启动,自己用命令mount /data/vol1进行mount。GP建议使用下面的挂载参数:rw,no atime,i no de64,allocsize=16m比如,挂载XFS格式的设备/dev/sdb到目录/data1,尼tc/fstab中的配置如下:/dev/sdb /data1 xfs rw,no atime,i no de64,allocsize=16m 1 14更改磁盘I/O策略Linux磁盘I/O调度器对磁盘的访问支持不同的策略,默认的为CFQ, GP建议设置为 deadline.以 roo t 身份编辑/boo t/grub/menu.ls t,添加一行 eleva tor二deadline,但是不要修 改failsafe的定义,如下图:在k对血T亍的最后追加花levEtopdea川Inf如下为正确配直的示rootgp_test 1 “老 vi /bootgrub/menu.lst壬 grub.conJ generated by anaiconda# Note zhat you do not have

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号