PostgreSQL高可用性与负载均衡原理及实例.doc

上传人:壹****1 文档编号:563942244 上传时间:2022-12-30 格式:DOC 页数:7 大小:44KB
返回 下载 相关 举报
PostgreSQL高可用性与负载均衡原理及实例.doc_第1页
第1页 / 共7页
PostgreSQL高可用性与负载均衡原理及实例.doc_第2页
第2页 / 共7页
PostgreSQL高可用性与负载均衡原理及实例.doc_第3页
第3页 / 共7页
PostgreSQL高可用性与负载均衡原理及实例.doc_第4页
第4页 / 共7页
PostgreSQL高可用性与负载均衡原理及实例.doc_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《PostgreSQL高可用性与负载均衡原理及实例.doc》由会员分享,可在线阅读,更多相关《PostgreSQL高可用性与负载均衡原理及实例.doc(7页珍藏版)》请在金锄头文库上搜索。

1、PostgreSQL高可用性与负载均衡原理及实例多个数据库服务器可以协同工作,比如在主服务器失效的时候备份服务器立即取代它的位置(高可用性),或者几台机器同时服务于同一个数据库(负载均衡)。理 想状态多台服务器之间可以无缝协作。为静态页面提供服务的 Web 服务器可以轻松的通过将 web 请求分摊到多台机器从而实现负载均衡。事实上,只读数据库也能轻松的以相同的方法实现负载均衡。不幸的是,大多数数据库服务器都需要同时处理混合的读/写 请求,将这些数据库联合起来工作是件很麻烦的事。虽然只读数据只需要在每台服务器上复制一份即可,但是在任何一台服务器上的写动作都必须传播到其它所有服 务器上,这样才能保

2、证将来对这些已修改数据的读取返回一致的结果。这个写同步问题就是导致多台服务器协同工作麻烦重重的最基本原因。有多种解决此问题的方法,其思路也各不相同,但都不是既简单又高效的方案。有一种解决方案是仅允许单独的一台主服务器修改数据,其它从服务器只能读取数据,还可能存在平时不允许访问、仅在失效切换后代替主服务器的备用服务器。一些失效切换和负载均衡方案是同步的,意思是直到所有服务器都完成了某个修改数据的事务之后,该事务才被认为是已经完成的。这将确保失效切换不会丢失 任何数据并且所有服务器都将返回一致的结果。另一些方案是异步的,这种方案允许在事务提交之后与传播到所有其它服务器之间有一小段延时,但是在切换到

3、 备份服务器的时候某些事务可能会丢失,并且不同的服务器可能返回不一致的结果。当同步可能会很慢的时候可以使用异步通信。还可以按照粒度对解决方案进行分类。某些方案只能将整个数据库集群作为一个整体,而某些方案可以针对每个数据库或每张表分别做不同的处理。在选择任何失效切换或负载均衡方案的时候都必须考虑性能因素。功能和性能不可兼得,比如,一个完全同步的解决方案在慢速网络上可能削减性能一半以上,而完全异步的方案可能仅对性能有极其微小的影响。下面的部分大致描述了各种常见的失效切换、复制、负载均衡方案。共享磁盘失效切换共享磁盘失效切换通过仅保存一份数据库副本来避免花在同步上的开销。这个方案让多台服务器共享使用

4、一个单独的磁盘阵列。如果主服务器失效,备份服务器将立即挂载该数据库,就像是从一次崩溃中恢复一样。这个方案允许快速的失效切换并且不会丢失数据。共享硬件的功能通常由网络存储设备提供,也可以使用完全符合 POSIX 行为的网络文件系统(NFS)。这种方案的局限性在于如果共享的磁盘阵列损坏了,那么整个系统将会瘫痪。另一个局限是备份服务器在主服务器正常运行的时候不能访问共享的存储器。一种改进的方案是文件系统复制:对文件系统的任何更改都将镜像到备份服务器上。这个方案的唯一局限是必须确保备份服务器的镜像与主服务器完全一致,特别是写入顺序必须完全相同。DRBD 是 Linux 上的一种流行的文件系统复制方案。

5、使用即时恢复(PITR)的热备份热备份服务器(参见节23.4)可以通过读取 WAL 记录流来保持数据库的当前状态。如果主服务器失效,那么热备份服务器将包含几乎所有主服务器的数据,并可以迅速的将自己切换为主服务器。这是一个异步方案,并且只能在整个数据库服务器上实施。主-从(Master-Slave)服务器复制这个方案将所有修改数据的请求发送到主服务器。主服务器异步向从服务器发送数据的更改信息。从服务器在主服务器运行的情况下只应答读请求。对于数据仓库的请求来说,从服务器非常理想的。Slony-I 是这个方案的一个例子,它支持针对每个表的粒度并支持多个从服务器。因为它异步、批量的更新从服务器,在失效

6、切换的时候可能会有数据丢失。基于语句的复制中间件可以使用一个基于语句的复制中间件程序截取每一个 SQL 查询,并将其发送到某一个或者全部服务器。每一个服务器都独立运行。写请求发送给所有服务器,读请求则仅发送给某一个服务器,从而实现读取的负载均衡。如果只是简单的广播修改数据的 SQL 语句,那么类似 random(), CURRENT_TIMESTAMP 以及序列函数在不同的服务器上将生成不同的结果。这是因为每个服务器都独立运行并且广播的是 SQL 语句而不是如何对行进行修改。如果这种结果是不可接受的,那么中间件或者应用程序必须保证始终从同一个服务器读取这些值并将其应用到写入请求中。另外还必须保

7、证每一个事务必须在所有服务器上全部提交成功或者全部回滚,或者使用两阶段提交(PREPARE TRANSACTION 和 COMMIT PREPARED)。Pgpool 和 Sequoia 是这种方案的实例。同步多主服务器复制在这种方案中,每个服务器都可以接受写入请求,修改的数据将在事务被提交之前必须从原始服务器广播到所有其它服务器。过多的写入动作将导致过多的锁定,从 而导致性能低下。事实上,在多台服务器上同时写的性能总是比在单独一台服务器上写的性能低。读请求将被均衡的分散到每台单独的服务器。某些实现使用共享磁 盘来减少通信开销。同步多主服务器复制方案最适合于读取远多于写入的场合。它的优势是每台

8、服务器都能接受写请求因此不需要在主从服务器之间划分工作负荷。 因为在服务器之间发送的是数据的变化,所以不会对非确定性函数(比如 random()造成不良影响。PostgreSQL 不提供这种类型的复制。但是 PostgreSQL 的两阶段提交(PREPARE TRANSACTION 和 COMMIT PREPARED)可以用于在应用层或中间件代码中实现这个功能。异步多主服务器复制对于那些不规则连接的服务器(比如笔记本电脑或远程服务器),要在它们之间保持数据一致是很麻烦的。在这个方案中,每台服务器都独立工作并周期性的与其他服务器通信以识别相互冲突的事务。可以通过用户或者冲突判决规则处理出现的冲突

9、。数据分区数据分区将一张表分解为多个数据集合,每个集合都仅可以被单独一台服务器修改。例如,数据可以按照办公室划分:伦敦和巴黎的办公室各自使用自己的服务器。 如果某个查询需要同时检索伦敦和巴黎的数据,应用程序可以同时查询两个服务器或者在每一台服务器上使用主/从复制来保持一份其它服务器上数据的只读副本。多服务器并行查询执行许多前述方案都允许多台服务器处理多个请求,但是没有一个方案允许多台服务器同时处理一个请求以加快速度。这个方案就允许多台服务器同时服务于一条查询语 句。通常的做法是将数据在多个服务器上进行分割,然后每个服务器执行与其所含数据相关的查询部分并将结果返回给中心服务器组装成最终结果,然后

10、再返回给用 户。Pgpool-II 就能实现这个功能。商业解决方案因为 PostgreSQL 是开放源代码并且很容易被扩展,许多公司在 PostgreSQL 的基础上创建了商业的闭源解决方案,提供独特的失效切换、复制、负载均衡功能。这是一个关于LinuxVirtualServer的比较简单的实验,是如何实现两台PostgreSQL数据库的负载均衡。这是一个关于LinuxVirtualServer的比较简单的实验,是如何实现两台PostgreSQL数据库的负载均衡。做这个实验的目的有三个:1,是一个朋友的需求;2,我本人也有一段时间没有看LVS方面的东西了,借这个机会再复习一下;3,因为这是个最

11、简单的LVS的实验,对LVS的初学者来说有很好的帮助。实现PostgreSQL数据库服务器的负载均衡Articles / 负载均衡Date: Apr 16, 2004 - 06:00 PM实验名称:实现PostgreSQL数据库服务器的负载均衡操作系统:Debian 3.0 r2所使用的内核:linux-2.4.23实验用到的模块: ipvsadm-1.21,PostgreSQL (ipvsadm命令的详细用法请参考这里)作者:功能描述:这是一个关于LinuxVirtualServer的比较简单的实验,是如何实现两台PostgreSQL数据库的负载均衡。做这个实验的目的有三个:1,是一个朋友的

12、需求;2,我本人也有一段时间没有看LVS方面的东西了,借这个机会再复习一下;3,因为这是个最简单的LVS的实验,对LVS的初学者来说有很好的帮助。安装步骤:1, 首先你要重新编译内核,如果你不清楚如何编译内核,可以到我们的“基础知识”栏目中去看看。将NetFilter和LVS的选项编译进你的内核,你可以参考一下这三张图片:网络编译选项,NetFilter编译选项,LVS编译选项2, 内核编译完成后用新内核启动系统,然后安装ipvsadmtar zxvf ipvsadm-1.21.tar.gzcd ipvsadm-1.21makemake install安装完毕3, 我们现在有如下的网络结构,要

13、实现对两台PostgreSQL服务器的负载均衡,实现对这两台PostgreSQL服务器:192.168.3.2,192.168.3.3的负载均衡很容易,用下面的几条命令:echo 1 /proc/sys/net/ipv4/ip_forwardipvsadm -A -t 192.168.1.100:5432 -s rripvsadm -a -t 192.168.1.100:5432 -r 192.168.3.2:5432 -m -w 1ipvsadm -a -t 192.168.1.100:5432 -r 192.168.3.3:5432 -m -w 1解释:echo 1 /proc/sys/n

14、et/ipv4/ip_forward:打开Linux LVS Router的路由功能。否则数据包是不会被转发的ipvsadm -A -t 192.168.1.100:5432 -s rr :添加一台虚拟的服务器,虚拟服务器的IP地址是192.168.1.100,端口是5432,用的算法是Round Robin(轮寻)ipvsadm -a -t 192.168.1.100:5432 -r 192.168.3.2:5432 -m -w 1在虚拟服务器192.168.1.100中添加真实的服务器192.168.3.2:5432;ipvsadm -a -t 192.168.1.100:5432 -r

15、192.168.3.3:5432 -m -w 1在虚拟服务器192.168.1.100中添加真实的服务器192.168.3.3:5432以上是这个实验的全部的内容,现在我们对他做一个小的讨论:1, 首先,这个实验是针对PostgreSQL集群的,PostgreSQL的默认端口号5432。如果你要做其他服务的集群,同样没问题的如http、FTP、SMTP,你只需要将命令里的端口号5432改成相应的端口号就可以了。2, 这个PostgreSQL的集群并不是很理想,有两种情况值得提一下:(A),当两台PostgreSQL中的一台出现故障时,ipvsadm并不能自动的检测到,不会将出现故障的服务器从集群中剔除,ipvsadm仍然会按照定好的规则对两台服务器做负载均衡,这样就会造成PostgreSQL的服务时好时坏。(B),因为我们现在只使用了一台Linux LVS Router,当Linux LVS Router出现故障时,整个PostgreSQL将停止服务。解决这两个问题的方法是用一种方法,时时的监测集群中所有机器包括服务器、LVS Router的健康状态,如果有服务器出现了故障,集群系统自动的将他从系统中剔除;然后准备两台以上的LVS Rou

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号