解析Nginx负载均衡

上传人:公**** 文档编号:431487421 上传时间:2023-12-29 格式:DOC 页数:13 大小:409.50KB
返回 下载 相关 举报
解析Nginx负载均衡_第1页
第1页 / 共13页
解析Nginx负载均衡_第2页
第2页 / 共13页
解析Nginx负载均衡_第3页
第3页 / 共13页
解析Nginx负载均衡_第4页
第4页 / 共13页
解析Nginx负载均衡_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《解析Nginx负载均衡》由会员分享,可在线阅读,更多相关《解析Nginx负载均衡(13页珍藏版)》请在金锄头文库上搜索。

1、对于一种大型网站来说,负载均衡是永恒的话题。随着硬件技术的迅猛发展,越来越多的负载均衡硬件设备涌现出来,如F5 BIG-IP、Citrix NetScaler、Radware等等,虽然可以解决问题,但其高昂的价格却往往令人望而却步,因此负载均衡软件仍然是大部分公司的不二之选。nginx作为webserver的后起之秀,其优秀的反向代理功能和灵活的负载均衡方略受到了业界广泛的关注。本文将以工业生产为背景,从设计实现和具体应用等方面具体简介nginx负载均衡方略。核心字:nginx 负载均衡 反向代理1.前言随着互联网信息的爆炸性增长,负载均衡(load balance)已经不再是一种很陌生的话题

2、,顾名思义,负载均衡即是将负载分摊到不同的服务单元,既保证服务的可用性,又保证响应足够快,给顾客较好的体验。迅速增长的访问量和数据流量催生了各式各样的负载均衡产品,诸多专业的负载均衡硬件提供了较好的功能,但却价格不菲,这使得负载均衡软件大受欢迎,nginx就是其中的一种。nginx第一种公开版本发布于,发布了1.0版本。它的特点是稳定性高、功能强大、资源消耗低,从其目前的市场占有而言,nginx大有与apache抢市场的势头。其中不得不提到的一种特性就是其负载均衡功能,这也成了诸多公司选择它的重要因素。本文将从源码的角度简介nginx的内置负载均衡方略和扩展负载均衡方略,以实际的工业生产为案例

3、,对比各负载均衡方略,为nginx使用者提供参照。2. 源码剖析nginx的负载均衡方略可以划分为两大类:内置方略和扩展方略。内置方略涉及加权轮询和ip hash,在默认状况下这两种方略会编译进nginx内核,只需在nginx配备中指明参数即可。扩展方略有诸多,如fair、通用hash、consistent hash等,默认不编译进nginx内核。由于在nginx版本升级中负载均衡的代码没有本质性的变化,因此下面将以nginx1.0.15稳定版为例,从源码角度分析各个方略。2.1. 加权轮询(weighted round robin)轮询的原理很简朴,一方面我们简介一下轮询的基本流程。如下是解

4、决一次祈求的流程图:图中有两点需要注意,第一,如果可以把加权轮询算法分为先深搜索和先广搜索,那么nginx采用的是先深搜索算法,即将一方面将祈求都分给高权重的机器,直到该机器的权值降到了比其她机器低,才开始将祈求分给下一种高权重的机器;第二,当所有后端机器都down掉时,nginx会立即将所有机器的标志位清成初始状态,以避免导致所有的机器都处在timeout的状态,从而导致整个前端被夯住。接下来看下源码。nginx源码的目录构造很清晰,加权轮询所在途径为nginx-1.0.15/src/http/ngx_http_upstream_round_robin.c|h,在源码的基本上,针对重要的、不

5、易理解的地方我加了注释。一方面看下ngx_http_upstream_round_robin.h中的重要声明:从变量命名中,我们就可以大体猜出其作用。其中,current_weight和weight的区别重要是前者为权重排序的值,随着解决祈求会动态的变化,后者是配备值,用于恢复初始状态。接下来看下轮询的创立过程,代码如下图所示。这里有个tried变量需要做些阐明。tried中记录了服务器目前与否被尝试连接过。她是一种位图。如果服务器数量不不小于32,则只需在一种int中即可记录下所有服务器状态。如果服务器数量不小于32,则需在内存池中申请内存来存储。对该位图数组的使用可参照如下代码:最后是实际

6、的方略代码,逻辑很简朴,代码实现也只有30行,直接上代码。2.2. ip haship hash是nginx内置的另一种负载均衡的方略,流程和轮询很类似,只是其中的算法和具体的方略有些变化,如下图所示:ip hash算法的核心实现如下图:从代码中可以看出,hash值既与ip有关又与后端机器的数量有关。通过测试,上述算法可以持续产生1045个互异的value,这是该算法的硬限制。对此nginx使用了保护机制,当通过20次hash仍然找不到可用的机器时,算法退化成轮询。因此,从本质上说,ip hash算法是一种变相的轮询算法,如果两个ip的初始hash值正好相似,那么来自这两个ip的祈求将永远落在

7、同一台服务器上,这为均衡性埋下了很深的隐患。2.3. fairfair方略是扩展方略,默认不被编译进nginx内核。其原理是根据后端服务器的响应时间判断负载状况,从中选出负载最轻的机器进行分流。这种方略具有很强的自适应性,但是实际的网络环境往往不是那么简朴,因此要慎用。2.4. 通用hash、一致性hash这两种也是扩展方略,在具体的实现上有些差别,通用hash比较简朴,可以以nginx内置的变量为key进行hash,一致性hash采用了nginx内置的一致性hash环,可以支持memcache。3. 对比测试本测试重要为了对比各个方略的均衡性、一致性、容灾性等,从而分析出其中的差别性,并据此

8、给出各自的合用场景。为了可以全面、客观的测试nginx的负载均衡方略,我们采用了两个测试工具、在不同场景下做测试,以此来减少环境对测试成果导致的影响。一方面简朴简介测试工具、测试网络拓扑和基本的测试流程。3.1. 测试工具3.1.1 easyABCeasyABC是公司内部开发的性能测试工具,采用epool模型实现,简朴易上手,可以模拟GET/POST祈求,极限状况下可以提供上万的压力,在公司内部得到了广泛的使用。由于被测试对象为反向代理服务器,因此需要在其后端搭建桩服务器,这里用nginx作为桩webserver,提供最基本的静态文献服务。3.1.2 polygraphpolygraph是一款

9、免费的性能测试工具,以对缓存服务、代理、互换机等方面的测试见长。它有规范的配备语言PGL(Polygraph Language),为软件提供了强大的灵活性。其工作原理如下图所示:polygraph提供client端和server端,将测试目的nginx放在两者之间,三者之间的网络交互均走http合同,只需配备ip+port即可。client端可以配备虚拟robot的个数以及每个robot发祈求的速率,并向代理服务器发起随机的静态文献祈求,server端将按照祈求的url生成随机大小的静态文献做响应。这也是选用这个测试软件的一种重要因素:可以产生随机的url作为nginx多种hash方略的key

10、。此外,polygraph还提供了日记分析工具,功能比较丰富,感爱好的同窗可以参照附录中的有关材料。3.2. 测试环境本测试运营在5台物理机上,其中被测对象单独搭在一台8核机器上,此外四台4核机器分别搭建了easyABC、webserver桩和polygraph,如下图所示:3.3. 测试方案一方面简介下核心的测试指标:均衡性:与否可以将祈求均匀的发送给后端一致性:同一种key的祈求,与否能落到同一台机器容灾性:当部分后端机器挂掉时,与否可以正常工作以上述指标为指引,我们针对如下四个测试场景分别用easyABC和polygraph进行测试:场景1 server_*均正常提供服务;场景2 ser

11、ver_4挂掉,其她正常;场景3 server_3、server_4挂掉,其她正常;场景4 server_*均恢复正常服务。上述四个场景将按照时间顺序进行,每个场景将建立在上一种场景基本上,被测试对象无需做任何操作,以最大限度模拟实际状况。此外,考虑到测试工具自身的特点,在easyabc上的测试压力在17000左右,polygraph上的测试压力在4000左右。以上测试均保证被测试对象可以正常工作,且无任何notice级别以上(alert/error/warn)的日记浮现,在每个场景中记录下server_*的qps用于最后的方略分析。3.4. 测试成果表1和图1是轮询方略在两种测试工具下的负载

12、状况。对比在两种测试工具下的测试成果会发现,成果完全一致,因此可以排除测试工具的影响。从图表中可以看出,轮询方略对于均衡性和容灾性都可以做到较好的满足。(点击图片查看大图)表2和图2是fair方略在两种测试工具下的负载状况。fair方略受环境影响非常大,在排除了测试工具的干扰之后,成果仍然有非常大的抖动。从直观上讲,这完全不满足均衡性。但是从另一种角度出发,恰恰是由于这种自适应性保证了在复杂的网络环境中可以物尽所用。因此,在应用到工业生产中之前,需要在具体的环境中做好测试工作。(点击图片查看大图)如下图表是多种hash方略,所不同的仅仅是hash key或者是具体的算法实现,因此一起做对比。实

13、际测试中发现,通用hash和一致性hash均存在一种问题:当某台后端的机器挂掉时,原有落到这台机器上的流量会丢失,但是在ip hash中就不存在这样的问题。正如上文中对ip hash源码的分析,当ip hash失效时,会退化为轮询方略,因此不会有丢失流量的状况。从这个层面上说,ip hash也可以当作是轮询的升级版。(点击图片查看大图)图5为ip hash方略,ip hash是nginx内置方略,可以看做是前两种方略的特例:以来源ip为key。由于测试工具不便于模拟海量ip下的祈求,因此这里截取线上实际的状况加以分析,如下图所示:图5 ip hash方略图中前1/3使用轮询方略,中间段使用ip

14、 hash方略,后1/3仍然是轮询方略。可以明显的看出,ip hash的均衡性存在着很大的问题。因素并不难分析,在实际的网络环境中,有大量的高校出口路由器ip、公司出口路由器ip等网络节点,这些节点带来的流量往往是一般顾客的成百上千倍,而ip hash方略恰恰是按照ip来划分流量,因此导致上述后果也就自然而然了。4. 总结与展望通过实际的对比测试,我们对nginx各个负载均衡方略进行了验证。下面从均衡性、一致性、容灾性以及合用场景等角度对比多种方略。(点击图片查看大图)以上从源码和实际的测试数据角度分析阐明了nginx负载均衡的方略,并给出了多种方略适合的应用场景。通过本文的分析不难发现,无论哪种方略都不是万金油,在具体的场景下应当选择哪种方略一定限度上依赖于使用者对这些方略的熟悉限度。但愿本文的分析和测试数据可以对读者有所协助,更但愿有越来越多、越来越好的负载均衡方略产出。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号