数据中心解决方案-高可用技术白皮书

资源描述

《数据中心解决方案-高可用技术白皮书》由会员分享，可在线阅读，更多相关《数据中心解决方案-高可用技术白皮书（30页珍藏版）》请在金锄头文库上搜索。

1、数据中心解决方案高可用技术白皮书 Huawei 3Com Technologies Co Ltd 华为3Com技术有限公司 http www huawei All rights reserved 版权所有侵权必究 Catalog 目录 1 总体介绍总体介绍 2 1 1 技术应用背景技术应用背景 2 1 1 1 数据中心现状 2 1 1 2 高可用对数据中心的重要性 2 1 2 可靠性基本概念可靠性基本概念 3 2 设计思路设计思路 4 2 1 数据中心可靠性设计所面临的挑战数据中心可靠性设计所面临的挑战 4 2 2 数据中心可靠性设计思路数据中心可靠性设计思路 4 2 2 1 数据中心

2、可靠性设计的策略 4 2 2 2 华为 3com 数据中心解决方案可靠性设计策略 5 3 关键技术说明关键技术说明 5 3 1 1 基础网络 6 1 设备级的可靠性设计 6 1 IRF构架 6 2 双主控板主备机制 8 3 灵活完备的配置恢复 8 4 设备关键部件冗余 8 5 完善的启动文件保护 9 6 高可用的网络机箱 9 7 负载均衡设备双机备份 9 8 IPS设备的双机冗余设计 9 9 HRP Huawei Redundancy Protocol 9 10 AUX口拨号支持实现双网 PSTN网 IP网管理 11 11 热补丁 11 2 网络级的可靠性设计 11 1 链路层 11 2

3、网络层 21 3 4 7层 24 3 1 2 网络构架 25 1 先进的分区理念 25 2 高可用的设备管理 26 4 典型应用组网典型应用组网 26 Figure List 图目录图表 1 各行业数据中心故障损失统计表 3 图表 2 数据中心解决方案高可用技术总图 6 图表 3 XRN的分布式弹性路由 7 图表 4 分布式链路聚合 DLA 8 图表 5 HRP协议应用示意图 10 图表 6 聚合技术层次结构 13 图表 7 聚合子层模块 14 图表 8 DLDP协议各状态的转换及触发状态转换的事件图 15 图表 9 SMART LINK备份端口典型组网 17 图表 10 SMART L

4、INK监控端口典型组网 18 图表 11 数据中心解决方案的典型组网 27 图表 12 数据中心解决方案中HA特性部署总图 27 1 数据中心解决方案高可用技术白皮书关键词关键词 HA 数据中心数据中心摘摘要本文对数据中心解决方案中的高可用关键技术进行介绍分别从设备本身和网络两个方面阐述了数据中心解决方案中的高可用技术实现方案要本文对数据中心解决方案中的高可用关键技术进行介绍分别从设备本身和网络两个方面阐述了数据中心解决方案中的高可用技术实现方案缩略语清单缩略语清单缩略语缩略语英文全名英文全名中文解释中文解释 MTBF Mean Time Between F

5、ailure 系统平均正常运行时间 MTTR Mean Time to Repair 系统平均恢复时间 RTO Recovery Time Objective 系统恢复实际目标 RPO recovery point objective 系统恢复点目标 ROI return on investment 投资回报率 VLAN Virtual Local Area Network 虚拟局域网 LACP Link Aggregation Control Protocol 链路聚合控制协议 STP Spanning Tree Protocol 生成树协议 RSTP Rapid Spanning Tree

6、 Protocol 快速生成树协议 MSTP Multiple Spanning Tree Protocol 多生成树协议 VRRP Virtual Router Redundancy Protocol 虚拟路由冗余协议 BPDU Bridge Protocol Data Unit 桥协议数据单元 HRP Huawei Redundancy Protocol 华为冗余协议 IRF Inteligent relisent fibric 智能弹性架构 DLDP Device Link Detection Protocol 设备链路检测协议 GR Graceful restart 设备重启保护 2

7、1 总体介绍总体介绍 1 1 技术应用背景 1 1 1 数据中心现状随着社会生产力的不断发展用户需求不断发展提高市场也不断发展变化谁能真正掌握市场迎合用户谁就能够占领先机提高自己的核心竞争力企业运营中关键资讯传递的畅通可以帮助企业充分利用关键资源供应链渠道管理了解市场抓住商机从而帮助企业维持甚至提高其竞争地位作为网络上数据存储和流通中心的企业数据中心很显然拥有企业资讯流通最核心的地位其越来越受到企业的重视当前各个企业行业的基础网络已经基本完成随着大集中思路越来越深入人心各企业行业越来越迫切的需要在原来的基础网络上新建自己的数据中心数据中心设施

8、的整合已经成为行业内的一个主要发展趋势利用数据中心企业不但能集中资源和信息加强资讯的流通以及新技术的采用还可以改善对外服务水平提高企业的市场竞争力一个好的数据中心在具有上述好处之外甚至还可以降低拥有成本 1 1 2 高可用对数据中心的重要性随着企业对信息访问依赖性的增加数据中心对企业日常业务影响也越来越大一旦企业数据中心出现故障将对企业日常业务的正常运作造成极大的冲击给企业带来巨大的损失总的来看数据中心出现故障时企业的损失分为以下几个方面对企业日常工作的冲击员工无法正常工作直接财产损失比如订单丢失企业合作伙伴损失赔偿等等企业声誉的损失如网络服

9、务提供商可能失去部分用户根据META Group的统计各行业平均每小时因为数据中心故障造成 1 010 536 00的损失其中能源通信制造业的损失分列前三甲具体情况详见下表 Industry Sector Revenue Hour Revenue Employee Hour Energy 2 817 846 00 569 20 Telecommunications 2 066 245 00 168 98 Manufacturing 1 610 645 00 134 20 Financial Institutions 1 495 134 00 1 079 89 Informatio

10、n Technology 1 344 461 00 184 03 Insurance 1 202 444 00 370 92 Retail 1 107 274 00 244 37 Pharmaceuticals 1 082 252 00 167 53 Banking 996 802 00 130 52 Food Beverage Processing 804 192 00 153 10 Consumer Products 785 719 00 127 98 3 Chemicals 704 101 00 194 53 Transportation 668 586 00 107 78 Utilit

11、ies 643 250 00 380 94 Healthcare 636 030 00 142 58 Metals Natural Resources 580 588 00 153 11 Professional Services 532 510 00 99 59 Electronics 477 366 00 74 48 Construction and Engineering 389 601 00 216 18 Media 340 432 00 119 74 Hospitality 330 654 00 38 62 Average 1 010 536 00 205 55 图表 1 各行业数据

12、中心故障损失统计表由上可数据中心的可靠性直接关系企业利益处于非常重要的地位一个高可靠的数据中心可以帮助企业在集中资源提高业务服务水平的同时降低运行成本可靠性已经成为衡量一个数据中心优劣的重要方面 1 2 可靠性基本概念传统意义上来说可靠性 AVAILABILITY 的涵义为系统正常运行时间占总运行时间的比例当前的总运行时间包括出问题以后修复所耗费的时间由以下两个基本概念组成 MTBF Mean Time Between Failure 系统平均正常运行时间 MTTR Mean Time to Repair 系统平均恢复时间 AVAILABILITY MTBF MTBF MT

13、TR 对现代企业数据中心来说用户除了关心数据中心正常运转的平均时间 MTBF 以外更为在意的是数据中心出现故障以后能否以很短的时间恢复正常运行是否能对核心业务的影响减轻到最小因此针对MTTR业界又扩展出了另外几个指标 RTO Recovery Time Objective RTO 表示完成应用及其相关业务流程并保证技术组件恢复到能够正常执行事务处理或业务职能的最长时间但是 RTO 并不意味着 100 恢复它通常指的是降级处理模式例如减少容量降低性能 4 RPO recovery point objective RPO 指某个时刻应用数据必须恢复到这个时刻才能继续

14、执行事务处理它规定了需要将信息恢复到哪个数据流点或者说企业能够忍受丢失多少数据 ROI return on investment ROI 是指用户的投资回报由于数据中心中各个部分的重要性有一定的差别因此各个分区出现故障后的影响各有不同对高可用的要求也不尽相同由于保证网络高可用意味着不菲价格因此分区的构架可以满足区分用户业务在保证用户数据中心整网高可用的目标的前提下尽可能的为用户降低成本 2 设计思路设计思路 2 1 数据中心可靠性设计所面临的挑战对于数据中心现代企业面临着两难的局面一方面处于企业数据流通最核心地位的企业数据中心对于企业来说有着至关重要的作用

15、企业对数据中心的依赖性越来越强另一方面由于影响数据中心网络环境的因素很多数据中心出现故障的情况几乎不可避免因此数据中心解决方案需要着重关注如何尽量减小数据中心出现故障后对企业关键业务造成的影响为了实现这一目标首先应该要了解企业数据中心出现故障的类型以及该类型故障产生的影响影响数据中心的故障主要分为如下几类硬件故障软件故障链路故障电源环境故障资源利用问题网络设计问题 2 2 数据中心可靠性设计思路 2 2 1 数据中心可靠性设计的策略由上 2 1 可以知道数据中心出现的故障类型较多风险也无法避免那怎样才能做到当故障发生时对企业关键业务造成的影响最小呢

16、其实我们可以看出虽然数据中心的故障类型众多但故障发生产生的后果却大同小异即导致数据中心中的设备链路或server发生故障无法对外提供正常服务对于这些故障的缓解最简单的方式就是冗余设计可以通过对设备链 5 路 server提供备份从而将故障对用户业务的影响降低到最小但是否是一味的增加冗余设计就可以达到我们缓解故障影响的目的呢有人可能会将网络可用性与冗余性等同起来但事实上冗余性只是整个可用性架构中的一个方面一味的强调冗余性冗余性反而可能会降低可用性减小冗余所带来的优点因为冗余性在带来好处的同时也会引入一些缺点提高网络复杂度加重网络支持负担增加配置和管理的复杂度因此数据中心的高可靠设计是一个综合的概念我们在提高网络的冗余性的同时还需要加强网络构架的优化从而实现真正的高可用一般来说设计一个高可用的系统主要关心以下四个方面设计高可用的网络构架关键链路提供设备级链路级冗余备份减少非计划性的宕机可用可靠的网络管理及时的故障检测定位 2 2 2 华为 3com 数据中心解决方案可靠性设计策略华为3COM的数据中心解决方案从

展开阅读全文

数据中心解决方案-高可用技术白皮书

最新文档