数据中心解决方案-高可用技术白皮书

上传人:我*** 文档编号:133270167 上传时间:2020-05-25 格式:PDF 页数:30 大小:1.30MB
返回 下载 相关 举报
数据中心解决方案-高可用技术白皮书_第1页
第1页 / 共30页
数据中心解决方案-高可用技术白皮书_第2页
第2页 / 共30页
数据中心解决方案-高可用技术白皮书_第3页
第3页 / 共30页
数据中心解决方案-高可用技术白皮书_第4页
第4页 / 共30页
数据中心解决方案-高可用技术白皮书_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《数据中心解决方案-高可用技术白皮书》由会员分享,可在线阅读,更多相关《数据中心解决方案-高可用技术白皮书(30页珍藏版)》请在金锄头文库上搜索。

1、 数据中心解决方案 高可用技术白皮书 Huawei 3Com Technologies Co Ltd 华为3Com技术有限公司 http www huawei All rights reserved 版权所有 侵权必究 Catalog 目 录 1 总体介绍总体介绍 2 1 1 技术应用背景技术应用背景 2 1 1 1 数据中心现状 2 1 1 2 高可用对数据中心的重要性 2 1 2 可靠性基本概念可靠性基本概念 3 2 设计思路设计思路 4 2 1 数据中心可靠性设计所面临的挑战数据中心可靠性设计所面临的挑战 4 2 2 数据中心可靠性设计思路数据中心可靠性设计思路 4 2 2 1 数据中心

2、可靠性设计的策略 4 2 2 2 华为 3com 数据中心解决方案可靠性设计策略 5 3 关键技术说明关键技术说明 5 3 1 1 基础网络 6 1 设备级的可靠性设计 6 1 IRF构架 6 2 双主控板主备机制 8 3 灵活完备的配置恢复 8 4 设备关键部件冗余 8 5 完善的启动文件保护 9 6 高可用的网络机箱 9 7 负载均衡设备双机备份 9 8 IPS设备的双机冗余设计 9 9 HRP Huawei Redundancy Protocol 9 10 AUX口拨号支持 实现双网 PSTN网 IP网 管理 11 11 热补丁 11 2 网络级的可靠性设计 11 1 链路层 11 2

3、网络层 21 3 4 7层 24 3 1 2 网络构架 25 1 先进的 分区 理念 25 2 高可用的设备管理 26 4 典型应用组网典型应用组网 26 Figure List 图目录 图表 1 各行业数据中心故障损失统计表 3 图表 2 数据中心解决方案高可用技术总图 6 图表 3 XRN的分布式弹性路由 7 图表 4 分布式链路聚合 DLA 8 图表 5 HRP协议应用示意图 10 图表 6 聚合技术层次结构 13 图表 7 聚合子层模块 14 图表 8 DLDP协议各状态的转换及触发状态转换的事件图 15 图表 9 SMART LINK备份端口典型组网 17 图表 10 SMART L

4、INK监控端口典型组网 18 图表 11 数据中心解决方案的典型组网 27 图表 12 数据中心解决方案中HA特性部署总图 27 1 数据中心解决方案 高可用技术白皮书 关键词 关键词 HA 数据中心 数据中心 摘摘 要 本文对数据中心解决方案中的高可用关键技术进行介绍 分别从设备本身和网络两个方 面阐述了数据中心解决方案中的高可用技术实现方案 要 本文对数据中心解决方案中的高可用关键技术进行介绍 分别从设备本身和网络两个方 面阐述了数据中心解决方案中的高可用技术实现方案 缩略语清单 缩略语清单 缩略语缩略语 英文全名英文全名 中文解释中文解释 MTBF Mean Time Between F

5、ailure 系统平均正常运行时间 MTTR Mean Time to Repair 系统平均恢复时间 RTO Recovery Time Objective 系统恢复实际目标 RPO recovery point objective 系统恢复点目标 ROI return on investment 投资回报率 VLAN Virtual Local Area Network 虚拟局域网 LACP Link Aggregation Control Protocol 链路聚合控制协议 STP Spanning Tree Protocol 生成树协议 RSTP Rapid Spanning Tree

6、 Protocol 快速生成树协议 MSTP Multiple Spanning Tree Protocol 多生成树协议 VRRP Virtual Router Redundancy Protocol 虚拟路由冗余协议 BPDU Bridge Protocol Data Unit 桥协议数据单元 HRP Huawei Redundancy Protocol 华为冗余协议 IRF Inteligent relisent fibric 智能弹性架构 DLDP Device Link Detection Protocol 设备链路检测协议 GR Graceful restart 设备重启保护 2

7、1 总体介绍总体介绍 1 1 技术应用背景 1 1 1 数据中心现状 随着社会生产力的不断发展 用户需求不断发展提高 市场也不断发展变化 谁能真正掌握 市场迎合用户 谁就能够占领先机提高自己的核心竞争力 企业运营中关键资讯传递的畅通可以 帮助企业充分利用关键资源 供应链 渠道管理 了解市场抓住商机 从而帮助企业维持甚至提 高其竞争地位 作为网络上数据存储和流通中心的企业数据中心很显然拥有企业资讯流通最核心 的地位 其越来越受到企业的重视 当前各个企业 行业的基础网络已经基本完成 随着 大集 中 思路越来越深入人心 各企业 行业越来越迫切的需要在原来的基础网络上新建自己的数据中 心 数据中心设施

8、的整合已经成为行业内的一个主要发展趋势 利用数据中心 企业不但能集中资源 和信息加强资讯的流通以及新技术的采用 还可以改善对外服务水平提高企业的市场竞争力 一个好的 数据中心在具有上述好处之外甚至还可以降低拥有成本 1 1 2 高可用对数据中心的重要性 随着企业对信息访问依赖性的增加 数据中心对企业日常业务影响也越来越大 一旦企业数 据中心出现故障 将对企业日常业务的正常运作造成极大的冲击 给企业带来巨大的损失 总的 来看 数据中心出现故障时 企业的损失分为以下几个方面 对企业日常工作的冲击 员工无法 正常工作 直接财产损失 比如 订单丢失 企业合作伙伴损失赔偿等等 企业声誉的损失 如 网络服

9、务提供商可能失去部分用户 根据META Group的统计 各行业平均每小时因为数据中心故障造成 1 010 536 00的损失 其中能源 通信 制造业的损失分列前三甲 具体情况 详见下表 Industry Sector Revenue Hour Revenue Employee Hour Energy 2 817 846 00 569 20 Telecommunications 2 066 245 00 168 98 Manufacturing 1 610 645 00 134 20 Financial Institutions 1 495 134 00 1 079 89 Informatio

10、n Technology 1 344 461 00 184 03 Insurance 1 202 444 00 370 92 Retail 1 107 274 00 244 37 Pharmaceuticals 1 082 252 00 167 53 Banking 996 802 00 130 52 Food Beverage Processing 804 192 00 153 10 Consumer Products 785 719 00 127 98 3 Chemicals 704 101 00 194 53 Transportation 668 586 00 107 78 Utilit

11、ies 643 250 00 380 94 Healthcare 636 030 00 142 58 Metals Natural Resources 580 588 00 153 11 Professional Services 532 510 00 99 59 Electronics 477 366 00 74 48 Construction and Engineering 389 601 00 216 18 Media 340 432 00 119 74 Hospitality 330 654 00 38 62 Average 1 010 536 00 205 55 图表 1 各行业数据

12、中心故障损失统计表 由上可数据中心的可靠性直接关系企业利益 处于非常重要的地位 一个高可靠的数据中心 可以帮助企业在集中资源 提高业务服务水平的同时降低运行成本 可靠性已经成为衡量一个数 据中心优劣的重要方面 1 2 可靠性基本概念 传统意义上来说可靠性 AVAILABILITY 的涵义为系统正常运行时间占总运行时间的比例 当前的总运行时间包括出问题以后修复所耗费的时间 由以下两个基本概念组成 MTBF Mean Time Between Failure 系统平均正常运行时间 MTTR Mean Time to Repair 系统平均恢复时间 AVAILABILITY MTBF MTBF MT

13、TR 对现代企业数据中心来说 用户除了关心数据中心正常运转的平均时间 MTBF 以外 更为 在意的是数据中心出现故障以后能否以很短的时间恢复正常运行 是否能对核心业务的影响减轻 到最小 因此 针对MTTR业界又扩展出了另外几个指标 RTO Recovery Time Objective RTO 表示完成应用 及其相关业务流程 并保证技术组件恢复到能够正常执行事务处理或业 务职能的最长时间 但是 RTO 并不意味着 100 恢复 它通常指的是降级处理模式 例如减 少容量 降低性能 4 RPO recovery point objective RPO 指某个时刻 应用数据必须恢复到这个时刻才能继续

14、执行事务处理 它规定了需要将信 息恢复到哪个数据流点 或者说 企业能够忍受丢失多少数据 ROI return on investment ROI 是指用户的投资回报 由于数据中心中各个部分的重要性有一定的差别 因此 各个分区 出现故障后的影响各有不同 对高可用的要求也不尽相同 由于保证网络高可用意味着不菲价 格 因此分区的构架可以满足区分用户业务 在保证用户数据中心整网高可用的目标的前提下 尽可能的为用户降低成本 2 设计思路设计思路 2 1 数据中心可靠性设计所面临的挑战 对于数据中心 现代企业面临着两难的局面 一方面处于企业数据流通最核心地位的企业数 据中心对于企业来说有着至关重要的作用

15、企业对数据中心的依赖性越来越强 另一方面由于影 响数据中心网络环境的因素很多 数据中心出现故障的情况几乎不可避免 因此 数据中心解决 方案需要着重关注如何尽量减小数据中心出现故障后对企业关键业务造成的影响 为了实现这一 目标 首先应该要了解企业数据中心出现故障的类型以及该类型故障产生的影响 影响数据中心 的故障主要分为如下几类 硬件故障 软件故障 链路故障 电源 环境故障 资源利用问题 网络设计问题 2 2 数据中心可靠性设计思路 2 2 1 数据中心可靠性设计的策略 由上 2 1 可以知道数据中心出现的故障类型较多 风险也无法避免 那怎样才能做到当故 障发生时对企业关键业务造成的影响最小呢

16、其实 我们可以看出虽然数据中心的故障类型众 多 但故障发生产生的后果却大同小异 即 导致数据中心中的设备 链路或server发生故障 无 法对外提供正常服务 对于这些故障的缓解最简单的方式就是冗余设计 可以通过对设备 链 5 路 server提供备份 从而将故障对用户业务的影响降低到最小 但是否是一味的增加冗余设计就可以达到我们缓解故障影响的目的呢 有人可能会将网络可 用性与冗余性等同起来 但事实上 冗余性只是整个可用性架构中的一个方面 一味的强调冗余 性冗余性反而可能会降低可用性减小冗余所带来的优点 因为冗余性在带来好处的同时也会引入 一些缺点 提高网络复杂度 加重网络支持负担 增加配置和管理的复杂度 因此 数据中心的高可靠设计是一个综合的概念 我们在提高网络的冗余性的同时 还需要 加强网络构架的优化 从而实现真正的高可用 一般来说设计一个高可用的系统 主要关心以下 四个方面 设计高可用的网络构架 关键链路提供设备级 链路级冗余备份 减少非计划性的宕机 可用可靠的网络管理 及时的故障检测定位 2 2 2 华为 3com 数据中心解决方案可靠性设计策略 华为3COM的数据中心解决方案从

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号