数据中心运营的一常见问题解决方案

上传人:s9****2 文档编号:470354334 上传时间:2023-05-12 格式:DOC 页数:18 大小:170.50KB
返回 下载 相关 举报
数据中心运营的一常见问题解决方案_第1页
第1页 / 共18页
数据中心运营的一常见问题解决方案_第2页
第2页 / 共18页
数据中心运营的一常见问题解决方案_第3页
第3页 / 共18页
数据中心运营的一常见问题解决方案_第4页
第4页 / 共18页
数据中心运营的一常见问题解决方案_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《数据中心运营的一常见问题解决方案》由会员分享,可在线阅读,更多相关《数据中心运营的一常见问题解决方案(18页珍藏版)》请在金锄头文库上搜索。

1、数据中心运营的一常见问题(解决方案 )1. 多大规模的数据中心才足够大 ?第一个问题通常的最难回答的或者最简单的问题。对于分析师来说,这个问题的 答案是“取决于许多因素”。但是,当你投资数千万美元建设一个新的数据中心的时 候,这个答案就不行了。这个问题的困难部分不是搞清楚你现在的需求有多大,而是 要搞清楚你在 15 年中的需求是什么。2. 我确实需要多少可用性 ?数据中心通常是由层次水平确定的。 层次水平实际上确定了这个环境的可用性 (正 常运行时间 )的目标。虽然经常引用 TIA 942 行业标准,但是,许多公司在设计的早期 阶段都使用正常运行时间学会 (UPTIME INSTITUTE)

2、的 4层可用性指南作为一个良好 的拇指定律。确定这个层是非常重要的,因为你的 60% 的资本预算都是由你确定层次 的决策确定的。3. 我需要多少能源 ?传统的数据中心是根据旨在支持当时典型的 IT 设备的最大容量的静态能源需求建 设的。这种模式现在不在起作用了,数据中心的设计需要考虑能源的伸缩性,以支持 未来安装高密度的机架环境。4. 绿色技术如何 ?在设计数据中心的时候,有没有我需要了解的市场上的绿色技术或者将出现的绿 色技术 ?从设计的角度看,在数据中心中使用句柄头和冷却工作量的最有效的方法是什么?5. 这个数据中心要使用多长时间 ?一个新的数据中心的实际的生命周期是什么 ?传统数据中心一

3、般使用寿命是 15 至 20 年。但是,由于目前的技术和计算需求的迅速变化,这个时间段是现实的吗?有没有一些方法把新的数据中心寿命延长到 20 年以上 ?6. 所有的应用程序都以同样的水平创建吗 ?在传统的数据中心设计中, 我们要支持例外的情况: 高可用性、 高性能和伸缩性。 但是,你的应用程序都需要这些水平的支持吗 ?我能根据我的应用程序的要求建立一个 环境以支持不同的服务和技术水平吗 ?7. 当前最新的设计趋势是什么 ?当前占主导地位的数据中心设计趋势是什么 ?使用(或者忽略 )这些趋势有什么好处 和坏处?8. 我应该建设一个还是多个数据中心 ?在整合项目中,最常提出的问题是“我需要多少了

4、数据中心 ?”这些问题的答案取 决于风险与回报、资本预算、地理位置、服务水平和恢复时间目标。在某些情况下, 建造两个数据中心能够建造一个数据中心便宜一些。9. 业务持续性与灾难恢复如何 ?当设计一个数据中心的时候,我应该还要制定我的业务持续性计划吗?或者在整个设计阶段考虑业务持续性与灾难恢复 ?有没有新的技术在解决业务持续性与灾难恢复 问题的同时还能为重要的应用程序提供高增长和冗余水平 ?10. 谁建设这个数据中心 ?我应该提前提出什么问题 ?我们如何确定这个工程公司、建筑公司、分包商、委托公司等等 ?目前有没有应该注意的最佳做法或者最糟糕的做法 ?1、数据中心建设,是建设现代化的高性能机房、

5、购置先进的通信、网络和硬件设备, 支持有线无线网络接入方式,实现高速、高带宽接入,搭配高配服务器和海量存储, 并向虚拟化方向发展?同时,数据中心要能够实现丰富的各类数据(视频、声像、电 子地图和各类图表)综合展现吗?2、数据中心建设,如何深化核心业务需求?如何搞好数据中心规划设计和组织管理? 是不是只管数据、不管应用系统的整合建设?只做各类数据的综合信息发布、查询和 检索,不考虑核心业务系统的集成(整合)?3、数据中心建设, 如何解决数据标准统一问题?目前, 信息化中最为薄弱的环节 数据标准化,存在着有 标准、不采标;现有标准不科学,数据冗余、系统结构稳定性 差;有些标准不实用,不符合业务管理

6、要求,要修订;各类基础标准不统一,分散在 不同业务系统中存在多个同义编码,规则不一致,产生信息孤岛、造成系统集成难度 加大;而各主流开发商均采用数据交换平台或数据接口的形式来解决集成, 无法治本、 导致系统的 可维护性极差,不能发挥数据中心的数据集中管控及服务功能,使数据中 心建设失去现实意义。4、数据中心建设,与业已存在的相关专业数据中心是什么关系?数据中心建设是采取 数据大集中策略?多级数据中心的数据整合策略是什么?下级或基层的本地数据怎么 办?如何保证数据一致性的同时、还要提高系统整体效率 ?5、数据中心建设,涉及到核心业务系统的整合开发建设,要采取的统一定制开发模 式是什么?如何保证不

7、同管理层级用户的不同管理需求、并能够实现可配置化?如何 避免因业务流程的调整而不断重复修改应用系统?新建业务系统、已建业务系统和在 建业务系统间的不同整合策略是什么?如何在建立统一数据标准、支持数据中心 建设 的同时,兼顾已有投资、实现系统集成?6、数据中心建设项目如何管控?如何结合各类核心业务系统建设,实现体系化建设要 求?如何科学组织达到预期?以上问题将会严重影响到数据中心建设的总体策略,也关系到数据中心建设能否实现 预期目标,应给以重视并解决。1. 您是否认为数据中心服务器整合真的物有所值?数据中心究竟是否应该对服务器进 行整合,有没有不需要整合的情况存在?专家:从理论上讲,数据中心整合

8、是值得肯定的。整合可以提高 IT 管理的效率和 性能,降低软件和基础设施成本。企业真正需要考虑的是成本的回收时间。尽管说通 过旧设备的淘汰及软件许可的收益企业可以获得一定的补偿,但新硬件和应用的部署 还是会对企业成本产生很大的影响。另一个需要考虑的因素是如何使企业内部员工能 尽 全力去完成整合工作,为了完成某些特定项目,我们是否需要对员工进行相关培训? 总体来说,在进行任何整合项目规划时,都需要做一个资产评估。只有这样,企业才 能知道它该如何去投资,何时能够收回投资。如果缺乏适当的预先规划,大多数整合 项目都不能确保万无一失。2. 以下是数据中心整合过程中特别需要注意的四个问题。将网络反应时间

9、与应用反应时间沦为一谈当你将服务器搬离用户所在地之后,你就会面临网络反应时间问题。用户与服务器间的物理距离会导致二者间信号传输的延迟。但是, 100 毫秒的网络延迟并不 意味 着 100 毫秒应用反应时间延迟。即使是面对一些最基本的任务,大多数应用也需要在 用户和服务器之间进行反复的数据交换(通常被称为应用“转换”)。因此,在将服 务器迁至远程后,对一个在本地只需 3 秒钟时间就可以完成的任务而言,如果网络延 迟 50 毫秒的话,就需要 30 秒才能完成。应用 设计(包括它需要进行“转换”的次数)被认为是 IT 技术人员的普遍问题, 而网络延迟则是广大网络经理经常面对的困难。 但是,网络经理们

10、无法改变光的速度, 也无法让东京离纽约更近一些。 因此把这一问题抛给他们是没有任何意义的。 事实上, 即使是在服务器进行搬迁之后,影响反应时间的还是应用设计问题。因此,在 网络方 面做过多的投资意义并不大。没有意识到网络延迟对服务器性能和可用性的影响网络延迟会同时影响服务器的性能和可用性。服务器会将资源分配给当前在线的 每个客户任务。本地客户会在短时间内完成这个任务,因为他们的应用受网络延迟的 影响很小。而远程客户就不是这样了,他们需要花更长的时间来完成这些任务,因为 他们的应用需要更多的“转换”次数。有一点很重要,在某个进程的运行周期内,服务器会对所分配的资源进行锁定, 直到该进程完成后再将

11、其释放。因此,当远程用户与一台服务器进行通信的时候, 在 很长时间内这台服务器的资源是处于忙碌之中的。这也就使该服务器无法向其它客户 释放资源一一这从很大程度上限制了服务器的性能和可用性。从这个角度 讲,IT机构必须要考虑网络延迟的情况,也使他们需要在服务器基础设施方面投入更多的资金。即使是暂时的服务器分离也会对性能有所影响对一个数据中心的成百上千台服务器进行迁移需要花上几个礼拜甚至是几个月 的时间。在整个迁移过程中, 一些系统会留在本地运行, 而另外的系统会在新的数据 中 心内运行。与服务器和用户间的网络延迟现象相比,这种服务器的分离状况对应用性 能的影响会更大,也更难以预料,因为计算进程的

12、设计并不能适应服务器彼此间的延 迟状况。所有在规划设计数据中心的 IT 机构都需要问几个问题。当内部互相有联系的服务 器被短时间分离后会产生什么影响?哪些服务器必须要和其它服务器一起迁移? Active Diectory 服务器是否应该被迁移?哪些服务器在迁移后需要被重新配置?不要到迁移完成后才考虑用户的性能期望值预先解决用户的服务等级期望值显得很重要。如果你要等到迁移完成后才告诉用 户说他们要去适应你所提交的服务,那你就是在把自己往火坑里推。但是在规划过程 中如果你可以预先考虑一下这个问题,你就可以避免这些问题,确保用户的期望值都 满足正常要求。有些时候,重新对服务等级目标(SLO)进行设定

13、显得没有多大意义,因为它与迁移之前的标准是一致的。如果之前处理一个任务需要花本地用户 3 秒钟的时 间,那 在本国范围内对服务器机型迁移后处理该任务所花的时间几乎不可能与原来保持一致。 因此,迁移后确定 7 秒钟左右的 SLO 似乎更合情合理。为了使用户认同这种服务等级, IT 机构必须对迁移后的服务器性能进行模拟和预 判。这使 IT 机构可以模拟出“用户可接受的性能环境”,在实际搬迁项目完成前,用 户就已经有了搬迁后系统性能的使用经验。事实上, IT 机构是可以避免这些问题的。但是要想做到这一点,他们采用一种严 格的方法来对项目进行规划,并完善应用团队、系统管理员以及网络架构师们的专业 技能

14、。在搬迁前后对企业环境及传统指标进行模拟的方法对于预测和解决服务器迁移包括所导致的应用性能问题是特别有用的。 因此, 项目规划过程中的所有参与者 企业用户在内,都需要明确数据中心搬迁会对应用性能有哪些影响。因此,如果你在规划数据中心整合或其它类型的服务器迁移项目,你需要考虑一下再 系统模拟技术方面的投资,它可以使你有选择地区体验不同的性能指标,从而确定哪 些工作需要做哪些工作不需要做。同时,这也可以确保你数据中心搬迁项目的成功 而不会遭遇潜在的灾难性后果。3. 灾难恢复计划如何做到成本优化?答:步骤 1:使用重复数据删除功能,以减少数据存储和复制费用,通常情况下,这要 比运送磁带的成本低。为了

15、证明这一点,我们假设一家企业使用的是不带重复数据删除功能的标准备份 软件、 LTO3 驱动器和 20TB 的生产数据。即便不考虑备份软件成本,提供 40TB 的磁 带容量也需要花费大约 66480 美元(其中包括驱动器、介质、异地存储、调用成本、 操作等)。但是,如果用户使用一台 4TB 重复数据删除设备,在重复数据删除比率为 10:1 条件下就能获得相同的 40TB 容量。如果这一设备的成本加运营成本为 17700 美元, 那么比起使用磁带解决方案的成本, 可以节省超过 300% 的资金(66480 美元减 17700 美元等于 48,780 美元,即实现了 300% 以上的节约效益)。为了

16、进一步消除异地磁带传送和调用的成本,同时消除基于阵列的数据复制许可 成本,可以再建议用户再部署一台重复数据 删除设备进行异地复制数据,同样只需要 10:1的重复数据删除率,就能使复制数据所需的广域网需求降低 90%.当DR端进行恢 复时,也可以利用磁盘上的数 据,这使得查找、加载和恢复数据的速度大大加快,从 而简化了恢复过程,将总用时从数天或数周缩短至数小时。步骤 2: 通过部署快照技术, 消除备份时的海量数据, 并提高备份和灾难恢复的恢 复点目标。备份就是拷贝。要拷贝数据,必须将物理数据从 A 点移动到 B 点。使用基于快照 的备份时,由于无需移动数据,因此备份频率更高。物理备份过程被消除了,这意味 着数据恢复速度则会有大幅提升。进行快照时,备份窗口可以缩短到短短几秒钟。步骤3:提供持续数据保护(CDP),以加快恢复速度并防

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号