《IT运维管理服务实施方案》由会员分享,可在线阅读,更多相关《IT运维管理服务实施方案(75页珍藏版)》请在金锄头文库上搜索。
1、IT运维管理服务实施方案74 / 77 作者: 日期: 第1章项目概况41.1项目背景41.2项目目标41.3需求分析4第2章运维服务管理体系建设62.1IT运维管理概述62.2运维管理流程体系72.2.1服务支持82.2.2服务提供142.3运维服务管理规划182.3.1第一阶段:服务磨合阶段182.3.2第二阶段:主动服务阶段212.3.3第三阶段:战略规划阶段242.4运维服务质量管理242.5建立运维管理规范262.5.1运维管理规范概要26第3章信息系统运行保障方案283.1统一服务台建设283.2建立文档管理制度293.3一般信息化设备及相关软件运维管理333.3.1一般信息化设备
2、服务范围333.3.2一般信息化设备运维333.3.3例行维护流程图343.3.4一般设备服务方案353.4防(杀)病毒服务403.4.1防病毒服务需求403.4.2制定合理的防病毒策略和安全管理制度。403.4.3客户端防病毒升级软件413.4.4防毒组件及时更新413.4.5每周防毒系统部署情况统计423.4.6每周对产生的病毒事件进行评估423.5信息资产巡检及普查服务423.5.1主动巡检423.5.2信息资产普查433.6其它有关说明及要求43第4章运维服务计划方案454.1运维服务准备454.1.1签定必要的协议和约定454.1.2人员准备454.1.3工具准备454.2项目人员组
3、织464.2.1人员结构464.2.2人员职责与岗位要求474.3服务计划484.3.1服务时间484.3.2进场初始阶段484.3.3第一个服务阶段494.3.4第二个服务阶段494.3.5服务总结和延续阶段50第5章应急服务方案515.1灾难应急措施515.1.1应急措施体制图与总则515.1.2大型灾难紧急行动方案525.2运行服务应急方案555.2.1启动应急流程555.2.2成立应急小组585.2.3应急处理过程585.2.4应急处理结果评估595.2.5统计和报告59第6章服务水平质量承诺及服务管理626.1服务水平体系626.1.1报告服务626.1.2管理类服务626.1.3主
4、动式服务636.1.4响应式服务636.2服务承诺646.2.1服务级别承诺646.2.2服务质量承诺656.3服务管理656.3.1服务管理总则656.3.2服务流程管理666.3.3服务台支持管理676.3.4事件管理696.3.5问题管理706.3.6知识库管理716.3.7服务记录管理71第1章 项目概况1.1 项目背景近年来为适应业务发展的需求,XX企业进行了大规模的电子商务建设,包括采购桌面PC约300台,打印机约100台,这些应用系统及硬件设备的投入使用极大的推动了XX企业信息化建设的进程。随着越秀工商局对整体IT系统(硬件、软件、网络通讯)的可用性要求日益提高,系统运行保障和维
5、护管理就成为确保业务系统安全稳定可靠运行的最有力的手段。XX企业主要有一栋N层的办公环境,现阶段对设备维护主要采用自主维护的方式。由于人力有限,建设任务繁重,中心技术人员在接手新项目及日常工作的同时往往需要做大量的维护工作,不少技术人员长期处于满负荷,严重影响了工作效率。在当前有限的人力物力资源下,为了保障和提高IT服务质量,XX企业有必要将计算机、外设及网络的运行维护进行外包,派驻2名工程师进行维护,以解决当前IT服务个方面日益增长的需求和有限的提供能力之间的矛盾,提高XX企业办公区域内的软、硬件、业务应用软件的运行维护效率,确保信息系统正常运行。1.2 项目目标结合XX企业业务工作及信息化
6、建设实际,完善运维管理体系的建设,加强信息系统正常运行保障,“以流程为导向,以服务为核心”提高服务质量水平、转变服务理念、拓宽服务范围、提高服务效率、提升用户服务满意度。1.3 需求分析本次项目XX企业需求主要包括两个部分,1、IT运维管理体系建设要求;2、信息系统正常运行保障服务。其中运维管理体系建设应完善服务内控制度即服务质量管理,逐步建立起一套符合XX企业自身实际的运维管理标准及应用制度;建设IT运营维护管理平台,采用标准的IT运维管理流程,提供准确、详尽、专业的报告制度,通过客观分析运维过中出现的各种障碍及问题,为XX企业信息化建设提供决策依据。信息系统正常运行保障涵盖了1、 一般信息
7、化设备及软件的运维管理; 2、 、防病毒服务;3、 办公区域内设备及软件巡检普查;4、 提供符合XX企业实际的服务响应水平及质量保障;5、 信息化资产管理第2章 运维服务管理体系建设2.1 IT服务管理概述现今,随着计算机技术,特别是网络技术的飞速发展,对于许多行政单位,许多企业而言,IT技术越来越深入到核心业务,影响策略制定和企业的发展。从而对IT环境的可靠性,可用性和快速适应性提出了越来越高的要求,与此同时,IT环境(包括软/硬件及相关技术)却变得越来越复杂。因此,对于一个单位而言: 如何把有限的IT资源最有效的作用于核心业务的发展 如何最快地获取专业的支持能力 如何实现对系统的完善管理,
8、提高系统的可靠性和可用性 如何提高用户的工作效率,增加最终用户满意度 如何跟上IT技术的发展,及时更新相关技术 如何提高对IT系统利用的灵活性 如何更好地管理IT运营成本 以提高服务能力,将会是单位可能面临的问题。 IT服务管理(ITSM)是一套帮助企业对IT系统的规划、研发、实施和运营进行有效管理的方法,是一套指导IT服务的方法论。ITIL是英国国家电脑局(CCTA)于八十年代开发的一套IT业界的服务管理标准库,它把业界在IT管理方面最好的方法归纳起来,形成规范,旨在为企业的IT部门提供一套从计划、研发、实施到运维的标准方法。它一经提出,便被欧洲各大公司纷纷采纳,随后在澳洲,美洲和亚洲流行开
9、来,目前已成为IT服务管理事实上的标准。通过参考这些标准,我们可以充分借鉴国际化标准的IT服务管理最佳经验,使我们“站在巨人的肩膀上”来设计、规划及运维IT服务,尽可能少走弯路,有效提高IT服务的质量。 ITIL框架图ITIL是基于流程的方法论。IT部门可用其检查是否用一种可控的和可训练有素的方法为最终用户交付所需的IT服务。ITIL合并了一套最佳的实践惯例,可适用于几乎所有IT组织,无论其规模大小,或采取何种技术。ITIL对IT服务管理实践中涉及的许多重要问题进行了系统的分析,包括全面的检查清单、任务、程序、责任等与任何IT服务组织密切相关的问题。这些概念的定义也涵盖了大多数IT服务组织的主
10、要行为。IT服务组织可以借助ITIL的指导建立和拓展自己的IT服务流程。2.2 运维服务管理流程体系运维务管理最核心的是“服务支持”(ServiceSupport)和“服务提供”(ServiceDelivery)两个模块。各流程相互贯穿和作用,形成有机整体,共同建立一个健全的服务管理体系。 如下图所示: 2.2.1 服务支持服务支持的内容描述了一个客户如何访问适当的服务,以支持其业务。服务支持包含以下内容:2.2.1.1 服务台我们为企业建设服务台,提供统一报障电话,统一报障、统一维修接口,越秀工商可以通过统一的报障电话申请服务、查询服务处理进程,监控服务质量。服务台(ServiceDesk)
11、是IT服务组织和用户相互联系的接入点。服务台曾经被称为帮助台(HelpDesk)。HelpDesk的主要任务是记录,分解和监控提出的问题。一个服务台可以具备更宽范的角色,如接收变更请求(RFC),并且可以支撑多种流程中的操作。服务台是服务提供者和用户之间的日常工作的单一联系点。它也是报告突发事件和提交服务请求的焦点。正因为如此,服务台的职责是保持将服务相关信息,行为和契机通知用户,并追踪了解用户每日的行为。例如,服务台可能扮演用户提交变更请求的联系点,基于变更管理流程传达变更实施计划,并保持将变更实施进程通知用户。变更管理应该确保服务台随时保持对变更行为情况的掌握。在任何对SLA产生影响的事件
12、面前,服务台处于第一线,并维护高速的信息流通道。围绕突发事件,服务台有可能在其权限范围被授权实施变更。此类变更的范围可能被预先定义。当所有相关变更发生时,变更管理流程将被告知。基本上,当对任何CI的规范做出修改之前,变更流程都需要对其进行预先审批。2.2.1.2 突发事件管理突发事件管理流程致力于解决突发事件,并快速恢复服务供应。突发事件被记录下来,并且事件记录的质量决定了相关的其它流程的效力。服务台接近于突发事件管理流程和问题管理流程,并处于它们之间。如果没有适当的控制,变更有可能引入新的突发事件。因此需要建立有效途径对变更进行跟踪。这是为什么建议持续不断地将突发事件记录在同一个CMDB中,
13、并分类为“问题”,“已知错误”,“变更记录”等信息,以促进服务台界面的信息沟通能力,简化事件调查和报告。突发事件的优先权及其升级需要作为服务级别管理流程中的一部分进行协商,并在SLA中备案。突发事件管理的目标:突发事件管理的目标是尽可能迅速地根据SLA中定义的普通服务级别作出反应,使产生问题后对业务行为及组织和用户的影响最小。突发事件管理也应该保留对事件的有效记录,以便于衡量和改进流程,并向其它流程汇报。突发事件流程如下图所示:2.2.1.3 问题管理对于突发事件有两种处理方法,一种是对其做出服务快速响应,尽快恢复其正常运行,另一种是鉴别和解决问题根源。这两种方法之间存在微妙的区别,而且经常被
14、互相混淆。对其做好区分具有重要意义。如果问题被怀疑存在于IT架构内部,问题管理流程将会瞄准其潜在的根源。一个问题可能是被突发事件暴露出来的,但是显然,问题管理的目标是解决问题根源,预防其可能产生的干扰,而不是迅速恢复系统运行。当问题被识别后(被识别的问题通常称之为已知错误),通常需要进行一个业务决策,决定是否采取永久性措施改进系统架构,以预防再次发生新的突发事件。如果需要,提交一个变更请求来实现改进。为了有效和高效地识别突发事件背后的问题根源及其发展趋势,问题管理流程需要准确全面的突发事件的记录。问题管理流程同样需要和可用性管理流程密切联络,以确定这些趋势并明确补救措施的重要性。流程:2.2.1.4 配置管理配置管理致力于控制一个变化中的IT架构(标准化和状态监控),鉴别配置项目(清册,相互关联,审核与注册),收集和管理有关IT架构的文档,为所有其它流程提供IT架构的相关信息。配置管理是所有其它服务管理流程不可分割的一部分。拥有当前架构中所有部件的最新的,准确的,全面的和详