ITIL服务的管理流程手册.doc

上传人:qingbi****02000 文档编号:125785673 上传时间:2020-03-20 格式:DOC 页数:79 大小:2.58MB
返回 下载 相关 举报
ITIL服务的管理流程手册.doc_第1页
第1页 / 共79页
ITIL服务的管理流程手册.doc_第2页
第2页 / 共79页
ITIL服务的管理流程手册.doc_第3页
第3页 / 共79页
ITIL服务的管理流程手册.doc_第4页
第4页 / 共79页
ITIL服务的管理流程手册.doc_第5页
第5页 / 共79页
点击查看更多>>
资源描述

《ITIL服务的管理流程手册.doc》由会员分享,可在线阅读,更多相关《ITIL服务的管理流程手册.doc(79页珍藏版)》请在金锄头文库上搜索。

1、 业务支撑网网管系统规范-服务管理流程分册 1中中国国移移动动业业务务支支撑撑网网网网管管系系统统规规范范服服务务管管理理流流程程分分册册中中国国移移动动通通信信集集团团公公司司2004 年年 4 月月 业务支撑网网管系统规范-服务管理流程分册 2目目录录1综述综述.32运维管理流程详述运维管理流程详述.42.1事件管理.42.1.1事件管理描述.42.1.2事件管理目的.42.1.3事件管理范围.52.1.4相关定义.62.1.5流程职责/角色.112.1.6主要内容.122.1.7流程衡量标准.132.1.8流程图举例.162.1.9事件信息项.182.2问题管理.192.2.1问题管理描

2、述.192.2.2问题管理目的.212.2.3问题管理范围.212.2.4相关定义.212.2.5职责/角色.252.2.6主要内容.252.2.7流程衡量标准.262.2.8流程图举例.282.2.9问题信息项.312.3变更管理.322.3.1描述.322.3.2目的.332.3.3范围.332.3.4相关定义.332.3.5职责/角色.382.3.6主要内容.392.3.7流程衡量标准.412.3.8流程图举例.442.3.9变更请求信息项.46 业务支撑网网管系统规范-服务管理流程分册 32.4配置管理.472.4.1描述.472.4.2目的.482.4.3范围.482.4.4相关定义

3、.492.4.5职责/角色.522.4.6主要内容.532.4.7流程衡量标准.542.4.8流程图举例.552.4.9常见配置元素属性表.573运维管理流程关系和运维支持体系运维管理流程关系和运维支持体系.673.1运维流程相互关系.673.2整体运维支持体系.694附录附录.714.1ITIL 国际规范简介 .714.1.1ITIL国际规范简介.714.1.2分阶段实施方法.734.2名词解释.761 综述综述本文作为中国移动业务支撑网网管规范附件之一,将详细描述本期中国移动业务支撑网网管的四大管理功能,及四大管理功能之关的关系,并借助于流程图的实例进行详细说明。运维管理流程包括:事件管理

4、、问题管理、变更管理、配置管理,本附件将分别对其进行定义和描述,包括:管理目的、管理范围、主要内容、职责/角色规划、流程示例等。在本附件最后,还简单介绍 ITIL 的相关内容和实施方法。 业务支撑网网管系统规范-服务管理流程分册 42 运维管理流程详述运维管理流程详述根据本期业务支撑网网管系统建设目标,本期运维管理主要实现事件管理、问题管理、变更管理和配置管理,而管理流程是运维管理的主线,它将整个运维管理工作有机地联接起来,下面将对每个流程的内容及其实际应用做一个详细介绍。2.1 事件管理事件管理2.1.1 事件管理描述事件管理描述事件管理流程是为IT用户尽快回到正常工作状态而设计,其关心的重

5、点是快速响应、快速恢复,使故障对业务的影响最小化。事件管理流程受事件触发和驱动,所谓事件,是指发生了非常规的运作情况,包括系统崩溃、软件故障、任何影响用户业务操作和系统正常运作的事情、以及影响业务流程或违背服务水平协议的情况。事件也包括一个用户的请求,如,重设用户密码。不是所有的事件都由用户产生,监控管理平台产生的告警也可引发事件。通常由帮助台负责记录事件相关信息,向用户提供对已知问题的处理方法,报告事件和尽快恢复服务,目的是在事件管理阶段获得尽可能高的事件解决率。所有的事件应该基于相关配置元素的关键等级和影响度进行优先级分类。事件管理的责任是记录、分类、调查/诊断、解决已知问题、监控跟踪事件

6、、与用户和问题管理流程交流、最终解决事件。2.1.2 事件管理目的事件管理目的事件管理流程的主要功能是尽快解决环境中出现的事件,保持 IT 环境的稳定性,其目的包括:在成本允许的范围内尽快恢复服务 快速响应系统监控产生的故障或用户的电话请求 业务支撑网网管系统规范-服务管理流程分册 5 在线获得帮助 沟通问题解决的状态进行事件控制 记录事件 就事件的优先级、紧急性和严重性进行分类 分析、诊断,必要时进行升级 监视,并结束事件支持业务运行 对业务应用提供二级支持 解答有关如何使用的问题 记录关于新服务的需求 记录关于改变的请求提供一个与业务部门的日常接口 提供关于服务状态的信息更新 新服务的报告

7、 关于即将到来的新服务或事件的通知 进行事后回顾提供 IT 管理信息 人力利用情况 服务可用性 产品质量 支持效率 供应商服务情况2.1.3 事件管理范围事件管理范围 在BOSS系统运维范围内所指的事件,包括所有与IT基础架构和业务相关的如下事件: 申告 故障 业务支撑网网管系统规范-服务管理流程分册 6 咨询 业务处理 维护作业工科事件的产生有两类: 由监控管理平台自动发现并产生的告警事件 由用户/IT 维护人员报告的事件但不包括: 外部用户汇报的事件 在开发和测试环境中的设备或系统产生的事件 “事件管理”流程不一定必须找到问题发生的根本原因,其重点在于如何在尽量短的时间内,恢复已经中断的I

8、T服务,提高服务的可用性。2.1.4 相关定义相关定义重分配规则事件的及时、正确分配和接手处理是确保事件在解决时限内解决的关键因素。一线和二线技术人员可以拒绝并根据重分配原则重新分配不属于自己运维范围的事件。事件性质根据移动的业务要求和管理要求,按照事件性质定义如下六类事件:性质性质描述描述申告针对 BOSS 系统的 IT 用户投诉故障指因 BOSS 系统错误或非正常因素由监控管理平台发现的告警事件咨询指对系统操作、业务流程等方面的求助和询问业务处理指需要运维人员进行后台数据处理的要求维护作业指运维人员的日常维护作业或临时进行的维护作业其他其他性质的事件。事件来源当接到一个问题时,帮助台人员需

9、要记录事件来源的类型。帮助台的事件来源可 业务支撑网网管系统规范-服务管理流程分册 7以包括以下:来源来源描述描述用户来自 IT 用户的事件可以有以下几种记录方式:电话/邮件/传真-来自用户/IT 维护人员报告的事件自助开单-用户/支持人员发现问题,直接在服务台系统客户端开单客服平台-来自客服平台的事件其他-其他方式进入帮助台的事件监控管理平台监控管理平台发现的告警事件,通过与服务管理平台接口发送告警信息到服务管理系统中 事件优先级优先级是事件管理的一个关键要素,优先级决定处理事件的顺序及所需的资源,事件优先级可分为四级,如下表所示:事件的优先级分两个层面来定义和确认:帮助台帮助台在接到来自监

10、控管理平台的告警事件或IT用户报告的事件时,迅速根据事件相关的业务/子业务或IT系统/设备的关键级别及事件的性质,定义该事件的优先级别。如果为紧急事件,立即升级到一线。对于监控管理平台上传的报警事件,应包含该事件相关联的配置元素的搜索代码,帮助台人员据此确定配置元素及其关键级别。帮助台人员可参考下表确定事件优先级:编号优先级1紧急2高3中4低 业务支撑网网管系统规范-服务管理流程分册 8本次事件所对应 CI 的关键级别事件优先级事件优先级1231紧急高中2紧急中低故障3高低低申告高中低事件性质咨询/业务处理/维护作业中低低一线一线人员在接受到帮助台升级上来的事件后,根据该事件相关的业务或IT系

11、统/设备的实际故障情况,并结合其他相关因素,再次确定事件优先级,如确实为紧急事件,则启动升级机制。确定事件优先级后,即可以确定事件的处理时限,优先级对应的事件解决时限参考下表:优先级紧急高中低解决时限(小时)482448事件的升级事件升级的目的是确保基于事件的优先级等级及时通知有关技术人员和领导,引起更多的重视,提供合适的资源,从而快速找到解决事件的方案。可根据所要求的处理时间定义事件优先级升级规则,包括不同等级的事件在不同的时间被升级到不同级别的人员:时间优先级即时响应+15 分钟处理时限 30%处理时限 40%处理时限紧急ABD E F-高ABCDE中ABC -D低AB C -升级组群:A

12、 帮助台 B 一线支持人员 业务支撑网网管系统规范-服务管理流程分册 9C二线支持人员D事件经理E管理层F 集团公司各省可以根据业务的实际情况调整升级标准。事件分类根据移动目前的事件种类,事件的分类层次设计不超过三层,第一级分类,称之为“类别”,第二级分类,称之为”子类”,第三级分类,称之为”条目”。本规范给出第一级、第二级分类。各省市根据自己的情况决定是否要定义到第三层。下表为事件分类表举例:类别类别子类子类条目条目网络通讯系统服务器基础架构存储系统操作系统数据库中间件双机热备软件系统软件系统监控软件采集计费结算业务客服 业务支撑网网管系统规范-服务管理流程分册 10业务管理账务管理账务处理

13、一级 BOSS拨测其他空调UPS机柜照明温湿度传感器外设配套设施其他事件状态代码 事件状态代码表明事件所处的处理状态,本规范规定的事件状态如下:事件状态代码事件状态代码描述描述新建新开事件记录分配事件在帮助台一线处理 一线支持人员已接手处理事件 二线处理二线支持人员已接手处理事件供应商处理由供应商处理已解决 事件已找到解决方案关闭确认解决方案,事件得以关闭事件结束代码事件结束代码说明了事件是在何种情况下关闭的,本规范规定的结束代码如下:事件结束代码描述暂时解决用变通办法暂时解决帮助台由帮助台人员成功解决已解决一线解决由一线人员成功解决 业务支撑网网管系统规范-服务管理流程分册 11二线解决由二

14、线人员成功解决第三方解决由第三方成功解决其他包括消失,误操作,可忽略等处理是否超时事件超时代码描述未超时事件最后时限范围内结束超时事件未能在最后时限范围内结束2.1.5 流程职责流程职责/角色角色事件管理流程主要分为以下几个职责/角色,分别简述如下:事件经理作为事件流程的负责人,负责制定流程的规则、策略、步骤调度资源,协调解决跨小组、部门的事件指导日常操作,确保流程的执行符合预定的要求和规则建立流程的衡量指标和报表与用户、服务商和管理层交流流程的使用情况确认和实施对流程的变更/改进计划帮助台人员在指定的响应时间内响应所有帮助台热线电话、邮件、传真等事件报告完整记录所有接收的事件信息,包括:记录

15、事件报告人的详细联系方式、事件特征表现、描述、发生时间等为事件进行适当的分类、为事件分配优先级等属性尝试使用工具、初步诊断、分析相关信息等方式解决问题如果帮助台不能解决这个事件,应当将事件分配给最合适的一线支持小组/人员来处理检查事件记录的处理进度,保持与事件报告人的联系,适时通知事件处理进展与用户确认事件解决方案,关闭事件一线支持人员 业务支撑网网管系统规范-服务管理流程分册 12一线支持人员负责提供对帮助台无法解决的事件进行快速有效的分析并提出解决方案以尽快恢复服务,并在必要时提供现场支持。验证事件的描述和信息,进一步收集相关信息决定需要采取何种措施恢复服务并实施有效的行动必要时提供现场支

16、持根据优先级提供有效的解决方案已解决的事件转回帮助台,由帮助台关闭事件实施事件解决方案更新事件解决信息,已解决的事件转回帮助台,由帮助台关闭事件如果一线不能解决这个事件,应当决定选择最合适的二线支持小组/人员来处理二线支持人员二线支持人员是相关问题领域的专家。负责提供对一线支持人员无法解决的问题进一步进行调研,找出解决方案并尽快恢复服务。各省可以考虑按照所维护的应用、系统进行分组,如,网络组、主机组等。进行事件的深入调查研究根据经验和专业技能,决定需要采取何种措施恢复服务并实施有效的行动必要时引入供应商的支持在系统中更新事件根源和最终解决方案更新事件记录,确保事件状态代码真实反映事件状态。及时

17、提供有效解决方案与其他小组合作,确定解决方案已解决的事件转回帮助台,由帮助台关闭事件如果二线不能在解决时限内解决这个事件,应当将事件进行升级2.1.6 主要内容主要内容事件管理流程始于事件的探测和报告,结束于事件的解决。该流程包含下述主要内容:事件接收和记录事件接收和记录 这个环节是事件管理流程的起点。所有用户或系统报告的IT 事件必须由此步骤开始。 业务支撑网网管系统规范-服务管理流程分册 13此步骤的目的是在事件发生时快速准确地发现,以协助事件的诊断和解决并通知相关人员。在此步骤中将会收集创建事件记录所需的信息。该环节的关键是信息的准确性和完整性。分类和在线支持分类和在线支持事件可以是一个

18、服务请求、信息请求或服务故障,对于每个事件,需要确立优先级、影响度、和分类。若没有现成的解决方案或临时解决措施,该事件将分配给合适的支持人员对此进行调查。该环节的关键是需要知识库支持和正确的事件分派。调查和诊断调查和诊断若在线支持人员无法解决事件,可运用自身技能、知识库、诊断工具等进行更加深入的分析以找到恢复服务的临时措施,必要时将使用多名技术员以寻求解决措施。解决和恢复解决和恢复技术人员实施事件的解决方案,并将解决完毕的事件转回帮助台,由帮助台通知用户解决的结果,并得到用户的确认。紧急事件和事件升级紧急事件和事件升级对于紧急事件,帮助台应立即提交给一线人员,由一线人员判断,上报给事件经理,并

19、同时上报给集团公司,由事件经理决定紧急处理的方式,确保其得到最快速的解决。当事件处理超过预期时限,将自动升级或由运维人员升级,以引起相关人员和管理人员的重视和参与。结束事件结束事件当用户确认事件解决后,此时可结束该事件,并在必要时更新知识库。若用户对此解决方案不满意,则对该事件继续进行处理,不能关闭。2.1.7 流程衡量标准流程衡量标准事件管理流程的主要衡量指标如下:事件记录数量,可按照部门、事件分类等分别统计事件关闭的数量,可以按照优先级,或者按照分类分别统计事件成功关闭的数量规定时间内解决的事件数量/百分比 业务支撑网网管系统规范-服务管理流程分册 14帮助台解决率事件解决的平均时间,可以

20、按照事件分类统计超时的事件数量,可以按人员、组别统计统计报表事件记录的数量,可按照事件分类、事件性质、事件优先级等分别按月、周、日汇总统计该时间段内创建的事件记录数量故障申告咨询业务处理维护作业其他紧急高中高中低中低中低中低紧急高中低网络设备服务器存储系统计费结算客服处于各状态的事件数量,可按事件来源、事件分类、事件状态实时汇总事件记录数量新建分配一线处理二线处理供应商处理已解决关闭网络设备服务器存储系统计费 业务支撑网网管系统规范-服务管理流程分册 15结算客服事件关闭的数量,可按事件来源、事件分类、事件结束代码等分别按月、周、日汇总统计该时间段内创建的事件记录的关闭数量成功解决可忽略事件后

21、续操作解决部分解决部门1监控系统1成功解决可忽略事件后续操作解决部分解决网络设备服务器存储系统按时、超时解决的事件数量/百分比,可按事件来源、事件分类、处理角色等分别按月、周、日汇总统计该时间段内创建的事件记录的解决数量帮助台一线二线第三方按时超时按时超时按时超时按时超时数量百分比数量百分比数量百分比数量百分比数量百分比数量百分比数量百分比数量百分比部门1监控系统1 业务支撑网网管系统规范-服务管理流程分册 16帮助台一线二线第三方按时超时按时超时按时超时按时超时数量百分比数量百分比数量百分比数量百分比数量百分比数量百分比数量百分比数量百分比网络设备服务器存储系统各角色事件解决率,可按事件来源

22、、事件分类、处理角色等分别按月、周、日汇总统计该时间段内创建的事件记录的解决率帮助台一线二线第三方部门1监控系统1帮助台一线二线第三方网络设备服务器存储系统2.1.8 流程图举例流程图举例如下是事件管理的逻辑示意图: 业务支撑网网管系统规范-服务管理流程分册 17事件管理逻辑流程帮助台一线支持省公司IT用户集团公司二线支持事件经理100.2?优先级最高 100.6?解决了吗 100.9解决了?吗 YNYNNYY第三方100.12?解决了吗 100.13需要第三方?支持 NNY100.14?超出时限 YN用户报告事件系统产生事件100.1创建事件记录并分类100.5尝试解决100.7事件转发至一

23、线100.16确认并关闭事件通知事件经理通知事件经理100.10事件转发至二线1 10 00 0. .8 8. .检检查查事事件件信信息息并并解解决决1 10 00 0. .1 11 1调调查查诊诊断断并并解解决决事事件件100.15.技术支持Y上报集团100.4?优先级最高 Yes100.3确认优先级NY流程说明流程说明序号序号步骤名称步骤名称责任人责任人输入输入说明说明输出输出100.1创建事件记录并分类帮助台事件特征描述接受从 IT 用户或监控管理平台报告的事件,在帮助台系统中产生新服务记录,填入相关信息。并对事件进行分类,根据设定标准进行分类和分优先级,设置相关属性。事件记录100.2

24、优先级最高?帮助台事件记录根据事件相关的配置元素 CI 的关键级别。确定事件的优先级是否最高,如是立即升级到一线支持人员,否则尝试解决。优先级确定结果100.3确认优先级别一线事件记录一线支持人员根据事件相关配置元素和其他相关信息确定该事件是否确属优先级最高已确定优先级的事件记录100.4优先级最高?一线已确定优先级的事件记录如果优先级确实最高,则立即升级到事件经理,并通报集团公司,并立即开始处理,如不是,则返回帮助台N/A通知事件经理事件经理事件记录最高优先级事件必须立即通知事件经理,由事件经理决定是否由原处理人按照原流程执行,还是需要紧急解决方案 业务支撑网网管系统规范-服务管理流程分册

25、18采取必要手段干预(例如:启动危机处理流程、会议等)。上报集团集团事件记录紧急事件必须上报集团公司(并在事件处理过程中的每个状态变化点将最新事件记录上传到集团公司)紧急事件100.5尝试解决帮助台事件记录通过查询知识库,尝试电话支持解决方案100.6解决了吗?帮助台N/A如果解决了,则进入 100.16,确认并关闭事件;如果不能解决,进入 100.7,转发至一线。N/A100.7事件转发至一线帮助台事件记录选择适当的一线人员,将事件转发转发的事件100.8检查事件并解决一线事件记录检查事件信息,寻求解决方案 解决方案100.9解决了吗?一线N/A如果解决,则将解决方案记入事件记录,并发还帮助

26、台,进入 100.16;如果不能解决,则需在事件记录中说明原因,转发二线N/A100.10事件转发至二线一线事件记录选择适当的二线人员,将事件转发转发的事件100.11调查诊断并解决二线事件记录进行进一步调查分析,找出解决方案解决方案100.12解决了吗?二线N/A如果”是”,则将解决方案记入事件记录,发还帮助台,进入 100.16;如果”否”,则转入 100.13。需要供应商支持?N/A100.13需要第三方支持?二线N/A判断是否需要引入第三方(第三方包括厂商和其他部门的支持人员):“是”,转入 100.15;“否”,转入 100.14N/A100.14超出时限?二线N/A如果超出处理时限

27、,必须及时通知事件经理N/A通知事件经理事件经理N/A事件经理应当特别关注超时的事件,并帮助协调资源,监督事件尽快解决N/A100.15技术支持供应商支持请求供应商得到通知后,应参与事件的解决,并提出解决方案,由二线人员监控供应商的响应速度和处理速度。解决方案100.16确认并关闭事件帮助台已解决的事件帮助台应与用户确认是否接受解决方案,如果用户认可,则可关闭事件,如果用户不能接受,则发还处理人员,继续处理。关闭的事件记录2.1.9 事件信息项事件信息项本规范规定事件管理流程必须包含如下事件信息项:信息项信息项说明说明填写方式填写方式事件流水号工单号码系统生成报告人信息本次事件报告人的联络信息

28、,包括:姓名省/分公司根据报告人的搜索代码,自动获取CMDB 中报告人信息 业务支撑网网管系统规范-服务管理流程分册 19部门电子邮件办公电话手机/BP生成时间在帮助台生成事件记录的时间系统生成地点事件发生的地点-发生时间事件发生的实际时间-事件性质从事件所属性质的角度来确定其处理流程,如申告、故障、求助、业务处理、维护作业等。-事件来源指事件工单产生的途径,有人工产生、系统自动产生两类。 由监控管理平台自动产生的,可自动填写事件优先级事件优先级决定了事件的解决时限和处理次序,通过综合衡量配置元素的关键级别和其他相关信息得出。-事件分类从事件从属的系统或技术架构的类型来进行分类,如数据库,服务

29、器等。-事件标题事件的标题由监控管理平台自动产生的,可自动填写事件描述对于整个事件内容的详细描述由监控管理平台自动产生的,可自动填写事件解决确认人在帮助台得到用户确认的有关人员-事件状态在事件整个生命周期中的不同状态系统生成分配对象被分配的技术支持组和人员-事件日志反映事件处理过程中的事件处理信息,包括人员,时间等信息-是否超时事件处理时间是否超出解决时限系统生成解决时间事件得到解决的时间-解决方案描述事件解决方案的描述-事件结束代码根据事件结束的不同方式赋予不同的结束代码-2.2 问题管理问题管理2.2.1 问题管理描述问题管理描述问题是一个或几个已暂时处理但根本原因尚不明确的事件, 许多事

30、件往往是由同一个问题引起的。问题的来源主要有以下几种: 业务支撑网网管系统规范-服务管理流程分册 20已经关闭的事件,经过回顾分析后,可能形成一个问题;重大事件,虽然经过紧急处理恢复服务,但未找到根本原因,也形成一个问题;对于趋势性事件的分析,形成问题。问题管理流程的根本目的是消除或减少事件的发生, 将 BOSS 系统内部缺陷导致的业务事件或问题的负面影响降到最低限度,此流程分析发生在生产环境的事件(常常是已关闭的事件记录),确定最常发生或具有最大影响的事件,找出根本原因,然后生成变更请求(RFC)、变通方法或建议的预防性措施来防止事件的再次发生。所以问题管理流程需要和变更管理流程一起来实施找

31、出的解决方案以从根本上解决问题。问题通常具有以下特征中的一个或全部: 一组具有一定关系的已结束的事件 一个重大或紧急事件(事件处理结束后定义为问题,由问题管理找出根本解决方案)问题管理与事件管理之间的差异问题管理与事件管理之间的差异问题管理与事件管理并不相同,它的主要目的是查明事件的潜在原因,并制定随后的解决方案和预防方法。在大多情况下,此目的与事件管理目的之间有一定冲突,因为事件管理的目的是尽快地恢复客户服务,通常是通过实施替代方案,而非确定一个永久性的解决方案(例如为了尽可能地预防未来可能出现的事件,寻求改善信息技术基础架构的结构)。就问题管理而言,对潜在原因的调查可能需要一定的时间,找到

32、解决方案的速度是次要的考虑因素,但是预防了问题的再次发生。问题管理流程可以按照不同领域的问题(如网络问题,或应用问题等)由相关组的技术支持专家来执行,原则上这些专家可以是事件管理的二线支持专家,他们在负责接受来自一线支持人员(帮助台员工)的支持请求的同时,也负责对以往事件进行分析,找出事件产生的根本原因,从而确定解决方案,消除这些根本原因,最终使此类事件不再发生;同时,也要从发生的事件中找出事件的发展趋势或潜在可能发生的问题,从而预先采取措施,保证 IT 服务的正常化。问题的根本原因找出后即成为已知错误, 对已知错误实施解决方案, 从而解决问题。所以问题管理流程的输出有: 变更请求 变通方法

33、业务支撑网网管系统规范-服务管理流程分册 21 根本解决方案 预防性措施 已知错误2.2.2 问题管理目的问题管理目的问题管理流程在 IT 部门设立的主要目的是分析已被列为问题的事件(一组或一个)的根本原因,然后找出解决方案。包括: 分析并确定事件的根本原因,以防止再次发生 主动提供预防性措施 提高 IT 服务的可靠性 降低 IT 支持成本 提高 IT 部门的整体形象和名誉2.2.3 问题管理范围问题管理范围 问题管理范围是对所有 IT 生产环境中未根本解决的问题和已知错误进行管理,并采取主动性预防措施来降低事件数量,重大或紧急事件在处理完后也被定义为问题以分析其产生的根本原因。一般对 IT

34、服务影响最大或最占用支持人员资源的事件优先进行分析。 问题管理范围不包括处于开发或测试环境的系统和应用。2.2.4 相关定义相关定义优先级优先级需要确定解决方案的紧急程度,本规范定义如下问题优先级:编号优先级代码解释1紧急关键级别为 1 的业务中断或将中断,影响一个以上关键地区或半数以上地区2高关键级别为 1 的业务中断或将中断,影响一个以上地区 业务支撑网网管系统规范-服务管理流程分册 22但未达到紧急标准3中关键级别为 1 的子业务或半数以上子业务中断或将中断4低未达到以上标准问题状态代码问题状态代码问题在整个生命周期中的不同状态。本规范定义如下问题状态:问题分类问题分类 (classif

35、ication)从问题从属的系统或技术架构的类型来进行分类。本规范定义如下问题分类:类别类别子类子类条目条目网络通讯系统服务器基础架构存储系统操作系统系统软件数据库编号代码描述1已登记问题登录到系统中2处理中问题正在处理过程中3拒绝问题分派被拒绝4已知错误问题根本原因已找出5已有解决方案解决方案已找到6RFC已提交 RFC7结束问题已结束8回顾问题已做回顾 业务支撑网网管系统规范-服务管理流程分册 23中间件双机热备软件系统监控软件采集计费结算客服业务管理业务账务管理 业务支撑网网管系统规范-服务管理流程分册 24账务处理一级 BOSS拨测其他空调UPS机柜照明温湿度传感器外设配套设施其他问题

36、性质问题性质根据问题的不同来源进行分类。本规范定义如下问题性质:编号代码备注1升级事件从事件管理中升级的事件2系统构架问题技术专家提出的问题3主动防范性分析事件记录找出的问题问题结束代码问题结束代码问题结束代码: 根据事件结束的不同方式赋予不同的结束代码。本规范定义如下问题结束代码: 业务支撑网网管系统规范-服务管理流程分册 25编号代码说明1根本解决找出问题的根本原因,并得到解决方案,成功解决2变通方法未找出根本原因,但有临时解决方案作为变通方法3没有解决问题无法解决4消失 问题无法再现2.2.5 职责职责/角色角色问题管理流程主要分为如下几个职责角色,分别简述如下:问题经理整体上对流程负责

37、,确保流程的有效执行定期评估流程,制定流程改进计划 确定或定义问题,并确保有效协调资源监视问题的诊断,分析和处理过程提出实施解决方案的变更请求定期制定IT问题报表,提供正确决策信息问题分析专家接受问题经理分派过来的问题分析和诊断问题,确定根本原因确定和测试解决方案协助事件支持人员进行重大或紧急事件的处理2.2.6 主要内容主要内容问题管理流程着重于消除事件或减少事件发生,确定事件的根本原因。主要活动包括分析事件、找出问题、分派问题、确定根本原因、找出解决方案以消除事件或在其发生时降低对用户或业务的影响。其主要内容如下: 业务支撑网网管系统规范-服务管理流程分册 261. 分析事件分析事件 定期

38、分析事件,找出潜在问题2. 生成问题记录生成问题记录 在系统中生成问题记录并把所有相关事件与此记录关联起来重大或紧急事件处理完后定义为问题技术支持专家在日常运维中发现的问题主动性防范3. 分派分派 根据问题内容将问题记录分派给适当的技术小组。4. 根本原因分析根本原因分析 被分派的小组人员将调查问题以期找出其原因,制定解决方案、变通方法或提出预防性措施,以消除产生原因,或在重发时使其影响力最小化。5. 更新已知错误更新已知错误 问题记录必须被更新以反映它是已知错误状态,并且把任何变通方法、避免或最小化负面影响的动作行为也记录下来(如果需要添加到知识库中)。6. 提出变更请求提出变更请求 对问题

39、的解决方案进行评估,通过提出变更请求(RFC)以对该方案进行测试和实施。如果 RFC 没有被批准,问题记录保持为已知错误,它们可以被事件支持人员在事件再次发生时参考借鉴。7. 关闭关闭 一旦找出问题根本原因,并实施了解决方案,确认已解决了问题,问题记录可以关闭。8.8. 事后回顾事后回顾 问题必须进行回顾以找出改进机会或总结预防性措施。包括改进事件监测、找出技能差距和文档资料改进等。2.2.7 流程衡量标准流程衡量标准问题管理流程的主要衡量指标如下:每一阶段内的已知错误数量在每一阶段内未结的问题记录每一阶段内未了结的由问题引发的RFC数量在IT环境中存在的临时性变通办法数量统计报表 业务支撑网

40、网管系统规范-服务管理流程分册 27问题的数量,可按问题分类、问题性质、优先级、影响度等分别按月、周、日汇总统计该时间段内创建的问题记录数量优先级影响程度紧急高中低高中低无网络设备服务器存储系统优先级影响程度紧急高中低高中低无升级事件系统构架问题主动防范性处于各状态的问题数量,可按问题分类、问题性质、问题状态分类实时汇总已登记处理中拒绝已知错误已有解决方案RFC结束回顾网络设备服务器存储系统已登记处理中拒绝已知错误已有解决方案RFC结束回顾升级事件系统构架问题主动防范性问题关闭的数量,可按问题分类、问题事件、问题结束代码等分别按月、周、日 业务支撑网网管系统规范-服务管理流程分册 28汇总统计

41、该时间段内创建的问题记录的关闭数量根本解决变通方法没有解决消失网络设备服务器存储系统根本解决变通方法没有解决消失升级事件系统构架问题主动防范性2.2.8 流程图举例流程图举例如下是问题管理的逻辑示意图举例: 业务支撑网网管系统规范-服务管理流程分册 29 问问题题管管理理逻逻辑辑流流程程事件管理人员变更管理人员省公司管理层问题经理问题分析专家集团公司300.1分析事件300.7推荐解决方案/变通方法300.9提交变更请求/监视变更实施300.6分析根本原因在必要时升级到管理层接受吗?YN需要变更吗?NY300.2创建问题记录300.3问题优先级和分类300.4分派给工作组/监视300.5拒绝问

42、题300.10关闭问题记录300.11回顾300.8安排实施解决方案上报集团公司Y评估/实施变更优先级最高吗?N事件记录升级到管理层关于该逻辑流程的简单描述如下:序号序号步骤名称责任责任人人输入输入说明说明输出输出300.1分析事件问题经理事件记录定期分析回顾事件,主动发现潜在问题。分析事件的频度和严重度,和其他的相关因素进行关联,如CI 位置、宕机时间、特定用户、硬件平台、软件版本和一天中发生的时间等。具体的做法可以是一周开一次由主要事件支持人员参加的例会,讨论上周发生的 IT 事件。分析结果300.2创建问问题分析结把找出的问题记录到系统中去,并进行详细说明问题记 业务支撑网网管系统规范-

43、服务管理流程分册 30题记录经理果录300.3问题优先级及分类问题经理问题记录根据问题的实际情况,给其分派一个优先级代码和影响度代码(必要时进行升级,如优先级最高时),并根据拟定的分类原则给问题赋予适当的类别代码并根据问题具体情况设定一个解决时限。已分类问题优先级最高吗?问题经理已分类问题如果问题优先级为最高,由问题经理立即把该问题上报到集团公司,并把该问题升级到管理层N/A300.4分派给工作组/监视问题经理问题记录初步判断问题的可能原因,把问题分派给相应工作组或个人,并监视问题的解决过程,如有必要(如超过解决时限)启动升级流程已分派问题在必要时升级问题经理N/A问题经理在监视问题解决的过程

44、中,根据具体情况可把该问题升级到管理层,如问题超出解决时限时N/A判断是否接受?问题分析专家N/A问题分析专家对问题进行初步分析,以决定接受与否。如拒绝转向 300。6 继续,如接受转向 300。7继续。N/A300.5拒绝问题问题分析专家已分派问题问题分析专家根据判断发现问题应该由其他组分析解决,就把问题发回问题经理,注明拒绝理由并推荐组名。转向 300。4 继续。已拒绝问题300.6分析根本原因问题分析专家已接受问题如果问题确应由本人或本小组解决,接受分派的问题,然后调查诊断问题,如有必要成立问题分析小组,举行问题根本原因分析研讨会议并确定问题的潜在原因。必要时更新问题状态。问题根本原因3

45、00.7推荐解决方案/变通方法问题分析专家问题记录、问题根本原因找出问题的根本原因后,根据实际情况制定变通方法或根本性解决方案,并确保这些方法或方案将降低或消除事件的发生率或影响度,更新问题记录。问题解决方案问题变通方法300.8安排实施解决方案问题经理问题解决方案问题变通方法根据问题专家提供的解决方案或变通方法, 计划并实施解决方案以解决问题解决方案实施计划判断是否需要问题经理N/A判断实施上述解决方案是否需要进行变更,如不需要变更转向 300。10 继续,如需要变更转向 300。9N/A 业务支撑网网管系统规范-服务管理流程分册 31变更?以提出变更请求。300.9提交变更请求问题经理解决

46、方案实施计划根据问题分析专家制定的解决方案或变通办法,提出变更请求,填写变更请求单,递交到变更管理流程,并监视变更的实施过程,和变更管理保持沟通。变更请求 RFC300.10 关闭问题记录问题经理已解决的问题变更结束后,确认问题已经解决,选择相应的结束代码,更新问题状态,关闭问题记录。已关闭的问题300.11回顾问题经理已关闭的问题对所有已关闭问题都进行回顾,找出可能改进的机会,包括问题的解决方案和管理流程方面,如改进升级规则、改进事件监测、找出技能差距和文档资料改进等;回顾之后更新问题状态。已回顾的问题2.2.9 问题信息项问题信息项本规范规定问题管理流程必须包含如下问题信息项:信息项信息项

47、说明说明问题流水号系统自动生成的工单号码生成时间生成问题记录的时间地点问题发生的地点问题性质指问题的来源问题优先级问题优先级决定找到解决方案的紧急程度影响程度问题对 IT 环境的影响程度问题分类从问题从属的系统或技术架构的类型来进行分类,如数据库,服务器等。问题标题问题的标题问题描述对于整个问题内容的详细描述问题状态在问题整个生命周期中的不同状态问题日志反映问题处理过程中的问题处理信息,包括人员,时间等信息解决时间问题得到解决的时间解决方案描述问题解决方案的描述问题结束代码根据问题结束的不同方式赋予不同的结束代码 业务支撑网网管系统规范-服务管理流程分册 322.3 变更管理变更管理2.3.1

48、 描述描述变更管理通过一个单一的职能流程来控制和管理整个 IT 运行环境中的一切变更,并和配置管理建立接口。变更管理应该由管理工具来支持,管理的范围可包括软件,硬件,网络设备和文档等的变更。变更请求通常由于问题的解决方案中需要对生产环境进行某些改变而产生。需成立一个变更顾问委员会(Change Advisory Board,以下简称 CAB)来帮助和支持变更经理,根据变更内容来决定 CAB 的成员,可以包括客户代表、运维支持人员、应用开发和供应商等跟变更有关的人员。 CAB 通过开会讨论等手段来评估变更请求(RFC)的:潜在风险和影响实施变更需要的资源是否批准变更如果批准,什么时间实施CAB

49、也负责变更实施后的回顾以考察:变更是否成功?是否产生其他副作用?实际所用的资源和预期的是否一致?批准后,变更将进入计划,测试/构建和实施阶段。计划/构建阶段也包括开发一个回退计划(Fallback Plan),用以在实施阶段出现问题或紧急状况时需要把变更回退回去。变更管理流程也负责紧急变更,在此种情况下,变更的评估、计划、测试和实施阶段都将快速进行。 业务支撑网网管系统规范-服务管理流程分册 332.3.2 目的目的变更管理流程将通过标准统一的方法和步骤来管理和控制所有对 IT 生产环境有影响的变更。主要的目的包括: IT 部门可以管理和引导用户变更需求通过对所有变更的正确评估,可以维护 IT

50、 生产环境的完整性变更和变更实施得到正确记录,并提供审核统计减少或消除由于变更实施准备不当等原因出现的对 IT 环境的破坏作用提高资源使用率2.3.3 范围范围 变更管理流程涵盖生产环境的所有变更。一般不包括:尚处于开发和测试阶段的系统和应用的变更不需要 IT 部门介入的、由用户控制的行为动作2.3.4 相关定义相关定义优先级优先级 优先级用来说明变更需要得到实施的紧急程度:风险等级风险等级除了常规变更,还需通过下表所列的衡量因素来评估实施变更可能带来的风险。序号序号优先级优先级说明说明1紧急要求变更在提出申请后二天内完成2正常除了常规和紧急之外的变更3常规预先定义的日常类变更 业务支撑网网管

51、系统规范-服务管理流程分册 34衡量因素衡量因素条件条件得分得分影响一个以上关键地区或半数以上地区1影响一个以上地区但未达到半数,并没有关键地区受影响2影响一个地区的全部用户3地市/区域 IT 用户数量(受到实施或取消的影响)影响一个地区的部分用户43 个或更多支持小组12 个支持小组2超过 1 人,相同的支持小组3准备/实施必需的资源1 人4无法测试,变更失败可能性很高1能实现部分测试,变更失败可能性较高2有成熟的变更方案,变更失败可能低3变更成功的可能性无需测试,变更失败可能性没有46 天或更长12-6 天21-2 天3变更规划时间小于 1 天4超过 2 小时或在线/服务断供期11-2 小

52、时2不到 1 小时3变更实施时间不到 30 分钟4回退时间超过 2 小时1回退难度中等以上(1-2 小时)2回退难度适中(1 小时或更短)3回退时间易于回退(30 分钟或更短)4注:紧急变更的实际规划时间很短,但评估时应按照该变更正常处理情况下所需的规划时间来评估。根据上表,对每个变更进行评估,最终得分为各分项得分的总和,再根据总分确定对应的风险等级和实施完成后的观察期:总得分总得分风险等级风险等级实施完后的观察周期实施完后的观察周期 业务支撑网网管系统规范-服务管理流程分册 356 9重大6-7 天10 13较大4-5 天14 17中等2-3 天18 +较小小于等于 1 天以上风险等级由变更

53、主管进行初步评定,再由 CAB 进行最终确定。状态状态变更请求从提出、实施到结束的整个生命周期中的不同状态:结束代码结束代码 根据结束变更的不同方式赋予不同代码:序号序号代码代码说明说明1完全成功完全达到变更目的2部分成功部分达到变更目的3取消变更实施过程中被取消4拒绝变更请求被 CAB 拒绝类别(类别(Category) 根据中国移动目前的变更种类,变更的分类层次设计不超过三层。第一级分类,称之为”类别”,第二级分类,称之为”子类”,第三级分类,称之为”条目”。本规范给出第一级、第二级分类,各省市根据自己的情况决定是否要定义到第三层。下表为变更分类表举例:类别类别子类子类条目条目基础架构网络

54、通讯系统序号序号状态状态说明说明1已登记变更请求已登入系统2已评估变更请求已得到 CAB 评估3已授权变更请求已得到 CAB 授权4 已计划变更实施计划已由变更经理收集并确定可执行5进行中变更实施过程中6已结束变更已结束7观察中变更实施结束后处于观察状态7已回顾变更已得到回顾8关闭变更请求已关闭 业务支撑网网管系统规范-服务管理流程分册 36服务器存储系统操作系统数据库中间件双机热备软件系统软件系统监控软件采集业务计费 业务支撑网网管系统规范-服务管理流程分册 37结算客服业务管理账务管理账务处理一级 BOSS拨测其他空调UPS机柜照明温湿度传感器配套设施外设 业务支撑网网管系统规范-服务管理

55、流程分册 38其他2.3.5 职责职责/角色角色变更管理流程主要分为如下几个职责角色,分别简述如下:变更请求者发现或获取变更需求确定并分析变更需求和内容填写变更请求单并提交给相关相应变更主管变更经理整体上对流程负责,确保流程的有效执行确保变更请求得到有效评估,授权和实施确保只有授权和必要的变更才被实行,并使该种变更影响最小化 定期召开变更会议,回顾/制定下阶段变更规划定期评估流程,制定流程改进计划定期制定变更管理报表,提供正确决策信息变更顾问委员会CAB针对具体变更请求,评估并分派相应资源回顾所有提交的RFC,并确保它们的潜在影响和风险得到评估回顾所有已执行的变更,确保满足变更目的参加CAB会

56、议和紧急CAB会议协助变更经理确定变更优先级及变更规划一般根据不同变更内容有不同人员组成变更主管由与变更请求内容相关的具体技术领域的负责人(如组长)担任检查由变更申请人提交的变更请求RFC,并完善或调整RFC信息,必要时拒绝无 业务支撑网网管系统规范-服务管理流程分册 39关或无法实施或没有必要的变更请求作为具体变更的项目经理,负责领导变更的构建测试,实施和参与回顾制定变更项目计划和时间规划等确保变更在预定的时间,资源和成本内完成在必要时,确保回退计划(Fallback Plan)得以正确实施变更实施人员根据变更主管制定的变更实施计划执行分派的任务以推进变更项目向变更主管汇报工作进程现场负责变

57、更实施2.3.6 主要内容主要内容变更管理流程通常将包括如下内容:提出提出 RFCRFC变更申请人提出 RFC,由变更主管负责检查和完善其内容,并进行风险等级、优先级的初步评估。接受接受 RFCRFC变更经理接受 RFC。变更请求分类和升级变更请求分类和升级通过分类,确定是否为重大变更、紧急变更,如果是常规变更请求,则由相应变更主管安排实施;如果风险等级为”重大”的变更请求,应上报省公司管理层和集团公司;紧急变更适用同一流程但将得到快速批准和实施。变更顾问委员会()评估变更顾问委员会()评估变更经理将根据特定的变更请求成立特定的CAB,成员包括对该变更的评估和批准提供应有附加价值的技术人员和管

58、理人员评估工作包括技术可行性,对容量的影响,对现有服务的影响,资源需求等 业务支撑网网管系统规范-服务管理流程分册 40批准批准 RFCRFC变更经理确定对该RFC有批准权的人员参加CAB,必要时参与评估评估后CAB根据判断决定是否批准RFC。建立变更实施计划测试结果,并批准实施建立变更实施计划测试结果,并批准实施变更请求得到评估和批准后,变更主管安排相应资源进行变更的构建/开发、测试,并制定实施计划。随后提交计划和测试结果给变更经理以获得批准。 规划规划 RFCRFC实施计划一旦获得批准,变更主管必须根据资源和其他情况进行规划,确定实施时间表,分配相应资源,并通知请求人。 协调变更实施协调变

59、更实施一切就绪后,可以实施变更相应小组实施变更,变更主管监视实施过程,并在必要时进行协调 更新变更状态更新变更状态在整个变更过程中,变更的状态从登记,评估,回顾到最后关闭是不同的变更经理负责更新预先定义好的变更状态 回顾和关闭回顾和关闭 实施变更后,CAB负责从技术和流程角度去回顾变更,确保RFC得到了预期效果,并寻找流程的改进机会。随后,变更经理负责关闭RFC。总结汇报总结汇报向管理层提供流程报表,提供变更的用价值的信息,定期向相关小组部门根据流程衡量标准汇报。变更会议变更会议变更经理负责定期或不定期召开变更会议,与IT内部成员和用户沟通,传递将要实施的变更等信息,以及对变更流程的反馈和建议

60、等。 业务支撑网网管系统规范-服务管理流程分册 41变更流程回顾变更流程回顾建议定期回顾变更管理流程以提高效率和效能,在实施变更流程不久之后,可以进行第一次回顾,以确保流程得到正确实施并起到预期目的。对发现的问题必须追根溯源并尽快解决之后,可以定期举行正式的回顾,如每六个月回顾一次。 2.3.7 流程衡量标准流程衡量标准变更管理流程的主要衡量指标如下:每一类型的变更数量 执行回退计划(Fallback plan)的变更数量变更实施的成功率紧急变更所占的比率被拒绝的RFC的数量或比例每一类优先级的变更数量统计报表统计报表RFC 数量,按优先级、风险等级、变更类别、申请人部门/归属小组等分别按月、

61、周、日汇总统计该时间段内创建的 RFC 数量风险等级重大风险等级高风险等级中风险等级低紧急正常常规优先级风险等级紧急正常常规重大高中低网络设备服务器存储系统 业务支撑网网管系统规范-服务管理流程分册 42优先级风险等级紧急正常常规重大高中低部门1小组1处于各状态的 RFC 数量,可按优先级、风险等级、变更类别、申请人部门/归属小组、状态实时汇总优先级风险等级紧急正常常规重大高中低已登记已评估已授权已计划进行中已结束观察中已回顾关闭已登记已评估已授权已计划进行中已结束观察中已回顾关闭网络设备服务器存储系统已登已评已授已计进行已结观察已回关闭 业务支撑网网管系统规范-服务管理流程分册 43记估权划

62、中束中顾部门1小组1RFC 关闭的数量,可按优先级、风险等级、变更类别、关闭代码等分别按月、周、日汇总统计该时间段内创建的 RFC 的关闭数量优先级风险等级紧急正常常规重大高中低完全成功部分成功取消拒绝完全成功部分成功取消拒绝网络设备服务器存储系统完全成功部分成功取消拒绝部门1小组1 业务支撑网网管系统规范-服务管理流程分册 442.3.8 流程图举例流程图举例如下是变更管理的逻辑示意图举例: 变变更更管管理理逻逻辑辑流流程程省公司管理层集团公司变更实施人员变更主管变更顾问委员会 (CAB)变更经理变更请求者NYNNNYYYY400.8制定具体计划& 协调沟通400.4协调CAB相关活动紧急流

63、程400.2检查/完善变更请求400.1提交变更请求授权?400.9 实施常规类变更吗?400.6制定测试/实施计划400.10回顾400.5评估风险/影响400.11结束紧急变更吗?400.3接受变更请求400.7总体变更计划批准吗?Y上报集团公司拒绝变更申请重大变更吗?Y/N升级到管理层集团公司审批 需要集团公司审批吗?N批准吗YN关于该逻辑流程的简单描述如下:序号序号步骤名步骤名称称责任人责任人输入输入说明说明输出输出400。1 提交变更请求变更请求者变更需求及相关信息请求者发现或接到变更请求,跟相关部门或用户确认,然后填写变更请求并提交给相关变更主管初始 RFC400。2检查/完善变更

64、请求变更主管初始RFC相关变更主管负责对变更请求者提交的 RFC进行检查,确定变更优先级和风险等级,如有必要则对 RFC 相关信息完善或更正,以经过完善的RFC,包含所有必需的 业务支撑网网管系统规范-服务管理流程分册 45保证 RFC 的正确性和完整性正确信息400。3接受变更请求变更经理经过完善的 RFC接受变更请求,检查变更请求的完整性和正确性,确定相关变更顾问委员会 CAB 成员 RFC 登录进变更管理系统常规变更?变更经理判断所提交的变更是否为常规变更, 如果是,直接由变更主管负责该变更的计划和执行;如不是常规类变更,则继续重大变更?变更经理风险等级为”重大”的变更请求,变更经理应立

65、即上报至集团和省公司管理层紧急变更?变更经理判断是否为紧急变更,如是,则转向紧急变更流程,否则继续400。4协调CAB 相关活动变更主管确定的CAB 名单相关变更主管与已确定的 CAB 成员进行沟通,确保 RFC 具体内容得到共识,并准备CAB 会议CAB 成员都已明确 RFC内容400。5评估风险/影响变更顾问委员会CAB待评估的RFC召开会议或指定人员对变更请求进行评估并得出结论RFC 得到评估,包括变更风险,优先级,影响度等授权吗?变更顾问委员会CAB决定是否对该变更请求授权,如果授权,则继续,否则拒绝变更请求并由变更经理与变更请求者进行沟通400。6 制定测试/实施计划变更主管得到授权

66、的 RFC变更主管负责测试和制定实施计划,并把测试结果和实施计划递交给变更经理以批准实施 变更的测试计划和实施计划批准吗?变更经理决定是否批准实施变更,必要时召集变更顾问委员会,如批准,则继续,否则把测试结果和实施计划 退还给变更主管并要求重新提交400。7总体变更计划变更经理变更的测试计划和实施计划综合其他 RFC,来制定或修改总体变更计划总体变更计划需要集团公司审批吗?变更经理N/A对于重大变更,还需判断是否属于需要集团公司审批的变更,如是,则上报集团公司,等待批准,如批准,则转 400。8,制定具体计划,如不批准,则转 400。6,重新制定测试和实施计划;如不需要集团公司审批的变更,则直

67、接转 400。8 进行制定具体计划N/A400。8制定具体计划和协调沟通变更主管变更测试计划和实施计划总体变更计划综合总体变更计划、变更测试和实施计划,确定一个最合适的实施时间,根据需要与相关部门进行充分沟通具体实施计划400。9实施变更实施人员具体实施计划根据具体实施计划执行变更实施,在必要时启动回退计划(Fallback Plan);并在实施完成已实施的变更 业务支撑网网管系统规范-服务管理流程分册 46后得到配置经理授权更新相关配置信息已更新的配置信息400。10回顾变更顾问委员会CAB已实施的变更变更经理召开 CAB 会议对实施的变更进行回顾以确定变更目的是否已达到已回顾的变更400。

68、11结束变更经理已回顾的变更更新相关信息,关闭变更记录变更请求关闭2.3.9 变更请求信息项变更请求信息项本规范定义如下变更请求信息项:信息项信息项说明说明变更请求序列号为每个变更请求分配一个唯一的序列号记录创建时间变更请求创建的时间发起人信息记录变更请求者的基本信息,包括:姓名省/分公司部门电子邮件办公电话手机/BP优先级紧急 正常 常规风险等级重大 高 中 低所影响的应用系统实施该变更将对哪些应用产生影响变更类别变更的分类变更描述简单描述变更请求变更详细内容详细描述变更的内容变更完成时限变更要求完成的时限变更状态RFC 所处的状态变更主管填入变更主管姓名,变更请求应当先由变更主管检查 业务

69、支撑网网管系统规范-服务管理流程分册 47变更主管提交时间变更主管提交变更请求的时间变更审批记录记录变更审批的历史记录,包括:审批人姓名审批结果原因时间变更计划包括变更的实施计划、测试计划、回退计划等,以及变更任务分配给哪些实施者变更日程安排变更实施的时间安排变更实施情况由变更实施人填写,用于描述实施时的现场情况变更测试情况描述测试的情况、测试结果变更观察情况描述变更结束后,观察期间的情况变更关闭状态完全成功 部分成功 取消 拒绝关闭时间变更关闭的时间关闭人关闭人的姓名2.4 配置管理配置管理2.4.1 描述描述配置管理是一个描述、跟踪和汇报所有 IT 基础架构中的每一个设备或系统的管理流程。

70、这些设备和系统被称为配置元素(CI) 。每一个 CI 必须被有效管理、跟踪和控制以支持 IT 服务和基础设施成功运行。配置管理流程所管理的配置元素包括硬件、软件和网络设备、文档等 IT 基础架构中所有必须控制的组成部份。所有的数据存在配置管理数据库(CMDB) 中。在说明一个配置元素(CI) 时,CI 被赋予一个名字和描述,同时诸如责任人、状态、配置等相关属性也被详细记录。CI 之间的关系也可找出并记录到 CMDB 中。CI 改变时, 业务支撑网网管系统规范-服务管理流程分册 48CMDB 中的相关信息被更新,对 CMDB 也进行定期审核以确认和维护数据的完整性和一致性。配置管理是 IT 基础

71、架构组成部份的文档化描述(如状态,关系等) ,并包括配置元素(CI) 相关的文档资料。它制定、跟踪和汇报相关信息,以增强其他流程的更有效运行,特别是变更管理、事件管理和问题管理等流程。配置管理是 IT 服务管理的一个核心流程,能确保 IT 环境中所有 IT 设备/系统及其配置信息得到有效完整的记录和维护,包括各 IT 设备/系统之间的物理和逻辑关系,从而为实现有效 IT 服务管理奠定基础。例如: 通过了解系统当前的配置信息,与其他配置元素的关系和历史状况等,帮助台员工可迅速正确判断故障,找出有效解决方案,从而确保系统的可用性。2.4.2 目的目的配置管理流程的总体目标是提供一个统一的一致的流程

72、来管理 IT 生产环境中的所有组成部份,以确保:所有配置元素(CI) 被识别和记录下来配置元素当前和历史状态得到汇报配置元素记录的完整性得到维护和确认BOSS 系统生产环境的稳定性2.4.3 范围范围 配置管理的范围是 IT 生产环境的所有配置元素(CI) ,包括生产环境的硬件、软件、网络设备、以及测试开发环境的硬文档等,具体内容包括识别、控制、汇报和审核等行为。 不包括:不包括:处于开发或测试环境的设备或系统 业务支撑网网管系统规范-服务管理流程分册 492.4.4 相关定义相关定义配置元素关键级别配置元素关键级别为了区别事件相关联的配置元素对移动业务的影响,对于 BOSS 系统主要配置元素

73、(CI)进行关键等级定义:等级描述说明1高2中3低所有配置元素的关键级别由其相关联的业务或子业务的关键级别决定,业务和子业务作为配置元素在配置管理数据库中管理。本规范规定业务/子业务关键级别定义如下:业务业务关键级别子业务子业务关键级别采集源1采集点1采集1数据传输1服务使用记录接受点1预处理点1高额处理1分拣1批价1入库1计费1输出点1漫游结算数据上传1漫游结算数据接收1结算1漫游结算数据处理1 业务支撑网网管系统规范-服务管理流程分册 50漫游结算稽核2漫游结算单生成2网间结算关口局数据收集3网间结算数据处理3网间结算稽核3网间结算单生成3帐务数据采集1出帐预处理1加载外部数据1出帐计算1

74、出帐核查1出帐调整1出帐确认1定期出帐1实时出帐1帐务处理1定额出帐3销帐1反销帐1欠费催缴1欠费服务限制1无主帐单检查2帐务对帐3帐务调帐2帐务减免2呆坏帐处理2帐务管理1挂帐处理3业务受理开户1预约服务3业务受理预销户3营业1业务受理销户2 业务支撑网网管系统规范-服务管理流程分册 51更改用户资料3服务变更1付费计划变更2套餐计划变更2营业缴费1托收2缴费卡缴费1银行划帐1冲正1客户服务查询2帐务情况查询2详单查询2停/复机管理1银行接口管理1SMP 接口管理2计费准确性3拨测系统运行状况3拨测3业务受理销户3性能统计3信令相关的性能统计1电路群性能统计1语音服务1CTI 服务器1IVR

75、1自动台话务2人工台话务1话务员信息3客户查询1业务受理1客户投诉与建议1客服1预约服务3 业务支撑网网管系统规范-服务管理流程分册 52信息发布3异地客户资料查询1异地停/复机1异地换卡/补卡1异地缴费1交费冲正117201 业务鉴权2一级 BOSS1WLAN 业务鉴权2 主机、存储、数据库、中间件的关键级别按其所承载的业务的最高关键级别确定网络、备份等设备原则上不作为高关键级别的资源,其关键级别由各省自定配置元素状态配置元素状态配置元素在整个生命周期中的不同状态,本规范规定如下配置元素状态代码:代码状态1已订购2已开发3已入库4已安装5测试中6生产中7维护中8已报废9已丢失10已退役11非

76、管辖2.4.5 职责职责/角色角色配置管理流程主要分为如下几个职责角色,分别简述如下:配置经理整体上对流程负责,确保流程的有效执行定期评估流程,制定流程改进计划 业务支撑网网管系统规范-服务管理流程分册 53制定配置管理政策定期制定配置管理报表,提供正确决策信息配置管理员记录和维护CMDB中的所有CI及相关信息根据配置经理要求产生相关报表保证对所负责的CI的数据正确性对所负责的CI进行添加,修改等2.4.6 主要内容主要内容配置管理流程着重于管理 IT 生产环境中所有必须控制的组成元素,并为其他相关流程(如事件管理等)提供相关信息,以使这些流程得到更有效的运行,从而保证 IT 环境的完整性和稳

77、定性。其主要流程内容如下:1. 识别和维护识别和维护 CIs确定需要进行配置管理的 IT 元素, 及所有必需的配置属性,并指明与 IT 环境中其他配置元素之间的关系。对配置管理数据库提供日常维护。2. 配置控制配置控制加强对 CI 变更的相应授权,在 CI 的整个生命周期内跟踪 CI 的状态(如以前、当前、计划状态等) , 确保只有被认可的和被标识的配置项及其配置信息才能输入 CMDB或更新 CMDB。3. 汇报和状态汇总汇报和状态汇总根据需要,定期产生配置管理报表,并能使相关人员进行选择、抓取、分类和返回所查询的 CMBD 数据。 定期产生配置项的状态报告,并能反映配置项的版本和变动历史。

78、业务支撑网网管系统规范-服务管理流程分册 544. 审计和确认审计和确认定期审核全部或部分 CMDB 数据,确认和物理环境的一致性,从而确保配置信息的完整性。该工作可定期和不定期进行:不定期(可每周或根据需要)从监控平台传送配置数据到服务管理平台的进行比对定期(如每季度)对全部或部分配置元素进行审计 如发现物理信息和逻辑信息的不一致性,需提交变更请求 RFC,通过变更管理流程进行调整。5. 流程管理流程管理配置流程管理主要包括计划、回顾和改进等。配置经理定期制定计划(如半年),以明确下阶段配置管理工作。配置经理定期回顾流程和审核结果,找出改进机会,包括针对流程和 CMDB 的改进2.4.7 流

79、程衡量标准流程衡量标准配置管理流程的主要衡量指标如下:所审计的CI符合CMDB版本/信息的比例由CMDB控制的CI的比例 检测到未被批准/授权的IT元素正在使用中统计报表由 CMDB 控制的 CI 的数量,可按 CI 的状态、类别汇总统计主机网络链路中间件数据库存储设备业务合同人员介质/文档已订购已开发已入库已安装 业务支撑网网管系统规范-服务管理流程分册 55测试中生产中维护中已报废已丢失已退役非管辖所审计的 CI 不符 CMDB 信息的数量,可按 CI 的类别汇总统计主机网络链路中间件数据库存储设备业务合同人员介质/文档审计不符数量占该类总数百分比监控平台检测到的不符 CMDB 信息的 C

80、I 数量,可按 CI 的类别按月、周、日分别汇总统计该时间段内所监测到的信息不符的 CI 数量主机网络链路中间件数据库存储设备业务合同人员介质/文档审计不符数量占该类总数百分比2.4.8 流程图举例流程图举例如下是配置管理的逻辑示意图举例: 业务支撑网网管系统规范-服务管理流程分册 56 配配置置管管理理逻逻辑辑流流程程配配置置管管理理员员配配置置经经理理200.6流程计划实施200.1维护/识别/定义200.2更新CMDB200.3报表/状态汇总200.4审计/确认200.7流程回顾和改进建议200.5流程计划制定关于该逻辑流程的简单描述如下:序号序号步骤名步骤名称称责任责任人人输入输入说明

81、说明输出输出200。1 识别,定义配置管理员待入库的IT 元素对所要管理的 IT 环境的所有组成元素进行命名和说明,包括对 CI 之间关系的描述;在添加一个新的授权记录时,确保所有需要的信息度符合配置管理的要求和标准确定所有必要信息的配置元素200。2更新CMDB配置管理员配置信息的增删请求根据需要更新配置管理数据库,如增加或删除配置信息已更新的CMDB200。3报表和状态汇总配置管理员报表或信息需求根据需要定期产生报表和状态汇总报告,向其他流程和相关人员提供配置信息配置信息报表或状态报告200。4审计/确认配置管理员审计需求通过审核确认 CMDB 中 CI 信息和其物理信息的一致性,并通过变

82、更管理流程消除不一致信息 ,具体可通过对所管理的配置元素的定期审计和随机抽查。审计结果变更请求200。5流程计划制定配置经理计划周期开始定期制定配置管理活动计划,包括人员,技术和流程等方面的内容。可以每半年进行一次已制定或改进的流程计划 业务支撑网网管系统规范-服务管理流程分册 57流程改进建议审计结果200。6流程计划实施配置经理已制定的流程计划实施流程计划已实施流程计划200。7流程回顾/改进建议配置经理回顾周期开始审计确认结束或回顾后发现流程效率不高,其他流程或组织需要新的方法等情况时,都需要对当前流程进行改进或制定新的流程。已回顾流程改进建议2.4.9 常见配置元素属性表常见配置元素属

83、性表以下对常见 CIBOSS 网管中需要维护的 CI,以及的 CI 的常见属性进行汇总罗列:主机主机主机基本属性属性属性说明说明主机名主机的标示关键级别主机的关键级别主机地址主机的 IP 地址(服务 IP)主机厂商主机的厂商主机型号主机的型号序列号主机序列号逻辑名主机的逻辑名搜索代码主机的唯一 ID逻辑卷路径各逻辑卷的路径名逻辑卷大小各逻辑卷的大小(MB)状态主机的状态用途主机的用途 业务支撑网网管系统规范-服务管理流程分册 58CPU 个数主机的 CPU 数目CPU 型号主机 CPU 的属性CPU 主频主机 CPU 的主频率内存大小主机的内存大小内置硬盘大小主机内置操作系统版本主机操作的版本

84、资产号主机的资产号系统网络接口数系统中网络接口的数量系统网络接口 IP 地址系统各网络接口的 IP 地址系统网络接口物理地址系统各网络接口的物理地址系统交换区大小总的 SWAP 区大小(MB)文件系统名称文件系统的标示文件系统的总空间主机文件系统总的可用量TPCC主机的 TPCC 值备注主机相关配置元素相关联配置元素相关联配置元素说明说明业务主机上承载的业务或子业务数据库主机上安装的数据库中间件主机上安装的中间件存储设备与主机相连的存储设备网络设备与主机相连的网络设备管理员主机的管理员维护合同主机的维护合同购置合同主机的购置合同网络网络 业务支撑网网管系统规范-服务管理流程分册 59网络基本属

85、性属性属性说明说明设备名称网络设备的标示关键级别网络设备的关键级别设备型号网络设备的型号搜索代码网络设备的唯一 ID状态网络设备的状态管理人员网络设备的管理员序列号网络设备的序列号网元类型网络设备的类型网元厂商网络设备供应商设备软件版本网元设备当前安装的软件版本号网元名网元配置名称,或由名字解析、DNS 服务解释的名称网元 IP 地址网元管理端口 IP 地址端口标识网元设备的每个端口的唯一标识名或 ID 号端口类型网络设备配置的端口模块类型端口设置速率网络设备各端口的最大速率(kbps)端口物理地址网络设备端口固化的物理地址端口 IP 地址网络设备端口配置的 IP 地址以及其掩码端口数量网络设

86、备配置各种类型端口的数目资产号网络设备的资产号用途网络设备的用途备注网络相关配置元素相关联配置元素相关联配置元素说明说明网络设备相关联的网络设备主机相关联的主机服务合同网络设备的维护合同 业务支撑网网管系统规范-服务管理流程分册 60购置合同网络设备的购置合同管理员网络设备的管理员链路链路(广域网广域网) 链路基本属性属性属性说明说明链路名称链路的标识搜索代码链路的唯一代码关键级别链路的关键级别状态链路的状态类型链路的类型带宽链路的带宽运营商链路所属的运营商资费链路的资费序列号链路的序列号用途链路的用途备注链路相关配置元素相关联配置元素相关联配置元素说明说明管理员链路的管理员网络设备相关联的网

87、络设备服务合同链路的维护合同购置合同链路的购置合同中间件中间件中间件基本属性属性属性说明说明 业务支撑网网管系统规范-服务管理流程分册 61软件名称中间件软件名称版本中间件产品版本关键级别中间件的关键级别序列号产品序列号搜索代码中间件的唯一 ID厂商中间件产品的厂商用途中间件的用途状态中间件的状态中间件类别交易中间件传输中间件应用服务器中间件端口号中间件的端口号最大并发连接数与数据库连接数最大并发网络客户端数量与客户端连接数系统日志路径中间件的系统日志路径用户日志路径中间件的用户日志路径配置的队列空间大小 传输中间件使用,中间件配置的所有队列所占字节数配置的队列所在路径 传输中间件使用,在队列

88、模式为磁盘队列时有效单条队列所允许的消息总个数传输中间件使用,单条队列所允许的消息总个数单条队列所占字节数 传输中间件使用,单条队列所占字节数队列模式传输中间件使用,指队列属性是内存队列还是磁盘队列应用服务器运行模式 应用服务器群集还是单机允许应用服务器支配的内存堆大小(MB)应用服务器使用,允许应用服务器支配的内存堆大小(MB)配置的总线程数应用服务器使用,配置的总线程数 业务支撑网网管系统规范-服务管理流程分册 62配置的数据库连接池大小应用服务器使用,配置的数据库连接池大小中间件相关配置元素相关联配置元素相关联配置元素说明说明主机运行中间件的主机业务中间件关联的业务或子业务数据库与中间件

89、相关联的数据库管理员中间件的管理员服务合同中间件的维护合同购置合同中间件的购置合同存储设备存储设备存储设备基本属性属性属性说明说明设备名存储设备名称设备型号设备规格型号关键级别存储设备的关键级别搜索代码存储设备的唯一 ID序列号产品序列号厂商存储设备厂商状态配置项状态用途存储设备的用途位置安放地点存储阵列数目各种类型的存储阵列的数目存储阵列标识每个存储阵列设定的唯一标识名存储阵列类型存储阵列的类型,包括是生产厂家、所属系列以及规格等存储微码版本存储阵列当前安装的微码版本号 业务支撑网网管系统规范-服务管理流程分册 63存储配置容量存储阵列当前配置的磁盘总容量存储采用 RAID 方式存储阵列各逻

90、辑卷采用哪种 RAID 数据保护方式存储 CACHE 容量存储阵列内配置的 CACHE 内存容量磁盘标识每个磁盘在存储中的标识名磁盘的规格存储阵列配置的磁盘规格,包括:单盘容量及转速主机通道卡标识主机通道卡在存储中的标识名主机通道卡类型存储配置主机通道卡的类型,例如:光纤、SCSI、UltralSCSI、ESCON 等类型的通道卡主机通道卡数目存储配置的各种通道卡数目磁盘适配卡标识磁盘适配卡在存储中的标识名磁盘适配卡类型存储配置的磁盘适配卡的类型,例如:光纤、SCSI、UltralSCSI、SSA 等类型的适配卡LUN 标识存储中划分的每个逻辑卷的标识热备盘配置数存储阵列当前配置的热备盘数目存

91、储设备相关配置元素数据库数据库数据库基本属性属性属性说明说明软件名称数据库软件名称版本数据库版本信息关键级别数据库的关键级别序列号产品序列号相关联配置元素相关联配置元素说明说明主机与该存储设备相关的主机管理员存储设备的管理员服务合同存储设备的维护合同购置合同存储设备的购置合同 业务支撑网网管系统规范-服务管理流程分册 64搜索代码数据库的唯一 ID厂商数据库厂商用途本数据库用于哪些应用状态数据库状态(即配置元素状态)数据库名数据库实例名数据库端口号数据库的端口号数据库的位数32/64 位安装的选项指数据库已经安装的选项,如分区、并行等归档方式日志归档方式信息归档日志目录如果采用归档方式,则列出

92、归档日志目录共享内存的大小共享内存的设定大小(MB)数据设备名数据库内数据文件或数据设备名数据库相关配置元素相关联配置元素相关联配置元素说明说明主机与该数据库相关的主机管理员数据库的管理员服务合同数据库的维护合同购置合同数据库的购置合同业务(业务和子业务均属于业务类业务(业务和子业务均属于业务类 CI 进行配置管理)进行配置管理)业务基本属性属性属性说明说明业务名称业务的名称版本版本信息关键级别业务的关键级别搜索代码业务的唯一 ID数据库实例名与业务关联的数据库实例中间件端口号与业务关联的中间件端口 业务支撑网网管系统规范-服务管理流程分册 65用途业务用途状态业务的状态厂商应用软件厂商业务相

93、关配置元素相关联配置元素相关联配置元素说明说明父业务如果是子业务,填入上级业务搜索代码;否则,填为”无”;主机与该业务相关的主机数据库与该业务相关的数据库中间件与该业务相关的中间件管理员业务的管理员服务合同业务的维护合同搜索代码购置合同业务的购置合同搜索代码PC属性属性说明说明设备名PC 的设备名称搜索代码PC 的唯一 ID型号PC 的型号序列号PC 的序列号状态PC 的状态用途PC 的用途CPUCPU 主频内存内容容量硬盘硬盘容量操作系统操作系统名称和版本业务PC 所承载的业务IPIP 地址 业务支撑网网管系统规范-服务管理流程分册 66位置PC 的安装位置管理员PC 的管理员服务合同PC

94、的服务合同购置合同PC 的购置合同配套设施配套设施属性属性说明说明设备名机房配套设施的设备名称搜索代码配套设施的唯一 ID型号配套设施的型号产品序列号配套设施的产品序列号状态配套设施的状态位置配套设施所处的位置用途配套设施的用途管理员配套设施的管理员服务合同配套设施的服务合同购置合同配套设施的购置合同合同合同属性属性说明说明合同名合同名称对象合同主体对象编号合同编号搜索代码合同的唯一 ID位置合同存放位置管理员合同管理人员签约厂商合同签约厂商 业务支撑网网管系统规范-服务管理流程分册 67人员人员属性属性说明说明姓名维护人员姓名搜索代码维护人员的唯一 ID办公电话维护人员办公室电话手机号码维护

95、人员手机号码邮件地址维护人员邮件地址地点维护人员工作地点组织维护人员所属的部门职务人员职务IT 组别维护人员所属的维护组介质介质/文档文档属性属性说明说明文档名称文档名称搜索代码文档的唯一 ID用途文档用途状态文档状态位置文档存放位置管理员文档管理员3 运维管理流程关系和运维运维管理流程关系和运维支持体系支持体系模式模式3.1 运维流程相互关系运维流程相互关系上一章是第一阶段各运维流程的详细描述和实际应用流程举例。但是,由于 IT 业务支撑网网管系统规范-服务管理流程分册 68环境从总体上来说是一个不可分割的有机体,所以上述各流程是不可能独立运行的,为了提高 IT 运维管理的整体性,各流程之间

96、必须设计接口。如下是上述四个流程之间的接口关系图:监控工具事件管理服务报告事件统计审计报告问题管理问题统计趋势分析问题报告问题回顾已知错误审计报告变更管理变更(发布)计划CAB会议纪要变更统计变更回顾审计报告管配置理CMDB报告CMDB统计政策/标准审计报告业务部门或IT用户事件问题,咨询等沟通,更新,变通方法等变更或发布请求事件 问题/已知错误 变更 Cis/关系CMDB帮助台如下为各接口的几个关键要点:1. 业务部门或 IT 用户与 IT 的接口主要表现在:用户提交事件或咨询请求给帮助台,帮助台在整个事件处理过程中保持与 IT 用户的沟通,直至解决方案的确认和事件请求的关闭如果在管理流程中

97、允许变更请求可以由用户提交,则 IT 用户可以把 RFC提交给变更管理人员2.事件管理流程的接口:监控系统发现的故障或报警输入到事件管理流程 业务支撑网网管系统规范-服务管理流程分册 69IT 用户的事件或服务请求输入到事件管理流程问题管理流程分析事件记录,确定问题提出变更请求 RFC 到变更管理流程实施事件解决方案,解决事件事件管理流程查询 CI 配置信息,进行事件的分析,诊断和解决3.问题管理流程的接口:事件记录输入到问题管理流程进行问题分析提出变更请求 RFC 到变更管理流程实施问题解决方案,解决问题问题管理流程查询 CI 配置信息,进行问题的分析,诊断和解决4.变更管理流程的接口:事件

98、管理和问题管理提出变更请求 RFC 到变更管理流程实施解决方案,解决事件或问题变更管理流程查询 CI 配置信息,如相互关系等,进行变更的风险,影响分析等变更请求处理完毕后,与配置管理协调以更新相关 CI 信息5.配置管理流程的接口:给事件管理,问题管理和变更管理等运维流程提供 CI 信息以上各流程还需和报表系统建立接口,以根据各自管理需求产生相关报表。3.2 整体运维整体运维管理模式管理模式支持体系支持体系通过在 IT 部门建立以上各符合 ITIL 指导框架的流程规范和设计各流程的相互关系及流程接口,可以在 IT 部门建立如下的三级支持体系: 业务支撑网网管系统规范-服务管理流程分册 70帮助

99、台一线支持/配置管理员IT用户二线支持/问题分析专家第三方网络支持 主机支持 数据库支持监控系统事件经理问题经理配置经理变更经理一线一线二线二线帮助台帮助台结合移动公司 BOSS 运维的具体情况,本规范有如下建议:帮助台人员必须 7*24 接受事件和分派事件一线人员一般是对系统和业务提供初始支持的维护人员,配置管理员也可由一线人员承担,负责配置管理数据库的维护工作二线人员一般是对系统和业务提供专业支持的维护人员,常按系统和业务分成不同小组,分别解决相应的事件;二线人员在问题管理流程中也作为相应领域的问题分析专家,负责对该类问题的调查和诊断所有流程的责任人(包括事件经理,问题经理,配置经理和变更

100、经理)负责该流程的整体管理和资源协调,常由较资深的维护主管承担流程中的几个角色可以由同一个人承担上图从三层支持的流程角度描述了运维管理模式支持体系,这里的重点是不同层面人员需要不同的技能和管理的侧重点,通过该支持体系,可以保证 IT 部门在处理 IT 事件和变更等日常工作中,具体岗位和人员的角色职责的明确定义,具体的运维流程与ITIL 规范相一致,从而保证整个 IT 管理系统的高效、平稳地运作,同时能和外部的厂商或合作伙伴实现有机结合。 业务支撑网网管系统规范-服务管理流程分册 714 附录附录4.1 ITIL 国际规范简介国际规范简介为加强对 BOSS 系统的管理和维护,规范 IT 运行管理

101、和操作,实现信息系统的自动化运行管理,提高系统可靠性、可用性,保障业务的稳定,特制定本规范,指导各省采用规范化的 IT 管理模式,建设集中式服务管理平台和管理流程。本规范中流程管理的理论依据参照 ITIL(Information Technical Infrastructure Library)服务管理体系,这是在全球 IT 管理业界公认的指导性框架。4.1.1 ITIL 国际规范简介国际规范简介ITIL 由 CCTA(英国国家电脑局)颁布,这是一套 IT 部门用来计划、研发、实施、运维高质量服务的标准管理库。它把各个业界在 IT 管理方面最好的方法归纳起来,变成规范,旨在为企业的 IT 部门

102、提供一套标准的 IT 管理方法, 使这些企业的 IT 部门可以站在”巨人”的肩膀上, 直接按照国际先进的 IT 管理思想和方法来管理和运行 IT,协助 IT 部门建立以服务为导向的 IT 运作。它一经推出,立即被广泛采用,目前在全球已被多于 100,000 家在各行业处于领先地位的企业所采用。ITIL 包含了一系列 IT 部门进行 IT 服务支持和实施的规范性流程,以及关于 IT 服务管理的最佳经验,包括帮助台、突发事件管理、变更管理等运维管理流程和服务级别管理、可用性管理等规划管理流程,通过这些流程规范的实施,可以将 IT 部门的管理工作从被动式服务转向主动式服务,并通过相应管理工具的集成,

103、 为 IT 工作人员和 IT 管理人员提供一个灵活量化的服务管理平台,从而使已往繁杂的 IT 管理变得有序而轻松。ITIL 标准库里的流程,可以分为两大组:服务运行管理流程,包括帮助台/突发事件管理,问题管理,变更管理和配置管理和发布管理等 业务支撑网网管系统规范-服务管理流程分册 72服务规划管理流程,包括服务级别管理,IT财务管理,容量管理,IT连续性管理和可用性管理等,最近把安全管理也纳入了进来。两者的主要区别在于,服务运行管理流程是日常性的,目标是处理日常的维护性管理工作、包括处理事件、控制变更等,以保证 IT 系统的稳定性,可靠性和用户的满意度;而服务规划性流程是通过服务目标的规划、

104、确定、监控和改进,来确保日常的 IT服务水平达到所需要的目标,并实现 IT 服务的持续性改进, 通过两者的结合,可以帮助 IT 部门提供面向业务和用户的 IT 服务,通过流程化、规范化的 IT 服务管理模式,帮助 IT 部门真正实现 IT 服务的业务价值。如下为各流程的简要介绍:服务台(Service Desk、HelpDesk),也称为帮助台,IT 服务管理与用户的单一接口,受理并处理用户的服务请求。事件管理(Incident Management),它和帮助台一起组成事件处理流程,有效解决各类IT突发事件,尽快恢复IT服务。问题管理(Problem Management), 寻求IT故障的

105、根源,解决存在的问题,从而消除或减少IT事件的发生。配置管理(Configuration Management),管理各IT资产系统(配置元素,CI),包括相互间的关联与依赖关系。变更管理(Change Management), 对变更请求进行记录、跟踪与管理,消除或减少IT变更对生产环境和系统的影响和风险,保证变更的平稳运行。发布管理(Release Management),确保IT系统和软件的有效实施和版本管理。服务级别管理(Service Level Management),保证整个业务系统的服务等级或水平,实现量化管理。可用性管理(Availability Management),监控

106、所有重要IT资源,保证整个业务系统的可用性。容量管理(Capacity Management),监控和提高系统性能,进行性能规划。IT连续性管理(Service Continuity),建立业务持续计划,保证系统的高可用性,以实现业务的持续运行。IT 财务管理( Finacial Management), 包括 IT 预算管理,成本管理和收费管理。 业务支撑网网管系统规范-服务管理流程分册 73安全管理(Security Management),对应用系统,网络及所有服务器提供可靠的安全保护。ITIL 服务框架帮助 IT 部门将目光转向了基于流程、关注服务品质、满足服务等级要求、面向用户的一系

107、列服务管理范畴,它帮助 IT 管理人员回答了”IT 部门能提供什么服务”的问题,也回答了”如何实施高质量 IT 服务”,更回答了“以什么可衡量的方式和标准”提供满足用户和业务需求的服务的问题。参考 ITIL 管理体系来建立运行管理平台、管理制度和流程,设计相应人员职责角色,优化管理组织结构,选择和配置各类管理工具,通过人员(People)、技术/工具(Technology)和流程(Process)的有机结合,有效实现上述项管理,并集成为一个整体的IT 运行管理系统,是实现 IT 运维管理标准化,规范化的重要步骤。4.1.2 分阶段实施方法分阶段实施方法ITIL 是综合性的 IT 服务管理体系,

108、包含了全部 IT 管理流程规范,但 IT 管理流程的构建或规范化是一个长期的过程,没有任何一家企业可以让自己的 IT 部门在一夜之间把所有的 ITIL 规范流程建立起来,一步使自己的 IT 管理变得成熟起来。因此,有计划、分步骤地将 ITIL 中所描述的各流程应用在日常的系统运行维护和管理中去是现阶段最切实可行的方法。 业务支撑网网管系统规范-服务管理流程分册 74时间时间IT价价值值人员 流程 技术配置管理突发事件管理问题管理变更管理日常运营维护服务级别管理可用性管理安全管理发布管理容量管理IT财务管理服务连续性管理利润中心利润中心运维管理运维管理服务管理服务管理根据 ITIL 的建议和实践

109、经验,以上是比较常见和可行的分阶段实施方案,其中的第一阶段包括帮助台/突发事件管理、配置管理、问题管理和变更管理, 所有这些流程组合成 ITIL 的运维管理流程规范,属于上述的服务运行管理流程。在第一阶段实行运维管理规范流程的目的,是通过采用 ITIL 国际标准和全新的 IT 管理结构,综合企业信息系统的各种资源,包括人员,流程和技术,形成全面、统一、集中的管理构架及服务管理流程,确保信息系统能为企业发展提供可靠、高效、安全的 IT服务。上述的运维管理流程和日常性运维工作是不同的,日常性运维工作是针对不同的系统平台和应用进行的例行工作,如数据库管理、数据备份等等, 而运维管理流程是通过规范的流

110、程来处理来自日常性运维工作中出现的突发事件,提出的变更请求等,包括所有在IT 运行环境中必要的管理活动和衡量方法以推动和维护 IT 服务和生产环境能满足服务级别协议和业务目标, 通过与日常性运维工作的结合,将管理着眼于”监视和控制”以确保 IT 基础设施的稳定性, 实现规范性的流程管理, 确保 IT 服务及 IT 的相关运作环境达到所业务所需要的服务级别。日常性运维工作在大多数 IT 部门里被认为是后端支持,所以动作和角色价值经常被低估。然而,高效的运维人员、相关工作流程和运维工具对于高质量的 IT 服务是很关键的。没有这些基础性工作,运维管理流程要成为 7*24 的连续性流程是不可能的,日

111、业务支撑网网管系统规范-服务管理流程分册 75常性运维工作通常包括:系统资源状态/警告管理输出和打印队列管理备份管理客户端,服务器和网络管理用户管理IP地址管理数据库管理语音设施管理安全管理协调预防性维护下图为第一阶段四个运维流程之间的总体关系图:由此可见,帮助台作为 IT 事件来源的中心接口,接受和登记事件并通过事件管理流程IT户 户事事件件管管理理问问题题管管理理变变更更管管理理配配置置管管理理I B MI B M监监控控系系统统帮助台服服务务管管理理平平台台IT户 户事事件件管管理理问问题题管管理理变变更更管管理理配配置置管管理理I B MI B MI B MI B MI B MI B

112、M监监控控系系统统帮助台服服务务管管理理平平台台 业务支撑网网管系统规范-服务管理流程分册 76进行统一处理解决,问题管理流程对已发生的事件或紧急重大事件进行根本原因的分析,从而解决根本问题,防止事件的发生或重复发生;而变更管理流程通过提出变更请求实施问题/事件的解决方案,并通过分析和控制变更的风险和影响来确保变更的平稳实施;同时,配置管理给事件管理和问题管理提供配置信息,进行原因分析和确定解决方案,而变更管理通过了解配置元素信息和相互关系,确定变更的潜在影响和风险,并通过通知配置管理更新配置信息,保证配置元素的正确性,以确保事件管理和问题管理能得到所需要的最新的配置信息。通过以上四个流程的建

113、立,可以使日常的运维工作流程化,职责角色更清晰化, 从而使解决问题的速度和质量得到有效提高,使 IT 部门内的相关支持信息更为畅通和透明,使支持服务的信息更为完整和有效,实现知识积累和知识管理,并可以帮助 IT 部门更好地进行量化管理和设定优化指标,进行持续地服务改进, 最终能够为业务部门和用户提供更高质量的服务并提高他们的满意度,把 IT 部门建设成为规范的 IT 运维中心。第二阶段的流程管理目的是实现服务管理, 重点在于在企业的 IT 环境中了解业务的 IT服务级别需求,以此定义双方同意的服务级别,如可用性需求,并通过标准的流程进行服务级别的监视,汇报和改进,最终实现量化管理,通过分析实际

114、服务水平和预定的服务目标之间的差距制定质量改进计划, 实现连续的质量改进循环,把 IT 部门建设成为真正的服务中心。 第三阶段是实现业务和 IT 的战略整合, 通过标准流程评估 IT 服务的在企业中的市场, 基于业务需要定义 IT 如何对企业价值链做贡献, 使 IT 部门最终能够成为用户的业务合作伙伴,最终把 IT 部门建设成为利润中心。4.2名词解释名词解释ITIL 国际规范CCTA(英国国家电脑局)开发的 ITIL,这是一套 IT 部门用来计划,研发,实施,运维高质量服务的标准管理库。它把各个业界在 IT 管理方面最好的方法归纳起来,变成规范,旨在为企业的 IT 部门提供一套标准的 IT

115、管理方法帮助台IT 服务管理与用户的单一接口,受理并处理用户的服务请求 业务支撑网网管系统规范-服务管理流程分册 77事件管理和帮助台一起组成事件处理流程,有效解决各类 IT 突发事件;尽快恢复 IT 服务问题管理寻求 IT 故障的根源,解决存在的问题;从而消除或减少 IT 事件的发生。配置管理管理各 IT 资产系统(配置元素,CI),包括相互间的关联与依赖关系。变更管理对变更请求进行记录、跟踪与管理,消除或减少IT变更对生产环境和系统的影响和风险,保证变更的平稳运行。发布管理确保IT系统和软件的有效实施和版本管理服务级别管理保证整个业务系统的服务等级或水平,实现量化管理可用性管理监控所有重要

116、IT资源,保证整个业务系统的可用性容量管理监控和提高系统性能,进行性能规划IT 连续性管理建立业务持续计划,保证系统的高可用性,以实现业务的持续运行IT 财务管理包括IT预算管理,成本管理和收费管理安全管理对应用系统,网络及所有服务器提供可靠的安全保护事件指发生了非常规的运作情况,包括系统崩溃、软件故障、任何影响用户业务操作和系统正常运作的事情、以及影响业务流程或违背服务水平协议的情况,事件也包括一个用户的请求重分配规则事件的及时、正确分配和接手处理是确保事件在目标服务时间内解决的关键因素。申告指因 IT 系统或应用原因引起的用户投诉或数据差错。故障指系统或应用中存在的错误或非正常因素,导致部

117、分或全部业务不可用或者服务不正常。咨询指对系统操作、业务流程等方面的求助和询问业务处理指需要技术人员进行后台数据处理的要求维护作业支持人员的日常维护作业或临时进行的维护作业事件来源当接到一个问题时,帮助台人员需要记录事件来源的类型: 用户, 系统管理工具事件优先级优先级是事件管理流程的一个关键要素。优先级决定处理事件的顺序及所需的努力。事件的优先级通过综合衡量事件的影响度和紧急度得出影响度影响度用于衡量事件的业务严重程度,通常等于事件对服务水平的影响程度。影响度通常通过问题所影响的人数、关键系统数以及服务故障所造成的损失。 业务支撑网网管系统规范-服务管理流程分册 78紧急度紧急度表明解决问题

118、所需的速度。具有高影响度的问题默认并不一定需要立即解决。事件升级事件升级的目的是确保基于事件的优先级等级及时通知有关技术人员和领导,引起更多的重视,提供合适的资源,从而快速找到解决事件的方案。事件分类根据移动目前的事件种类,事件的分类层次设计不超过三层,第一级分类,称之为”类别”,第二级分类,称之为”子类”,第三级分类,称之为”条目”。事件状态事件状态表明事件所处在整个生命周期中的不同状态,如新开事件,一线处理中,已关闭等。事件结束代码事件结束代码说明了事件是在何种情况下关闭的事件经理作为事件流程的负责人一线支持人员负责提供对帮助台无法解决的事件进行快速有效的分析并提出解决方案以尽快恢复服务,

119、并在必要时提供现场支持二线支持人员是相关问题领域的专家。他负责提供对一线支持人员无法解决的问题进一步进行调研,找出解决方案尽快恢复服务三线支持人员一般由第三方厂商承担事件流水号系统自动生成的工单号码事件持续时间事件从发生到解决的时间配置元素 CI需要被管理的每一个 IT 系统或设备配置管理数据库CMDB是一个数据集合,存储所有配置管理的数据和信息配置元素属性表示配置元素 CI 的一项信息,如序列号,版本等配置元素状态配置元素在整个生命周期中的不同状态,如已登记,维修中等配置元素关系不同配置元素之间的相互关系,如联结,父子等搜索代码在配置管理数据库(CMDB)唯一能识别配置元素的代码,并以此进行

120、配置元素的搜索等问题优先级别问题需要找到解决方案的紧急程度问题影响程度问题对 IT 环境的影响程度,包括对其他 IT 系统,对相关 IT 人员等问题状态问题在整个生命周期中的不同状态,如已登记,处理中等问题分类从问题从属的系统或技术架构的类型来进行分类,如数据库,服务器等问题性质根据问题的不同来源进行分类,如事件记录主动性分析等 业务支撑网网管系统规范-服务管理流程分册 79问题结束代码根据事件结束的不同方式赋予不同的变同方法,没解决等流程角色在问题管理流程中的的不同角色,具体包括问题经理, 问题分析专家等变更优先级别变更需要得到实施的紧急程度变更风险实施变更可能带来的风险变更状态变更请求从提

121、出到实施到结束的整个生命周期中的不同状态结束代码根据结束变更的不同方式赋予不同代码变更类别变更的不同来源进行类别划分变更类型从变更从属的系统或技术架构的类型来进行分类流程角色在变更管理流程中的的不同角色, 具体包括变更请求者, 变更经理, 变更顾问委员会 CAB 等, 变更主管等RFC对问题的解决方案进行评估,通过变更请求(RFC)进行测试和实施。根据 RFC 对业务的影响和成本进行评估并决定继续进行与否。CAB (Change Advisory Board)来帮助和支持变更经理,CAB 的成员根据变更的实质可以包括客户代表,运维支持,应用开发和供应商等跟变更有关的人员回退计划用以在实施阶段出现问题或紧急状况时需要把变更回退回去

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 初中教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号