3月4日Tivoli讲师姜岩-IT服务管理的实践与总结

上传人:宝路 文档编号:47615793 上传时间:2018-07-03 格式:PPT 页数:53 大小:1.77MB
返回 下载 相关 举报
3月4日Tivoli讲师姜岩-IT服务管理的实践与总结_第1页
第1页 / 共53页
3月4日Tivoli讲师姜岩-IT服务管理的实践与总结_第2页
第2页 / 共53页
3月4日Tivoli讲师姜岩-IT服务管理的实践与总结_第3页
第3页 / 共53页
3月4日Tivoli讲师姜岩-IT服务管理的实践与总结_第4页
第4页 / 共53页
3月4日Tivoli讲师姜岩-IT服务管理的实践与总结_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《3月4日Tivoli讲师姜岩-IT服务管理的实践与总结》由会员分享,可在线阅读,更多相关《3月4日Tivoli讲师姜岩-IT服务管理的实践与总结(53页珍藏版)》请在金锄头文库上搜索。

1、 IT服务管理的实践与总结光大银行IT服务管理建设的回顾与发展内容提要p背景介绍nIT建设背景、ITSM项目背景、运行资源背景p初步建设n项目启动、项目实施、收益与问题p持续完善n工具挖潜、流程落实、人员转变、制度配套p当前状态nITSM基础、人员专业分工、流程的细化、ITSM成本问题背景介绍IT建设背景、ITSM项目背景、运行资源背景背景介绍pIT生产系统背景n2000年-4套,开始集中建设n2005年-35套 初步形成规模,带来运行管理压力n2008年-150套 ITSM建设的急迫性pITSM项目背景n2003年开始登记整理故障记录等n2004年开始ITSM理论接触n2005年6月启动(一

2、次故障启动)p运行资源背景n2005年前操作员、系统管理员,被动式管理n2006年开始,人员细分,主动式管理(投产审批及标 准)初步建设项目启动、项目实施、收益与问题IT系统的快速发展与变化p初期目标:nIT运行信息控制(CMDB):以运行维护为导向,配置内容:服务器 、网络端口、操作信息、文档、帐户、备份介质、监控体系.;n完备监控体系的建设:统筹考虑监控工具、人员、制度及流程,充分 利用监控环节的各类信息;n事件处理的初步控制:对事件进行分类、登记、跟踪,并做事后分析 与评估,促进优化监控、系统管理等工作(无细化的处理流程) ;n变更的管理:对各类变更事件首先以CMDB为核心进行评估与控制

3、, 为后续阶段的质量管理等奠定基础;n操作环节的控制:对56套生产系统的每日300个操作任务进行自动化 控制与调度;p按需建设:n按照当时的需要,只针对配置、事件、控制与监控进行建设,解决当 前矛盾;nITIL的其它部分在初期不加以实施,但做总体考虑(如:SLA);n实施的计划要充分考虑各类成本以及自身资源(如:人员的内部培养 、外部聘用、专业服务购买)IT系统的快速发展与变化p简洁实用n对于各类流程根据实际情况先简单实现,不按照ITIL模型照搬; (如:事故处理流程,人员矩阵式配置)n人员角色采取有重点逐步过渡的方式;(如:一线监控人员)n各类制度是推动ITSM建设的关键,保证制度具有可操作

4、性,具备 :人员角色、职责、流程、考核等关键要素;(如:作业调度使 用管理规定)n责任到人、考虑与待遇配合,有专人负责流程并提出修改意见; (如:运行主管、交接班管理)p持续演变n事件、变更与配置等是一个循序渐进的过程,分阶段由简单到复 杂;(一期项目做,二期可能还需要做)n人员、制度、流程与工具都要根据情况不断调整;(如:监控的 四个流程自检、调整、判断、分析及一个报告重点、隐患、 解决)IT服务管理建设的初步目标日常运维有效管理日常运维管理的核心内容企业IT基础部件主机等硬件存储设备各类系统软件 各类应用软件 各类通讯线路 各类文档流程 各类配置参数日常运维有效管理的目标保障IT系统的稳定

5、与效率从容应对各类紧急事件合理的IT系统架构设计流程控制工作流程控制操作流程控制全面的监控体系IT基础环境监控 应用系统检查 系统性能管理 总体运行情况分析总体运行情况分析CMDB、事件、配置、变更CMDB配置管理 从项目开始的理想设计到实际应用的逐渐过度CMDB初期的理想化CMDB的实用化以系统运行为主导、考虑IT审计等需要;每类CI都要考虑相关的责任人;CI之间的关系更重要;每类CI都对应一定的流程CMDB的实用化既是软件的架构也是监控信息监控体系的建设系统监控在运行管理中的功能p运行管理架构的建设建立IT运行的预警机制:提高故障主动发现的比率建立系统的评估机制:基于数据对系统性能、容量评

6、估建立IT运行质量控制机制:问题的预先解决、质量把关p是IT服务管理体系的基础奠定数据基础:真实的运行数据奠定控制基础:事故发现、定位、处理的基础奠定知识基础:监控消息的“消化”,形成知识库(专业服务 )奠定人员基础:监控环节不仅仅是一类人员的工作奠定流程基础:是各类流程的起点,也是监视环节Page 14监控在ITSM中的功能n以OVO为基础的监控工具体系OVO服务器LOGLOGIC 对SYSLOG日志的搜集 过滤、报警 SNMP转发OVO的各类AGENT 各类设备的SNMP应用自定义的服务 检查流程ECC、ISEE 加密机 专用设备各类报警消息故障工单OVSD:1.控制故障解决; 2.控制监

7、控部署; 3.控制监控策略; 4.控制故障判断;质量控制安装配置标准 测试的标准 检查的标准 控制的标准OVSD与OVO的配合(日常工作流程)与IT服务管理中其他功能的关系n与事故处理的关系p对于事故的发现与定位,主要依靠监控体系,同时对于没有在监控体系 发现与定位的事故,必须认真评估,查找原因后不断修补监控体系,提 高OVSD中故障主动发现的比例;n与变更管理的关系p在变更过程中必须考虑监控和检查手段;p在发现监控体系漏洞后必须通过变更环节协调CMDB中CI修改;n与配置管理的关系p在配置管理数据库(CMDB)建立应用系统监控信息,针对任何投产的 应用系统,能够明确其构成结构及对应监控手段,

8、建立完整的应用架构 档案(可考虑SN的展现);n与系统开发的关系p在应用开发阶段,逐步按照应用系统投产文档建立规范完善架构设 计、容灾、容错、性能等环节,并最终产生移交文档;(质量控制)p将移交文档在监控、配置管理等环节实施;监控系统有效运行流程_(新系统投产)开发人员建立应用可 用检查清单按照: 1)IT基础环境;2)应用可用检查; 两个项目形成投产 监控档案在OVO中部署各节点及层面的 监控模板,设置特定阀值实施应用可用的: 1)特定检查; 2)服务检查;系统管理员建立应用IT 基础环境 检查清单监控管理员依照以往经验 建立应用可用 基础检查清单1)通过OVSD 变更流程登记; 2)变更O

9、VSD 问题库协调一线 监控人员; 3)统一报警到 OVO平台;一线监控人员 监控OVO对:1)IT基础环境严重报警; 2)应用可用严重报警; 发起事故工单 协调责任人处理 按授权启动应急流程监控系统有效运行流程_ (持续维护)OVO监控平台一线监控人员 监控OVO 对:1)IT基础环境 严重报警; 2)应用可用 严重报警; 发起事故工单 协调责任人 处理 按授权 启动应急流程OVSD平台开发人员建立应用可 用检查清单系统管理员建立应用IT 基础环境 检查清单监控管理员依照以往经验 建立应用可用 基础检查清单按管理规定监控并发起报警用户投诉检查:1)所有事故来源为监控体系 的有效性;2)未被监

10、控体系发现的事故 ,确认监控检查方式;事故管理ITSM建设初期目标_事故处理事故的分类,由值班人员统一跟 踪ITSM建设初期目标_事故处理事故来源的详细定义,统计分析 的基础ITSM建设初期目标_事故处理提高故障主动发现的比率变更管理ITSM建设初期目标_变更管理CMDB是变更的基础,变更与监 控协调一致ITSM建设初期目标_操作的控制操作的变更首先在CMDB实现ITSM建设初期目标_操作的控制作业调度的实现ITSM建设初期目标_操作的控制作业执行情况的监控IT服务管理建设的收获与问题n流程控制、全面监控、主动管理n人员转化、流程制度、工具支持IT服务管理建设的收获_初期建设思路p理论产生的背

11、景nIT系统故障的危害巨大;n有效维护IT系统超出了纯粹的技术范畴;n基于技术的复杂管理体系;p理论的意义n总体描述了管理的范畴,细化各个环节;n科学的划分了各个管理控制层次;p利用理论指导的思路n首先:统计分析企业自身各类IT事故、事件,找出最近、威胁最 大的问题;n其次:分析企业已有的IT参与人员、制度及流程;n再次:参照企业对IT部门的责权利定义;n最后:制定IT服务管理的基础建设方案;IT服务管理建设的收获主动式系统管 理 通过变更等流程控制 CMDB进而控制IT架构 的关键环节; 根据OVSD的事件、变 更管理,控制IT服务质 量; 根据系统的变更,及时 定义修改对应的各类流 程;

12、依照各类控制流程、IT 架构设计策略,逐步完 善应用系统设计规范, 保证系统的效率与安全全面监控体系完善配置OVO等IT基础环 境监控工具,首先保障IT 基础环境健康,做到及时 排除事故隐患; 积极利用各类系统优化工 具及专业分析排除故障隐 患 制定标准,设计应用检查 规范 充分搜集整理以上三个渠 道的系统运行数据,为系 统管理环节提供系统设计 规范素材完善的流程控 制 根据系统管理环节的定义 ,在iEAI实现所有操作流程 的控制,对操作的执行过程 保留完整的执行现场数据; 实现项目流程的管理,保 证投入运行系统的质量;在OVSD实现ITSM的工作 流程控制(人员角色间配合 )过渡到完善的IT

13、服务管理架构是一个渐变的过程,借鉴 理论,结合实际,在IT系统日常运营管理工作中,首先 努力做好以下三个方面的工作,为后续ITSM建设打下坚 实的基础IT服务管理建设的收获主动系统管理p涵盖范围n应用系统日常变更、配置、事故处理策略与流程;n应用系统各类检查与应急处理流程;n应用系统的持续优化;n应用系统规范的细化以及与开发环节的衔接;n针对系统运行的各类统计分析报表;p参与人员角色划分n运行主管、监控管理员、系统管理员、变更管理员、项目开发人员p关键问题n能够控制各类CI之间的关联关系;n能否有效的实施各类流程及管理制度;p主要职责n保证日常变更的完整与准确(与监控,处理流程的关系)n依据运

14、行中的各类事件和要求,调整应用系统规范,做到预先控制n控制对关键配置信息的更改与维护IT服务管理建设的收获主动系统管理数据库主机、服务器存储文档组织人员厂商服务网络应用操作流程CMDB 纳入范围、专人管理帐户IT服务管理建设的收获主动系统管理通过分析抓住重点,消除故障 根源IT服务管理建设的收获全面的监控体系p涵盖范围n生产系统的IT标准组件监控(OS/DB/MW/硬件/网络);n关键应用进程及其日志,应用与外部的关联,应用特定配置、特殊设备 ;n应用批作业的特定监控(批处理状态检查等);p参与人员角色划分n监控人员、运行主管、监控管理员、系统管理员、变更管理员、应用开 发人员p监控的不同部分

15、n监控广泛概念的IT标准工业组件(IT基础环境监控);n可灵活自定义系统主动检查流程(特定应用监控);n深入分析与优化能力(性能分析);p主要职责n通过监控体系主动发现事故,通过分析报告发掘隐患;n通过自检、调整、判断、分析四个流程保证监控系统的不断自我完善 ;n通过监控系统的积累,逐步建立知识库 ;IT服务管理建设的收获全面的监控体系全面监控体系的概况应用前端应用服务进程、专用设备存储操作系统中间件数据库主机网络应用 外部 连接专业诊断工具及性能管理OVO IT组件标准监控主动检查流程应用 维护 流程 (批作 业等)此部分主要监 控构成应用系 统的标准IT组 件,针对标准 的协议、资源 、服

16、务、日志 等进行监控, 考虑各应用系 统的不同特点 ,定义不同的 监控模板,被 动大范围的监 控各类事件发 生,同时搜集 系统运行性能 数据,这类故 障约占系统故 障的3040 此部分主要 是针对应用 系统的特定 配置、维护 操作、应用 的关联、专 用设备等进 行监控,是 一个灵活修 改、主动检 查的体系, 主动发现应 用系统故障 的6070IT服务管理建设的收获人员的流程化事件发生:多渠 道一线登记:分类 ,发起呼叫,跟 踪二线解决:系统 管理员总负责, 首先定位问题, 其次解决三线支持:项目 组,系统工程师 ,厂商监控/问题:确认监 控漏洞、修订标准IT服务管理建设存在的问题人员转化p人员分工的细化与流程整体的协调;pITSM人员角色与目前IT部门人员所属部门的协调 ;p人员角色的责权利与企业人力资源部门的协调;p各层次人员的持续培训问题;p发挥各层面人员主动性的问题;IT服务管理建设存在的问题流程制度p流程修改的成本控制;p流程与管理制度的

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号