智能it运维管理经验分享

上传人:101****457 文档编号:89387785 上传时间:2019-05-24 格式:PPT 页数:32 大小:19.50MB
返回 下载 相关 举报
智能it运维管理经验分享_第1页
第1页 / 共32页
智能it运维管理经验分享_第2页
第2页 / 共32页
智能it运维管理经验分享_第3页
第3页 / 共32页
智能it运维管理经验分享_第4页
第4页 / 共32页
智能it运维管理经验分享_第5页
第5页 / 共32页
点击查看更多>>
资源描述

《智能it运维管理经验分享》由会员分享,可在线阅读,更多相关《智能it运维管理经验分享(32页珍藏版)》请在金锄头文库上搜索。

1、智能IT运维管理 经验及分享,IT运维咨询顾问 胡雨晴,Page2,运维现状与困难,信息化迅猛发展的同时,给IT部门带来了更大的压力,IT部门面临的“技术”难题,信息化迅猛发展的同时,给IT部门带来了更大的压力,IT部门面临的“管理”难题,面对困难,如何找到解决办法?,1 业务运行环境越来越复杂,故障定位慢,2 运维工作繁重,缺少自动化工具和手段,4 信息化建设投入巨大,难以展现效果,3 运维工作没有流程化、规范化、电子化,资源统一监控,问题高效解决,运维水平提升,业务系统掌控,建设成果可视化,Page6,资源统一监控,IT基础管理网络管理,网络管理,主机系统管理,中间件管理,应用系统管理,数

2、据库管理,1.网络自动发现 360度雷达扫描视图 多协议多算法自动调整 自动发现详情 多协议并发发现,效率高 自动发现与建模 2.网络设备性能管理 全局性能监测 设备负荷TOPN排名 实时性能监控 3.网络拓扑管理 全局拓扑视图、拓扑分层视图 拓扑试图可自定义编辑 分布式拓扑模式 拓扑发现深入,2、3层拓扑 4.网络流量管理 全局流量监测 链路流量TOPN排名 重要链路流量信息 应用流量分析 5.网络故障管理,网络管理:通过多种协议的主动管理方式,实时监控网络设备性能参数,快速发现故障,及时发出告警,自动发现,设备性能管理,网络故障管理,网络拓扑管理,IT基础管应用管理,网络管理,服务器管理,

3、中间件管理,基础服务管理,数据库管理,机房监控管理,1. 业务视图(以业务角度管理IT) 2.非代理监控方式 3.实时性能分析 网络实时性能分析 主机性能实时分析 4.关键进程监控管理 5.应用指标TOP10总结,应用系统管理:对网络内的主机、操作系统、数据库、中间件等应用系统的故障检测和性能管理。,1.事件关联分析 2.根源性告警设置 3.智能化告警处理 告警通知 智能告警处理,避免告 警风暴 4.告警详细信息展示 5.经验知识库维护管理,告警事件管理:将IT环境中的事件统一搜集,经过智能分析与过滤,形成告警事件,并予以通知和展示。,应用监控管理,告警设置平台,统一告警平台,性能状态,IT基

4、础管理机房管理,网络管理,主机系统管理,中间件管理,应用系统管理,数据库管理,机房监控管理,机房监控管理:全面的机房动力环境元素的监控,形成多维汇总报表数据,通过Portal统一展现,,1.温湿度、UPS、市电等统一显示 2.告警数据集成显示 3.机房管理系统页面集成 4.统一事件管理 5.统一机房监控对比 6.实时机房性能数据展示,Page10,IT生存环境,无线管理,Page11,可视化无线热图,真实反映无线热点覆盖情况,直观体现无线设备下用户连接数量; 智能的无线障碍物信号衰减算法,真实体现无线信号覆盖情况,为规划无线解决解决方案提供依据; 无线AC、AP、Radio、在线用户、WLAN

5、服务的统一资源管理,可清晰地建立各资源的关联关系,降低管理员的管理难度; 向导式配置管理,使无线方案的落地变得轻松、简单; 多维度的无线资源统计报表,直观展示无线设备总体健康状况和利用情况。,Page12,业务系统掌控,Page13,掌控的基础,是很清晰的知道IT资源支撑了哪些业务,哪些服务,Page14,IT需要全局掌控,Page15,IT需要全局掌控哪个业务出现了问题,Page16,IT管理需要全局掌控具体发生了什么,Page17,IT管理需要全局掌控从整体到局部,从宏观到微观,Page18,问题高效解决,异常事件即时告警,定位故障,Page19,万一出了事要能快速定位,解决,看看设备之间

6、的关联关系,追查故障,排除影响,查看维护记录,寻求相关知识帮助,排除问题,恢复业务,IPAD移动终端,随身携带的IT管家,Page20,IPAD客户端-资源一览,IPAD客户端-资源详情,系统全面支持IOS平台移动终端iPad,通过移动终端随时随地了解IT资源运行情况; 终端支持事件、告警、资源一览,实现关键设备运行状态查询、告警处理等功能。,Page21,运维水平提升,主动巡防能力,及早发现隐患,Page22,手工化的设备健康检查耗时费力,依赖命令检查技术门槛高,缺乏有效监督和提醒,问题发现不及时,巡检记录难以统计、分析。,自定义设定自动巡检范围、指标、频度以及巡检报告表单; 自动、手动两种

7、方式对设备的运行状况进行巡检; 自动生成巡检报告; 支持巡检报告自动发送功能。,自动巡检设置,巡检报告,掌控所有配置项信息,实现资产全生命周期管理,Page23,这台设备是谁负责?什么时候采购的?什么时候过保?如果对这台设备进行变更,会对其他设备及业务造成什么影响?,向导方式完成配置导入、自动发现、权限配置、关联关系设定等系列CMDB的构建工作; 可自定义扩展配置项属性; 图形化设置并展示配置项间关系; 可定义配置项审计任务,并进行自动化审计操作,生成审计报告; 实现CMDB与资源管理的双向关联。,配置关系视图,配置项定义,技术储备,全面提升组织能力,Page24,人员的经验和技能该如何进行复

8、制?如何形成知识库,达成经验积累?同类事件再次发生时,如何找出历史的解决方法供参考?,实现知识在事件处理过程中积累,一步勾选添加知识库; 实现知识生命周期管理,包括新建、审批、发布等; 按照个人需要可自定义知识查询视图; 支持知识评级管理,价值排名,且与绩效挂钩。,知识一览及详情,添加知识,Page25,建设成果可视化,Page26,管理需要可视化,Page27,管理需要可视化,Page28,管理需要可视化,Page29,建设思路,集简约、高效、自动化IT运维体系建立的思路,第一步: 建立自动化监控和管理平台,并展现信息化建设成果,第二步: 建立故障与流程的自动触发,结合SLA提升人员服务效率

9、,第三步: 建立可量化的IT部门考核体系,呈现IT部门业绩和价值,IT部门工作的未来蓝图,异常,告警通知,自动生成事件单,事件管理 快速响应、解决突发故障及请求,在最短时间内恢复业务,IP呼叫中心 电话受理,自动识别来电用户身份,服务台座席 创建事件单,自助服务台 用户WEB登录,提报服务或故障请求,生成事件单,技术人员 受理并尝试解决,分派,查询知识,解决,通知用户 获得满意度反馈,升级,问题管理 根源分析,找出根本原因,避免故障再次发生,知识库,服务级别管理 跟踪事件处理时效,达成与客户的服务约定,申请 变更,变更管理 控制变更可能产生的风险,问题小组 分析并根源解决,解决方案入知识库,申

10、请变更,变更评审委员会 评估、制定变更计划,受理,指派,技术人员 变更实施及发布,CMDB,资产配置管理员 更新配置信息,通知,配置管理 资产配置全生命周期管理,更新,发现 同步,客户与IT主管,计划任务管理 周期性任务提醒、执行、监督,项目管理 开发及重大实施项目周期管理,长周期变更任务,KPI与报表管理 报表输出,关键绩效指标分析,达成服务 级别协议,IT主管 决策、优化改进,用户-客户端 服务或故障报告,用户-电话 服务或故障报告,大屏幕,项目经理,技术人员 执行计划任务,机房,IT基础架构监控系统,机房监控系统,THANKS,星网锐捷网络有限公司 地址:北京海淀区复兴路29号中意鹏奥大厦东塔A座11层 邮编:100036 Office Tel: 010-51715999 Fax: 010-51413399 ,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号