自动化运维项目总结报告

上传人:工**** 文档编号:476416064 上传时间:2023-07-14 格式:DOC 页数:68 大小:100KB
返回 下载 相关 举报
自动化运维项目总结报告_第1页
第1页 / 共68页
自动化运维项目总结报告_第2页
第2页 / 共68页
自动化运维项目总结报告_第3页
第3页 / 共68页
自动化运维项目总结报告_第4页
第4页 / 共68页
自动化运维项目总结报告_第5页
第5页 / 共68页
点击查看更多>>
资源描述

《自动化运维项目总结报告》由会员分享,可在线阅读,更多相关《自动化运维项目总结报告(68页珍藏版)》请在金锄头文库上搜索。

1、自动化运维项目总结报告简介第一篇:自动化运维项目总结报告自动化运维系统研发项目 总结报告 一、 项目背景 随着信息时代的持续发展,IT运维已经成为IT服务内涵中重要的组成部分。面对越来越多复杂的业务、多样化的用户需求,不断扩展的IT应用需要越来越合理的模式来保障IT服务能灵活便捷、安全稳定地持续保障,从初期的几台服务器发展到庞大的数据中心,单靠人工已无法满足在技术、业务、管理等方面的需求,那么标准化、自动化、架构优化、过程优化等降低IT服务成本的因素越来越被广大行业客户重视。 二、 自动化运维研发阶段性 经过对市场背景的分析,在公司高层资源的支持下,2016年7月完成项目立项及成立研发项目团队

2、,12月已完成初步框架认定工作,在对市场需求、业务环境调研过程中,认为自动化运维需满足架构独立、部署友好、可运维性、容错容灾、质量监控、性能成本、用户体验等特点。项目组经过半年的研发努力,项目研发有了阶段性的突破成果。 2.1 架构独立 任何架构的产生都是为了满足特定的业务诉求,如果我们在满足业务需求的同时,能够兼顾运维对架构管理的非功能性要求。那么我们有理由认为这样的架构是对运维友好的。站在运维的角度,所诉求的架构独立包含四个方面:独立部署、独立测试、组件规范、技术解耦等。 2.2 部署友好 希望从端到端打通开发、测试、运维的所有技术环节,以实现快速部署和交付价值的目标。实现高效可靠的部署能

3、力,要做好全局规划,要保证部署以及运营阶段的全方位运维掌控,从以上要求分析,有五个维度是对部署友好相关的:CMDB配置、环境配置、依赖管理、部署方式、发布自测等。 2.3 可运维性 运维从脑海中是最理想的服务架构,首先想到的事可运维性强的那种类型。不具可运维的应用或架构,对运维团队带来的不仅仅是难题,还有阻止运维人员职业发展前进堵绊脚石,因为维护一个没有可运维性的架构,简直就是在浪费运维人员的时间。因为可运维性按操作和管理规范应归纳为以下几点:配置管理、版本管理、标准操作、进程管理、空间管理、日志管理、集中管控等。 2.4 容错容灾 运维的四大职责:质量、效率、成本、安全。安全是一个运维团队首

4、要保障的,运维人员立项的高可用架构设计应该包含以下几点:负载均衡、可调度性、本地双活、主从切换、柔性扩展等。 2.5 质量监控 保证和提高业务质量是自动化运维研发的目标,而监控能力是我们实现目标的重要技术手段。为质量监控提供便利和数据支持,需实现以下几点:指标度量、基础监控、组件监控、业务监控、链路监控、质量评估、数据库监控等; 2.6 性能成本 成本问题,也就是技术ROI(投入产出比)的问题。当系统规模和体量变大之后,掌控在运维手中的各类资源,将占整个研发团队支出的大头。如果没有很好的成本控制意识和策略,资源体量将会持续增大,甚至是翻倍或指数级的增长,对于公司成本会是非常大的负担和压力。 运

5、维工作者需要考虑到服务器CPU资源利用率的提升(引申出来各种虚拟化、容器或云资源的使用)、IDC&CDN流量带宽使用的管控,还有人力的投入和成本的管控。如何使得系统能够更高效地被充分利用起来,如何能够最大限度的减少成本支出,是我们必须要去考虑的问题。 2.7 用户体验 这里提到的体验,指的是终端用户的访问体验。对于非功能或非产品的使用体验,运维最需要关注的是访问速度。开发团队可能更多的注意力会放在自己负责的代码以及该部分的性能问题,不会关注到端到端全流程的性能和体验。而运维可以站在全局的角度来审视和治理整个端到端的全链路性能情况,并给出对应的性能优化建议 三、 项目总结 3.1 项目研发经费

6、3.2 研发工作总结 在研发运维自动化项目,遇到了很多问题和经验,要实现运维价值最大化,就要确保业务质量、效率、成本的全面提高,业务架构是不得不面临的问题,能站在不同角度对业务架构提出建议和需求,才能持续优化出最好的架构,在研发过程中一定要着重注意以下两点: 1) 一定要标准先行,做到技术的标准化。这包括资源标准化、OS的 基础配置标准化、基础软件(如Tomcat、JVM)配置标准化、应用配置标准化、流程规范标准化等等。做到了标准化,消除了各种差异,才能为后续的自动化开发铺平道路。 2) 在技术建设上,我想按照顺序来一个渐进的过程应该是:CMDB、 应用配置管理和持续集成&发布。CMDB:这运

7、维自动化的基石,重要性不言而喻。有特别要说明的一点,否则外界容易对CMDB产生错误的认识:CMDB不仅仅是硬件和资源的信息记录,更重要是要建立起应用与资源之间对应关系。建立了这个关联关系,以此为基础,配套着应用配置管理、监控、发布、稳定性等系统的建设,才能最终形成体系化的运维平台,这样的平台才有力量和生命力,否则只是碎片化的运维模式 3.3 取得的成效 通过部署和实施自动化平台,实现对资产信息和配置发现、操作系统安装、补丁管理、应用程序分发、日常巡检、脚本执行等各种报表运维自动化,在这基础之上,可以帮助运维人员更深入的了解配置信息,真正实时的服,快速部署及配置操作系统集和软件应用。 提高运维效

8、率 通过实现日常运维任务的自动化,缩短操作时间,减少操作失误,使得运维人员从简单的任务中解放出来,进行规则制定、任务设计、系统优化等有价值的工作 有效支撑业务 通过自动化平台可进行并发,批量的安装与变更操作,变更后验证等,可有效保证变更质量,缩短业务上线时间 保证系统合规 通过自动化平台进行短周期,高频率的自动巡检,出具巡检报告,自动修补违规项,使得我部已有的安全,配置规范能够有效实施,切实保障安全生产。 减少管理风险 根据最佳实践流程执行所有更改,以确保和内部政策和外部法规的合法性。高效的变更管理可提供所有变更的详细核查痕迹,指明每个变更的授权人、授权时间、执行人和执行时间。大大减少花在实现

9、和证明监管合规性上的时间和人力消耗。 四、 IT自动化运维的展望 (1) 建立自动化运维管理平台 IT运维自动化首先要建立IT运维的自动化监控和管理平台。通过监控工具实现对用户操作规范的约束和对IT资源进行实时监控,通过自动监控管理平台实现故障或问题综合处理、集中管理及自动运行维护,以完成对系统补丁的同步分发域升级、数据备份、病毒查杀等工作 (2) 建立故障事件自动触发流程,提高故障处理效率 IT设备在遇到问题时要回自动报警,无论是系统自动报警还是使用人员报的故障,应以红色标识显示在运维大屏幕上。然后IT运维人员只需按照流程,一步一步操作就可以完成告警的处理。 (3) 建立规范的事件跟踪流程,

10、强化运维执行力度 建立每种时间的规划化处理和跟踪指南,可以减少IT运维操作的随意性和强化运维的执行力度,在很大程度上可降低故障发生的概率。同时,用户还应可以通过自主服务台、电话服务台灯随时追踪该故障请求的处理状态。 (4) 建立统一运维自动化 随着企业服务器、网络设备、存储数量越来越多,导致管理复杂,大批量的部署和变更使部署更为简单、减少错误,提高生产力,降低风险与成本。因此,集成统一的自动化工具,可以使IT异常复杂的环境将统一应用的不同IT要求以统一的视图展现,控制统一的变更发布。 第二篇:IT运维自动化概述IT运维自动化 概述 目录 1 什么是IT运维自动化2 传统运维管理方式存在的问题3

11、 IT运维自动化迫在眉睫 4 IT运维自动化管理的具体内容 5 IT运维自动化的工具 6 建立高效IT运维自动化管理的步骤 1.什么是IT运维自动化? 随着信息时代的持续发展,IT运维已经成为IT服务内涵中重要的组成部分。面对越来越复杂的业务,面对越来越多样化的用户需求,不断扩展的IT应用需要越来越合理的模式来保障IT服务能灵活便捷、安全稳定地持续保障,这种模式中的保障因素就是IT运维(其他因素是更加优越的IT架构等)。 从初期的几台服务器发展到庞大的数据中心,单靠人工已经无法满足在技术、业务、管理等方面的要求,那么标准化、自动化、架构优化、过程优化等降低IT服务成本的因素越来越被人们所重视。

12、其中,自动化最开始作为代替人工操作为出发点的诉求被广泛研究和应用。 IT运维从诞生发展至今,自动化作为其重要属性之一已经不仅仅只是代替人工操作,更重要的是深层探知和全局分析,关注的是在当前条件下如何实现性能与服务最优化,同时保障投资收益最大化。自动化对IT运维的影响,已经不仅仅是人与设备之间的关系,已经发展到了面向客户服务驱动IT运维决策的层面,IT运维团队的构成,也从各级技术人员占大多数发展到业务人员甚至用户占大多数的局面。 因此,IT运维自动化是一组将静态的设备结构转化为根据IT服务需求动态弹性响应的策略,目的就是实现IT运维的质量,降低成本。可以说自动化一定是IT运维最高层面的重要属性之

13、一,并且需要与之配套的一系列软硬件平台环境及体系。 2.传统运维管理方式存在的问题 目前许多企业的IT运维已经实现从人工运维到计算机管理,但延展咨询在同客户的交流中发现其中很多企业的IT运维管理还只是处在“半自动化”的运维状态。因为这种IT运维仍然是等到IT故障出现后再由运维人员采取相应的补救措施。这些传统式被动、孤立、半自动式的IT运维管理模式经常让IT部门疲惫不堪,主要表现在以下三个方面: (1)运维人员被动、效率低 在IT运维过程中,只有当事件已经发生并已造成业务影响时才能发现和着手处理,这种被动“救火”不但使IT运维人员终日忙碌,也使IT运维本身质量很难提高,导致IT部门和业务部门对I

14、T运维的服务满意度都不高。目前绝大多数的企业IT运维人员日常大部分时间和精力是处理一些简单重复的问题,而且由于故障预警机制不完善,往往是故障发生后或报警后才会进行处理,,使到IT运维人员的工作经常是处于被动“救火”的状态,不但事倍功半而且常常会出现恶性连锁反应。 (2)缺乏一套高效的IT运维机制 目前许多企业在IT运维管理过程中缺少自动化的运维管理模式,也没有明确的角色定义和责任划分,使到问题出现后很难快速、准确地找到根本原因,无法及时地找到相应的人员进行修复和处理,或者是在问题找到后缺乏流程化的故障处理机制,而在处理问题时不但欠缺规范化的解决方案,也缺乏全面的跟踪记录。 (3)缺乏高效的IT

15、运维技术工具 随着信息化建设的深入,企业IT系统日趋复杂,林林总总的网络设备、服务器、中间件、业务系统等让IT运维人员难以从容应对,即使加班加点地维护、部署、管理也经常会因设备出现故障而导致业务的中断,严重影响企业的正常运转。出现这些问题部分原因是企业缺乏事件监控和诊断工具等IT运维技术工具,因为在没有高效的技术工具的支持下故障事件很难得到主动、快速处理。 3.IT运维自动化迫在眉睫 尽管IT运维管理的技术在不断进步,但实际上很多IT运维人员并没有真正解脱出来,原因在于目前的技术虽然能够获取IT设备、服务器、网络流量,甚至数据库的警告信息,但成千上万条警告信息堆积在一起更本没法判断问题的根源在

16、哪里。另外,目前许多企业的更新管理绝大多数工作都是手工操作的。即使一个简单的系统变更或更新往往都需要运维人员逐一登录每台设备进行手工变更,当设备数量达至成百上千时,其工作量之大可想而知。而这样的变更和检查操作在IT运维中往往每天都在进行,占用了大量的运维资源。因此,实现运维管理工作的自动化对企业来说已迫在眉睫。 现在随着IT运维管理工作的复杂度和难度的大大增加,仅靠过去几个“运维英雄”或“技术大拿”来包打天下已经行不通了,企业开始需要运用专业化、标准化和流程化的手段来实现运维工作的自动化管理。因为通过自动化监控系统能及时发现故障隐患,主动的告诉用户需要关注的资源,以达到防患于未然。 例如,全天候自动检测与及时报警能实现IT运维的“全天候无人值守”,大大降低IT运维人员的工作负担。而且,通过自动化诊断能最大限度地减少维修时间,提高服务质量。因此, 对于越来越复杂的IT运维来说,将纯粹的人工操作变为一定程度的自动化管理是一个重要发展趋势 首先,IT运维流程自动化能够提高流程的可控性,可以基于业务需求来制定个性化的流程,使企业领导

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号