测试信息系统自动化运维探讨

上传人:工**** 文档编号:487103806 上传时间:2024-01-20 格式:DOC 页数:4 大小:17KB
返回 下载 相关 举报
测试信息系统自动化运维探讨_第1页
第1页 / 共4页
测试信息系统自动化运维探讨_第2页
第2页 / 共4页
测试信息系统自动化运维探讨_第3页
第3页 / 共4页
测试信息系统自动化运维探讨_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《测试信息系统自动化运维探讨》由会员分享,可在线阅读,更多相关《测试信息系统自动化运维探讨(4页珍藏版)》请在金锄头文库上搜索。

1、测试信息系统自动化运维探讨 摘要:随着信息化建设的不断深入,日常的工作对信息系统的依赖程度也越来越高,信息系统的任何波动都会对业务造成影响。为保证信息系统的平安与稳定,需要进行运维管理。测试运维工作包括操作系统、网络管理、各专业应用系统及数据库的运行及维护全过程,涉及大量设备和平台。文中阐述了自动化运维根本原理,更深层的进行实际工作的全局分析,将自动化运维技术应用到测试生产实际,关注当前条件下如何实现性能与效劳最优化。关键词:运维;自动化;效率0引言测试分公司的经过多年的信息系统建设,现有计算机设备1443台、24h在线运行设备12台,部署在不同的基层单位。在网络传输上现使用光纤长度150km

2、,21个C类IP地址,可管理交换机等网络设备128台套。在数据库配置上配备中心数据库一套,部署在11个生产单位的测试专业数据库33套。累计保存近50余万井层次测试数据300GB,年增长4万井层次15GB。信息系统已经成为日常工作必不可少的工具。面对根底设施资源多,网络覆盖范围大、网段分散,数据库中数据量大等问题,日常运维管理也越来越复杂。目前测试分公司的运维已经实现从人工运维到计算机管理,但运维管理还只是处在半自动化;的状态。运维方式仍然是等到故障出现后再由运维人员采取相应的补救措施。这些传统的被动、孤立、半自动式的运维管理模式经常让运维人员疲惫不堪,让运维工作陷入被动,没有流程设置,周而复始

3、就形成了连锁的恶性循环反响。即使加班加点地维护、部署、管理也经常会出现故障而导致业务的中断,影响生产。随着计算机软硬件技术的不断开展,自动化运维技术给我们提供了极佳的解决方案。1自动化运维的意义自动化运维就是把周期性、重复性、规律性的工作都交给工具去做,由过去的手工执行转为自动化操作,从而减少乃至消除运维中的延迟、实现零延时;的运维,最终到达提升运维效率的目的。自动化运维是一种基于流程化的框架,将运维与操作流程相关联,旦被监控系统发现性能超标,会触发相关事件以及事先定义好的流程,可自动启动故障响应和恢复机制。面对越来越复杂的业务,越来越多样化的用户需求,不断扩展的应用需要合理的运维来保障效劳。

4、如果测试分公司的整个,运维管理做得不好,那么建立起来的信息系统功能再好再强也没有用,因为业务部门根本无法顺利使用。自动化运维首先带来的是运维效率的提高:可帮助运维人员完成日常的重复性工作如备份。其次是保障平安:在运维管理过程中,一旦发现平安隐患,运维管理系统会及时预警,同时提前修复,防止系统危机。最后是维持稳定:通过监控最大程度地保障系统的稳定和运行质量。即使出现问题,也能够快速发现、快速响应、快速恢复,合理的运维方式能够有效保护数据。如图1所示,运维自动化的实现可以减轻对人工操作的依赖,实现运维思路的变更。监控自动化是运维自动化的起点之一。对效劳运行的状态进行实时的监控,随时发现效劳的运行异

5、常和资源消耗情况;输出重要的日常效劳运行报表以评估业务整体运行状况,发现隐患。运维人员把握监控的覆盖程度。虽然针对生产系统的各层次都部署了监控工具,需要有管理员去配置。靠管理员主观能动性去让监控实现对某个生产系统所有运行状态进行实时监控还比拟困难,所以需要让运维人员明确知道监控覆盖面的及格线。例如:磁盘占用空间大于设定数值时,监控功能自动预警通过微信等功能告知相应的处理人员。模板化部署系统环境。建立每种事件的标准化处理和跟踪指南,可以减少运维操作的随意性和强化运维的执行力度,在很大程度上可降低故障发生的概率。运维手册是运维标准化最根本的工作项之一,但由于运维涉及的问题很多,运维文档也演变成一个

6、越来越复杂的文档,当文档复杂到一定程度时就会变成一个负担,很难保文档的及时更新。在这里以运维手册简单化为原那么。监控自动化发现了问题就应该接入相应的流程进行处理,这时候故障事件自动触发问题处理跟踪流程,并利用运维文档完成整体故障处理。通过监控工具实现对用户操作标准的约束和对资源进行实时监控。在自定义周期内进行自动触发完成对运维的例行巡检,形成检查报告。运维自动化管理建设不是一次性建好,要以实用为主分阶段的解决自身实际问题,最终建立完善的运维的自动化监控和管理平台。2应用情况建立试井运维手册,形成文档管理。按照文档要求记录下问题原因以及解决的步骤,并定期回忆文档从中整理出的共性问题。例如:屡次发

7、生在软件可以正常解释井的情况下,但点击入库按钮无响应。初期选择重新安装软件,恢复使用。后期通过筛查运维手册,研究问题机器的共性。定位到具体的丧失文件,查到丧失原因、发现问题根源。防止了同类问题的发生,提高了软件使用者的满意度。标准化处理可以减少运维操作的随意性和强化运维的执行力度,可降低故障发生的概率减少运维工作量。测试分公司平均每年入库近四万井层次的测试数据,已经积累了五十多万井层次,300多GB的数据量。这些数据是油田重要的数据资产,需要进行平安管理,保证数据资产平安最重要的手段就是备份。面对日益增长的测试数据资料,由于属地原因分布在所属采油厂的各个基层测试大队30个节点上,人工重复登录各

8、个节点,进行账户认证,检查存储空间,执行数据库的导出命令,对导出文件进行压缩,进行标准命名,通过网络拷贝到备份效劳器,删除本地冗余备份,检查备份效劳器存储空间,删除备份效劳器冗余备份,整个备份过程繁琐冗杂,容易产生误操作,效率低下。编制批处理文件,根据各个节点上数据量大小,规划备份执行具体时间,通过操作系统方案任务定时完成备份工作,整个备份过程在网络上部署,在分布式各个节点上,分布各个时间节点周期自动定时运行。没有人为因素,测试专业数据库自动完成备份工作,保证数据平安。大庆油田现今有21个油气开发、研究单位、工程效劳单位通过成果发布平台应用测试资料。生产测试解释信息入库成为了生产的重要环节。生

9、产数据入库的准确性、及时性就越来越重要。编写软件进行数据库数据信息的比照。保障测试生产数据入库的准确性、及时性。在测试井成果数据传输中,设立重点监控,进行测试数据质量检查。及时发现解释外报却未入库的井次,标准数据入库情况,进行数据检查核对,并公示考核,分析总结影响数据入库的因素,提高数据库入库质量。设定监控点,监控外报数据与成果发布数据库中的数据差异。节约时间本钱,可以很快的发现差异井次、及时改正,大幅提高了工作效率。并且,提高精准度可以明确展示数据间具体差异。3结语随着测试分公司信息化建设的持续深入,根底设备的不断增加以及各个专业平台的推广使用,测试信息运维工作量势必越来越大,运维管理的自动化已经是大势所趋。真正实现测试信息工作完全自动化运维是一项复杂的系统工程,首先要将工作中最耗时间的事情自动化,如此迭代往复最终建立一个信息化自动化运维平台,简化工作流程、提高工作效率、提升效劳质量。可以将运维人员从繁琐的、例行、容易发生人为事故的工作中脱离出来,做更有价值的运维工作。参考文献:【1】JanvanBon,章斌译基于ITIL的全球最正确实践.清华大学出版社,2021,1:814【2】王敏浅谈运维自动化运维派,2021,5.

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号