linux运维工程师工作总结

上传人:bin****86 文档编号:53718856 上传时间:2018-09-04 格式:DOCX 页数:47 大小:59.92KB
返回 下载 相关 举报
linux运维工程师工作总结_第1页
第1页 / 共47页
linux运维工程师工作总结_第2页
第2页 / 共47页
linux运维工程师工作总结_第3页
第3页 / 共47页
linux运维工程师工作总结_第4页
第4页 / 共47页
linux运维工程师工作总结_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《linux运维工程师工作总结》由会员分享,可在线阅读,更多相关《linux运维工程师工作总结(47页珍藏版)》请在金锄头文库上搜索。

1、linuxlinux 运维工程师工作总结运维工程师工作总结篇一:新浪资深运维工程师总结的 linux 运维笔记运维工程师的职责和前景一、什么是站运维?首先明确一下,全文所讲的”运维“是指:站运维,与其它运维的区别还是蛮大的;然后我们再对大型站与小型站进行范围定义,此定义主要从运维复杂性角度考虑,如站规范、知名度、服务器量级、pv 量等考虑,其它因素不是重点;因此,我们先定义服务器规模大于 1000 台,pv 每天至少上亿(至少国内排名前 10) ,如 sina、baidu、QQ,等等;其它小型站可能没有真正意义上的运维工程师,这与站规范不够和成本因素有关,更多的是集合络、系统、开发工作于一身的

2、“复合性人才” ,就如有些公司把一些合同采购都纳入了运维职责范围,还有如 IDC 络规划也纳入运维职责。所以,非常重要一定需要明白:运维对其它关联工种必须非常了解熟悉:络、系统、系统开发、存储,安全,DB 等;我在这里所讲的运维工程师就是指专职运维工程师。 我们再来说说一般产品的“出生”流程:1、首先公司管理层给出指导思想,PM 定位市场需求(或 copy 成熟应用)进行调研、分析、最终给出详细设计。2、架构师根据产品设计的需求,如 pv 大小预估、服务器规模、应用架构等因素完成络规划,架构设计等(基本上对络变动不大,除非大项目)3、开发工程师将设计 code 实现出来、测试工程师对应用进行测

3、试。4、好,到运维工程师出马了,首先明确一点不是说前三步就与运维工作无关了,恰恰相反,前三步与运维关系很大:应用的前期架构设计、软/硬件资源评估申请采购、应用设计性能隐患及评估、IDC、服务性能安全调优、服务器系统级优化(与特定应用有关)等都需运维全程参与,并主导整个应用上线项目;运维工程师负责产品服务器上架准备工作,服务器系统安装、络、IP、通用工具集安装。运维工程师还需要对上线的应用系统架构是否合理、是否具备可扩展性、及安全隐患等因素负责,并负责最后将产品(程序) 、络、系统三者进行拼接并最优化的组合在一起,最终完成产品上线提供用户使用,并周而复使:需求-开发(升级)-测试-上线(性能、安

4、全问题等之前预估外的问题随之慢慢就全出来了)在这里提一点:站开发模式与传统软件开发完全不一样,站一天开发上线 15 个升级版本是家常便饭,用户体验为王嘛,如果某个线上问题像 M$需要 1 年解决,用户早跑光了;应用上线后,运维工作才刚开始,具体工作可能包括:升级版本上线工作、服务监控、应用状态统计、日常服务状态巡检、突发故障 处理、服务日常变更调整、集群管理、服务性能评估优化、数据库管理优化、随着应用 PV 增减进行应用架构的伸缩、安全、运维开发工作:a 、尽量将日常机械性手工工作通过工具实现(如服务监控、应用状态统计、服务上线等等) ,提高效率。b、解决现实中服务存在的问题,如高可靠性、可扩

5、展性问题等。c、大规模集群管理工具的开发,如 1 万台机器如何在1 分钟内完成密码修改、或运行指定任务?XX 台服务器如何快速安装操作系统?各分布式 IDC、存储集群中数 PT 级的数据如何快速的存储、共享、分析?等一系列挑战都需运维工程师的努力。在此说明一下其它配合工种情况,在整个项目中,前端应用对于络/系统工程师来说是黑匣子,同时开发工程师职责只是负责完成应用的功能性开发,并对应用本身性能、安全性等应用本身负责,它不负责或关心络/系统架构方面事宜,当然软/硬件采购人员等事业部其它同事也不会关心这些问题,各司其职,但项目的核心是运维工程师!所有其它部门的桥梁。上面说了很多,我想大家应该对运维

6、有一些概念了,在此打个比方吧,如果我们是一辆高速行驶在高速公路上的汽车,那运维工程师就是司机兼维修工,这个司机不简单,有时需要在高速行驶过程中换轮胎、并根据道路情况换档位、当汽车速度越来越快,汽车本身不能满足高速度时对汽车性能调优或零件升级、高速行进中解决汽车故障及性能问题、时刻关注前方安全问题,并先知先觉的采取规避手段。这就是运维工作! 最后说一下运维工程师的职责:”确保线上稳定“,看似简单,但实属不容易,运维工程师必须在诸多不利因素中进行权衡:新产品模式对现有架构及技术的冲击、产品高频度的升级带来的线上 BUG 隐患、运维自动化管理承度不高导致的人为失误、IT 行业追求的高效率导致流程执行

7、上的缺失、用户增涨带来的性能及架构上的压力、IT 行业宽松的技术管理文化、创新风险、互联安全性问题等因素,都会是站稳定的大敌,运维工程师必须把控好这最后一关,需具体高度的责任感、原则性及协调能力,如果能做到各因素的最佳平衡,那就是一名优秀的运维工程师了。二、运维工作师需要什么样的技能及素质做为一名运维工程师需要什么样的技能及素质呢,首先说说技能吧,如大家上面所看到,运维是一个集多 IT 工种技能与一身的岗位,对系统-络-存储-协议-需求-开发-测试-安全等各环节都需要了解一些,但对于某些环节需熟悉甚至精通,如系统(基本操作系统的熟悉使用,*nix,windows)、协议、系统开发(日常很重要的

8、工作是自动运维化相关开发、大规模集群工具开发、管理) 、通用应用(如lvs、ha、web server、db、中间件、存储等) 、络,IDC 拓朴架构;技能方面总结以下几点:1、通用应用方面需要熟悉:操作系统(目前国内主要是 linux) 、数据库(mysql,oralce)。2、开发能力,这点非常重要,开发语言:perl、python、php(其中之一) 、shell(awk,sed,expect.等). 所以有开发底子对学运维是个优势。3、系统、络、安全,存储,CDN,DB 等需要相当了解,知道其相关原理。个人素质方面:1、沟通能力、团队协作:运维工作跨部门、跨工种工作很多,需善于沟通、并

9、且团队协作能力要强;这应该是现代企业的基本素质要求了,不多说。2、工作中需胆大心细:胆大才能创新、不走寻常路,特别对于运维这种新的工种,更需创新才能促进发展;心细,运维工程师是站 admin,最高线上权限者,一不小心就会遗憾终生或打入十八层地狱。3、主动性、执行力、精力旺盛、抗压能力强:由于 IT行业的特性,变化快;往往计划赶不上变化,运维工作就更突出了,比如国内各大公司服务器进行搬迁的时候,时间紧迫,如限 1 周内完成,这种情况下,运维工程师的主动性及执行力就有很高的要求了:计划、方案、服务无缝迁移、机器搬迁上架、环境准备、安全评估、性能评估、基建、各关联部门扯皮,7X24 小紧急事故响应等

10、。4、其它就是一些基本素质了:头脑要灵光、逻辑思维能力强、为人谦虚稳重、亲和力、乐于助人、有大局观。5、最后一点,做站运维需要有探索创新精神,通过创新型思维解决现实中的问题,因为这是一个处于发展中的职业(国外起步比国内早) 。三、怎样才算是一个合格的运维工程师1、保证服务达到要求的线上标准,如%;保证线上稳定,这是运维工程师的基本责职所在。2、不断的提升应用的可靠性与健壮性、性能优化、安全提升;这方面非常考验主动性和创新思维。3、站各层面监控、统计的覆盖度,软件、硬件、运行状态,能监控的都需要监控统计,避免监控死角、并能实时了解应用的运转情况。4、通过创新思维解决运维效率问题;目前各公司大部份

11、运维主要工作还是依赖人工操作干预,需要尽可能的解放双手。5、运维知识的积累与沉淀、文档的完备性,运维是一个经验性非常强的岗位,好的经验与陷阱都需积累下来,避免重复性范错。6、计划性和执行力;工作有计划,计划后想法设法达到目标,不找借口。7、自动化运维;能对日常机械化工作进行提炼、设计并开发成工具、系统,能让系统自动完成的尽量依靠系统;让大家更多的时间用于思考、创新思维、做自已喜欢的事情。 以上只是技术上的一些层面,当然个人意识也是很重要的。四、运维现状和发展前景运维现状:优秀运维人才的极度缺乏:目前各大公司基本上都靠自已培养,这个现状导致行业内运维人才的流动性非常低,非常多好的技术都局限在各大

12、公司内部,如 google 50 万台机器科学篇二:运维工程师年终工作总结篇一:系统运维工程师年终个人工作总结及下年工作计划*公司系统运维工程师年终个人工作总结及下年工作计划时间一晃而过,弹指之间,XX 年悄然而至,自从 XX年 3 月份刚进入公司,我是第一次接触公司、接触通信行业、接触公司络管理及维护。虽然跟我的专业和技能都一致,但所有的实际经验都是第一次,让我没有任何准备,同样也打消了任何顾虑,人生就是这样,所有的一切都是要从第一次开始,没有接触过、干过并不可怕,领导给了我机会,让我有了一次尝试、一次展现自己的平台,那么我一定会更加倍的努力做好工作才是最大的回报。并且也是对自己的一次肯定。

13、经过一段时间的工作及陌生环境的磨合,专心钻研业务知识,努力提高理论知识和业务工作水平。遵纪守法,踏实工作认真完成领导交办的各项工作任务,使自己渐渐的融入和适应到新的工作环境中。过去的大半年里在领导和同事们的悉心关怀和支持帮助下,通过自身的不懈努力,在思想、学习和工作等方面取得了新的进步。现总结如下:一、公司电脑日常维护工作1、先对公司员工进行一次基本知识培训,让员工了解到计算机的正确使用方法,病毒防范,重要文件的备份等。从而大大提高了员工对电脑使用的熟练程度。2、先恢复良好的秩序。电脑使用时如发现故障和需更改设置,必须先报告公司运维人员,由专门人员来进行专业及针对化的操作,个人不能私自进行改动

14、,进行这样做的目的避免由于人为的盲目操作使某一台电脑的故障影响整个局域内的其它工作,使故障扩大化,并延长了解决问题的周期。3、使员工使用统一的、经过安全测试的系统及应用软件,安装、设置统一的杀毒软件、防火墙等安全防护软件,且经过努力实践,并在每台机器上设定了自动系统补丁升级及定期查杀规则。4、对于个人的关键性数据资料、邮件进行路径转移备份,使这些数据远离危险故障点,避免意外丢失所带来的严重后果。操作系统进行常规定期备份,便于事后的还原。5、对于络管理进行了监管工作,公司所有电脑安装了行为管理软件后,员工工作效率逐步提高,自觉性得到明显改进,从而净化了公司络办公环境。经过一段时间的贯彻和工作,先

15、前的混乱现象得到有效控制,现公司的十余台电脑,工作状态稳定,没有出现大面积的系统崩溃和故障。二、络的日常维护路由器及交换机的维护管理,确保公司络运行正常,员工正常利用络资源。加强路由器的规则设置,优化外接口,内部员工合理地分配带宽流量,使公司的络能稳定有效地工作。三、公司络制度管理和完善公司经过一段时间的运转,各个部门的规章制度通过大家一起研究、探讨、立会并完善制定了各项规章制度,计算机管理也形成了制度,大家按章办事,使之成为一种工作习惯。同时公司的资产管理及日常的文书表格非常混乱和环节上的缺失。为此特地制作了一批表格、登记申请单及统计表。使得公司资产和资源得到有效的管理和控制,杜绝管理上的失

16、控和资产流失。四、公司服务器平台管理与维护工作公司发展逐步扩大,对于公司所有的业务支撑平台-服务器,为重中之重;本年度我司服务器相应出现几次重大故障,分别如下:1、络故障七次,重大一次,因服务器遭 ddos 攻击,导致我司服务器无法正常工作。事后通过紧急处理后得以恢复正常。其它几次分别为机房断电、络升级、电信与联通 dns 解析故障影响到我司服务器平台络连接不正常。2、系统故障三次,其中一次为短信平台服务器系统文件损坏,导致系统崩溃。经过技术部采用紧急预案措施在两小时内得以恢复系统。3、其它故障共计 5 次,因联通关溢出,无法与我司ivr 服务器数据库关同步,导致用户无法正常订购与使用我司亲情相伴业务。经过出现几次重大故障后,技术部多次研究与讨论,制定出一套完善的应急措施与日常维护计划。尽量归避风险及减少事故发生,同时确保做到问题提前预防、及时发现、迅速解决并恢复正常运营。4、针对服务器出现在问题所在,在技术部其它同事的配合下完成服务器的重新部署,访问权限及安全性的提高,数据库优化等相关措失后,目前服务器已运行正常。5、公司针对员工的工作岗位与职位重新部署了

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号