服务器运维管理手册

上传人:jiups****uk12 文档编号:44426092 上传时间:2018-06-09 格式:DOC 页数:7 大小:415.50KB
返回 下载 相关 举报
服务器运维管理手册_第1页
第1页 / 共7页
服务器运维管理手册_第2页
第2页 / 共7页
服务器运维管理手册_第3页
第3页 / 共7页
服务器运维管理手册_第4页
第4页 / 共7页
服务器运维管理手册_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《服务器运维管理手册》由会员分享,可在线阅读,更多相关《服务器运维管理手册(7页珍藏版)》请在金锄头文库上搜索。

1、服务器运维管理手册1一、一、 文档简介文档简介本文档根据艾特项目服务器硬件设备与系统应用管理需求,针对日常维护内容进行技术归类于总结,描述具体操作步骤与操作方法,积累服务器事件处理能力,使之服务运维能力更为主动可控。二、二、 文档目的文档目的标准服务器故障处理方法指引,硬件及系统软故障分别处理方法。三、三、 具体操作说明具体操作说明1) 服务器硬件管理服务器硬件管理1 1检查与故障判断:检查与故障判断:服务器硬件的主动检查方式主要分三种:设备面板指示灯检查硬件系统日志检查第三方工具检查( (一一) )面板指示灯检查面板指示灯检查IBM 服务器上面有,电源指示灯,硬盘/IDE 设备活动指示灯,网

2、卡指示灯,系统过热报警灯.硬盘槽还有硬盘指示灯。图示说明图示说明详细描述:详细描述:服务器运维管理手册2服务器运维管理手册3( (二二) )第三方检测工具检查第三方检测工具检查IBM 诊断工具: IBM Systems Director 、 IBM Systems Director Active Energy Manager、IBM ServerGuide 2 2硬件设备变更操作标准:硬件设备变更操作标准:判断并确定最快恢复时间服务器运维管理手册4判断是否有做冗余设置判断是否需要关机操作磁盘设备检测并确定阵列信息,确定有做数据备份是否对其它关联应用有影响制定回退方案,保证数据与应用的可用性设备

3、变更操作设备兼容性测试应用系统运行测试设备变更后正式应用2) 服务器系统管理服务器系统管理Linux 系统管理1 Linux 系统管理系统管理1.1 平均负载(uptime) 1.2 磁盘空间使用率(df -h) 1.3 进程监控(ps ef | grep java) 查看应用程序启动进程数是否正常1.4 内存监控(free -m) 描述:服务器运维管理手册5total:总计物理内存的大小used:已使用多大 free:可用有多少 shared:多个进程共享的内存总额buffers/cached:磁盘缓存的大小。 第三行(-/+ buffers/cached): used:已使用多大。free

4、:可用有多少。1.5CPU 占用率(top) 描述: top 提供一个当前运行系统实时动态的视图,也就是正在运行进程。在默认情况下,CPU 使用率最高的任务排在第一行,并每 5 秒钟刷新一次。1.6 I/O 监控(vmstat 2 10)1.7 日志系统 系统日志(cat /var/log/messages | grep Jul 23 | grep error) 记录报警信息服务器运维管理手册6硬件启动日志(dmesg | grep error) 记录系统启动错误信息应用系统日志 服务器各个应用的日志系统,比如: /var/log/httpd/error_log 等等2 监控报警机制监控报警机

5、制根据监控软件设置相关资源监控的伐值以及对相应服务端口的在线监控,出现端口宕 机或者资源使用偏高及异常,采用邮件报警通知相关运维人员3 接到报警后处理接到报警后处理运维人员接到报警后依据相应的故障情况才去措施服务器运维管理手册73.1 资源占用偏高 遇到资源占用偏高的情况,运维人员登录服务器查看是什么情况导致哪些资源占 用偏高,先采取不影响业务的调整手段,如果必须得停止服务做相应操作就及时通知 项目经理与客户沟通是否可以停止服务做故障维护操作3.2 服务故障遇到相关业务服务故障后查看应用程序后台日志,从日志中找问题,可以通知项目 经理安排相关开发人员协作处理4 故障整理故障整理在解决完故障之后进行相关文档整理,描述故障起因及处理方法,以及给出预防此类 故障的具体方法措施

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号