IBMP系列小型机日常维护手册与指南

上传人:好** 文档编号:119648628 上传时间:2020-01-21 格式:DOC 页数:22 大小:3.07MB
返回 下载 相关 举报
IBMP系列小型机日常维护手册与指南_第1页
第1页 / 共22页
IBMP系列小型机日常维护手册与指南_第2页
第2页 / 共22页
IBMP系列小型机日常维护手册与指南_第3页
第3页 / 共22页
IBMP系列小型机日常维护手册与指南_第4页
第4页 / 共22页
IBMP系列小型机日常维护手册与指南_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《IBMP系列小型机日常维护手册与指南》由会员分享,可在线阅读,更多相关《IBMP系列小型机日常维护手册与指南(22页珍藏版)》请在金锄头文库上搜索。

1、IBM P 系列小型机 日常维护 故障定位 故障排除 培训手册 操作指南 1 22 目目录录 目目录录 1 1 第一章 机房环境及物理检查第一章 机房环境及物理检查 1 1 一 机房内环境要求 1 二 电源要求 2 三 硬件检查 2 第二章 系统日常维护流程第二章 系统日常维护流程 4 4 2 1 系统启动 4 2 2 系统关闭 4 2 3 查看系统的错误记录 4 2 4 系统与数据备份 5 2 5 系统恢复 8 2 6 DUMP 8 2 7 日常检查服务器状态的项目及其相关命令 8 2 8 性能监控与调优 10 2 9 安全工作守则 11 2 10 维护电话 11 第三章 故障定位 故障排除

2、第三章 故障定位 故障排除 1111 3 1 硬件故障 11 3 2 磁阵故障 12 3 3 网络故障 17 3 4 OS 故障 18 3 2 HA 故障 18 3 2 其他故障 20 2 22 第一章 机房环境及物理检查第一章 机房环境及物理检查 一 机房内环境要求一 机房内环境要求 1 温度与湿度 最佳工作温度 20 25摄氏度 极限工作温度 10 40摄氏度 湿度 8 80 在23摄氏度条件下 如果不是工作在最佳温度 请注意改善机房环境 2 同时机房要保证清洁 机房应保持清洁 若空气灰尘过多 很容易造成资源读写错误及磁盘机中磁 盘或读写磁头毁损 二 电源要求二 电源要求 电 压 要求电压

3、稳定 尖峰电压会损坏设备 电压范围 220V 10 即200 240V 50 60Hz 电源功率 视机器类型和系统配置而定 电源线 标准的零 地 火三相电 其中零 地电压不得超过3 0V 电源接驳 用符合电流要求的空气开关或其他设备和主机电源线接驳 保证计算机系统 的可靠工作应使用稳压电源和UPS 并建议配备发电机组 对于冗于电源的接 入 建议采用两路单独输入 三 硬件检查三 硬件检查 检查服务器 磁阵的安装 电源线 7133和主机接线符合要求 服务器状态检查 服务器状态检查 1 当服务器处于启动和正常工作状态时 其前面板上的液晶显示屏上应无信息 显示 2 当液晶显示器上出现带数字和字母的信息

4、时 说明有硬件告警 可以通过查 询相关机型的 Service Guide 查到相应告警原因 情况严重的 则要立即通 知 IBM 技术专家进行问题排查 71337133状态检查 状态检查 磁阵前面板上有7133机柜的状态灯 与电源灯并排 和各硬盘的状态灯 一排小灯 与 各硬盘位置一一对应 1 当机柜的状态灯出现橙黄色时 说明有硬件告警 此时要检查磁柜的电源 接线 硬 3 22 盘等 如果有硬件故障则立即进行更换和更正 如果查不出具体问题 则需要联系相关 专家进一步诊断 2 当硬盘工作正常时 与各硬盘对应的硬盘灯会呈绿色 如无读写 则绿灯一直亮 如该硬盘有读写操作 则绿灯会不规则闪烁 当硬盘损坏时

5、或 SSA 环路出现问题时 则硬盘状态灯将熄灭 或者呈闪烁状态 以 1 3 秒的频率有规律地 不停地闪烁 4 22 第二章 第二章 系统日常维护流程系统日常维护流程 2 12 1 系统启动系统启动 系统启动正常顺序如下 首先对外设 磁盘阵列 磁带库等 加电 待所有外设加电自检完成后 主机加电正常起机 主机加电后 系统进行自检 在液晶显示屏 显示 ok 后 才能按白色POWER键起机 启动主机HACMP 启动后可用命令 tail f tmp hacmp out 来检查启动情况 在HACMP未完全 启动前不要进行下一步 检查服务器的网络地址 路由表 可用netstat i netstat rn 等

6、 检查文件系统 逻辑 卷 可用 mount lsvg o 等 检查各项应用是否工作正常 2 22 2 系统关闭系统关闭 停止HACMP smitty clstop 查看HACMP的状态 检查服务器的网络地址 路由表 可用netstat i netstat rn 等 检查文件系统 逻辑卷 可用 mount lsvg o 等 在HACMP未完全停止前不要进行下一步 关闭主机 shutdown F 重启系统可以使用 shutdown Fr 如有必要的话 按磁盘阵列前方的白色按钮关闭磁盘阵列 2 32 3 查看系统的错误记录查看系统的错误记录 在系统运行时 一些系统错误会记录在errlog 中 其中有

7、些错误还会在终端上显示 检查错 误日志可用以下命令 errpt more 查看系统所有的记录 IDENTIFIER TIMESTAM P T C RESOURCE NAME DESCRIPTION E85C5C4C 0426104399 P S CFGLFT SOFTWARE PROGRAM ERROR 2BFA76F6 0426104099 T S SYSPROC SYSTEM SHUTDOWN BY USER 9D4CF6E7 0426104399 T O errdemon ERROR LOGGING TURNED ON 1E2AC07E 0426103999 T O errdemon E

8、RROR LOGGING TURNED OFF 1E5EER4T 0423132999 T O clstrmgr OPERATOR NOTIFICATION 其中 IDENTIFIER 为错误编号 当需要检查详细信息时常会用到 TIME STAMP 为时间标签 它记录的是出错时间 其格式 月月日日时时分分年年 5 22 T 为Type 它记录的是错误类型 P 为永久错误 需引起注意 T 为临时错误 C 为Class 它记录的是错误种类 如 H Hardware S Software O Errloger command messages U undetermined RESOURCE NAME

9、 为错误来源 DESCRIPTION 为错误描述 errpt aj 查看系统详细记录内容 其中IDENTIFIER为错误编号 如 errpt aj 0426104399 errpt dH 查看系统所有的硬件出错记录 2 42 4 系统与数据备份系统与数据备份 有效及时的系统备份是系统管理的非常重要的一环 当系统出现故障时 特别是文件系统被严重 损坏或硬盘损坏时 常需要使用系统备份来恢复系统 在以下情况下应做系统备份 1 新装机 在硬件及系统软件安装完成后 应做系统备份 2 软件改动 系统软件或应用软件有改动时 应做系统备份 3 定期备份 对系统进行定期备份 最好每两或三个月做一次备份 系统备份

10、操作介绍 在命令行中输入 smitty mksysb 可见到以下画面 6 22 按 F4 键 见到以下画面 通过上下键选择备份的目标设备 选 dev rmt0 磁带机 按回车 见到以下画面 7 22 再按回车 开始备份 直到见到以下画面 表示备份完成 备份注意事项 进行系统备份无须停止业务 业务可以继续进行 建议客户进行定期的系统备份 使用命令smitty mksysb 客户也可根据需要利用SMIT对 系统的特定的VG或FS进行备份 smitty mksysb只备份rootvg中mount起来的文件系统 其它文件系统或数据并没有做备 份 所以数据备份需要另外完成 建议客户使用TAR格式 在条件

11、允许的情况下 最好有一盘以上备份带 以防止磁带损坏 系统备份过程中有时候会提示有些 tmp 目录下的文件无法备份 显示如下 Creating list of files to back up Backing up 34025 files 1694 of 34025 files 4 2733 of 34025 files 8 backup 0511 449 An error occurred accessing tmp sh34736 1 A file or directory in the path name does not exist backup 0511 449 An error oc

12、curred accessing tmp sh34736 2 A file or director y in the path name does not exist backup 0511 449 An error occurred accessing tmp sh34736 3 A file or director y in the path name does not exist 8 22 15458 of 34025 files 45 31920 of 34025 files 93 0512 003 mksysb may not have been able to archive so

13、me files The messages displayed on the Standard Error contained additional information 这是正常现象 备份成功 2 52 5 系统恢复系统恢复 当系统发生比较严重的故障以致采取一般性维护手段不能在短期内恢复原系统 在与客户进 行蹉商后 可将最近一次的系统备份带倒回机器内以全面恢复系统到最近一次做备份时的系统环 境 然后可将当日的数据备份再倒回系统内 至此 系统可恢复正常运行 此后 客户应当与IBM 工程师再进行整个事件的全面分析与回顾 以期找到故障发生的原因 并采取相应措施以杜绝类 似事件再次发生 2 62

14、6 DUMPDUMP 当系统运行出现软件故障导致系统down机时 机器的液晶显示器会出现 888 102 xxx 0c0 xxx可 能为700或其它 AIX常会将当时系统的运行情况记录下来 这就是DUMP 当DUMP产生后 请将磁带放入磁带机 用命令 snap a o dev rmt0将DUMP 文件拷贝到磁带 设备 dev rmt0 中 注明磁带机的block size DUMP产生的日期和机器的型号及序列号 同时 请用 errpt a tmp err log 将errorlog 记在 tmp err log中 并将 tmp err log 和 tmp hacmp 拷贝到软盘或磁带上 将磁带

15、和软盘交给IBM工程师 2 72 7 日常检查服务器状态的项目及其相关命令日常检查服务器状态的项目及其相关命令 1 运行 lsdev 命令配以各种参数 所列各种设备状态都应为 Available lsdev C H S a 列出系统中可用设备 lsdev Cc processor列出系统中的所有 CPU lsdev Cc memory列出系统中的所有内存 lsdev Cc disk列出系统中的所有硬盘 lsdev Cc adapter grep ent列出系统中的所有网卡 lsdev Cc adapter grep scsi列出系统中的所有 SCSI 卡 lsdev Cc adapter gr

16、ep ssa列出系统中的所有 SSA 卡 2 lspv 命令 lspv显示系统中可用的 PV lspv hdiskn显示 hdiskn 的具体信息 lsdev Cc pdisk 显示磁盘阵列的硬盘的具体信息 对 SSA 硬盘的检测 在对主机进行工作之前可以先把磁盘阵列上电 等主机完全启动后 登录到 主机上 运行以下命令 lsdev Cc pdisk 应该可以看到所有 SSA 硬盘 并且状态应为 9 22 Available 3 lsattr 命令 lsattr E l mem0列出系统中内存 mem0 的大小 本项目中内存有 4GB 4 lsvg 命令 lsvg列出系统中所有的 vg lsvg rootvg列出 rootvg 的详细信息 lsvg o 列出激活的 vg 5 oslevel 命令 oslevel显示操作系统版本信息 6 netstat 命令 netstat in显示系统中各网卡的配置 可查看网卡的 IP 配置好了没有 7 通过运行 diag 命令运行硬件诊断程序检测主机内所有硬件 检测结果为 No trouble found 显示各部分工作正常 8 使用 diag命令 选

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号