ibm rs6000小型机故障的基本定位方法

上传人:第*** 文档编号:30598483 上传时间:2018-01-30 格式:DOC 页数:17 大小:78KB
返回 下载 相关 举报
ibm rs6000小型机故障的基本定位方法_第1页
第1页 / 共17页
ibm rs6000小型机故障的基本定位方法_第2页
第2页 / 共17页
ibm rs6000小型机故障的基本定位方法_第3页
第3页 / 共17页
ibm rs6000小型机故障的基本定位方法_第4页
第4页 / 共17页
ibm rs6000小型机故障的基本定位方法_第5页
第5页 / 共17页
点击查看更多>>
资源描述

《ibm rs6000小型机故障的基本定位方法》由会员分享,可在线阅读,更多相关《ibm rs6000小型机故障的基本定位方法(17页珍藏版)》请在金锄头文库上搜索。

1、RS/6000 小型机故障的基本定位方法摘自 IXPUB - 疲惫的鱼一 故障的定义弄清楚系统发生了什么问题系统现在能做什么?不能做什么?故障什么时候发生的?有没有做平时不同的操作?故障有没有规律?定时还是不定时?发生的频率有多高?是一台机器出现故障还是多台机器故障?故障现象是否相同?最近有没有做改动?如安装了新的硬件、软件,改变了系统的一些设置。二 故障信息的收集1) 收集故障信息对于判断、诊断故障原因,修复系统非常重要。2) 系统故障记录(errorlog)errdemon 进程在系统启动时自动运行记录包括硬件、软件及其他操作信息故障记录文件为/var/adm/ras/errlog,可备份

2、下来或拷贝到别的机器上分析errpt 命令的使用 (普通用户权限也可使用)# errpt |more 列出简短出错信息ERROR_ID TIMESTAMP T C RESOURCE_NAME ERROR_DESCRIPTION192AC071 0723100300 T 0 errdemon Error logging turned off0E017ED1 0720131000 P H mem2 Memory failure9DBCFDEE 0701000000 T 0 errdemon Error logging turned on038F2580 0624131000 U H scdisk0

3、 UNDETERMINED ERRORAA8AB241 0405130900 T O OPERATOR OPERATOR NOTIFICATIONTIMESTAMP: MMDDHHMMYY (月日时分年)T(类型): P 永久; T 临时; U 未知 (永久性的错误应引起重视)C(分类): H 硬件; S 软件; O 用户; U 未知# errpt -d H 列出所有硬件出错信息# errpt -d S 列出所有软件出错信息# errpt -aj ERROR_ID 列出详细出错信息# errpt -aj 0502f666 Date/Time: Jun 19 22:29:51Sequence N

4、umber: 95Machine ID: 123456789012Node ID: host1Class: HType: PERMResource Name: scsi0Resource Class: adapterResource Type: hscsiLocation: 00-08VPD: Probable CausesADAPTER HARDWARE CABLECABLE TERMINATOR DEVICEFailure CausesADAPTERCABLE LOOSE OR DEFECTIVERecommended ActionsPERFORM PROBLEM DETERMINATIO

5、N PROCEDURESCHECK CABLE AND ITS CONNECTIONSDetail DataSENSE DATA0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 00003) 控制面板上的 LED 代码.8 位代码,通常系统故障灯会同时亮起。某些机型还会同时显示故障设备位置代码。.4 位代码,通常是 Exxx。.3 位代码,通常为 0yyy,只看后 3 位。.8 位和 4 位代码可查看系统服务手册 (Service Guide)。3 位代码可查看系统诊断手册(Diagnostic Information for Mul

6、tiple Bus System)。.闪动的 888, 系统崩溃,硬件或软件原因造成。按 reset 键会显示更多内容。888-102 一般为软件故障(888-102-207 例外)系统会产生一个 dump。888-102-xxx-0C9 系统正在做 dump, 请等待。888-102-xxx-0C0 系统 dump 完成,可关电重启。888-103 或 105 硬件故障,一般有 SRN 代码及位置代码。4) SMS (System Management Service) 故障记录如何进入 SMS 菜单当主控台出现键盘图标后(LED 显示 E1F1 时) 按 1 键。选择Utilities,选

7、择Error Log, 抄下 8 位故障代码(在 SMS 中还可以更改系统启动顺序表)5) MAIL # mail系统会向 root 用户发 mail 报告出错信息。通常系统出现故障后没有进行检查修复,系统会定时提醒 root。6) 运行故障诊断程序(Diagnostic),对系统硬件进行检查和诊断。当发现有硬件故障时应立即使用 diag#diag 选高级诊断(Advance Diagnostic) 选问题诊断(Problem Determination) 或 选系统检查(System Verification)(选 PD 会对系统错误记录进行分析)diag 运行后会给出 SRN 代码,故障设

8、备名称及百分比,地址代码等。对于 PCI 机型应在系统报错 7 天之内运行 diag 程序对出错记录里的 sense 数据进行分析。7) 其他用于收集系统信息的命令lsdev -C 系统设备信息#lsdev -Cc diskhdisk0 Available 00-06-00-2,0 4.5 GB 16 Bit SCSI Disk Drivehdisk1 Available 00-06-00-1,0 4.5 GB 16 Bit SCSI Disk Drivehdisk2 Defined 00-06-00-4,0 16 Bit SCSI Disk Drive lspv 查看物理卷信息#lspvhd

9、isk0 0007821160af3d76 rootvghdisk1 000782117f571294 rootvghdisk2 0000000045c45bde datavglsvg 查看卷组信息#lsvg datavgVOLUME GROUP: datavg VG IDENTIFIER: 0000000055e2458bVG STATE: active PP SIZE: 4 megabyte(s)VG PERMISSION: read/write TOTAL PPs: 2169 (8676 megabytMAX LVs: 256 FREE PPs: 1 (4 megabytes)LVs:

10、3 USED PPs: 2168 (8672 megabytOPEN LVs: 2 QUORUM: 2TOTAL PVs: 1 VG DESCRIPTORS: 2STALE PVs: 0 STALE PPs: 0ACTIVE PVs: 1 AUTO ON: yesMAX PPs per PV: 2032 MAX PVs: 16#lsvg -l rootvgrootvg:LV NAME TYPE LPs PPs PVs LV STATE MOUNT POINThd5 boot 1 1 1 closed/syncd N/A . lv00 jfs 51 102 1 closed/stale /ibm

11、cxxlv01 jfs 1 1 1 open/syncd /cics_regionslv02 jfs 4 4 1 open/syncd /var/mqm lslpp 查看文件组信息# lslpp -L |grep 23100020.devices.pci.23100020.rte 4.3.2.7 C IBM PCI 10/100 Ethernet Adapt看某个文件组是否已安装,如以太网卡驱动。也用于查询补丁程序的版本。lsattr 查看设备参数设置# lsattr -El ent2busio 0x7fffc00 Bus I/O address Falsebusintr 9 Bus inte

12、rrupt level Falseintr_priority 3 Interrupt priority Falsetx_que_size 512 TRANSMIT queue size Truerx_que_size 256 RECEIVE queue size Truerxbuf_pool_size 384 RECEIVE buffer pool size Truemedia_speed 10_Half_Duplex Media Speed Trueuse_alt_addr no Enable ALTERNATE ETHERNET address Truealt_addr 0x000000000000 ALTERNATE ETHERNET address Trueip_gap 96 Inter-Packet Gap True lscfg 查看 VPD 信息(Virtual Product Data)# lscfg -vl ssa1DEVICE LOCATION DESCRIPTIONssa1 30-68 IBM SSA Enhanced RAID Adapter(14104500)Part Number.097H0645FRU Number.097H0645 不同的硬件设备有

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 外语文库 > 英语学习

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号