系统日常维护

上传人:工**** 文档编号:563855185 上传时间:2023-08-30 格式:DOC 页数:14 大小:3.03MB
返回 下载 相关 举报
系统日常维护_第1页
第1页 / 共14页
系统日常维护_第2页
第2页 / 共14页
系统日常维护_第3页
第3页 / 共14页
系统日常维护_第4页
第4页 / 共14页
系统日常维护_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《系统日常维护》由会员分享,可在线阅读,更多相关《系统日常维护(14页珍藏版)》请在金锄头文库上搜索。

1、系统日常维护1.1系统启动系统启动正常顺序如下:首先对外设(磁盘阵列、磁带库等)加电。交换机网络交换机、SAN交换机待所有外设加电自检完成后, 主机加电正常起机。为了深入检查CPU和内存等关键部件,可以在某些型号的主机上通过服务处理器菜单选择“慢”启动方式。观察液晶显示屏代码的变化直至显示C32/C33,最后代码显示结束,液晶显示屏变为背光常亮,此时主机起机正常。启动主机HACMP,smitty clstart,启动后可用命令 tail -f /tmp/hacmp.out 来检查启动情况,在HACMP未完全启动前不要进行下一步。检查服务器的网络地址,路由表(可用netstat -i , net

2、stat -rn 等),检查文件系统,逻辑卷(可用 mount , lsvg -o 等)。检查各项业务是否工作正常。1.2系统关闭停应用停止HACMP ( smitty clstop), 关闭后可用命令 tail -f /tmp/hacmp.out 来检查关闭的情况,查看HACMP的状态,检查服务器的网络地址,路由表(可用netstat -i , netstat -rn 等),检查文件系统,逻辑卷(可用 mount , lsvg -o 等)。在HACMP未完全停止前不要进行下一步。关闭主机 (shutdown F)。如有必要的话,按磁盘阵列前方的白色按钮关闭磁盘阵列。1.3查看系统的错误记录在

3、系统运行时,一些系统错误会记录在errlog 中,其中有些错误还会在终端上显示。检查错误日志可用以下命令:#errpt|pg查看系统所有的记录IDENTIFIER TIMESTAM P T C RESOURCE_NAME DESCRIPTIONE85C5C4C 0426104399 P S CFGLFT SOFTWARE PROGRAM ERROR2BFA76F6 0426104099 T S SYSPROC SYSTEM SHUTDOWN BY USER9D4CF6E7 0426104399 T O errdemon ERROR LOGGING TURNED ON1E2AC07E 04261

4、03999 T O errdemon ERROR LOGGING TURNED OFF1E5EER4T 0423132999 T O clstrmgr OPERATOR NOTIFICATION 其中IDENTIFIER 为错误编号,当需要检查详细信息时常会用到。TIME STAMP 为时间标签,它记录的是出错时间,其格式:月月日日时时分分年年T 为Type , 它记录的是错误类型P :为永久错误,需引起注意T :为临时错误。C 为Class, 它记录的是错误种类,如H : HardwareS : SoftwareO : Errloger command messagesU : undeter

5、minedRESOURCE_NAME 为错误来源DESCRIPTION 为错误描述#errpt -aj 查看系统详细记录内容其中IDENTIFIER为错误编号,如 #errpt -aj 0426104399#errpt -dH 查看系统所有的硬件出错记录1.4系统与数据备份有效及时的系统备份是系统管理的非常重要的一环。当系统出现故障时,特别是文件系统被严重损坏或硬盘损坏时,常需要使用系统备份来恢复系统。在以下情况下应做系统备份:1、新装机。在硬件及系统软件安装完成后,应做系统备份。2、软件改动。系统软件或应用软件有改动时,应做系统备份。3、定期备份。对系统进行定期备份,最好每两或三个月做一次备

6、份。系统备份操作介绍:在命令行中输入smitty mksysb ,可见到以下画面:mksysb miX /dev/rmt0按 F4 键,见到以下画面:通过上下键选择备份的目标设备(选/dev/rmt0 磁带机),按回车,见到以下画面:再按回车,开始备份,直到见到以下画面,表示备份完成:备份注意事项:进行系统备份无须停止业务,业务可以继续进行。建议客户进行定期的系统备份(使用命令smitty mksysb)。客户也可根据需要利用SMIT对系统的特定的VG或FS进行备份。smitty mksysb只备份rootvg中mount起来的文件系统,其它文件系统或数据并没有做备份,所以数据备份需要另外完成

7、(建议客户使用TAR格式)在条件允许的情况下,最好有一盘以上备份带,以防止磁带损坏。 系统备份过程中有时候会提示有些/tmp目录下的文件无法备份,显示如下:Creating list of files to back up.Backing up 34025 files.1694 of 34025 files (4%).2733 of 34025 files (8%).backup: 0511-449 An error occurred accessing ./tmp/sh34736.1: A file or directory in the path name does not exist.b

8、ackup: 0511-449 An error occurred accessing ./tmp/sh34736.2: A file or directory in the path name does not exist.backup: 0511-449 An error occurred accessing ./tmp/sh34736.3: A file or directory in the path name does not exist.15458 of 34025 files (45%).31920 of 34025 files (93%).0512-003 mksysb may

9、 not have been able to archive some files.The messages displayed on the Standard Error contained additionalinformation.这是正常现象,备份成功。1.5系统恢复 当系统发生比较严重的故障以致采取一般性维护手段不能在短期内恢复原系统,在与客户进行蹉商后,可将最近一次的系统备份带倒回机器内以全面恢复系统到最近一次做备份时的系统环境,然后可将当日的数据备份再倒回系统内。至此,系统可恢复正常运行。此后,客户应当与IBM工程师再进行整个事件的全面分析与回顾,以期找到故障发生的原因,并采取相

10、应措施以杜绝类似事件再次发生。1.6 DUMP当系统运行出现软件故障导致系统down机时,机器的液晶显示器会出现 888 102 xxx 0c0 (xxx可能为700或其它),AIX常会将当时系统的运行情况记录下来,这就是DUMP。当DUMP产生后,请将磁带放入磁带机,用命令 # snap -a -o /dev/rmt0将DUMP 文件拷贝到磁带设备/dev/rmt0 中。注明磁带机的block size, DUMP产生的日期和机器的型号及序列号。同时,请用# errpt -a /tmp/err.log 将errorlog 记在/tmp/err.log中,并将 /tmp/err.log 和 /

11、tmp/hacmp.* 拷贝到软盘或磁带上。将磁带和软盘交给IBM工程师。1.7日常检查服务器状态的项目及其相关命令1 运行lsdev 命令配以各种参数,所列各种设备状态都应为Available。#lsdev C H S a 列出系统中可用设备。#lsdev Cc processor列出系统中的所有CPU。#lsdev Cc memory列出系统中的所有内存。#lsdev Cc disk列出系统中的所有硬盘。# lsdev -Cc adapter | grep ent列出系统中的所有网卡# lsdev -Cc adapter | grep scsi列出系统中的所有SCSI卡。# lsdev -

12、Cc adapter | grep ssa列出系统中的所有SSA卡。2 lspv命令#lspv显示系统中可用的PV。#lspv hdiskn显示hdiskn的具体信息。#lsdev Cc pdisk 显示磁盘阵列的硬盘的具体信息。对SSA硬盘的检测:在对主机进行工作之前可以先把磁盘阵列上电,等主机完全启动后,登录到主机上,运行以下命令“ lsdev Cc pdisk “,应该可以看到所有SSA硬盘,并且状态应为Available.。3 lsattr命令# lsattr E l mem0列出系统中内存mem0的大小,本项目中内存有4GB。4 lsvg命令#lsvg列出系统中所有的vg。#lsvg

13、 rootvg列出rootvg的详细信息。5 oslevel命令#oslevel显示操作系统版本信息。6 netstat命令#netstat in显示系统中各网卡的配置。可查看网卡的IP配置好了没有。7 通过运行# diag 命令运行硬件诊断程序检测主机内所有硬件,检测结果为 “No trouble found ”显示各部分工作正常。8 对SSA硬盘链路连接的校验,可以通过SSA 工具里的Link Verification 来检测。如有必要,可以用 # diag运行硬件诊断程序的硬盘诊断部分进行硬盘的表面分析测试 ,由1% 至100%,检测结果显示主机内置硬盘的所有扇区均读写正常。lspg a

14、 查看PAGING SPACE的使用情况,如果使用率超过70%,就需要采取措施。lsvg o | lsvg il | grep i查看有无stale的lv,如果输入该命令之后有输出结果,就需要采取措施检查系统硬件情况:设备故障灯是否有亮,有无其他否异常情况。有否发给root用户的错误报告(mail)。检查hacmp.out,smit.log等系统文档。用vmstat, topas 命令检查系统性能,检查有否性能瓶颈。检查能否顺利进入CDE界面,如果不能进入的话,要检查/etc/hosts表中有否错误的项目。用smitty ssaraid 查看磁盘阵列RAID盘的状态是否是Good。 用sysdumpdev l 查看系统的DUMP设置是否正常。用instfix ik | grep ML当前操作系统补丁版本补丁程序(PTF)是否满足稳定运行的需要。用lscfg vp | grep alter 查看微代码(Microcode)是否满足稳定运行的需要。1.8 AIX维护

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号