IBM P750小型机日常维护手册(9月11日).pptx

上传人:摩西的****12 文档编号:144771961 上传时间:2020-09-14 格式:PPTX 页数:13 大小:840.15KB
返回 下载 相关 举报
IBM P750小型机日常维护手册(9月11日).pptx_第1页
第1页 / 共13页
IBM P750小型机日常维护手册(9月11日).pptx_第2页
第2页 / 共13页
IBM P750小型机日常维护手册(9月11日).pptx_第3页
第3页 / 共13页
IBM P750小型机日常维护手册(9月11日).pptx_第4页
第4页 / 共13页
IBM P750小型机日常维护手册(9月11日).pptx_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《IBM P750小型机日常维护手册(9月11日).pptx》由会员分享,可在线阅读,更多相关《IBM P750小型机日常维护手册(9月11日).pptx(13页珍藏版)》请在金锄头文库上搜索。

1、学 海 无 涯,IBM P750 小型机 日常维护手册 一、 服务器硬件运行状态检查,1,当服务器处于启动和正常工作状态时,其前面板上的状态灯(与电源灯并排)和各硬盘的状态灯(一排 小灯,与各硬盘位置一一对应)应显示为绿色。 当服务器的状态灯出现 橙黄色时,说明有硬件告警,此时要检查服务器的电源、接线、硬盘等。如果有 硬件故障则需要立即进行更换和更正,如果查不出具体问题,则需要联系相关专家进一步诊断。 当硬盘工作正常时,与各硬盘对应的硬盘灯会呈绿色,如无读写,则绿灯一直亮,如该硬盘有读写操作, 则绿灯会不规则闪烁,当硬盘损坏时,则硬盘状态灯将熄灭,或者呈闪烁状态:以 13 秒的频率有规 律地、

2、不停地闪烁。 如果发现有服务器硬件状态灯不正常的情况,请及时联系我公司工程师,以便及时进行诊断并解决故障。,二、 HMC(硬件管理平台)管理与操作,HMC 的两种访问途径: 1、 在机房直接通过显示器和键盘进行管理维护等相关操作 2、 通过 web 远程访问,登录HMC web 管理界面,访问地址为:https:/ 1、登录 HMC 1.1 浏览器访问连接HMC 后,首页界面如下图所示。,学 海 无 涯,点击下图所示链接,进入HMC 验证登录界面。 输入用户名与口令,登录HMC。 用户名:hscroot 口令:,1.4 成功登录到 HMC 管理界面如下图所示。,2,学 海 无 涯,2、注销 H

3、MC 在 HMC console 右上角有(hscroot | help | log off)链接,单击 log off,会出现如下图所示注销界面:,选择 Log off,系统返回到 HMC 初始登录界面状态。 3、重启 HMC 左边导航栏中选择 HMC Management shut down or Restart,如下图所示,对HMC 进行正常 重启及关机操作。 请谨慎对 HMC 进行关机和重启操作!,3,学 海 无 涯,4、状态栏功能 状态栏位于HMC 左下角位置,如下图所示,负责监控并反映管理系统资源状态和HMC 状态。,单击每个图标状态可以列出详细状态,你可以查到更详细的帮助信息:

4、:非法操作,如果任何被管理的主机执行了非法操作,这个图标将会变亮。 :黄灯警告, 如果任何被管理的主机有错误并有黄灯被点亮,这个图标也将会变亮 :报错日志:日志中有报错信息,这个图标将会变亮,此项与 :摘要,摘要中会将有用信息做统计并显示在工作栏中。 5、Service Management 导航栏中Service Management 强大的管理功能给用户日常维护提供了更简单直观的界面,如下图所示, 但日平时最常用的子项是 Manage Serviceable Events,如下图步骤可以对 HMC 所管理的设备进行日常错误 及时直观的观察,以确保 IBM 小型机能正常工作,下图就是基本的操

5、作方法图示: Service ManagementManage Serviceable Events,4,学 海 无 涯,5,学 海 无 涯,6、Service Plans-分区管理与操作 6.1 如何查看小型机资源配置:,如上图红色标注所示,选中所需查看主机(备注:请不要同时选中多台主机及多个分区),在下拉菜单中选 中“Properties”,打开参数窗口,通过“Properties”可以查看主机运行状态,CPU,内存,I/0 等重要硬件系统参 数,如下图所示。,6,学 海 无 涯,同理,在分区区域中先中每分区后的 Properties 选项,便可以直观方便的掌握分区状态和资源配置信息。 6

6、.2 如何开关机及激活分区: 关机。,开机。,7,学 海 无 涯,Operation 项中主要包含小型机及分区开关机,及消除报警灯这两项功能,如虽要对小型机下电操作,请先 将图 15 中的分区 Deactivate(建议:最好在操作系统中按照正常流程将操作系统 shutdown),最后再将主 机 power off。 注意:非特殊情况,无专业人员指导,严禁进行开关机操作! 6.3 手动消除黄灯警告 如下两图所示, Operations 中 LED status,及 Deactivate Attention LED 两项中所指,针对不同分区或主机 所报出的警告黄灯,进行特定的消除黄灯操作。,8,

7、学 海 无 涯 6.4 如何打开控制终端(Terminal Window),在 HMC 上对分区操作系统进行操作,可以通过分区下拉菜单 Console Window-Open Terminal Window 对选中分区进行操作,如图所示,操作界面如同telnet 界面。 在 HMC 中同一分区只允许打开一个 Terminal Window,如试图打开第二个窗口,系统提示如图 17 所示界 面。,三、 AIX 系统日常维护 1、查看系统的错误记录 很重要,应该定期查看,如发现有硬件(H)类型的报错,应该及时关注。 在系统运行时,一些系统错误会记录在errlog 中,其中有些错误还会在终端上显示。

8、 检查错误日志可用以下命令: #errpt | more 查看系统所有的记录,RESOURCE_NAME,IDENTIFIER E85C5C4C 2BFA76F6 9D4CF6E7 1E2AC07E 1E5EER4T,TIMESTAM PTC 0426104399PS 0426104099TS 0426104399TO 0426103999TO 0423132999TO,CFGLFT SYSPROC errdemon errdemon clstrmgr,DESCRIPTION SOFTWARE PROGRAM ERROR SYSTEM SHUTDOWN BY USER ERROR LOGGIN

9、G TURNED ON ERROR LOGGING TURNED OFF OPERATOR NOTIFICATION,9,学 海 无 涯 其中 IDENTIFIER 为错误编号,当需要检查详细信息时常会用到。 TIME STAMP 为时间标签,它记录的是出错时间,其格式:月月日日时时分分年年 T 为 Type , 它记录的是错误类型 P :为永久错误,需引起注意 T :为临时错误。 C 为 Class,它记录的是错误种类,如 H : Hardware S : Software O : Errloger command messages U : undetermined RESOURCE_NAM

10、E为错误来源 DESCRIPTION 为错误描述 #errpt -aj 查看系统详细记录内容 其中 IDENTIFIER 为错误编号,如 #errpt -aj 0426104399,10,#errpt -dH查看系统所有的硬件出错记录,2、日常检查服务器状态的项目及其相关命令 2.1 运行 lsdev 命令配以各种参数,所列各种设备状态都应为 Available。,#lsdev C H S a #lsdev Cc processor #lsdev Cc memory #lsdev Cc disk #lsdev -Cc adapter | grep ent #lsdev -Cc adapter

11、| grep scsi #lsdev -Cc adapter | grep ssa,列出系统中可用设备。 列出系统中的所有 CPU。 列出系统中的所有内存。 列出系统中的所有硬盘。 列出系统中的所有网卡 列出系统中的所有SCSI 卡。 列出系统中的所有SSA 卡。,2.2 lspv 命令,#lspv #lspv hdiskn #lsdev Cc pdisk,显示系统中可用的 PV。 显示 hdiskn 的具体信息。 显示磁盘阵列的硬盘的具体信息。,2.3 lsattr 命令,# lsattr E l mem0,列出系统中内存 mem0 的大小,本项目中内存有 4GB。,2.4 lsvg 命令,

12、#lsvg #lsvg rootvg,列出系统中所有的vg。 列出 rootvg 的详细信息。,学 海 无 涯,#lsvg o,列出激活的vg,oslevel 命令 #oslevel显示操作系统版本信息。 netstat 命令 #netstat in 显示系统中各网卡的配置。可查看网卡的 IP 配置好了没有。 diag 命令 通过运行# diag 命令运行硬件诊断程序检测主机内所有硬件,检测结果为 “No trouble found ”显示各部分 工作正常。 lsps 查看页面空间 lsps a 查看 PAGING SPACE 的使用情况,如果使用率超过 70,就需要采取措施。 查看 LV(卷

13、)状态 lsvg o | lsvg il | grep i stale 查看有无 stale 的 lv,如果输入该命令之后有输出结果,就需要采取措施 查看 mail # mail,查看有否发给 root 用户的错误报告(mail)。 3、检查文件系统 查看有没有“满”的文件系统。文件系统满可导致系统不能正常工作,尤其是 AIX 的基本文件系统。 如/ (根文件系统)满则会导致用户不能登录。 # df -k(查看 AIX 的基本文件系统) Filesystem1024-blocksFree UsedIused Iused Mounted on,除/usr 文件系统,其他文件系统都不应太满,一般不

14、超过 80。,11,学 海 无 涯,4、性能监控与调优 4.1 通过 topas 来观察 topas 能够将系统的全局信息,包括 CPU、内存、磁盘、网络、文件系统、事件队列、文件等信息,排列在 一个统一的界面上进行展示。,Network,BPSI-PktsO-Pkts,B-In,B-Out,Namei Dirblk,Execs Runqueue Waitqueue,Disk,Busy,BPS,TPSB-ReadB-Writ,FileSystem,BPS,TPSB-ReadB-Writ,MEMORY Real,MB Comp Noncomp Client,Name,PIDCPU,PgSp Ow

15、ner,PAGING Faults Steals PgspIn PgspOut PageIn PageOut Sios,PAGING SPACE Size,MB Used Free,12,WPAR Activ WPAR Total Press: h-help q-quit,NFS (calls/sec) SerV2 CliV2 SerV3 CliV3 SerV4,4.2 通过命令 vmstat 1 来观察. kthrmemorypagefaultscpu - - - - - rbavmfrerepipofrsrcyinsycs us sy id wa 命令解析:vmstat 命令的输出可以反映

16、系统整体运行状况,包括 cpu、内存、虚拟页面、系统进程和系统 调用情况。 检查 CPU 是否为瓶颈,分别检查 CPU 的四项数值和kthr 的两项数值. 检查 MEM 是否为瓶颈,分别检查 Memory 的两项数值和 Page 的六项数值.,学 海 无 涯 通过命令 sar mu P ALL 来观察。 命令解析:sar 可以用来收集反映系统运行状况,在这里主要是查看 CPU 的运行状况,CPU 是否负载均 衡,是否存在分配不均的情况。 通过命令 ps gv | more 来观察。,PIDTTY STAT,TIME PGINSIZE 4:207,RSSLIMTSIZTRS CPU MEM COMMAND 12 14516xx0 145040.05.0 swapper,0 1,- A - A1:33103 78952 79044 3276825360.0 29.0

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号