X3850X5服务器无法开机故障处理

上传人:M****1 文档编号:505638389 上传时间:2022-11-08 格式:DOCX 页数:8 大小:124.96KB
返回 下载 相关 举报
X3850X5服务器无法开机故障处理_第1页
第1页 / 共8页
X3850X5服务器无法开机故障处理_第2页
第2页 / 共8页
X3850X5服务器无法开机故障处理_第3页
第3页 / 共8页
X3850X5服务器无法开机故障处理_第4页
第4页 / 共8页
X3850X5服务器无法开机故障处理_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《X3850X5服务器无法开机故障处理》由会员分享,可在线阅读,更多相关《X3850X5服务器无法开机故障处理(8页珍藏版)》请在金锄头文库上搜索。

1、编号密级IBM X3850 X5服务器无法开机故障处理步骤V1.0设备概况客户名称机房位置设备型号IBM X3850 X5设备序列号操作系统微码版本应用软件硬件配置二、问题描述接到客户报修,一台IBM X3850X5服务器宕机后无法开机, 诊断面板上BRD指示灯亮起,立即赶往现场处理。经过现场确认,设备电源可以正常加电,但按下开机按钮后无法启动,液晶面板在01、FR间循环显示,断电重新加电现象相 同。通过用客户管理电脑连接IMM管理端口查看日志,有如下报 错信息:1. I 7/6/2016:6:24:35 N 0x4000000e00000000 Remote LoginSuccessful.

2、 Login ID: USERID from Web at IP address 192.168.70.12. E 7/2/2016:2:6:35 C 0x800706081410ffff Sensor I/OBoard VRD has transitioned to non-recoverable3. I - - 7/2/2016:2:6:29 N 0x806f00091381ffff Host Power has been turned off4. E - - 7/2/2016:2:6:26 C 0x80070608140bffff Sensor CPU2 VRD has transiti

3、oned to non-recoverable三、处理步骤通过设备维护手册查询,报错内容 “Sensor CPU 2 VRD hastransitioned to non-recoverable”为CPU板故障,报错内容“s ensor I/O BoardVRD has transitioned to non-recoverable” 为PC I板故障。这两个故障都可能导致目前无法开机的现象,从时间点看CPU板首先故障,所以CPU板故障可能性最大并准备备件准备更换,同时准备PCI板现场备用。CPU板更换步骤如下:1. 现场准备好新的备件。2. 关闭服务器和外围设备,并根据需要断开电源线和所有外

4、部电缆连接,以更换 设备。3. 卸下顶盖。4. 卸下顶盖支架)。5. 卸下电源。6. 从微处理器板组合件卸下 I/O 板滑盖。7. 卸下内存卡。8. 卸下 ServeRAID 适配器。9. 卸下中间风扇。10. 卸下内存卡仓。11. 卸下微处理器。12. 断开以下电缆连接:前部风扇、可扩展指示灯、操作员信息面板和CD/DVD电 源。13. 拧松服务器后部的指旋螺钉。14. 将组合件轻轻向服务器前部滑动;然后使用左侧的微处理器板手柄,从一定角 度取出组合件。15. 更换成新的CPU板,按相反步骤进行安装后加电开机测试。更换新CPU板后主机可以正常开机,但在启动过程中会有如 下报错并无法进入操作系

5、统:there are offli ne or missi ng virtual drives with preserved cache. please check the cables and en sure that all drives are prese nt. Press any key to continue or C load the configuration utility.按照提示进行RAID卡管理界面,有如下内容提示:以上提示内容原因为RAID卡cache中有脏数据未能正常写入 磁盘,选择 Discard cache 选项丢弃,然后退出管理界面,设备正 常进入操作系统。自

6、此设备硬件故障已经修复,但查看诊断面板仍然有 Log 报 错灯亮起,通过登陆IMM管理台查看,有如下报错信息:FPGA frrnware mismalch inlErnal to system Sh06N5962. Please attempt to flash the FPGA Jirmwane.Afirmware orsofhAare i/icompatibiliydetected an syslent SMH06M弓弭2报错为FPGA微码版本不匹配,通过看到VPD信息发现FPGA 微码版本高于 IMM 和 UEFI 微码版本,于是与客户沟通将所有微 码升级到最新版本。升级前先进入主机BI

7、OS,将system log events 清除,升级过程如下:1、到官网下载最新的微码版本;a) IMM: ibm_fw_imm_yuooh2b-1.51_linux_32-64b) FPGA: ibm_fw_fpga_g0ud92b-5.02_linux_32-64c) UEFI: ibm_fw_uefi_g0e185a-1.85_linux_32-642、重启服务器,按F1到UEFI界面下;3、打开浏览器连接 IMM 管理台, 默认 IP 地址:192.168.70.125,用户名/密码:USERID/PASSWORD(0 为 数量 0);4、首先升级IMM模块微码,点击Firmware

8、 Update菜单中 的浏览,选择下载好的IMM微码包,点击update进行 升级,升级过程大概10-15分钟,升级完成后点击RestartIMM 菜单重启 IMM 模块,整体升级过程中千万不要重启服务器;integrated Management Module Sys 相 m丁胡聞itors System Status Virtual Light Path EvetiI Log VitaJ Product Data Tasks PowerfRestarf Remte Control PXE Mehvork BootUpdate FirmwareTo update 3 armware comp

9、cneni, select a firnrsre file nd click Update/-測贤.FiHFWsna Updiat巳” IMM Cantf&iSystem 5就咖呂Login Pnofiles書逓劳3 咨議芒 彎址丸全I1 RM中时立我曲1 10M中旦兰乍械件Rewurce Cent |杀斶询MJMr-曲培Ifni舷注 与迪O Oj IMM-34JO0?02W5Integrated Management ModuleFirmware Update Progress9fl% compMedl (Upgrading flrjn-grejPlesse remain on Hiis p

10、age unM Ih日 update is- tomplele gnd you wa a st3li*5 nwsage* Systism MMiiLx 卑-System Status 常血I bght P諦 E V Log Wad Pfirilicl Data p TasksPWer/RBEtaft Ramole Oonlrd PXE 加Nork BootFirnnwflrig Upck相丁 I M CefilYoJSystem Settings Login Profiles Ate帼Serial PortRod AssqnnwnlsNelmrk Interfaces.15 * 3 谷益 财址

11、大盘IE;胡中逊*.支松 J侣IM中国自訣梓 ITResoue Cent呂60询可Xr.用R绘训阿憑程 gJMM-0B5B2F955Integrated Management Module-Sylenn 丁 MorirlDfs冽sJlam Stalua VSrtual Light Path Event Log VMal Product Data t TasksPow&r/RiBlart Remcrte Conbd PXE Netwofft; BoatFirmware Succssfiilty UpdatedFeas r&Elad I MM far changes to takB effect.

12、 Please click OK In canbnLie witn ncrmal Dperatons.|CIKFinnware UpdateIMM Cumml SyEJlBOi Settings Logm Rfofitee5、重新连接 IMM 后,按照以上方法分别顺序升级 FGPA和 UEFI 微码;6、都升级完成后,关闭服务器电源并拔掉电源线;7、等待5-10分钟,连接电源线并启动到BIOS界面,查看Vital Product Data (VPD)中微码版本是否更新(在IMM也可以查看),同时检查CPU、内存状态是否都正常;Firmware VPD1 irrwaie lyppVet siofl String心时电a专H DateUMYUOOE3CUEGOEirSBU &:06/0/2D12ditffiYTAIMI!06/1&20?2 _fpgaG0UD83A0&/TQJ2Q128、确认状态都正常后,退出 BIOS 并进行操作系统,同时LOG 报警灯亮的问题也已解决,故障处理完成。四、经验总结对于服务器无法开机的问题,首先判断电源是否正常,同时结合服务器诊断面板和IMM管理台,综合判断可以快速定位故障。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号