爱立信常见故障处理

资源描述

《爱立信常见故障处理》由会员分享，可在线阅读，更多相关《爱立信常见故障处理（48页珍藏版）》请在金锄头文库上搜索。

1、爱立信常见故障处理（核心网室）故障处理技术指引故障现象用指今DPWSP查看CP状态如下: CP40: 故障处理技术指引故障现现象在交换机上执行指令ALLIP时出现告警标题为CP FAULT。故障处理技术指引故障现象在交换机上执行指令ALLIP时出现告警标题为RP FAULT或EM FAULT。故障处理技术指引故障现现象在交换机上执行指令ALLIP时出现告警标题为BACKUP INFORMATION FAULT。（若是HLR上出现此告警，则派任务工单给监控在夜间做CP备份）故障处理技术指引故障现象在交换机上执行指令ALLIP时出现告警标题为GROUP

2、SWITCH FAULT。 ALLIP; 810硬件: DISTRIBUTED GROUP SWITCH FAULT UNIT TCASE STATE FTYPE XM-B-0-1 1 BLOC INTERNAL501进进入“AP LOCAL MODE”下用指令 “AFPFTI F TRANSFERQUEUE”，告警便可以消除。故障处处理技术术指引故障现现象告警AP SYSTEM ANALYSIS 详细详细描述：A2/APZ “GZMMSC63/JB/0/0“ 804 041127 0011 AP SYSTEM ANALYSIS AP APNAME NODE NODENAME1 G

3、ZG13MAP1C A GZG13MAP1A OBJECT COUNTER INSTANCE LIMIT VALUE LogicalDisk % Free Space C: 故障处处理技术术指引处处理流程C盘盘空间间不足时时可删删除的文件 1、C:acsdataFtpmktrbuild该该目录录存储储的是爱爱立信TR需要的logfile，可以完全删删除（一般可在提交给爱给爱立信后即刻删删除）。 2、C:Temp该该目录录存储储的是windows NT系统统的临时临时文件，可以完全删删除。 3、C:WINNTsystem32logfilesMSFTPSVC1C:WINNTsyste

4、m32logfilesMSFTPSVC2C:WINNTsystem32logfilesMSFTPSVC3该该目录录存储储的是windows NT系统记录统记录的用户户登录录信息、安全事件信息等 logfiles，可删删除较较旧的文件，建议议至少保留一周之内的文件，如实实在空间间不足，也可全部删删除。故障处处理技术术指引处处理流程4、C:acslogsfch该该目录录下如果有扩扩展名为为.old的文件，形似： acs_fch_activity.old，为为系统统自动动保留的旧版本文件，可删删除该该.old文件。C:acslogsprc该该目录录下如果有扩扩展名为为.old的文件，形

5、似： ACS_PRC_error.old，为为系统统自动动保留的旧版本文件，可删删除该该.old文件。C:acslogsusa该该目录录下如果有扩扩展名为为.old的文件，形似：usa.tmp.old，为为系统统自动动保留的旧版本文件，可删删除该该.old文件。C:acslogscore该该目录录下如果有扩扩展名为为.unknown.x（其中x为为一阿拉伯数字）的文件，形似：core.unknown.x，可删删除该该文件。 5、清空C盘盘回收站故障处处理技术术指引故障现现象详细详细描述:Alarm Identifier Class Category Time 8796:0 A2

6、APZ Sun Nov 21 07:17:42 2004 Object of Reference LOGFILE/APPLICATION-VIRUS Alarm Text AP ANTIVIRUS FUNCTION FAULT SIGNATURE FILE DOWNLOAD FAILED Problem DataSun Nov 21 07:17:41 2004 3004 GZG33MAP2A 2 264 InoculateIT EVENTLOG_WARNING_TYPE 07:16:11 11/21/04 176 gzg33map2a 07:17:41 11/21/04 The automat

7、ic download has run 4 times unsuccessfully. The next attempt will occur at the regularly scheduled download time. 故障处处理技术术指引处处理流程解决方法:在AP1设设置eTrust软软件,记记住沟选选 Redistribution Server选项选项 , 然后APG2（计费专计费专用）就可以通过过 “Redistribution Server”的方式从APG1 更新病毒库库。故障处处理技术术指引故障现现象在交换换机上执执行指令ALLIP时时出现现告警标题为标题为 AP S

8、YSTEM CLOCK NOT SYNCHRONIZED，一般由于AP 和CP时时间间不同步(差值值大于10分钟钟)引起处处理流程处处理流程如下： 1. 检查检查 CP 时间时间故障处理技术指引故障现现象网管不能联联机。AP的的两个 NODE之间间交替REBOOT，最终终会导导致两节节点UNDEFINED状态态。可能原因：1、数据盘镜盘镜像故障 raidutil -L raid 有数据盘盘节节点状态为态为 Drive Failed 2、磁盘盘空间满导间满导致统计统计故障一般有相关的统计统计告警3、。故障处理技术指引处处理流程处理流程如下： 1. tel

9、net 该该网元，在cluster res 起来，但还还没有来得及循环环reboot时时停掉进进程控制的cluster res （ ACS_PRC_ClusterControl）；cluster res ACS_PRC_ClusterControl_0 /off /waitcluster res ACS_PRC_ClusterControl_1 /off /wait 检查检查告警 alist 检查检查 cluster res ，找出状态为态为 failed的cluster res cluster res |findstr -ive online 若没有failed 的cluster res

10、进进行第4步；否则转则转入第5步；故障处理技术指引处处理流程4.检查检查数据盘盘的镜镜像。（对应对应有告警mirrored disks not redudent） raidutil -L raid 如果有Drive Failed 的镜像盘，则进行重建，一般会持续6 小时左右。若重建失败，则需更换node 5.对对于有failed 状态态的cluster res , 先消除相关的告警后，再将对应对应的res 进进行offline、online。 eg: 如果由于R盘或S盘满引起统计进程停止，则先应删除无用的文件，消除硬盘空间告警，在对统计进程进行重启不能在不作任何相

11、关处理的情况下，直接将failed状态的cluster res 进行人工online 6.人工重启进进程控制的cluster res cluster res ACS_PRC_ClusterControl_0 /on /waitcluster res ACS_PRC_ClusterControl_1 /on /wait检查检查系统统状态态 hostname prcstate alist net state cluster nodecluster res |findstr -ive online 故障处理技术指引故障现现象由于系统统运行故障，有时时 AP节节点并非指示了正确的状态态。例如A

12、CTIVE边边不能执执行MML，提示为为：“mml only allowed from active node” ，相反在passive却可以执执行。处处理流程处理流程如下：方法一： 1.1、在APG两个Node上分别别人工停止的Cluster Server 分别telnet上APG的两个Node，执行如下指令：net stop clussvc 1.2、任选选一边边（通常选选PDC，即Node A）人工启动动 Cluster Serve telnet上选定的Node，执行如下指令： net start clussvc处处理流程1.3、观观察到选选定的Node上Cluster

13、Server已经经启动动执执行指令：cluster res 有结结果显显示即说说明 Cluster Server已经经启动动 1.4、确定选选定的Node已经经恢复正常的状态态执执行指令：prcstate（观观察到状态为态为 active）或cluster node（观观察到选选定的Node状态态为为UP）执执行指令：MML（观观察到已经经能够够正常接入CP模式即说说明状态态已经经恢复正常） 1.5、在APG另外一个Node人工启动动Cluster Server telnet上该该Node，执执行如下指令： 1. net start clussvc 6、确定APG两个Nod

14、e状态态均已恢复正常 1.执执行指令：cluster res（观观察到指令能正常输输出结结果且所有resource均为为online状态态）处处理流程方法二：（适用于方法一无效的情况下） 1.任选选AP 一边边（例如 B 侧侧）执执行 prcboot -s ,暂时暂时停掉这这一边边； 1.在剩下的一边边（ A 侧侧）执执行 prcboot , 待系统统起来后，若 CLUSTER 正常，则该侧为则该侧为一定为为active; 测试测试 MML 及其他的 APG指令，以确认该侧认该侧正常；在active边执边执行 fcc_reset other, 强制另一边彻边彻底重启；有时

15、时停掉的一边边系统统cluster会自动动起来，这时这时候也一定要执执行第3步 1. 检查检查系统统状态态 hostname prcstate alist net state cluster nodecluster res |findstr -ive online 故障说明及处理流程故障现现象由于SCTP层层网络络状态发态发生改变变而产产生的O2级级告警告警举举例： SCTP NETWORK STATUS CHANGESAID EP02MG1301RIP 10.26.36.37 处处理流程处理流程如下：发发送心跳消息即可消除告警。指令：IHSHI:SAID=said， RIP=“rip”;如上诉诉告警信息的例子即可用： Ihshi:said=ep02mg1301,rip=“10.26.36.37”;来消除告警。谢谢！

展开阅读全文

爱立信常见故障处理

最新文档