关于印发《邵阳移动网络故障管理办法》的通知各县(市、区)分公司、各专业维护中心:现将《邵阳移动网络故障管理办法》印发给你们,请认真组织学习,严格遵照执行 二○一三年一月十八日邵阳移动网络故障管理办法第一章 总则第一条 为加强全市移动通信网络故障的管理,确保全网通信高质高效运行,依据集团及省公司相关管理办法要求,结合我市实际情况,特制定本办法第二条 本办法适用于移动交换网、无线网、传输网、数据网、通信配套系统、MDCN网及相关支撑系统等第三条 各级维护单位应树立全程全网运行维护管理的基本思想,搞好全程全网的协作配合,迅速准确地解决网络故障,减少业务损失,保证全网的运行质量和客户通信畅通做到所有设备有人管、事事有人负责同时吸取既发故障不足和教训,避免后续类似故障的发生第四条 本办法的解释和修改权属中国移动通信集团湖南有限公司邵阳分公司网络部第二章 网络故障的定义和级别第五条 网络故障包含业务故障和设备故障,是指一个或多个通信设备不能正常运行,严重时造成业务质量下降甚至中断,给用户正常使用带来影响的通信事故由于割接、升级、调整等造成的规定时间内的设备或业务中断,不计入网络通信故障。
第六条 故障的时间定义1.网络故障发生时间按照以下顺序判定:第一按照网管系统出现相关告警的时间判定;第二按照系统日志中出现相关障碍的时间判定;第三按照计费系统收到该系统的最后一张计费话单的时间判定;第四在信令监测系统或数据业务监控系统具备监控条件的情况下,以监测系统监测到的最后一个完整信令流程作为故障发生时间;第五按照客户服务部门收到第一个用户投诉的时间判定故障发生时间2.业务故障恢复时间:通过网管性能系统确认业务已恢复,且计费正常的时间3.业务故障历时:业务故障发生至业务恢复之间的时间间隔,即业务故障历时=业务恢复时间-业务故障发生时间4.设备故障恢复时间:网管系统中该故障的相关告警信息完全消除的时间,其次是系统日志中该故障恢复正常的时间5.设备故障历时:设备故障发生至设备故障恢复之间的时间间隔,即设备故障历时=设备恢复时间-故障发生时间第七条 根据故障对业务的影响情况以及故障持续时间,故障级别由重到轻依次分为重大故障、严重故障和一般故障三级重大故障见《湖南移动全网重大通信故障定义》;严重故障见《湖南移动全网严重通信故障定义》;一般故障是指除重大故障和严重故障之外的其他故障第三章 职责和分工第八条 故障管理设备分工界面1、本地维护设备包括:(1)无线网:XCDR 、BSC、RNC、BTS、NodeB、PCU、WLAN。
2)传输网:城域传输网核心层/骨干汇聚层、接入层3)数据网:MDCN网、IP城域网、CMNET网等4)动力系统:本地维护设备相关的动力配套设备、其他已经明确由分公司维护的机房动力及配套设备5)根据核心网集中维护管理办法,负责属地设备的属地化维护工作2、与集中维护设备相关的机房现场和设备,包括但不限于:属地化维护、机房安全及管理、机房布线、动力及配套设备、工程随工、环境卫生等,按照属地的原则,由设备属地维护所在维护单位负责第九条 市公司网络部职责1、负责制定全网故障处理流程和办法,并组织全市各级维护单位进行学习2、调度应急资源,指挥网络故障的抢修处理3、根据故障的原因对业务的影响程度,按照相关办法负责对网络故障进行考核4、针对严重影响业务的重大故障,根据相关要求组织市公司相关维护单位、县(市、区)分公司召开故障分析会,分析故障原因5、对于严重影响业务的重大故障,负责下发故障通报第十条 网络调度中心的职责1、负责网络故障的集中监控、收集统计,并及时向相关领导及省公司汇报,其主要职责为:(1)及时发现故障告警,并派发(或转派)网络监控工单;(2)及时受理、处理省公司网络监控工单(或),如为重大故障应10分钟内受理监控工单,并及时通知本公司相关专业人员及相关领导。
故障恢复后,应在30分钟内通知省网管中心监控值班人员,及时回复监控工单,并详细说明故障原因、故障影响范围、故障处理情况等3)及时将相关维护管理人员上报的故障信息,按相关要求以工单(或先以方式上报,后补报故障工单)方式上报省网管中心如为重大故障应在故障发生后30分钟内通过省内EOMS向省网管中心上报重大故障工单;应在重大故障消除后30分钟内在EOMS重大故障上报工单中填写消障时间(如影响业务还需填写业务恢复时间);应在重大故障恢复后36小时内,以工单附件提交故障分析报告4)督促各县(市、区)分公司及各维护部门发布网络故障资讯及工程预约5)负责保管监控机房配备的固定、外网移动(联通或电信),确保能够正常使用2、负责对本地网维护设备故障处理进行跟踪与督办3、负责对全市故障进行分析和总结第十一条 交换IT中心的职责1、负责交换网相关设备、交换网管系统设备的维护、交换故障处理、故障分析及交换故障录入工作,并按故障通知流程及时向分公司相关领导汇报2、负责数据网(MDCN、IP承载网接入设备)相关设备的维护、故障处理、故障分析及故障录入工作,并及时向网络调度中心上报故障处理过程、处理结果、故障类型及故障具体原因。
3、故障处理完成后,及时对故障处理过程、处理结果、故障类型及详细故障原因进行记录4、根据市公司网络部的网络故障管理办法制定交换网、数据网专业的故障处理流程第十二条 网络优化中心的职责1、负责BSC、XCDR、RNC, OMC、WLAN的维护、故障处理、故障分析及故障录入工作,并及时向网络调度中心上报故障处理过程、处理结果、故障类型及详细故障原因2、配合县(市、区)分公司及代维公司处理无线网重大或疑难故障3、根据市分公司网络部的网络故障管理办法制定无线网专业的故障处理流程第十三条 传输动力中心职责1、负责做好一干邵阳段、二干邵阳段、本地网、城域网维护工作、传输城域网网管以及动环配套、视频监控设备各项维护、故障处理、故障分析及故障录入工作,并及时向网络调度中心上报故障处理过程、处理结果、故障类型及故障具体原因2、配合县(市、区)分公司及代维公司处理传输网及动力、环境监控设备的重大或疑难故障3、根据市分公司网络部的网络故障管理办法制定传输网专业及动环配套专业的故障处理流程第十四条 全业务部职责1、负责IP城域网、CMNET、集团专线、互联网的维护、故障处理及故障分析工作,并及时向网络调度中心上报故障处理过程、处理结果、故障类型及详细故障原因。
2、配合县(市、区)分公司及代维公司处理集团专线、互联网重大或疑难故障3、根据市公司网络部的网络故障管理办法制定故障处理流程第十五条 县(市、区)分公司职责1、负责本县(市、区)分公司相关设备的维护、故障处理、故障分析及故障录入工作,并及时向网络调度中心上报故障处理过程、处理结果、故障类型及故障具体原因2、协助本县(市、区)分公司代维人员处理无线及传输网重大或疑难故障3、根据市分公司网络部的网络故障管理办法制定本县(市、区)分公司故障管理办法及处理流程第四章 故障的监控和上报第十六条 故障监控要求1、负责对未纳入集中监控范围的本地移动网络各专业设备或系统进行7×24小时实时监控,及时监控上述各网元的各级告警和故障,负责全市所有机房的动力环境、网络安全的监控2、监控手段以浪潮监控平台为主,同时利用本地终端,每30分钟内查看一次所负责监控各网元上的各类告警信息,力争在故障发生的第一时间发现故障,有效压缩故障历时3、负责7×24小时受理省公司派发的监控工单、故障工单、网络投诉工单、生产任务工单,根据维护职责通知相关人员处理,并在规定时限内回单第十七条 故障上报要求为保障移动通信的服务质量,提高故障处理时效,必须严格执行故障逐级上报制度。
1、属于我市监控和维护的设备遇到重大故障、严重故障、基站批量退服(20个及以上),在10分钟内先分析判断、定位,确定故障发生的大致区域和基本性质后,在5分钟内应通知相关维护人员、各维护中心主任或各县(市、区)分公司经理、网络部领导、主管领导2、根据网络部指示及时将故障情况上报省监控中心上报省网管中心时,应主动交换双方工号或姓名,上报故障的分公司应详细地将故障发生时间、故障发生地点、故障现象、故障影响范围、故障对业务可能产生的影响报告省网管中心,对于一时不能确定的故障原因、故障范围、对业务的影响程度等情况,在上报后,必须在1小时内通过电子运维系统补报省网管中心,并在故障处理过程中及时上报处理情况3、对于影响业务的重大故障或造成大量客户投诉的重大事件,在按照故障上报的生产流程上报的同时,及时向省公司网络部相关人员进行沟通联络,包括将发生时间,事件影响范围,初步诊断原因等信息,以便及时调动各种资源尽快处理恢复4、故障恢复后的上报要求故障恢复后,故障处理单位须及时向网调中心反馈故障原因,网调中心将故障恢复信息15分钟内短信通知相关领导及维护人员,内容包括故障的开始时间、恢复时间、初步原因、影响范围。
对于需上报省公司的故障,网调中心必须在请示故障处理单位和网络部后向省公司上报故障原因5、工信部及集团公司定义的重大故障上报要求(1)对于重大故障(定义见附件),依据《关于对中国移动通信网重大故障上报工作的补充说明》( 网通[2008]848号)的要求,网调中心在达到故障级别后30分钟内,报市公司网络部、市公司主管领导审批后,填写集团EOMS《重大故障上报工单》的“故障信息”报省公司随后及时更新EOMS《重大故障上报工单》的“故障处理情况”报省公司2)在重大故障消除后48小时,报市公司网络部、市公司主管领导审批后,通过EOMS《重大故障上报工单》的“报障人附件”提交《重大故障处理报告》第五章 网络故障的抢修处理第十八条 各级维护单位在进行全程全网故障管理时,应本着先局内后局外、先本端后对端、先网内后网外的原则,按照具体路由接续方式,查清障碍段落对于影响通信的故障,应按照“先抢通、后恢复”的原则进行处理,确保将业务损失减少到最小第十九条 各级维护单位应建立故障处理的多专业联动机制,构建矩阵式的应急抢修团队一是根据各专业设备特性,明确多专业联动机制的触发条件二是明确多专业联动机制的调度责任岗位,实现有序调度。
三是明确各专业在联动机制触发后的响应速度和操作规范第二十条 各级维护单位应根据网络故障处理流程以及相关设备的重大紧急障碍处理流程,结合网络实际情况,制定各专业的网络故障处理流程和应急处理方案库,并及时更新第二十一条 市公司相关维护单位故障抢修处理要求:1.市公司相关维护单位在接到故障通知后,应牵头组织抢修对于重大故障和1小时内未恢复的严重故障、2小时内未恢复的一、二干光缆故障(以故障发生初步确认的级别为依据),市公司相关维护单位必须尽快派人赶到网调监控机房(原则上45分钟内),组织抢通抢修2.对于影响全市性业务的重大故障,市公司网络部、相关维护单位应组织技术力量,在接到通知后赶赴现场(邵阳城区原则上45分钟内、邵阳郊区1小时内,其他县(市)视情况尽快赶赴现场),指挥调度应急资源,协调组织督促解决,迅速恢复通信,压缩故障历时3.对于重大故障,市公司相关维护单位每小时向市公司网络部领导汇报,并对故障进行全过程的跟踪,协助调度资源第二十二条 县(市、区)分公司协助配合市公司故障处理要求:对于重大、严重故障,各县(市、区)分公司网络部主任和相关维护员接到通知后赶赴现场,组织抢通抢修对于重大故障、一干光缆故障、1小时内未恢复的严重故障、2小时内未恢复的二干光缆故障(以故障发生初步确认的级别为依据),要求县(市、区)分公司主管领导赶赴现场。
到达故障现场的时限要求为:原则上在接到通知后5分钟内出发;10公里内30分钟到达现场;50公里内,1小时到达现场;50-100公里,2小时到达现场;100-150公里,2.5小时到达现场未到达现场之前,应指挥故障抢修第六章 网络故障损失的核算第二十三条 对每起故障,主要考虑从4个方面核算受影响情况1.影响通信能力(单位:用户×小时 ):以故障时的可能提供的通信能力,亦即可能用户数在这段时间的累计(积分)来估算在实际计算中我们以历史同期发生的呼叫总次数作为初始值,通过用户拨打(使用业务)系数 A 次/用户*小时 计算得到2.影响用户数(用户):以通信能力在故障时段的小时平均来估算,也就是平均每个小时影响了多少用户3.影响业务量(Erl、次、条...):各种网元故障所影响业务量(单位:Erl、次、条…)的核算,均以故障时可能发起业务的总量来估算4.经济损失(元):以故障时可能创造的业务收入来估算第二十四条 需核算业务受影响情况的故障定义主要分"通信全阻"和"非通信全阻"2类对于不同类别的故障,核算要求不同通信全阻类故障需要核算“影响通信能力”、“影响用户数”、“影响业务量”、“经济损失”4项指标;非通信全阻类故障只需核算“影响业务量”、“经济损失”2项指标。
第二十五条 对于影响业务的故障,参照《全网重大通信故障影响业务核算表》如实核算影响业务情况后上报第七章 网络故障的分析第二十六条 一般故障、严重故障、重大故障处理完成后,各级维护部门必须在电子运维系统上做好详细的记录,并定期对故障现象和处理情况进行汇总统计故障记录内容应包括故障现象、故障类型、故障起始时间、故障修复时间、故障历时、故障原因分析、故障处理情况及责任分析、故障处理人等故障结束后,在电子运维系统的故障经验库中录入重大故障和具有典型性的一般故障的处理过程,作为同类故障处理的借鉴经验第二十七条 市公司相关维护单位和县(市、区)分公司网络维护部门应建立有效的日常性网络故障分析制度,每月都要对网络故障情况进行全面分析、总结,找出工作中的不足并及时加以改进第二十八条 重大故障排除后,市公司相关维护单位应组织县(市、区)分公司主管领导、相关技术人员和厂家参加的专题分析会议,进行故障原因分析,找出故障真正原因,制定下一步的解决措施同时将故障情况向全市进行通报第二十九条 每个月5个工作日前,市网调中心将上个月的故障进行汇总并初步定级,并报网络部审核第八章 责任追究第三十条 严格按照故障的上报和处理要求进行故障处理,并在故障规定处理时限内处理好故障,凡是未按照、未达到以上要求的,按照《邵阳移动网络运行质量竞赛办法》或其它相关考核、竞赛办法的要求进行考核。
第三十一条 对于重大故障,要严格责任追究,凡因人为原因造成网络故障特别是重大网络故障发生的,一定要按照《网络故障责任追究管理办法》追究相关人员的责任,并加大处罚力度第三十二条 在故障处理中违反了以上规定,影响了故障的及时处理,对通信造成严重影响的,将追究责任单位和责任人的相关责任,情节特别严重的将追究相关法律责任第九章 其它第三十三条 各县(市、区)分公司和市公司相关维护部门对于凡是涉及可能影响业务的操作,必须在凌晨0:00-5:00的话务闲时进行对于厂家技术人员进入机房操作,必须建立相关制度和流程,要求在相关领导审批同意后方可进入,操作的全过程必须有局方维护人员全程陪同进行,在操作过程中出现问题,所造成的损失由厂家全部负责对于厂家技术人员需远程进行登陆操作时,必须严格按照相关信息与安全管理办法进行第三十四条 此前其他文件中对故障的定义如与本办法的定义不一致,以本办法为准第三十五条 本办法自下发之日起执行附件:1.移动网络故障处理流程图2.网络故障分析处理流程图3.湖南移动全网重大通信故障4.湖南移动全网严重通信故障5.湖南移动全网重大通信故障影响业务核算表6.中国移动重大故障和重大安全事件上报管理办法7、故障通知流程 。