word华为LTE指标监控指导书一、 指标监控内容和KPI指标定义1. 主要监控内容话统KPI主要包括以下几大类:接入性指标、保持性指标、移动性指标、业务量指标、产品运行类指标、系统可用性指标和网络资源利用率指标通过上述重点话统KPI指标的监测,可以达到:识别突发问题、风险提前预警、话统KPI的稳定与提升,目前TD-LTE系统需要重点关注的话统KPI指标如下表:指标分类数据来源具体的KPI指标接入性指标无线侧RRC连接建立成功率ERAB建立成功率无线接通率保持性指标无线掉话率E-RAB掉线率移动性指标eNodeB内切换出成功率eNodeB间切换出成功率同频切换成功率异频切换成功率切换成功率业务量指标上、下行业务平均吞吐量量上、下行PRB平均利用率干扰指标系统上行每PRB子载波平均干扰噪声网络资源指标无线侧上行PRB资源使用的平均个数下行PRB资源使用的平均个数2. KPI指标公式定义请参考附件中OMC920对应指标定义:二、 数据提取方法1. OMC自定义指标以eNB间切换成功率为例: 1、查看工具栏,点击自定义指标管理,选择功能子集模块eNODEB,选择测量族和测量组〔指标所在的测量族请参考文档《中国移动集团要求上报TDD LTE网络指标V2.1.8》〕,如图1:图12、右击系统内切换出测量,选择添加后出现如下图窗口,输入指标名称〔注意单位的选择〕,填写公式后,点击应用图23、在自定义指标管理界面找到定义的指标,右击,选择测量设置,如图3图34、在弹出的窗口,如图4,勾选新对象自动测量,点击应用,完毕。
图42. KPI指标提取1、点击结果查询,选择新查询,选择对象,如需选取局部站点〔点击第一个对象后,按住“Shift〞键,再点击最后一个站点,可将这些对象全选〕,如图5图52、选取需要查询的指标和对应的周期类型,如图6,按需要选择日期X围和时间方式,如图7图6图73、指标查询结果如图8图83. 告警提取常见告警分类表告警等级告警号告警名称本机网管紧急网元连接中断ENODEB重要29243小区服务能力下降告警重要19240小区不可用告警重要26205BBU单板维护链路异常告警重要29207基站控制面传输中断告警重要25621直流输出异常告警重要26276制式间站点配置冲突告警重要26238RRU组网拓扑类型与配置不一致告警重要BBP心跳检测失败告警重要26529射频单元驻波告警重要26322BBU测收发光异常重要26503RRU测收发光异常重要26233BBU IR光接口性能恶化告警重要29201S1接口故障告警重要25888SCTP链路故障告警重要26235射频单元维护链路异常告警重要26506RRU测光口性能恶化重要26260系统时钟不可用告警主要告警分析和常见的处理手段下面以“网元链路中断〞为例说明如何查看和处理常见告警,其他告警类可查看附件内容。
〔附件:〕示例:【网元中断】●告警解释:网元与OMC网管之间的中断,一般来讲,为断电或传输问题● 对系统的影响 对该网元无法控制 ● 告警处理序号处理方法“是〞“否〞1检查同一环路下基站是否全部中断(基站侧检查光路和电源是否OK.) 2 32通知传输中心处理433通知机房巡检处理故障(基站侧更换传输光模块/光纤)44完毕三、 坏小区〔TOP小区〕查找和分析处理每小时对上一个小时的全网整体指标进展提取,如果指标变化波动较大,需提取小区级别指标进展查看,将小区级的掉话率指标和掉话绝对次数按从高到低的顺序进展排序, 确认是全网的整体问题还是TOP小区引起的指标波动,假如剔除TOP小区后,指标恢复正常,如此是TOP小区问题,优先分析掉话绝对次数多且掉话率高的Top小区;否如此是全网性问题,以下是关于TOP小区筛选的方法和主要KPI处理方法流程:1. 接入性TOP分析处理1.1.1 指标定义指标分类数据来源具体的KPI指标指标定义接入性指标OMC920RRC连接建立成功率RRC连接建立完成次数/RRC连接请求次数〔不包括重发〕ERAB建立成功率E-RAB建立成功总次数/E-RAB建立尝试总次数无线接通率RRC连接建立成功率*E-RAB建立成功率1.2 指标分析与统计点介绍l RRC连接建立成功率图1中【A点】〔1〕指标L.RRC.ConnReq.Att加1,不统计重发的次数。
Case1:eNB下发RRC_Conn_Setup消息后,在T300定时器超时前,收到一样的UeID发起的RRC_Conn_Req〔Setup丢失,UE MAC冲突解决定时器超时后重发RRC_Conn_Req,UeID不变〕,记为一次重发RRC_Conn_Req消息Case2:T300超时后,UE仍未收到RRC_Conn_Setup,UE重新搜网,发起初始接入,UeID是取0~239的随机值或上层下发的TMSIeNB侧记为新的一次初始接入,L.RRC.ConnReq.Att加1Case3:发起Attach后会启动T310定时器如果UE发出RRC_Conn_Setup_Cmp后,ENB没有收到,UE会在定时器超时后重新发起Attach,ENB侧记为新的一次初始接入;RRC_Conn_Setup_Cmp丢失不会触发重建,发起重建的前提是安全已经激活〔2〕如果RRC Connection Request消息信元Establishment Cause为“emergency〞,指标L.RRC.ConnReq.Att.Emc加1〔3〕如果RRC Connection Request消息信元Establishment Cause为“highPriorityAccess〞,指标L.RRC.ConnReq.Att.HighPri加1。
〔4〕如果RRC Connection Request消息信元Establishment Cause为“mt-Access〞,指标L.RRC.ConnReq.Att.Mt加1〔5〕如果RRC Connection Request消息信元Establishment Cause为“mo-Singnalling〞,指标L.RRC.ConnReq.Att.MoSig加1〔6〕如果RRC Connection Request消息信元Establishment Cause为“mo-Data〞,指标L.RRC.ConnReq.Att.MoData加1B点】当eNodeB下小区接收到UE发送的RRC Connection Request消息并下发RRC Connection Setup消息给UE时,指标L.RRC.ConnSetup加1C点】当eNodeB收到UE返回的RRC Connection Setup plete消息时统计相应指标,L.RRC.ConnReq.Succ加1RRC Setup Success Rate计算: RRCSetupSuccessRate=〔L.RRC.ConnReq.Succ〕/(L.RRC.ConnReq.Att)*100%l E-RAB建立成功率如图2、3中【A点】所示,当eNodeB收到来自MME的E-RAB SETUP REQUEST或者INITIAL CONTEXT SETUP REQUEST消息时统计该指标。
如果E-RAB SETUP REQUEST或者INITIAL CONTEXT SETUP REQUEST消息中要求同时建立多个E-RAB,如此相应指标按各个业务的QCI分别进展累加B点】当MME收到来自eNodeB的E-RAB SETUP RESPONSE或者INITIAL CONTEXT SETUP RESPONSE消息时E-RAB建立成功次数累加ERAB Setup Success Rate计算公式:ErabSetupSuccessRate=〔L.E-RAB.SuccEst〕/(L.E-RAB.AttEst)*100%1.3 TOP小区分析和处理Ø 处理流程和方法通过对TOP小区建立失败的原因进展观察,通过对不同的原因做相应的观察,不同失败原因对于相应指标有不同的变化,应对观察指标和优化策略均不同,下表为指标提取的建立失败的不同原因分类和相应说明:① 小区RRC建立失败次数:1、□ 资源分配失败而导致RRC连接建立失败的次数,指标ID:1526727083;重点关注top资源是否足够,包括top用户数,传输、PRB等;2、□ UE无应答而导致RRC连接建立失败的次数,指标ID:1526727084;关注质差、干扰、无线环境等;3、□ 小区发送RRC Connection Reject消息次数,指标ID:1526728269;关注传输问题、是否拥塞、干扰;4、□ 因为SRS资源分配失败而导致RRC连接建立失败的次数,指标ID:1526728485;重点关注SRS带宽、配置指示、配置方式、SRS ACK/NACK设置是否合理等;5、□因为PUCCH资源分配失败而导致RRC连接建立失败的次数,指标ID:1526728486;关注PUCCH信道相关参数设置是否合理,CQI RB数配置是否合理等;d6、□流控导致的RRC Connection Request 消息丢弃次数,指标ID:1526728489;关注拥塞,业务流控相关参数是否设置正确等;7、□流控导致的发送RRC Connection Reject消息次数,指标ID:1526728490;关注拥塞,业务流控相关参数是否设置正确等; ②对小区E-RAB建立失败次数:1、□因未收到UE响应而导致E-RAB建立失败的次数,指标ID:1526726717;处理建议:需排查覆盖,干扰,质差,ENODEB参数设置错误,终端与用户行为异常等原因。
2、□核心网问题导致E-RAB建立失败次数,指标ID:1526728276;处理建议:需跟踪信令,排查核心网问题〔EPC参数设置,TAC码设置的一致性,对用户开卡限制,硬件故障方面排查〕;3、□传输层问题导致E-RAB建立失败次数,指标ID:1526728277;处理建议:需查询传输是否有故障,高误码,闪断,传输侧参数设置问题4、□无线层问题导致E-RAB建立失败次数,指标ID:1526728278;处理建议:处理建议:需排查覆盖,干扰,质差,ENODEB参数设置错误,终端与用户行为异常等原因5、□无线资源不足导致E-RAB建立失败次数,指标ID:1526728279;处理建议:1、排查TOP小区资源是否足够,是否故障引起,假如存在资源不足问题,可考虑参数调整,流量均衡〔小区选择,重选和切换类参数〕;2、结合现场调整天馈,流量均衡;3、热点区域,增补基站等;6、□安全模式配置失败导致E-RAB建立失败次数,指标ID:1526728280;处理建议:需排查覆盖,干扰,质差,ENODEB参数设置错误,终端与用户行为异常等原因在一般正常情况下建立失败的通常为无线侧问题导致的可以处理,具体常见处理方法。