故障汇总报告

上传人:飞****9 文档编号:139807309 上传时间:2020-07-24 格式:DOC 页数:4 大小:69KB
返回 下载 相关 举报
故障汇总报告_第1页
第1页 / 共4页
故障汇总报告_第2页
第2页 / 共4页
故障汇总报告_第3页
第3页 / 共4页
故障汇总报告_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《故障汇总报告》由会员分享,可在线阅读,更多相关《故障汇总报告(4页珍藏版)》请在金锄头文库上搜索。

1、XXXXXXXXX 故 障 汇 总 报 告【二零壹参年壹月陆月】 报告人: 报告时间:2013-07-10 内容摘要: 1、故障内容概述。2013上半年度重大故障汇总。2、故障原因分析重大故障原因分析。3、故障总结、后续工作重点故障总结、后续工作安排。各位领导好: 首先感谢贵方选用我司的WLAN系列产品。在此我们对上半年所有在网设备发生的重大故障做一个汇总并加以分析,并对我们的工作内容进行调整;以保证我司设备运行更稳定。同时也敬请各位领导对我们维护工作中的不中足之处提出重要建议。一、故障内容概述:1、设备概况: 目前在网的AC设备26组,AP两万台以上(包含:室内AP、村通、大覆盖)。具体信息

2、见下表: 地市7605I8610AQ2000-ENH AQ2000-E2AN2 AQ3000AF4000AF3120AF3120-N榆林1191087820821590延安1126535163242咸阳219793004374503宝鸡22806172944020750西安22624铜川197240545渭南12753114564710070安康31113387318812900汉中1210361339220205268112商洛4473641257430合计141264269923231923042921122、重大故障统计: 在过去的半年中,我司设备故障较多(14次),平均每台设备发一次故

3、障。经过对比分析,共有9个故障。故障汇总如下:序号地市故障现象简述故障次数设备型号1咸阳1号业务板下AP设备离线,手动使AP上线后用户无法接入网络,AC自动重启1Autex86102咸阳某一业务板下挂的热点断电再来电后用户出现无法打开PORTAL页面以及无法认证的情况2Autex86103咸阳陕西服装学院用户无法打开认证页面,现场用户可以搜索到CMCC-EDU信号,可以获得业务IP地址,但无法推送认证页面,认证用户流量显示为01Autex86104咸阳4号业务板数据丢失1Autex86105咸阳AC自动重启2Autex86106宝鸡AC掉死,现场测试无信号1Autex86107宝鸡PING不可

4、达告警,不用认证直接登录,但用户上网正常1Autex7605i8榆林SNMP协议间隙性不同1Autex86109汉中用户不能认证,提示浏览器异常4Autex8610二、故障原因分析、故障进展地市故障现象简述故障原因是否彻底解决咸阳1号业务板下AP设备离线,手动使AP上线后用户无法接入网络,AC自动重启AC设备软件存在漏洞,对于dbus和主线程处理用户表项时,未加线程互斥锁;导致收到用户离线报文,主线程删除用户,同时在dbus侧调用该用户的相关参数,导致asd模块挂死,asd模块异常,频繁调用dbus,导致dbus收发包拥塞,AP接入关键进程WID需要dbus通信,dbus繁忙时会出现AP频繁上

5、下线问题,由于asd进程长时间异常导致AC自动重启2.0.18SP7已经解决咸阳某一业务板下挂的热点断电再来电后用户出现无法打开PORTAL页面以及无法认证的情况当热点断电再来电后,CMCC与CMCC-AUTO用户突然占用了同一个端口,导致EAG(负责用户认证的模块)服务锁死,用户出现打不开PORTAL以及无法认证的现象2.0.18SP7已经解决咸阳陕西服装学院用户无法打开认证页面,现场用户可以搜索到CMCC-EDU信号,可以获得业务IP地址,但无法推送认证页面,认证用户流量显示为0现网配置的是iptables授权,从iptables取流量。iptables授权和取流量需要调用某个接口函数,从

6、日志看,每次调用该函数都失败了,导致给用户的授权和取流量也失败了2.0.18SP7已经解决咸阳4号业务板数据丢失FD指针耗尽导致配置丢失2.0.18SP7已经解决咸阳AC自动重启由于nat内存模块在使用了rcu锁之后,没有使用call_rcu去free该内存模块,而是直接free掉。导致非法内存访问,令内核挂掉,从而导致整机异常重启补丁解决,已实施宝鸡AC掉死,现场测试无信号内核异常2.0.18SP7解决宝鸡PING不可达告警,不用认证直接登录,但用户上网正常EAG模块掉死Autex7605i榆林SNMP协议间隙性不同SNMP进程占用内存过高,导致进程重启006补丁解决,未实施汉中用户不能认证

7、,提示浏览器异常eag模块异常建议升级2.0.18SP7三、故障总结,后续工作重点:从上半年发生的故障分析得出结论,造成故障原因如下:1、 设备软件BUG。2、 与其它设备厂商的配合、组网等。针对故障原因,我们会在以下方面做出改进:1、加强与贵方维护人员、我司产品技术支持中心的沟通。对于其它省市已知发现的故障引患,在第一时间拿到解决方案(补丁或软件更新)并进行部署工作。避免因为已知的故障引患,造成设备重启、断网等重大事故。此事由我司李永强专人负责。2、加强设备巡检工作,提高巡检频率。由目前的一天一次提高到一天两次。由各地市常驻人员负责。3、发生重大故障后,由专人(地市技术负责人,目前有5位资深工程师,分别负责各地市)负责恢复业务,对故障进行跟踪直到处理完成;在处理故障及时给贵方汇报故障处理进展。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 总结/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号