浙江移动——MISC OMC 维护经验介绍

上传人:夏** 文档编号:570652328 上传时间:2024-08-05 格式:PPT 页数:47 大小:1.84MB
返回 下载 相关 举报
浙江移动——MISC OMC 维护经验介绍_第1页
第1页 / 共47页
浙江移动——MISC OMC 维护经验介绍_第2页
第2页 / 共47页
浙江移动——MISC OMC 维护经验介绍_第3页
第3页 / 共47页
浙江移动——MISC OMC 维护经验介绍_第4页
第4页 / 共47页
浙江移动——MISC OMC 维护经验介绍_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《浙江移动——MISC OMC 维护经验介绍》由会员分享,可在线阅读,更多相关《浙江移动——MISC OMC 维护经验介绍(47页珍藏版)》请在金锄头文库上搜索。

1、MISC OMC(SOMP) 维护经验交流浙江移动通信公司浙江移动通信公司SOMP一期建设介绍一期建设介绍目目 录录SOMP一期一期功能介绍功能介绍SOMP 维护经验总结维护经验总结MISC OMC(SOMP)建建设背景背景 目前,全国共建目前,全国共建设完成了完成了27套套 MISC系系统,作,作为数据数据业务管理平台,其重管理平台,其重要性日益要性日益显著。著。MISC系系统设备量多,量多,结构复构复杂,不利于,不利于维护。因此如何提高。因此如何提高和加和加强MISC系系统的的维护管理已成管理已成为当前需要迫切解决的当前需要迫切解决的问题。 为此集此集团公司公司选择在浙江在浙江进行了行了M

2、ISC OMC-SOMP的开的开发试点工作。点工作。MISC OMC功能分两期功能分两期实现,一期主要,一期主要实现基本的告警基本的告警监控和数据控和数据维护功能,功能,开开发工作从工作从3月月5日开始,日开始,历时2个半月个半月终于在于在5月月17日正式部署上日正式部署上线。 SOMP一期建设介绍一期建设介绍目目 录录SOMP一期一期功能介绍功能介绍SOMP维护经验总结维护经验总结SOMP一期功能介一期功能介绍主要功能模主要功能模块包括包括系系统监控:拓扑控:拓扑视图、树型型视图、实时告警、告警、历史告警、告警史告警、告警规则设置置性能管理:性能管理:实时性能性能显示、示、历史性能史性能查询

3、、MISC性能指性能指标统计报表:表:业务质量量报表、系表、系统运行运行报表、系表、系统告警告警报表表配置管理:配置管理:MISC部署信息、部署信息、MISC产品信息、品信息、MISC配置、配置、WAP配制配制IP网网络监测:WAP 业务跟踪、跟踪、MISC业务跟踪跟踪权限管理限管理个人个人资料管理料管理其中“系统监控”是使用最频繁,也是最实用的工具。它能在最短的时间内让维护人员了解系统的健康状况。 系系统监控控拓扑管理拓扑管理展示了系统的分层拓扑视图,维护人员可以通过一张图看到整个系统的结构和运行情况,同时也可以点击进入一组设备,察看详细情况当有告警产生时,相应的设备会有告警提示,以便维护人

4、员能及时发现处理拓扑视图可以进行修改配置,便于维护人员在网络拓扑发生变化和系统扩容后对拓扑图进行调整拓扑管理截图系系统监控控树型型视图树型视图可以展示所有网元设备的性能状况,包括CPU、内存、磁盘空间、主要进程等通过树型视图可以对告警的阀值进行配置和修改告警的刷新、告警的刷新、编辑拓扑拓扑视图和和树形形视图的不同使用的不同使用 拓扑拓扑视图和和树形形视图是系是系统监控的不同呈控的不同呈现方式,拓扑方式,拓扑视图能展能展示系示系统的整体网的整体网络结构,能直构,能直观的反的反应告警或故障在网告警或故障在网络中所中所处的位的位置,即使置,即使监控人控人员不是很了解系不是很了解系统的的组成,也能迅速

5、的判断告警或故成,也能迅速的判断告警或故障的位置,及障的位置,及时通知通知设备维护人人员。 但是由于空但是由于空间的限制,拓扑的限制,拓扑视图所提供的信息是有限的,因此所提供的信息是有限的,因此对于熟悉系于熟悉系统架构的架构的维护人人员,树形形视图更更为适合。因适合。因为树形形视图能提能提供更全面的供更全面的设备信息,不信息,不仅包括包括CPU、内存、磁、内存、磁盘空空间,更包括了,更包括了对部署在主机上的重要部署在主机上的重要进程的程的监控(如包月控(如包月话单进程、程、BOSS同步同步进程)程),数据,数据库表空表空间、连接数等。接数等。树形形视图中中对“应用用监控控”的使用的使用 在在树

6、形形视图中,有一中,有一项是是“应用用监控控”。其原理是使用模。其原理是使用模拟消息从内网消息从内网对业务或或设备进行行测试,比如,比如对www portal、wap portal、sso登登陆进行行业务测试(比如从内网(比如从内网模模拟用用户访问WAP的首的首页地址:地址:http:/10.203.25.1:18001的的 消息包,消息包,测试反反应结果),果),对MISC WebService 接口接口监控、控、MISC Socket 接口接口监控等,从控等,从测试响响应结果和果和时长,从而判断从而判断业务是否正常。是否正常。维护人人员可以根据本省的可以根据本省的实际需求来需求来设置需要置

7、需要测试的接口和的接口和业务。模。模拟包的包的发送送频率是可率是可设置的(一般置的(一般为5分分钟)。)。对应用的用的监控能比控能比较直直观的反的反映映业务使用是否正常(特使用是否正常(特别是是WAP这类用用户比比较不敏感的不敏感的业务),使),使维护人人员能在用能在用户投投诉之前之前发现解决解决问题)。)。通通过“树形形视图”对监控控项的配置的配置 对监控控项和告警和告警阀值的的设置可以通置可以通过“树形形视图”来来实现。维护人人员可以可以根据网根据网络的的实际情况,有情况,有选择地添加相地添加相应的的设备或或监测项,同,同时也能也能对告警告警的的门限限进行行设置,方便了置,方便了对网网络系

8、系统的的监测和管理。和管理。 除了除了对系系统常常规的的CPU、内存、磁、内存、磁盘的的监控控项外,外,设置置对系系统重要重要进程程的的监控,能控,能让维护人人员及及时了解系了解系统应用是否正常,比如在主机上的用是否正常,比如在主机上的listener、outcom、monthfeereq、monthfeeresp等重要等重要进程,特程,特别是和是和DCS刷新刷新相关的相关的单点点进程(如果部署在一台程(如果部署在一台kernel上上DCS服服务端端单点点进程出程出现出出现问题,就会,就会导致整个系致整个系统的阻塞)的阻塞)系统监控告警管理告警管理告警分为实时告警、历史告警(实时告警通过确认、

9、清除后成为历史告警) 在“树形监控”中所列出的各台设备的告警将汇总到告警管理界面中呈现(这些告警同时也被送到IP网管)。通过“告警管理”中的实时告警查看当前需要处理的告警。 维护人员可以通过“历史告警”对发生过的告警进行分类查询(按告警等级、告警设备类型等),通过历史告警的查询能让维护人员了解哪一类告警是频繁发生的,需要引起维护人员重视的,从而采取相应的解决措施。(如在历史告警中查询发现某台kernel的opt目录出现告警的频率很高,在分析后发现是系统日志没有被及时送到report主机,修改定时任务后,使告警频率明显减少。)告警管理截图性能管理介性能管理介绍性能管理分为实时性能、历史性能、MI

10、SC性能指标三部分实时性能以表格的形式呈现了系统每台设备当前CPU、内存、磁盘情况,并能以EXL的格式导出,便于维护人员制作各类报表。历史性能可以统计出单台设备在一段时间内的指标变化趋势,如CPU、内存的增长情况。维护人员能通过趋势曲线图判断设备的运行是否正常(如CPU、内存如果在短期内增长迅速就需要检查是哪些进程过多的消耗了系统资源或检查系统内核参数是否需要调整)性能管理截图性能管理介性能管理介绍MISC性能指标: 和MISC实时性能是两个不同的概念,MISC性能指标反映的是MISC系统重要接口的业务性能指标,主要是鉴权/批加接口、服务定购接口、定购同步接口等重要接口的消息量和成功率,这些消

11、息量的统计是通过计数器的方式实现的,反映的是当前系统的运行指标情况,统计的粒度从5分钟到1小时,可以设置。该指标是监控系统业务是否正常的重要手段,因为系统在设备硬件正常的情况下,也可能会由于软件运用的不正常引起业务流量或成功率异常,这些能通过性能指标及时得到反映。统计报表(表(业务报表)表) 业务报表包括表包括鉴权成功率情况,成功率情况,鉴权失失败的原因分布,的原因分布,维护人人员通通过对“非用非用户/SP原因引起的失原因引起的失败”进行分析,能及行分析,能及发现系系统中存在的中存在的问题,比如,比如9001错误、9005错误偏多,偏多,说明系明系统内部可能存在内部可能存在“阻塞阻塞”的情况,

12、需要的情况,需要对系系统进行行优化。化。 业务报表表还包括了定包括了定购同步、定同步、定购/取消成功率、包月取消成功率、包月话单成功率等成功率等统计指指标。 业务报表能表能让维护人人员对系系统的整体的整体业务量、量、业务分布情况、分布情况、业务运行运行质量等全局情况有所了解。量等全局情况有所了解。 统计报表截图统计报表(系表(系统报表)表) 系系统报表能帮助表能帮助维护人人员了解系了解系统中不同中不同类型消息的流量,系型消息的流量,系统忙忙时业务情况(情况(24小小时业务量分布),从而更好的核算承量分布),从而更好的核算承载消息的消息的设备是否是否满足需求。足需求。 维护人人员可以灵活的可以灵

13、活的选择某某类网元的来网元的来进行行统计,比如,比如选择BOSS到到DSMP发送送/接收消息的接收消息的总量、成功量、成功率。也可以量、成功量、成功率。也可以选择某一某一类消息如消息如鉴权/批价消息、定批价消息、定购同步消息、从而同步消息、从而对各各类消息消息进行行细分,有分,有针对性的性的对不同不同接口的不同消息接口的不同消息进行行优化,从而化,从而实现精精细化化维护。统计报表(告警表(告警报表)表) 告警告警统计能分日、周、月能分日、周、月对不同不同类型的告警型的告警进行分行分类统计,使,使维护人人员能能对系系统发生告警的生告警的频率、告警的率、告警的类型、告警的型、告警的设备等做出等做出

14、详细的的统计,为日常日常维护重点提供参考。重点提供参考。配置管理配置管理配置管理包括MISC产品信息、部署信息、WAP业务配置、MISC系统配置等功能维护人员通过配置管理可以对MISC平台进行系统参数、局数据(外部网元、号段、CITY等)、DCS刷新、定购关系查询、消息跟踪 等配置管理配置管理 通通过MISC配置信息、部署信息配置信息、部署信息维护人人员能能查询到目前系到目前系统中中的主机的信的主机的信息,包括主机的息,包括主机的IP、内存、硬、内存、硬盘、存、存储空空间、CPU等信息等信息,以及,以及业务程序的程序的配置信息,比如分布在配置信息,比如分布在业务程序分布在哪些主机上,是程序分布

15、在哪些主机上,是负载均衡均衡/主主备还是是单机等,包括承机等,包括承载这些程序的主机名称、主机些程序的主机名称、主机IP地址、地址、软件属性、运行状件属性、运行状态。另外另外还包括了中包括了中间件的部署信息。件的部署信息。这些些产品信息品信息使使维护人人员能随能随时了解了解设备情况,同情况,同时也减也减轻了了报表上表上报时的的统计的工作量。的工作量。配置管理截图配置管理配置管理 配置管理中主要包括系配置管理中主要包括系统参数配置、局数据配置、数据参数配置、局数据配置、数据库连接串配置等,接串配置等,由于大部分系由于大部分系统参数在系参数在系统建建设初就是确定的,因此使用并不多。使用比初就是确定

16、的,因此使用并不多。使用比较频繁的是局数据配置,特繁的是局数据配置,特别是号段数据和网元数据,其中号段数据可以通是号段数据和网元数据,其中号段数据可以通过一定格式的文本文件一定格式的文本文件导入、入、导出及出及查询功能,功能,简化了化了维护工作。当新增短信工作。当新增短信网关、彩信中心网关、彩信中心时,则通通过外部网元外部网元维护表、外部网元表、外部网元鉴权表表进行数据的添行数据的添加,同加,同时还需要在需要在startoutcomm.sh中增加中增加对该网元网元发起起连接的接的outcomm配配置置,并重启才能生效(目前并重启才能生效(目前这一步一步还没有在配置管理界面中没有在配置管理界面中

17、实现,需要在主机,需要在主机上上进行修改)。行修改)。配置管理(配置管理(辅助工具)助工具) 辅助工具包括:助工具包括:用户信息、定购关系查询DCS刷新管理反向定购管理外部网元流量控制业务点播超时设置业务跟踪工具 特特别是用是用户信息、定信息、定购关系关系查询、业务跟踪在跟踪在处理用理用户投投诉上是十分上是十分实用的。(不用的。(不过这里的里的业务跟踪接口跟踪接口仅限于限于鉴权/批价接口,且批价接口,且为实时跟着接口,不能跟着接口,不能对历史史记录查询,如果要,如果要对历史消息史消息查询,可以使用可以使用IP监测工具)工具)用用户信息信息查询页面(面(查询用用户状状态)用用户信息信息查询页面(

18、面(查询用用户定定购关系)关系)DCS刷新刷新页面面能对指定的主机和指定的数据表进行加载,当某个业务或某个用户数据在数据库中存在,而在系统DCS内存中不存在的时候可以对单个表进行刷新,更新DCS中的信息。IP监测系系统 IP监测目前包括目前包括WAP和短信跟踪两部分,是通和短信跟踪两部分,是通过IP网网络层镜像端口抓包像端口抓包的方式的方式记录所有的交互消息,从而所有的交互消息,从而实行跟踪功能。行跟踪功能。 WAP业务跟踪包括跟踪包括对首首页访问、非首、非首页访问、服、服务鉴权、服、服务定定购等,等,维护人人员能根据用能根据用户投投诉的内容的内容选择需要跟踪的消息。需要跟踪的消息。查询的的结

19、果能提供果能提供应答答结果、果、访问时延、延、SP代代码、业务代代码等信息,便于等信息,便于维护人人员处理理WAP投投诉和故障定位提供了便捷的手段。和故障定位提供了便捷的手段。 短信短信业务跟踪包括跟踪包括鉴权批价、服批价、服务定定购、定、定购关系同步等。关系同步等。 IP监测系系统和和辅助工具中的助工具中的业务跟踪的最大区跟踪的最大区别是它能是它能记录历史消息,史消息,同同时能提供更全面的消息。能提供更全面的消息。目目 录录 SOMP一期建设介绍一期建设介绍SOMP一期一期功能介绍功能介绍SOMP维护经验总结维护经验总结MISC OMC维护经验总结 MISC OMC一期由于开发时间短,很多功能(比如对系统队列积压数的监控、对外接口的监控等)都需要在二期实现。但是通过合理的利用目前已有的功能,已经能覆盖MISC的基础维护,确保系统的安全稳定运行。 MISC是一套庞大的、功能复杂的系统,浙江公司希望和其它兄弟省共同交流探讨维护心得和维护经验,共同将MISC的维护工作做好。感谢大家感谢大家!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号