《Zabbix运维监控平台解决方案设计》由会员分享,可在线阅读,更多相关《Zabbix运维监控平台解决方案设计(10页珍藏版)》请在金锄头文库上搜索。
1、 实用文档Zabbix 运维监控解决方案文案大全 实用文档目录一、背景 . 3二、目标 . 3监控的基本内容.4三、采用的软件. 4四、软件的特点. 5五、软件的优势. 5系统架构.7监控实现方式:.8监控指标.8规则引擎.9文案大全 实用文档一、背景网站平台部署运行后会出现各种各样的故障,比如服务器CPU 负载高,磁盘容量使用超过 80%,内存使用超过阈值,系统进程多,tomcat 服务宕机等问题都会给公司平台稳定和服务带来非常大的损失,此时需要一个相对完整的监控体系可以24 小时监控您的网站,一旦网站发生异常,会有报警提醒您,如邮件,微信,电话,短信,及时避免流量损失。Zabbix 是一个
2、企业级的开源分布式监控解决方案,它是一个基于 WEB 界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。zabbix 具备常见的商业监控软件所具备的功能(主机的性能监控、网络设备性能监控、数据库性能监控、FTP 等通用协议监控、多种告警方式、详细的报表图表绘制)支持自动发现网络设备和服务器;支持分布式,能集中展示、管理分布式的监控点;扩展性强,server提供通用接口,可以自己开发完善各类监控。zabbix server 可以通过 SNMP,zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在Linux,Solaris,
3、HP-UX,AIX,Free BSD,Open BSD,OS X 等平台上。二、目标物理范围:组件:硬件,OS,存储,中间件,数据库,机房,网络等文案大全 实用文档维度:可用性,性能。指标:见下。监控的基本内容性能数据 基本 CPU,磁盘,网络,内存等关系系统正常运行的基本指标。端口状态 一般交换机或网络设备,端口启动状态,流量大小,网络状态日志内容 日志内容监控,系统日志,应用程序日志,错误信息。系统状态 DB ,OS,中间件等的系统状态硬件状态 硬盘状态,风扇,电池,内存,主板等系统状态机房状态 UPS,机柜电功率,机房电功率,机房温度,湿度,空气质量,漏水,消防,人员出入,机房门状态,机
4、柜门状态,红外线,图像,防盗等应用状态 程序启动时间,网站访问速度等。三、采用的软件软件名称: ZABBIX 4.0 LTS文案大全 实用文档四、软件的特点zabbix 是一个基于 WEB 界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。zabbix 能监视各种网络参数,保证服务器系统的安全运营;并提供柔软的报警机制以让系统管理员快速定位/解决存在的各种问题,其真正的可扩展性,高可用性,易用性,灵活性,极大地降低了企业的总成本,是目前最受欢迎的解决方案五、软件的优势1.企业级开源监控方案2. 各组件分离Zabbix 由 3 部分构成,zabbix server,Web fron
5、t,zabbix DB,Zabbix Proxy与可选组件 zabbix agent。3 监控方式zabbix server 可以通过 SNMP,zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在 Linux, Solaris, HP-UX, AIX, Free文案大全 实用文档BSD, Open BSD, OS X,W等 agent 配置文件中,根据要求编写脚本,将定期执行该脚本平台上。zabbix agent 需要安装在被监视的目标服务器上,它主要完成对硬件信息或与操作系统有关的内存,CPU 等信息的收集。7 丰富的可视化功能,
6、包括仪表盘,自定义图表和网络拓扑功能8 代理支持的系统版本zabbix agent 可以运行在 Linux ,Solaris, HP-UX, AIX, Free BSD, Open BSD, OS X,Tru64/OSF1, Windows NT4.0, Windows 2000/2003/XP/Vista)等系统之上。9 支持无代理监控方式Zabbix server 可以支持 fping ,对网络通畅,丢包率,错误率,重传等的监控10 支持 Web 网站的自动登录测试可以支持对 web 网站的自动登录测试,并对登录结果进行匹配和测试。11 核心功能文案大全 实用文档zabbix server
7、 可以单独监视远程服务器的服务状态;同时也可以与zabbix agent 配合,可以轮询 zabbix agent主动接收监视数据(trapping 方式),同时还可被动接收 zabbixagent 发送的数据(trapping 方式)。另外 zabbix server 还支持 SNMP (v1,v2),可以与 SNMP 软件(例如:net-snmp)等配合使用。Zabbix proxy 为分布式服务器的一种实现方式。Zabbix proxy 和zabbix server 同步config。Zabbix proxy 主动轮训zabbix agent,将数据采集到 zabbix proxy 的数
8、据库中,将数据,zabbix proxy 使用一个进程将数据同步到 zabbix sever 上。如果发生 proxy 联系不到 server ,将对在本地数据库保持 2 天的数据,网络联通或server 可以通信后,proxy 将对把数据重新传送到 server。准备采用的软件:zabbix 4.0 LTS系统架构文案大全 实用文档监控实现方式:OS安装 Agent,zabbix server 设置监控配置项,采集结果。网络设备 通过 SNMP,zabbix Server 开启 snmppoller 进程轮询 SNMP,根据SNMP查询结果存储设备 一般通过 API 方式,没有 API 的,
9、采用登陆设备上,返回命令采集结果,对采集结果进行格式化。数据库 一般为通过插件,第二种为通过集中库,对数据库进行读取。硬件 通过 IPMI 方式,获取相关硬件信息,如风扇,温度,电池,硬盘,内存插槽等硬件环境信息。机房监控 通过 API 方式,直接调用机房环境监控系统的数据。中间件 通过 JMX 监控,MQ 或其他的 memo cache 通过编写脚本并格式化输出。应用: 通过嵌入 Jar 包,程序轮询,将相关信息收集到本地,然后推送到监控服务器上业务: 通过将数据库中的数据采集,查询发送给监控服务器。监控指标NumberTypeCPUCase备注123456Load AverageCPU U
10、tilizationMemory UtilizationSwap /pagfile UtilizationNetwork TransferMemoryNetworkError/Drop文案大全 实用文档File System UtilizationDisk I/ODiskProcess MonitoringWindows ServiceTCP Port ConnectivityTCP Port Response TimeDNS MonitoringNTP MonitoringText Log101112131415161718ServiceLogFileEventLogOthercounter(windows)规则引擎1、警报触发机制:规则引擎,查询zabbix 监控数据 DB 中的事件,根据系统架构编写,根据指标或触发器,生成事件,规则引擎对事件和系统的的负责人,显示警报内容。2、警报的校验:对任何警报,通过 3 种的间接方式验证,如果在 3 个网段发生的事件进行校验,如果文案大全 实用文档发生两个重复的警报内容,则触发警报。3、警报的发送方式:事件平台,邮件,微信,电话和短信现阶段,事件为统一平台 事件平台4、警报推送方式:PUSH 方式,即根据 CMDB 中的系统的负责组的信息进行定位目标人群,群组人员信息由负责人负责。