一、背景
Zabbix是一个企业级的开源分布式监控解决方案,它是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。
zabbix具备常见的商业监控软件所具备的功能(主机的性能监控、网络设备性能监控、数据库性能监控、多种告警方式、详细的报表图表绘制等)支持自动发现网络设备和服务器,是目前最受欢迎的解决方案。
二、监控目标
产品部署运行后会出现各种各样的故障,比如服务器CPU负载高,磁盘容量使用超过80%,内存使用超过阈值,服务宕机等问题都会给公司平台稳定和服务带来非常大的损失,此时需要一个相对完整的监控体系可以24小时监控您的业务,一旦发生异常,会有微信或者邮件报警提醒您,让系统管理员快速定位/解决存在的各种问题,保障线上服务稳定运行。
监控内容
CPU负载: 监控CPU每1分钟、5分钟、15分钟的平均负载情况
内存使用率: 监控操作系统内存缓存、使用率等情况
网络流量: 实时监控网卡的进出口流量,以免带宽跑满造成服务不可访问
硬盘使用率: 监控系统硬盘使用情况,超过80%即可考虑扩容或清理磁盘
WEB监测: 实现对网站网页的监测,包括响应速度,状态码访问状态等
系统状态: 系统运行时间、运行状态等
业务监控: 后期根据业务需要增加相应监控项目
三、软件特点及优势
软件特点
支持分布式,能集中展示、管理分布式的监控点。具有扩展性强,高可用性,易用性,灵活性等特点,极大地降低了企业的总成本。
软件版本
目前最新的版本是5.0的,建议安装成熟稳定的版本,建议部署 zabbix4.2版本。
zabbix4.2版本截图
软件优势
1、数据采集:可用性和性能检测,自动发现,支持agent、snmp、JMX、telnet等多种采集方式,支持主动和被动模式数据传输、支持用户自定义插件,自定义间隔收集数据
2、高可用:server对设备性能要求低,支持proxy分布式监控,分布式集中管理,有自动发现功能,可以实现自动化监控;开放式接口,扩展性强,插件编写容易
3、告警管理:支持多条件告警,支持多种告警方式,支持多组模板,模板继承。
4、告警设置:告警周期,告警级别,告警恢复通知、告警暂停,时段阈值、支持维护周期、支持单机停用
5、图形化展示:允许自定义创建多监控项视图,网络拓扑,自定义面板展示,自定义IT服务可用性
6、历史数据:历史数据查询可配置,内置housekeeping数据清理机制
7、安全审计:具备安全的用户审计日志,权限认证,用户可以限制允许维护的列表。
四、系统架构和运行模式
Zabbix采用标准的C/S架构模式,根据业务需求有server-agent方案和server-proxy-agentd方案,并且有主动模式和被动模式选择。
Zabbix模式:
主动模式:由Agent主动建立TCP链接并向Server端发送请求。
被动模式:由Server建立TCP链接并向Agent端发送请求。
五、Grafana可视化工具
随着业务的越发复杂,对软件系统的要求越来越高,这意味着我们需要随时掌控系统的运行情况。因此,对系统的实时监控以及可视化展示,就成了基础架构的必须能力。
Grafana 是一款采用 go 语言编写的开源应用,主要用于大规模指标数据的可视化展现,可以通过结合Zabbix采集到的数据进行度量分析和可视化展示,是网络架构和应用分析中最流行的时序数据展示工具。
Grafana仪表盘截图
可视化展示的基础是需要相关的监控指标数据,当zabbix部署完毕后建议通过zabbix+grafana的可视化监控方案完善运维监控体系,保障线上服务安全稳定的运行。
您还未添加分享代码,请到主题选项中,添加百度分享代码!
您可以选择一种方式赞助本站
支付宝转账赞助
支付宝扫一扫赞助
微信钱包扫描赞助