在前一篇 分布式监控系统Zabbix3.2跳坑指南 中已安装好服务端和客户端,此处客户端是被监控的服务器,可能有上百台服务器.监控的目的一个是可以查看历史状态,可以对比零晨和工作区间数据的对比,以便后期进行优化指导.还有一个是报警,总不能等到服务器出现异常了才去从头查是什么问题吧.所以这篇主要介绍报警中最基础的一个 配置邮件预警. 通常zabbix提供了 e-mail.sms.jabber.微信等预警方式,sms等前期需要资金投入那就先否决吧,谁叫老板不给钱. 安装邮件发送工具mailx 这里我…
在 分布式监控系统Zabbix3.2跳坑指南 和 分布式监控系统Zabbix3.2给异常添加邮件报警 已经介绍了如何安装以及报警.此篇通过介绍监控数据库的3306端口连接数来了解如何监控其它端口和配置自定义监控项的过程. 添加监控脚本 在要监控的客户端上新建脚本: /usr/local/zabbix/alertscripts/check_3306_port_num.sh 内容如下: #!/bin/bash ss -an|grep 3306|grep ESTAB|wc -l 这个脚本很简单,就是获…
前面已经介绍了分布式监控系统Zabbix-3.0.3-完整安装记录(2)-添加mysql监控,但是没有提供可以直接使用的Key,太过简陋,监控效果不佳.要想更加仔细的监控Mysql,业内同学们都会选择采用Percona Monitoring Plugins监控MySQL.以下就是Zabbix中通过percona监控MySQL的操作记录:…
在前篇分布式监控系统Zabbix3.2监控数据库的连接数 中已经对数据库的端口3306进行了监控,可以看到数据库的连接数历史变化有高有低,那如果达到了数据库连接数的阀值是不是主动通知给运维人员去检查问题呢,总不能实时盯着看吧,下面就怎么配置预警作简单介绍. 在这里我们是针对模板级别来进行配置,而有些园友如果只针对某台服务进行预警那也是可以的,只需要在此台服务器上的触发器列表中添加一项即可,配置步骤一样. 配置触发器 找到Template App MySQL模板 >触发器>创建触发器 在新增页面…
一般来说,Zabbix可以通过多种方式把告警信息发送到指定人,常用的有邮件,短信报警方式,但是现在越来越多的企业开始使用zabbix结合微信作为主要的告警方式,这样可以及时有效的把告警信息推送到接收人,方便告警的及时处理.之前介绍了分布式监控系统Zabbix-3.0.3-完整安装记录(6)-微信报警部署,然而新版微信已取消了企业号,改用企业微信.使用微信号发短信一般会有条数限制,企业微信没有这个限制,而且成员分组也方便.比起之前的微信企业号,企业微信方式在zabbix报警设置上还是有一点不一样的…
分布式监控系统Zabbix-3.0.3的安装记录 环境说明zabbix-server:192.168.1.30     #zabbix的服务端(若要监控本机,则需要配置本机的Zabbix agent,下面会提到)zabbix-agent:192.168.1.7     #zabbix的客户端(被监控端,需要配置Zabbix agent,下面会提到) 一.zabbix-server端的操作记录(192.168.1.30 ) zabbix服务器端要提前安装好LNMP环境(mysql,nginx,ph…
一.Linux下开源监控系统简单介绍1)cacti:存储数据能力强,报警性能差2)nagios:报警性能差,存储数据仅有简单的一段可以判断是否在合理范围内的数据长度,储存在内存中.比如,连续采样数据存储,有连续三次不在合理范围内的数据就报警3)zabbix:结合上面两种工具的优点,又可以存储数据,又可以报警. Zabbix是一个基于Web界面提供分布式系统监视及网络监视功能的企业级开源解决方案.借助Zabbix可很轻松地减轻运维人员们繁重的服务器管理任务,实现业务系统持续运行.下面会逐步介绍Za…
Zabbix3.0 Server以后就自带了MySQL插件来监控mysql数据库的模板,只需要配置好agent客户端,然后在web端给主机增加模板就行了. 以下是公司线上的zabbix3.0环境下添加mysql监控操作记录: Zabbix_agent客户端操作1)首先在客户端的mysql里添加权限,即本机使用zabbix账号连接本地的mysqlmysql> grant all on *.* to zabbix@'localhost' identified by "123456”;mysql…
 zabbix并没有给我们提供这么一个模板来完成在Linux中磁盘IO的监控,所以我们需要自己来创建一个,在此还是在Linux OS中添加. 由于一台服务器中磁盘众多,如果只一两台可以手动添加,但服务集群达到几十那就非常麻烦,因此需要利用 自动发现 这个功能,自动发现后自动添加对服务器磁盘的监控,而且添加磁盘后也会自动添加到监控,实现自动化运维的效果,所以在这里也演示一次自动发现的配置. 打开Linux模板,添加自动发现规则 上面的key值是需要在 zabbix_agent.conf 中配置的…
对公司的jira访问状态进行监控,当访问状态返回值是200的时候,脚本执行结果为1:其他访问状态返回值,脚本执行结果是0.然后将该脚本放在zabbix进行监控,当非200状态时发出报警.jira访问状态的监控脚本为: 在jira部署机(比如是192.168.1.21)的zabbix监控脚本目录下编写监控脚本(jira的端口为8080): [root@jira ~]# cd /data/zabbix/monitor_scripts/ [root@jira monitor_scripts]# cat…
前面几篇陆续介绍了zabbix3.0.3监控系统的部署和监控项配置,今天这里分享下zabbix3.0.3的邮件报警的配置过程~由于采用sendmail发送邮件,常常会被认为是垃圾邮件被拒,所以不推荐这种方式!这里,针对zabbix报警信息的发送,可以采用下面两种方式中的任意一种:1)利用sendEmail程序来发送报警邮件.sendEmail是一个轻量级,命令行的SMTP邮件客户端,非常完美,使用简单并且功能强大.这个被设计用在php.bash .perl和web站点使用.2)利用python脚…
之前部署了Zabbix-3.0.3监控系统,在安装数据库时已经将zabbix库设置了utf-8字符. 首先确定zabbix开启了中文支持功能:登录到zabbix服务器的数据目录下(前面部署的zabbix数据目录是/data/www/zabbix),打开 locales.inc.php文件[root@Zabbix-server include]# pwd/data/www/zabbix/include[root@Zabbix-server include]# vim locales.inc.php…
前段时间在公司IDC服务器上部署了zabbix3.0.3监控系统,除了自带的内存/带宽/CPU负载等系统资源监控模板以及mysql监控模板外,接下来对诸如nginx.php.memcache.磁盘IO的监控项配置在此做下记录,希望能帮助到有用到的朋友们~ nginx的监控模板:zbx_nginx_templates.xmlphp的监控模板:zbx_php-fpm_templates.xmlmemcache的监控模板:zbx_memcached_templates.xml      (这是1121…
Zabbix可以通过多种方式把告警信息发送到指定人,常用的有邮件,短信报警方式. 现在由于微信使用的广泛度,越来越多的企业开始使用zabbix结合微信作为主要的告警方式,这样可以及时有效的把告警信息推送到接收人,方便告警的及时处理.前面介绍了zabbix的邮件报警的部署过程,这里继续说下zabbix的微信报警环境的部署. 废话不多说了,下面记录了微信报警的操作过程: 接下来详细记录如下: 1)微信企业号的申请过程 2)微信企业号登陆后的相关设置 3)zabbix结合微信报警脚本设置 ------…
前面介绍了zabbix3.0.3环境及相关监控项的添加,下面介绍下针对apache的监控配置:1)在apache配置文件中打开server-status状态访问功能(自带的) [root@IDC-Admin-01 ~]# /data/apache/bin/httpd -v Server version: Apache/2.4.25 (Unix) Server built: Jun 19 2017 19:18:00 [root@IDC-Admin-01 ~]# cat /data/apache/c…
由于采用sendmail发送邮件,常常会被认为是垃圾邮件被拒,所以不推荐这种方式!这里,针对zabbix报警信息的发送,可以采用下面两种方式中的任意一种:1)利用sendEmail程序来发送报警邮件.sendEmail是一个轻量级,命令行的SMTP邮件客户端,非常完美,使用简单并且功能强大.这个被设计用在php.bash .perl和web站点使用.2)利用python脚本来发送邮件 一.利用sendemail发送报警邮件1)先下载安装包到本地,解压.[root@Zabbix-server ~]…
对于进程和端口的监控,可以使用zabbix自带的key进行监控,只需要在server端维护就可以了,相比于nagios使用插件去监控的方式更为简单.下面简单介绍配置:监控端口zabbix监控端口使用如下key:key:net.tcp.listen[port]Checks if this port is in LISTEN state. 0 - it is not, 1 - it is inLISTEN state.解释:监听端口状态,返回结果为1,则运行:返回结果为0,则没有运行.比如监控ssh…
监控的目的一个是可以查看历史状态,可以对比零晨和工作区间数据的对比,以便后期进行优化指导.还有一个是报警,总不能等到服务器出现异常了才去从头查是什么问题吧.所以这篇主要介绍报警中最基础的一个 配置邮件预警. 安装邮件发送工具mail 我选择的是mailx,所以的关闭其他的邮件发送工具 #systemctl stop sendmail #关闭 #systemctl disable sendmail #禁止开机启动 #systemctl stop postfix #关闭 #systemctl dis…
zabbix是什么在此就不多作介绍了,可以参考之前的文章 零代码如何打造自己的实时监控预警系统 ,这篇主要介绍安装及注意事项. 主要分为服务端和客户端安装,客户端又分为Linux.Windows. 服务端安装环境 CentOS6.8 Zabbix3.2 Mysql5.6 Apache PHP56w 环境准备 关闭selinux setenforce 0 进入mysql,创建zabbix用户并授权 mysql -uroot -p CREATE DATABASE zabbix CHARACTER S…
公司在IDC机房的一台服务器上部署了MongoDB,由于所存储的业务数据比较重要,所以对MongoDB的监控显得尤为重要!Zabbix监控MongoDB性能的原理:通过echo "db.serverStatus()" | mongo admin 来查看mongodb的状态. Zabbix监控MongoDB性能,主要监控以下项目:- 内存使用情况- 连接数- 锁- 刷新写操作到磁盘- 每秒执行的查询,插入,删除,更新等操作次数- 每秒访问的索引次数,每秒命中索引的次数- MongoDB产…
群机器人是钉钉群的高级扩展功能,群机器人可以将第三方服务的信息聚合到群聊中,实现自动化的信息同步.例如:通过聚合GitHub,GitLab等源码管理服务,实现源码更新同步:通过聚合Trello,JIRA等项目协调服务,实现项目信息同步.不仅如此,群机器人支持Webhook协议的自定义接入,支持更多可能性. 比如我们可将Zabbix运维报警提醒通过自定义机器人聚合到钉钉群中,以实现钉钉告警.下面记录下Zabbix通过钉钉告警的设置过程: 一. 钉钉机器人创建登录钉钉客户端,创建一个群,把需要收到报…
通过zabbix做web监控,不仅仅可以监控到站点的响应时间,还可以根据站点返回的状态码或响应时间做报警设置,比如说对某个url进行监控,当访问返回的状态码是非200状态时都报警(创建触发器即可).下面简单介绍下监控设置: 1)首先在监控主机里创建"应用集"和"Web场景" 客户端选择测试站点的浏览器类型,这里选择使用IE10作为客户端. 2)接着创建触发器 在上面“添加”按钮后选择对应的监控项目,功能选择“最新的T值不是N”,N值设置为200,即web访问的状态码…
前面已分别介绍了zabbix的邮件.微信报警设置,这些都是手机在有网络时才能收到报警信息,那如果手机没有网的情况下怎么办,这就需要考虑使用短信接口报警了.当服务出现故障达到预警级别是通过发送短信的形式告诉运维人员,以便及时处理.公司的短信接口是从短信服务器购买的,并经过公司开发大神调整后使用的.废话不多赘述,下面直接记录配置过程: 一.zabbix服务端的脚本路径设置 [root@zabbix ~]# cat /data/zabbix/etc/zabbix_server.conf|grep al…
前面已经介绍了分布式监控系统Zabbix-3.0.3-完整安装记录(2)-添加mysql监控,但是没有提供可以直接使用的Key,太过简陋,监控效果不佳.要想更加仔细的监控Mysql,业内同学们都会选择采用Percona Monitoring Plugins监控MySQL.Percona有比较详细的监控Mysql的模版以及脚本,它提升了在高负载情况下的InnoDB的性能.为运维人员提供一些非常有用的性能诊断工具:另外它有更多的参数和命令来控制服务器行为.废话不多说,下面记录下使用Percona M…
Zabbix想要集中展示图像,唯一的选择是screen,后来zatree解决了screen的问题,但性能不够好.Graphtree 由OneOaaS开发并开源出来,用来解决Zabbix的图形展示问题,性能较好,Graphtree默认只支持3.0.0以上的zabbix版本.Zabbix自带的"聚合图形"和Graphtree图形插件在使用上还是有一定区别的,其中:"聚合图形" 一般是用于同屏展示业务系统所有机器的同一个监控项的图形,而Graphtree 一般是用于同屏展…
1.为什么要使用监控系统? 我们知道一个系统不管怎么讲它都会出故障,我们为了保证线上业务的最大化的可用性,通常我们要给关键业务做高可用:做高可用的目的是为了让故障发生时,能够有一个备用的解决方案,将故障转移,从而实现服务的高可用性:那么问题来了,我们怎么知道系统发生了故障或者将要发生故障呢?怎么去把将要发生的故障扼杀在摇篮里呢?这个时候我们就需要用到监控系统:监控系统本质上不是业务系统,没有监控系统,线上业务系统也是可以正常运行的,它的存在主要是方便我们对业务系统的重要指标数据做采集.分析,使得…
Python之路,Day20 - 分布式监控系统开发   本节内容 为什么要做监控? 常用监控系统设计讨论 监控系统架构设计 监控表结构设计 为什么要做监控? –熟悉IT监控系统的设计原理 –开发一个简版的类Zabbix监控系统 –掌握自动化开发项目的程序设计思路及架构解藕原则   常用监控系统设计讨论 Zabbix Nagios   监控系统需求讨论 1.可监控常用系统服务.应用.网络设备等 2.一台主机上可监控多个不同服务.不同服务的监控间隔可不同 3.同一个服务在不同主机上的监控间隔.报警…
https://www.zabbix.com/wiki/howto/install/Ubuntu/ubuntuinstall 环境介绍OS: Ubuntu 10.10 Server 64-bitServers:zabbix-server:10.6.1.181zabbix-client-1:10.6.1.182 1. 环境部署前面,我们简单介绍了一下Zabbix,那么在本章,我们就来把Zabbix的环境部署起来,然后再在下一张详细的讲解其使用方法.由于Zabbix采用的是分布式架构,因此我们采用两…
前文我们了解了分布式监控系统zabbix的相关组件的作用和zabbix的部署,回顾请参考https://www.cnblogs.com/qiuhom-1874/p/13997582.html:今天我们来了解下zabbix的基础使用: 在开始使用zabbix之前,我们先来了解下zabbix的一些术语 1.监控项(item):什么是监控项? 在zabbix中监控项(item)是一个核心的东西,所有监控都是围绕监控项展开的,可以说没有监控项就没有我们想要的指标数据:所以简单讲监控项就是被监控对象的指标…
前言 <牧神记>有一句话说的好,破心中神.当不再对分布式,微服务,CLR畏惧迷茫的时候,你就破了心中神. zipkin复习 第一篇: .Net架构篇:思考如何设计一款实用的分布式监控系统? 第二篇:NetCore实践篇:分布式监控客户端ZipkinTracer从入门到放弃之路,我们提到了zipkin的原理和架构说明,以及用zipkintracer实践失败的记录. 今天我们来复习下. zipkin作用 全链路追踪工具(根据依赖关系) 查看每个接口.每个service的执行速度(定位问题发生点或者…