Zabbix的集中式监控
相对于传统的ZABBIX硬件系统级监控(CPU,内存,硬盘,网卡),应用级的监控就显得有些复杂了。
如果对不同的应该来不同的应用,配置会很多的。
如果我们能在一个指定的AGENT上监控所有的APACHE,NGINX,MYSQL,PHP-FPM,TOMCAT之类的话,
那后期维护就是比较简单的事了。
且对于MYSQL,WEB这种,可以直接手动建一个AGENT,利用自动发现功能,LOW DISCOVERY,弄好图表和触发器,然后维护相关的配置文件即可。(在ZABBIX SERVER进行类似监控,在压力不大的情况下,也是一个好主意~)
相关模板和脚本附后。
http://files.cnblogs.com/files/aguncn/TemplateAppNginx.xml
http://files.cnblogs.com/files/aguncn/nginx_monitor.sh
我们的自定义用户参数,可以这样来:
UnsafeUserParameters= #mysql UserParameter=MySQL.BBS,/usr/bin/ -P -e UserParameter=MySQL.WWW,/usr/bin/ -P -e UserParameter=MySQL.WEND,/usr/bin/ -P -e UserParameter=MySQL.JIJ/usr/bin/ -P -e #http UserParameter=web.site.discovery,/etc/zabbix/alertscripts/web_site_code_status web_site_discovery UserParameter=web.site.code[*],/etc/zabbix/alertscripts/web_site_code_status web_site_code $ #nginx UserParameter=nginxSiteDiscovery,/etc/zabbix/alertscripts/nginx_monitor.sh nginxSiteDiscovery UserParameter=getNginxStatus[*],/etc/zabbix/alertscripts/nginx_monitor.sh getNginxStatus "$1" "$2" #php-fpm UserParameter=php.site.discovery,/etc/zabbix/alertscripts/php-fpm-status php_site_discovery UserParameter=php.site.code[*],/etc/zabbix/alertscripts/php-fpm-status php_site_code "$1" "$2" UserParameter=PhpSiteDiscovery,/etc/zabbix/alertscripts/php_monitor.sh PhpSiteDiscovery UserParameter=getPhpStatus[*],/etc/zabbix/alertscripts/php_monitor.sh getPhpStatus "$1" "$2"
======================
转一篇可以用这种方式扩展的东东。感谢这个聪明的朋友:)
http://qicheng0211.blog.51cto.com/3958621/1557695
==========================
“nginx统一监控”意思是在一台Linux服务器上集中监控所有nginx站点的status状态。我们把这个服务器叫做“nginx监控服务器”,可以是装有zabbix agent的zabbix server,或是其他装agent的被监控客户端。
思路:把所有nginx站点的URL写入到“nginx监控服务器”上的一个配置文件中。增加或删除nginx监控站点只需要修改这个配置文件,利用zabbix的low-level discovery动态监控这些站点。“nginx监控服务器”的zabbix-agent调用nginx监控脚本,获取nginx_status后,利用zabbix-sender把监控数据发送到zabbix服务器端。
配置步骤如下:
一、在被监控nginx站点上配置stub_status模块
开启stub_status模块监控,在server块中加入location就行了。
假设“nginx监控服务器”的IP地址为192.168.0.1,配置如下:
1
2
3
4
5
6
7
8
|
location /nginx_status { stub_status on; access_log off; allow 127.0.0.1; # 要允许“nginx监控服务器”访问nginx status allow 192.168.0.1; deny all; } |
重启nginx,然后请求http://domain/nginx_status 就行了,下面是结果:
1
2
3
4
|
Active connections: 1 server accepts handled requests 16672 16672 16769 Reading: 0 Writing: 1 Waiting: 0 |
二、在nginx监控服务器上配置监控脚本
首先,在nginx监控服务器上安装好zabbix-agent和zabbix-sender,推荐yum安装。
注意:设置zabbix_agentd.conf里Timeout=30。减少因脚本执行超时,agent获取不到数据的情况。
然后,建立脚本文件的目录/etc/zabbix/monitor_scripts。
1
|
shell # mkdir -p /etc/zabbix/monitor_scripts |
把监控脚本nginx_monitor.sh放到/etc/zabbix/monitor_scripts
目录下。
nginx_monitor.sh脚本内容如下,需要修改AGENT_CONF变量的值:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
|
#!/bin/bash # # Filename: nginx_monitor.sh # Revision: 1.0 # Date: 2014/09/24 # Author: Qicheng # Email: # Website: http://qicheng0211.blog.51cto.com # Description: nginx统一监控脚本 # Notes: # # 修改AGENT_CONF的值为本地zabbix agent的配置文件路径 AGENT_CONF= "/etc/zabbix/zabbix_agentd.conf " # nginx站点的配置文件路径 NGINX_SITE_CONF= "/etc/zabbix/monitor_scripts/nginx_site.conf" # zabbix_sender的路径 ZBX_SENDER= "/usr/bin/zabbix_sender" FUNCTION=$1 HOST_NAME=$2 NGINX_SITE=$3 CURL= "/usr/bin/curl" TIMEOUT=30 # nginx site low-level discovery function nginxSiteDiscovery() { nginx_site=($( grep '^[^#]' ${NGINX_SITE_CONF})) max_index=$[${ #nginx_site[@]}-1] printf '{\n' printf '\t"data":[' for key in ` seq -s ' ' 0 $max_index` do printf '\n\t\t{' printf "\"{#NGINX_SITE}\":\"${nginx_site[${key}]}\"}" if [ $key - ne $max_index ]; then printf "," fi done printf '\n\t]\n' printf '}\n' } # 获取nginx status,把数据发送到zabbix server function getNginxStatus() { nginx_status_url= "${NGINX_SITE}/nginx_status" # 获取nginx_status后,保存到下面的文件里 nginx_status_file= "/tmp/nginx_status_$(echo ${NGINX_SITE} | sed 's#^http.*://##; s#/#_#g').log" :> "$nginx_status_file" # curl获取nginx_status ${CURL} -s --connect-timeout ${TIMEOUT} "$nginx_status_url" 2>&1 | tee "$nginx_status_file" line_num=$( cat "$nginx_status_file" | wc -l) # 判断是否正确获取nginx_status [ $line_num - ne 4 ] && { echo "ERROR: $nginx_status_file is not correct." ; exit 1;} active=$( cat "$nginx_status_file" | grep 'Active' | awk '{print $NF}' ) reading=$( cat "$nginx_status_file" | grep 'Reading' | awk '{print $2}' ) writing=$( cat "$nginx_status_file" | grep 'Writing' | awk '{print $4}' ) waiting=$( cat "$nginx_status_file" | grep 'Waiting' | awk '{print $6}' ) accepts=$( cat "$nginx_status_file" | awk NR==3 | awk '{print $1}' ) handled=$( cat "$nginx_status_file" | awk NR==3 | awk '{print $2}' ) requests=$( cat "$nginx_status_file" | awk NR==3 | awk '{print $3}' ) echo "Sending the data to zabbix server..." # 将特定格式的数据发送到zabbix server,每行的格式为:<hostname> <key> <value> cat << EOF | ${ZBX_SENDER} -c ${AGENT_CONF} -i - "${HOST_NAME}" "nginx_status[$NGINX_SITE,active]" "${active}" "${HOST_NAME}" "nginx_status[$NGINX_SITE,reading]" "${reading}" "${HOST_NAME}" "nginx_status[$NGINX_SITE,writing]" "${writing}" "${HOST_NAME}" "nginx_status[$NGINX_SITE,waiting]" "${waiting}" "${HOST_NAME}" "nginx_status[$NGINX_SITE,accepts]" "${accepts}" "${HOST_NAME}" "nginx_status[$NGINX_SITE,handled]" "${handled}" "${HOST_NAME}" "nginx_status[$NGINX_SITE,requests]" "${requests}" EOF } [ $ # -eq 0 ] && { echo "ERROR: The script needs at least one parameter."; exit 1;} case $FUNCTION in nginxSiteDiscovery|getNginxStatus) $FUNCTION ;; *) echo "ERROR: Bad parameters." exit 1 ;; esac |
创建nginx站点配置文件nginx_site.conf:
1
2
|
shell # touch /etc/zabbix/monitor_scripts/nginx_site.conf shell # chown -R zabbix:zabbix /etc/zabbix/monitor_scripts |
把所有被监控nginx站点的URL写入到nginx_site.conf文件中,每一行一个URL,如下图:
在zabbix_agentd.conf最后面添加自定义参数:
1
2
|
UserParameter=nginxSiteDiscovery, bash /etc/zabbix/monitor_scripts/nginx_monitor .sh nginxSiteDiscovery UserParameter=getNginxStatus[*], bash /etc/zabbix/monitor_scripts/nginx_monitor .sh getNginxStatus "$1" "$2" |
最后重启zabbix agent。
在zabbix server端执行zabbix_get命令测试:
如上图所示,说明环境部署好了。
三、zabbix WEB端
1、导入模板
导入"Template App Nginx.xml"模板,附件有下载。
模板的Item prototypes如下:
“get nginx status of {#NGINX_SITE}”监控项是Zabbix agent类型,用于调用脚本获取nginx_status。其他item是Zabbix trapper类型,用于接收zabbix-sender发来的nginx_status。
模板配置了触发器,如果获取不到nginx_status则发出告警。
2、创建nginx监控主机并链接模板
“nginx监控主机”的配置中要填写Agent interfaces,并链接模板Template App Nginx。
3、数据展示
本文出自 “启程的Linux博客” 博客,请务必保留此出处http://qicheng0211.blog.51cto.com/3958621/1557695
Zabbix的集中式监控的更多相关文章
- ZABBIX作集中式NGINX性能监控的注意要点
今天测试好了.但有几个要点要注意. 一是出了问题看日志. 二是主动测试脚本. 三是注意LLD自动发现的ZABBIX类型(TRAPPER,捕捉器类型) 四是有主机上有问题时可以看到(UNSUPPORT) ...
- 网站集群架构(LVS负载均衡、Nginx代理缓存、Nginx动静分离、Rsync+Inotify全网备份、Zabbix自动注册全网监控)--技术流ken
前言 最近做了一个不大不小的项目,现就删繁就简单独拿出来web集群这一块写一篇博客.数据库集群请参考<MySQL集群架构篇:MHA+MySQL-PROXY+LVS实现MySQL集群架构高可用/高 ...
- 03: zabbix API接口 对 主机、主机组、模板、应用集、监控项、触发器等增删改查
目录:Django其他篇 01: 安装zabbix server 02:zabbix-agent安装配置 及 web界面管理 03: zabbix API接口 对 主机.主机组.模板.应用集.监控项. ...
- 【Linux】Zabbix + MPM + msmtp + mutt 监控MySQL + 邮件报警
Zabbix部署参考博文 http://blog.sina.com.cn/s/blog_5611597901017oe0.html MPM安装配置参考博文和MPM官网下载地址 http://blog ...
- Centos7搭建集中式日志系统
在CentOS7中,Rsyslong是一个集中式的日志收集系统,可以运行在TCP或者UDP的514端口上. 目录 开始之前 配置接收日志的主机 配置发送日志的主机 日志回滚 附件:创建日志接收模板 ...
- 理解OpenShift(7):基于 Prometheus 的集群监控
理解OpenShift(1):网络之 Router 和 Route 理解OpenShift(2):网络之 DNS(域名服务) 理解OpenShift(3):网络之 SDN 理解OpenShift(4) ...
- elk + filebeat,6.3.2版本简单搭建,实现我们自己的集中式日志系统
前言 刚从事开发那段时间不习惯输出日志,认为那是无用功,徒增代码量,总认为自己的代码无懈可击:老大的叮嘱.强调也都视为耳旁风,最终导致的结果是我加班排查问题,花的时间还挺长的,要复现问题.排查问题等, ...
- [转]系统架构演变--集中式架构-垂直拆分-分布式服务-SOA(服务治理)-微服务
一.系统架构演变 1.1. 集中式架构 当网站流量很小时,只需一个应用,将所有功能都部署在一起,以减少部署节点和成本.此时,用于简化增删改查工作量的数据访问框架(ORM)是影响项目开发的关键. 存在的 ...
- 中小型研发团队架构实践七:集中式日志ELK
一.集中式日志 日志可分为系统日志.应用日志以及业务日志,系统日志给运维人员使用,应用日志给研发人员使用,业务日志给业务操作人员使用.我们这里主要讲解应用日志,通过应用日志来了解应用的信息和状态,以及 ...
随机推荐
- python下载IGS观测数据
最近在学习GPS数据软件处理,经常需要下载数据练习,反复去网站上很麻烦,于是就写了一个小小的爬虫,用的是韩国的服务器,使用了python中的ftplib库实现的 今天稍微改了一下代码,可以选择卫星系统 ...
- C# 各种集合
大多数集合都在 System.Collections,System.Collections.Generic两个命名空间. 其中System.Collections.Generic专门用于泛型集合. ...
- SQL数据库安装
安装过程中经常出现失败或者提示,那么久要清楚干净所有的数据在重新安装,步骤如下. SQL2008卸载 一.从控制面板卸载 1)点击计算机右下角“开始”,点击“控制面板” 2)点击“卸载程序”. 卸载与 ...
- The windows PowerShell snap-in 'Microsoft.Crm.PowerShell' is not installed on this computer
加载PowerShell插件时出现以下错误: The windows PowerShell snap-in 'Microsoft.Crm.PowerShell' is not installed on ...
- 解决kernel headers报错
Make sure you have updated version $ sudo apt-get update Search for kernel version (optional) $ apt- ...
- servlet 项目 ,,启动没问题,,但是,一请求也面就报错误。。。。求解决。。。。。。。。。。。。。各种百度,都没解决了啊。。。。。急急急急急急急急急急急急急急急急急急
信息: Server startup in 1674 mslog4j:WARN No appenders could be found for logger (com.mchange.v2.log.M ...
- linux常用命令之ln
ln是linux中又一个非常重要命令,它的功能是为某一个文件在另外一个位置建立一个同不的链接,这个命令最常用的参数是-s,具体用法是:ln –s 源文件 目标文件. 当我们需要在不同的目录,用到相同的 ...
- const和volatile的区别
一.关键字const有什么含意? 只要一听到说:“const意味着常数”,就知道我正在和一个业余者打交道.去年Dan Saks已经在他的文章里完全概括了const的所有用法,因此ESP(译者:Embe ...
- iOS 事件处理机制与图像渲染过程(转)
iOS 事件处理机制与图像渲染过程 iOS RunLoop都干了什么 iOS 为什么必须在主线程中操作UI 事件响应 CALayer CADisplayLink 和 NSTimer iOS 渲染过程 ...
- 基于nodejs的消息中心
参考:http://t42dw.iteye.com/blog/1767013