相对于传统的ZABBIX硬件系统级监控(CPU,内存,硬盘,网卡),应用级的监控就显得有些复杂了。

如果对不同的应该来不同的应用,配置会很多的。

如果我们能在一个指定的AGENT上监控所有的APACHE,NGINX,MYSQL,PHP-FPM,TOMCAT之类的话,

那后期维护就是比较简单的事了。

且对于MYSQL,WEB这种,可以直接手动建一个AGENT,利用自动发现功能,LOW DISCOVERY,弄好图表和触发器,然后维护相关的配置文件即可。(在ZABBIX SERVER进行类似监控,在压力不大的情况下,也是一个好主意~)

相关模板和脚本附后。

http://files.cnblogs.com/files/aguncn/TemplateAppNginx.xml

http://files.cnblogs.com/files/aguncn/nginx_monitor.sh

我们的自定义用户参数,可以这样来:

UnsafeUserParameters=

#mysql
UserParameter=MySQL.BBS,/usr/bin/ -P  -e
UserParameter=MySQL.WWW,/usr/bin/ -P  -e
UserParameter=MySQL.WEND,/usr/bin/ -P  -e
UserParameter=MySQL.JIJ/usr/bin/ -P  -e 

#http
UserParameter=web.site.discovery,/etc/zabbix/alertscripts/web_site_code_status web_site_discovery
UserParameter=web.site.code[*],/etc/zabbix/alertscripts/web_site_code_status web_site_code $

#nginx
UserParameter=nginxSiteDiscovery,/etc/zabbix/alertscripts/nginx_monitor.sh nginxSiteDiscovery
UserParameter=getNginxStatus[*],/etc/zabbix/alertscripts/nginx_monitor.sh getNginxStatus "$1" "$2"

#php-fpm
UserParameter=php.site.discovery,/etc/zabbix/alertscripts/php-fpm-status php_site_discovery
UserParameter=php.site.code[*],/etc/zabbix/alertscripts/php-fpm-status php_site_code "$1" "$2"
UserParameter=PhpSiteDiscovery,/etc/zabbix/alertscripts/php_monitor.sh PhpSiteDiscovery
UserParameter=getPhpStatus[*],/etc/zabbix/alertscripts/php_monitor.sh getPhpStatus "$1" "$2"

======================

转一篇可以用这种方式扩展的东东。感谢这个聪明的朋友:)

http://qicheng0211.blog.51cto.com/3958621/1557695

==========================

“nginx统一监控”意思是在一台Linux服务器上集中监控所有nginx站点的status状态。我们把这个服务器叫做“nginx监控服务器”,可以是装有zabbix agent的zabbix server,或是其他装agent的被监控客户端。

思路:把所有nginx站点的URL写入到“nginx监控服务器”上的一个配置文件中。增加或删除nginx监控站点只需要修改这个配置文件,利用zabbix的low-level discovery动态监控这些站点。“nginx监控服务器”的zabbix-agent调用nginx监控脚本,获取nginx_status后,利用zabbix-sender把监控数据发送到zabbix服务器端。

配置步骤如下:

一、在被监控nginx站点上配置stub_status模块

开启stub_status模块监控,在server块中加入location就行了。

假设“nginx监控服务器”的IP地址为192.168.0.1,配置如下:

1
2
3
4
5
6
7
8
    location /nginx_status{
        stub_status on;
        access_log off;
        allow 127.0.0.1;
        # 要允许“nginx监控服务器”访问nginx status
        allow 192.168.0.1;
        deny all;
    }

重启nginx,然后请求http://domain/nginx_status 就行了,下面是结果:

1
2
3
4
Active connections: 1 
server accepts handled requests
 16672 16672 16769 
Reading: 0 Writing: 1 Waiting: 0

二、在nginx监控服务器上配置监控脚本

首先,在nginx监控服务器上安装好zabbix-agent和zabbix-sender,推荐yum安装。

注意:设置zabbix_agentd.conf里Timeout=30。减少因脚本执行超时,agent获取不到数据的情况。

然后,建立脚本文件的目录/etc/zabbix/monitor_scripts。

1
shell# mkdir -p /etc/zabbix/monitor_scripts

把监控脚本nginx_monitor.sh放到/etc/zabbix/monitor_scripts目录下。

nginx_monitor.sh脚本内容如下,需要修改AGENT_CONF变量的值:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
#!/bin/bash
#
# Filename:    nginx_monitor.sh
# Revision:    1.0
# Date:        2014/09/24
# Author:      Qicheng
# Email:
# Website:     http://qicheng0211.blog.51cto.com
# Description: nginx统一监控脚本
# Notes:       
#
 
# 修改AGENT_CONF的值为本地zabbix agent的配置文件路径
AGENT_CONF="/etc/zabbix/zabbix_agentd.conf "
# nginx站点的配置文件路径
NGINX_SITE_CONF="/etc/zabbix/monitor_scripts/nginx_site.conf"
# zabbix_sender的路径
ZBX_SENDER="/usr/bin/zabbix_sender"
 
FUNCTION=$1
HOST_NAME=$2
NGINX_SITE=$3
CURL="/usr/bin/curl"
TIMEOUT=30
 
# nginx site low-level discovery
function nginxSiteDiscovery()
{
    nginx_site=($(grep '^[^#]' ${NGINX_SITE_CONF}))
    max_index=$[${#nginx_site[@]}-1]
    printf '{\n'
    printf '\t"data":['
    for key in `seq -s' ' 0 $max_index`
    do
        printf '\n\t\t{'
        printf "\"{#NGINX_SITE}\":\"${nginx_site[${key}]}\"}"
        if [ $key -ne $max_index ];then
            printf ","
        fi
    done
    printf '\n\t]\n'
    printf '}\n'
}
 
# 获取nginx status,把数据发送到zabbix server
function getNginxStatus()
{
    nginx_status_url="${NGINX_SITE}/nginx_status"
    # 获取nginx_status后,保存到下面的文件里
    nginx_status_file="/tmp/nginx_status_$(echo ${NGINX_SITE} | sed 's#^http.*://##; s#/#_#g').log"
    :>"$nginx_status_file"
 
    # curl获取nginx_status
    ${CURL} -s --connect-timeout ${TIMEOUT} "$nginx_status_url" 2>&1 | tee "$nginx_status_file"
    line_num=$(cat "$nginx_status_file" wc -l)
    # 判断是否正确获取nginx_status
    [ $line_num -ne 4 ] && { echo "ERROR: $nginx_status_file is not correct."exit 1;}
 
    active=$(cat "$nginx_status_file" grep 'Active' awk '{print $NF}')
    reading=$(cat "$nginx_status_file" grep 'Reading' awk '{print $2}')
    writing=$(cat "$nginx_status_file" grep 'Writing' awk '{print $4}')
    waiting=$(cat "$nginx_status_file" grep 'Waiting' awk '{print $6}')
    accepts=$(cat "$nginx_status_file" awk NR==3 | awk '{print $1}')
    handled=$(cat "$nginx_status_file" awk NR==3 | awk '{print $2}')
    requests=$(cat "$nginx_status_file" awk NR==3 | awk '{print $3}')
    echo "Sending the data to zabbix server..."
    # 将特定格式的数据发送到zabbix server,每行的格式为:<hostname> <key> <value>
    cat << EOF | ${ZBX_SENDER} -c ${AGENT_CONF} -i -
"${HOST_NAME}" "nginx_status[$NGINX_SITE,active]" "${active}"
"${HOST_NAME}" "nginx_status[$NGINX_SITE,reading]" "${reading}"
"${HOST_NAME}" "nginx_status[$NGINX_SITE,writing]" "${writing}"
"${HOST_NAME}" "nginx_status[$NGINX_SITE,waiting]" "${waiting}"
"${HOST_NAME}" "nginx_status[$NGINX_SITE,accepts]" "${accepts}"
"${HOST_NAME}" "nginx_status[$NGINX_SITE,handled]" "${handled}"
"${HOST_NAME}" "nginx_status[$NGINX_SITE,requests]" "${requests}"
EOF
}
 
[ $# -eq 0 ] && { echo "ERROR: The script needs at least one parameter."; exit 1;}
 
case $FUNCTION in
    nginxSiteDiscovery|getNginxStatus)
        $FUNCTION
        ;;
    *)
        echo "ERROR: Bad parameters."
        exit 1
        ;;
esac

创建nginx站点配置文件nginx_site.conf:

1
2
shell# touch /etc/zabbix/monitor_scripts/nginx_site.conf
shell# chown -R zabbix:zabbix /etc/zabbix/monitor_scripts

把所有被监控nginx站点的URL写入到nginx_site.conf文件中,每一行一个URL,如下图:

在zabbix_agentd.conf最后面添加自定义参数:

1
2
UserParameter=nginxSiteDiscovery,bash /etc/zabbix/monitor_scripts/nginx_monitor.sh nginxSiteDiscovery
UserParameter=getNginxStatus[*],bash /etc/zabbix/monitor_scripts/nginx_monitor.sh getNginxStatus "$1" "$2"

最后重启zabbix agent。

在zabbix server端执行zabbix_get命令测试:

如上图所示,说明环境部署好了。

三、zabbix WEB端

1、导入模板

导入"Template App Nginx.xml"模板,附件有下载。

模板的Item prototypes如下:

“get nginx status of {#NGINX_SITE}”监控项是Zabbix agent类型,用于调用脚本获取nginx_status。其他item是Zabbix trapper类型,用于接收zabbix-sender发来的nginx_status。

模板配置了触发器,如果获取不到nginx_status则发出告警。

    2、创建nginx监控主机并链接模板

“nginx监控主机”的配置中要填写Agent interfaces,并链接模板Template App Nginx。

    3、数据展示

本文出自 “启程的Linux博客” 博客,请务必保留此出处http://qicheng0211.blog.51cto.com/3958621/1557695

Zabbix的集中式监控的更多相关文章

  1. ZABBIX作集中式NGINX性能监控的注意要点

    今天测试好了.但有几个要点要注意. 一是出了问题看日志. 二是主动测试脚本. 三是注意LLD自动发现的ZABBIX类型(TRAPPER,捕捉器类型) 四是有主机上有问题时可以看到(UNSUPPORT) ...

  2. 网站集群架构(LVS负载均衡、Nginx代理缓存、Nginx动静分离、Rsync+Inotify全网备份、Zabbix自动注册全网监控)--技术流ken

    前言 最近做了一个不大不小的项目,现就删繁就简单独拿出来web集群这一块写一篇博客.数据库集群请参考<MySQL集群架构篇:MHA+MySQL-PROXY+LVS实现MySQL集群架构高可用/高 ...

  3. 03: zabbix API接口 对 主机、主机组、模板、应用集、监控项、触发器等增删改查

    目录:Django其他篇 01: 安装zabbix server 02:zabbix-agent安装配置 及 web界面管理 03: zabbix API接口 对 主机.主机组.模板.应用集.监控项. ...

  4. 【Linux】Zabbix + MPM + msmtp + mutt 监控MySQL + 邮件报警

    Zabbix部署参考博文 http://blog.sina.com.cn/s/blog_5611597901017oe0.html  MPM安装配置参考博文和MPM官网下载地址 http://blog ...

  5. Centos7搭建集中式日志系统

    在CentOS7中,Rsyslong是一个集中式的日志收集系统,可以运行在TCP或者UDP的514端口上.   目录 开始之前 配置接收日志的主机 配置发送日志的主机 日志回滚 附件:创建日志接收模板 ...

  6. 理解OpenShift(7):基于 Prometheus 的集群监控

    理解OpenShift(1):网络之 Router 和 Route 理解OpenShift(2):网络之 DNS(域名服务) 理解OpenShift(3):网络之 SDN 理解OpenShift(4) ...

  7. elk + filebeat,6.3.2版本简单搭建,实现我们自己的集中式日志系统

    前言 刚从事开发那段时间不习惯输出日志,认为那是无用功,徒增代码量,总认为自己的代码无懈可击:老大的叮嘱.强调也都视为耳旁风,最终导致的结果是我加班排查问题,花的时间还挺长的,要复现问题.排查问题等, ...

  8. [转]系统架构演变--集中式架构-垂直拆分-分布式服务-SOA(服务治理)-微服务

    一.系统架构演变 1.1. 集中式架构 当网站流量很小时,只需一个应用,将所有功能都部署在一起,以减少部署节点和成本.此时,用于简化增删改查工作量的数据访问框架(ORM)是影响项目开发的关键. 存在的 ...

  9. 中小型研发团队架构实践七:集中式日志ELK

    一.集中式日志 日志可分为系统日志.应用日志以及业务日志,系统日志给运维人员使用,应用日志给研发人员使用,业务日志给业务操作人员使用.我们这里主要讲解应用日志,通过应用日志来了解应用的信息和状态,以及 ...

随机推荐

  1. python下载IGS观测数据

    最近在学习GPS数据软件处理,经常需要下载数据练习,反复去网站上很麻烦,于是就写了一个小小的爬虫,用的是韩国的服务器,使用了python中的ftplib库实现的 今天稍微改了一下代码,可以选择卫星系统 ...

  2. C# 各种集合

    大多数集合都在  System.Collections,System.Collections.Generic两个命名空间. 其中System.Collections.Generic专门用于泛型集合. ...

  3. SQL数据库安装

    安装过程中经常出现失败或者提示,那么久要清楚干净所有的数据在重新安装,步骤如下. SQL2008卸载 一.从控制面板卸载 1)点击计算机右下角“开始”,点击“控制面板” 2)点击“卸载程序”. 卸载与 ...

  4. The windows PowerShell snap-in 'Microsoft.Crm.PowerShell' is not installed on this computer

    加载PowerShell插件时出现以下错误: The windows PowerShell snap-in 'Microsoft.Crm.PowerShell' is not installed on ...

  5. 解决kernel headers报错

    Make sure you have updated version $ sudo apt-get update Search for kernel version (optional) $ apt- ...

  6. servlet 项目 ,,启动没问题,,但是,一请求也面就报错误。。。。求解决。。。。。。。。。。。。。各种百度,都没解决了啊。。。。。急急急急急急急急急急急急急急急急急急

    信息: Server startup in 1674 mslog4j:WARN No appenders could be found for logger (com.mchange.v2.log.M ...

  7. linux常用命令之ln

    ln是linux中又一个非常重要命令,它的功能是为某一个文件在另外一个位置建立一个同不的链接,这个命令最常用的参数是-s,具体用法是:ln –s 源文件 目标文件. 当我们需要在不同的目录,用到相同的 ...

  8. const和volatile的区别

    一.关键字const有什么含意? 只要一听到说:“const意味着常数”,就知道我正在和一个业余者打交道.去年Dan Saks已经在他的文章里完全概括了const的所有用法,因此ESP(译者:Embe ...

  9. iOS 事件处理机制与图像渲染过程(转)

    iOS 事件处理机制与图像渲染过程 iOS RunLoop都干了什么 iOS 为什么必须在主线程中操作UI 事件响应 CALayer CADisplayLink 和 NSTimer iOS 渲染过程 ...

  10. 基于nodejs的消息中心

    参考:http://t42dw.iteye.com/blog/1767013