Zabbix——异常问题处理】的更多相关文章

问题知悉只能知悉一次知悉了之后就不能再次知悉了,但又不想再创建新的异常怎么办呢.....直接改数据库数据.首先找到acknowledges表这里边存放的全是已经知悉的异常然后找events表,events表中有acknowledged字段0为未知悉,1为知悉.将ackniwkedges和events关联数据的acknowledged都改为0,然后删除acknowledged表数据.暴力操作直接把acknowledges数据全干掉,吧events的ackowledged字段全改为0即可.…
报错: zabbix server is not running: the information displayed may not be current 解决: selinux关闭.开启selinux会引起一连串问题,甚至zabbix的discovery功能也不能正常使用 关闭SELinux的方法: 修改/etc/selinux/config文件中的SELINUX="" 为 disabled ,然后重启. 如果不想重启系统,使用命令setenforce 0…
zabbix可不仅仅只有监控功能,还支持远程执行命令,实现简单自动化运维 以下以监控mysql的3306端口为例,如该端口异常关闭,自动执行命令重启mysql 创建一个监听3306的监控项,键值按照这样写也可以.不过可能换成net.tcp.listen[3306]会更合适一些 表达式那里,点击右边的按钮,在监控项里选择刚才新增的监控项就可以了,监控到未监听返回0,正常监听返回1.我们设置返回0时,触发该触发器实现告警和进行下一步操作 接下来新增一个动作.新的触发条件那里选择触发器=刚才新创建的触…
今天来了解一下关于ELK的“L”-Logstash,没错,就是这个神奇小组件,我们都知道,它是ELK不可缺少的组件,完成了输入(input),过滤(fileter),output(输出)工作量,也是我们作为运维人员需要掌握的难点,说到这里 ,又爱又恨:“爱之好,恨之难”:这个Logstash拥有这强大的插件功能,除了帮我们过滤,高效的输出日志,还能帮我们与Zabbix监控相结合? 因为我们的Logstash支持多种输出类型,能够收集web服务日志,系统日志,内核日志:但是:竟然是有日志输出,肯定…
针对平时工作中,zabbix snmp出现异常超时.不稳定.时通时断:Timeout while connecting 等的情况,以下我将以使用乐维监控为例,进行解决方案的详细叙述.   一.问题:设备SNMP不通 网络设备SNMP不通 Timeout while connecting to"192.168.1.99:161".    1.1 检查配置 1.  管理IP是否对应上     2.  对象团体名是否正确    3.  监控项snmp版本是否对应上    4.  根据以上3点…
数据采集频率:1分钟采集一次 数据连续多次异常触发:连续三次异常才触发告警 告警次数:告警三次 告警频率:每隔10分钟告警一次 默认模板“Template App Zabbix Agent”监控项“Agent ping”,下图中“更新间隔”即是数据采集频率 该模板中“Zabbix agent on {HOST.NAME} is unreachable for 5 minutes”触发器,nodata()函数最近5分钟都没有数据返回则触发,上文agent.ping的频率为1分钟,5分钟即为5次.…
监控的目的一个是可以查看历史状态,可以对比零晨和工作区间数据的对比,以便后期进行优化指导.还有一个是报警,总不能等到服务器出现异常了才去从头查是什么问题吧.所以这篇主要介绍报警中最基础的一个 配置邮件预警. 安装邮件发送工具mail 我选择的是mailx,所以的关闭其他的邮件发送工具 #systemctl stop sendmail #关闭 #systemctl disable sendmail #禁止开机启动 #systemctl stop postfix #关闭 #systemctl dis…
htxk-106主机信息现象如下: 通过zabbix_get命令 zabbix_get [7189]: Check access restrictions in Zabbix agent configuration 解决方法:通过查看zabbix相关的文件,发现在usr/local/sbin目录下存在zabbix_agend文件,查看文件的时间是7月份的,应该是次机器上以前安装过zabbix导致的, 删除改文件后重启即可: 到这里以为问题已经解决了,可以当通过shell脚本再次安装192.168…
保存下面的脚本到任意路径 名字.py 修改属组和权限: chown zabbix:zabbix * chmod 755 * 演示的路径为:/usr/local/zabbix/scripts/ # -*- coding:utf- -*- #.收集服务器上登录的IP #.删除收集到的白名单IP #.如果收集到的IP为空,则将白名单IP写入收集里面 import os import sys #获取ip ip=os.popen("who -u | grep -Eo '([0-9]{1,3}\.){3}[…
模板中的心跳监控项默认是主动性的,在windows下直接装上客户端后,如果不协调时间,可能会出现心跳数据异常, 因为是主动式的监控,agent上的数据主动的推送到server上,但是从server上看最新数据,是断断续续的,有时候长达5m,导致触发器触发,有告警发生(间隔30s).从server日志里还能看到xxxx主机 connected restored,有几个客户机的最新数据获取时间超前或者滞后 后来重启了agent,数据获取也同步了,数据刷新也正常了…