一般来讲,在安装完 Nagios 后,我们做的第一件最正确的事,就是设置它的邮件通知,对吧。因为如果没有这一步骤的话,你怎么能够知道什么时候会出现问题呢?

伴随着成功的初始安装,你即将是你司唯一一个能够接收到告警数据的人。Nagios 的一个很好的功能就是可以监控到不同的服务器。人生如梦,这种蜜月期并不会持续太久,很快事情就会从很好处理变得开始难以操纵,等到你意识到已为时晚矣———每天都会有几十个甚至上百个告警铺天盖地的蜂拥而至。你试图去理清这些永无休止、有如浪潮般的告警邮件,但依然是剪不断,理还乱......

说实话,告警信息真没必要非得弄得诸如此般狼狈不堪的模样。以下列出了关于有效告警的几个方面,并且告诉大家 Nagios 邮箱告警的不可取之处。

请注意,告警信息都是动态的,即并非是静态的一成不变的

当这些告警信息以电子邮件的方式进入到你的邮箱后,它们就不会再发生改变了,然而现实中的告警却是无时无刻的不在变化。这意味着你将会每一刻都收到状态发生了改变的告警电子邮件,导致你查看邮件时很难搞清哪一个告警才是当下发生的。这时候小伙伴儿们就该说了,解决此类问题很简单啊,只单单查看最近时间的一些告警邮件即可,说的简单,同志们,试想一下,你登陆邮箱后成百上千封邮件扑面而来,你从中很快速的筛选出离得最近的有效告警邮件,并且这些告警恰恰能够把你系统出现的所有问题都涵盖到,并且去一一解决,做到无一遗漏,现实吗?

应用性能管理告警压缩

Nagios 是基于服务器和主机形式的告警监控,这就意味着,如果一台服务器有多项问题,那么每一个问题都会对应发送出一个相关的邮件。你只能自己通过界定他们之间的依赖关系,来尝试解决告警问题。在现代化环境中,我们发出的更多的是应用性能管理告警,而并不是特定的服务器或是主机。

例如,在一百台服务器中,如果只有一台出了问题,碰巧除此之外其余所有的服务器都在如期的正常工作中,我们就用不着整晚都在修复中度过了。而如果有五十台服务器宕了,那就是非常严重的报警了,但我们一下子也处理不了五十个告警呀。因此,我们更习惯于只接受到有关应用层面的一个压缩告警,告诉我有多少服务器受到了影响,又有多少服务器依然是在正常的运行中,好让我能够对当下出现的问题一目了然。

告警分析

通常情况下,在解决告警或者完全弄懂告警的问题上,告警信息的监控其实并不到位。比如我现在手头上有一个问题,那么往往得到更多的告警信息才能够大幅度地减少解决这个问题的时间。

例如,一台服务器超负荷了,如果我们能看到最近几小时的 CPU 图表,并且能了解到应对此问题做出高级指令后的执行结果,会对我们解决告警起到至关重要的作用。这些完全可以用 OneAlert 的分析功能来实现,但这仅仅这也是该功能的冰山一角。如果你还能看到这个问题发生时的最近告警事件的柱状图,又或者是在这一段时间中,发生在你的系统中所有信息的一系列变化,包括告警事件次数、平均确认时间、平均解决时间等,会不会是超赞的呢?

可控的

单单获取内容是不够的,比如现在,当我收到一个告警的时候,介于我正在忙其他更重要的事情,我想指派给某人来处理此告警,又或者是这个报警本身就应该由相应的人来处理,系统必须正确的把报警信息指派给特定的人,该怎么办呢?更深一层次的说,我们需要有大量的可控化操作,比如勘察记录、人工指派、逐层分级以及解决问题的分享等。

团队协作

一个团队如果能够很好的互相协作,会使得很多事情变得很好解决,但团队中处理 Nagios 的邮件报警有的时候真的是很痛苦。让我们来看一看那些堆积邮件如山的邮箱吧,你怎么知道是否有人已经做出了正确的答复?你又该如何快速的将一个告警,开放式的分配指派给他人,又或者请教他人解决的方式呢?你能够看到团队其他成员关于某一事件的最后一次告警作出的详细笔录吗?这些看似简单的问题,对于邮箱告警来说基本不可能实现。

Nagios 很难制定人性化的程序。我们知道,只有得益于一些插件和先进的配置的帮助,问题才会得到更好的解决。把控系统的所有可能性,并且持续的维护它们是 OneAlert 的使命。仅仅举几个例子:告警压缩、告警分析、指派分配、告警记录、团队分享等太多太多了……那么问题来了,你应该如何开始管理你的监控系统?

OneAlert 专注于解决处理以上所有的痛点,不要惊奇,想来了解一下吗?现在还可以免费体验,赶快行动吧!

Nagios 邮箱告警的方式太OUT了!的更多相关文章

  1. Nagios全方位告警接入-电话/微信/短信都支持

    百度告警平台地址: http://gaojing.baidu.com 联系我们: 邮箱:gaojing@baidu.com 电话:13924600771 QQ群:183806029 Nagios接入 ...

  2. Zabbix三种邮箱告警配置

    环境 环境 IP地址 主机名 需要安装的应用 系统版本 服务端 192.168.23.140 zabbix lamp zabbix_server zabbix_agent CentOS 8 客户端 1 ...

  3. Zabbix邮箱告警

    一.安装邮箱 yum install mailx 二.配置邮箱 vim /etc/mail.rc set from=875667601@qq.com set smtp=smtp.qq.com set ...

  4. 自定义nagios check_load告警阀值

    自定义nagios  check_load告警阀值 日期:2012-01-11 来源: heipark 分享至: - 默认check_load配置 define service{ use generi ...

  5. Grafana邮箱告警

    1.grafana-server 配置 smtp 服务器 vim /etc/grafana/grafana.ini #修改一下内容 ################################## ...

  6. [elk]elastalert邮箱告警

    本次要完成以下任务: 1.源码包安装elasticalert 2.配置邮箱报警 原则: 先很快的通过alert报警发一份邮件,其次了解alert配置文件各个选项 源码安装elasticalert 参考 ...

  7. SpringCloud微服务实战——搭建企业级开发框架(四十五):【微服务监控告警实现方式二】使用Actuator(Micrometer)+Prometheus+Grafana实现完整的微服务监控

      无论是使用SpringBootAdmin还是使用Prometheus+Grafana都离不开SpringBoot提供的核心组件Actuator.提到Actuator,又不得不提Micrometer ...

  8. zabbix使用邮箱告警

    目的:使用自己的邮箱(目前我使用的是腾讯企业邮箱)发送告警邮件 1.配置Email:管理->报警媒介类型->Email->修改对应Email参数 2.修改admin用户的报警媒介Em ...

  9. Nagios Email告警 发不了,可能是 /var/spool/mqueue nagios用户没权限

    Nagios邮件报警   Nagios邮件报警 准备 yum - y install ntp        ntpdate time.windows.com   同步时间,否则无法发送邮件 yum - ...

随机推荐

  1. dedecms 首页分页功能

    1.需要引入 <script language="javascript" type="text/javascript" src="{dede:g ...

  2. h2database源码浅析:事务、两阶段提交

    Transaction Isolation Transaction isolation is provided for all data manipulation language (DML) sta ...

  3. C#学习笔记12:枚举、结构、数组基础学习

    枚举:public enum MyEnum { 值1, 值2, 值3 } Public enum Season { 春, 夏, 秋, 冬 } 枚举的作用:规范用户的输入,枚举可以转换为int类型,可以 ...

  4. 安装.NET Framework组件时,电脑意外重启后再次安装失败

    因为软件运行环境需要安装.Net Framework,我安装的是2.0sp版本,可以安装过程中计算机意外关闭,重新打开后再次安装却出现安装失败的提示,具体内容是: 产品: Microsoft .NET ...

  5. Java内存溢出的详细解决方案

    本文介绍了Java内存溢出的详细解决方案.本文总结内存溢出主要有两种情况,而JVM经常调用垃圾回收器解决内存堆不足的问题,但是有时仍会有内存不足的错误.作者分析了JVM内存区域组成及JVM设置虚拟内存 ...

  6. [jquery]高级篇--js绑定事件

    参考:  http://www.cnblogs.com/leejersey/p/3545372.html jQuery on()方法是官方推荐的绑定事件的一个方法.$(selector).on(eve ...

  7. Bootstrap使用心得

    久闻Twitter的Bootstrap框架强大且易用,近日为改版小丸工具箱的官网特地花了一周实践. 这篇文章总结我在使用Bootstarp中的一些关键点. 1.布局 Bootstrap框架的布局采用了 ...

  8. 程序员面试题精选100题(16)-O(logn)求Fibonacci数列[算法]

    作者:何海涛 出处:http://zhedahht.blog.163.com/ 题目:定义Fibonacci数列如下: /  0                      n=0 f(n)=      ...

  9. N个数随机相加得出固定值的排列组合

    static double[] iArr = new double[10] { 1,2,3,4,5,6,7,8,9,10 }; static Stack<double> stack = n ...

  10. rsync+inotity

    rsync默认端口:873xinetd默认服务 inotify参数详解inotifywait-r:递归-q:只打印事件-m:始终监听事件--excludei:排除--timefmt:时间格式--for ...