Zabbix作为一款流行的企业级监控工具,可以监控各种网络设备和服务的状态,并提供强大的告警功能,能够在出现异常情况时及时通知管理员。以下是Zabbix的一些特点:

  • 支持多种监控方式,包括SNMP、JMX、IPMI等,可以监控各种网络设备、服务器、虚拟化平台等;
  • 提供了丰富的监控项和模板,可以轻松地监控各种指标,如CPU、内存、磁盘、网络等;
  • 提供了灵活的告警方式,可以通过邮件、短信、电话等方式通知管理员,并且可以根据不同的告警级别设置不同的通知方式。

尽管Zabbix在监控和告警方面非常强大,但在处理告警事件方面仍有不足之处

  • 缺乏告警降噪和抑制风暴的能力;
  • 没有提供oncall值班调度的能力;
  • 没有提供IM工具内闭环处理告警的能力;
  • 告警协同处理能力薄弱,没有数据沉淀和分析。

不仅仅是Zabbix,很多告警系统存在类似的问题,而FlashDuty正是为了解决这些问题而存在:

  • 提供丰富的集成来源,支持接收Zabbix等告警事件,在一个平台处理公司内所有告警
  • 提供灵活的告警降噪、聚合、静默、抑制、收敛能力,避免告警风暴,不错过任何敏感信息
  • 提供强大的值班能力,支持各种排班场景,告警仅通知对的人
  • 打通飞书、钉钉和企业微信,真正做到在IM内部随时随地处理告警
  • 提供完善告警协同、故障协同能力,支持知识沉淀和关键指标分析

快速接入Zabbix告警

FlashDuty支持接入Zabbix 3.x~6.x 所有版本的告警事件。不同版本接入方式略有不同:

  • 3.x~4.x版本:支持Script方式接入
  • 5.x~6.x版本:支持Webhook方式以及脚本方式接入

Webhook接入方式(3步,详情参照文档,本文仅简述):

  1. 下载并导入FlashDuty定制的Media Type,配置好URL等信息
  2. 关联FlashDuty Media Type到一个User
  3. 创建Action,配置触发、恢复与更新Operations通过FlashDuty Media Type发送信息到User

Script接入方式(4步,详情参照文档,本文仅简述):

  1. 创建Script类型的Media Type,配置好Parameters
  2. 登录 Zabbix server 所在服务器,切换到脚本目录,下载并导入FlashDuty定制的推送脚本
  3. 关联FlashDuty Media Type到一个User
  4. 创建Action,配置触发、恢复与更新Operations通过FlashDuty Media Type发送信息到User。注意修改Default Message配置,FlashDuty将解析Message中加密的信息,来获得更丰富的告警详情

Zabbix告警详情

  1. FlashDuty提取Zabbix告警详情中的部分信息作为标签

2.多条相关的原始告警信息将被合并到一条告警中,可以在关联事件中回溯

设定灵活的触达策略

FlashDuty通知策略非常灵活,可以针对不同场景设定不同的通知策略:

  1. 支持按照时间条件来过滤事件,并发送到不同的人群;
  2. 支持设置聚合发送窗口,如果在等待期内告警自动恢复或被人工处理,则不会发送该条告警;
  3. 支持单聊群聊通知方式,以及多样的通知渠道。推荐以IM方式进行通知;
  4. 支持告警在不同人群中升级;

  1. 支持自定义通知模板渲染(Golang模板语法及上百种常用函数),配合预览调试能力;

  1. 支持告警静默、告警抑制,提前设定策略,减少不必要的告警通知。

设置专属值班日历

支持日常值班、节假日值班、临时调班等值班场景,支持自定义值班角色等高级选项,可灵活扩展。

自定义值班角色为高级功能,需要联系我们开通

在IM内外处理告警

全面打通飞书、钉钉和企业微信,支持在聊天页面直接处理告警,操作状态将在多端同步,真正做到随时随地处理告警

  1. 首次登录即完成账户关联,后续免登录
  2. 提供关键功能按钮,可以直接在卡片消息上操作
  3. 处理进度实时同步卡片,全员可见

以下分别为在飞书、钉钉和企业微信iOS客户端内处理告警过程:



查看告警治理趋势分析

支持统计关键的告警治理指标:

  1. 支持告警、故障的MTTx指标按多维度统计;
  2. 支持告警、故障等数量统计;
  3. 支持TopK告警策略和告警对象发现。

最后

总的来说,FlashDuty可以弥补Zabbix等监控系统在告警降噪、值班调度、告警协同处理等方面的不足。它支持多种告警来源,灵活的告警降噪和静默功能,强大的值班能力,以及完善的告警协同、故障处理、趋势分析能力。

如果您正在寻找一款更好的告警处理系统,那么FlashDuty值得一试。现在点击链接完成注册,自动获得专业版14天试用机会

玩转Zabbix智能告警:降噪、排班、认领、升级、IM协同的更多相关文章

  1. 运维告警排班太复杂?试试Cloud Alert智能告警排班

    前言: 之前的几篇文章有说过,通过智能告警平台Cloud Alert,将指定条件的告警以多样化的通知方式,通知到指定的人,其中的通知的方式包含电话.短信.邮件.微信.APP.钉钉等. 本篇文章就来说下 ...

  2. 详解 OneAlert 排班可以帮你做什么

    排班的存在,实质是通过有序安排,降低企业/团队人力成本,提升工作效率. 阅读导航(预计2min)   1. 详解排班功能 轮班机制 工作时间 双视图展示 灵活调整 2. 利用排班如何助力运维团队 排班 ...

  3. Zabbix全方位告警接入-电话/微信/短信都支持

    百度告警平台地址: http://gaojing.baidu.com 联系我们: 邮箱:gaojing@baidu.com 电话:13924600771 QQ群:183806029 对于使用zabbi ...

  4. zabbix邮件告警

    Zabbix邮件告警看了很多文档,写的那叫一个蛋疼,明明没有发出去邮件,硬要糊弄观众,我也跟着被糊弄. 操作系统环境: CentOS 5.5 x84_64位 Zabbix版本2.2.3 Web服务器: ...

  5. 通过python为zabbix发送告警邮件

    最近部署ZABBIX的邮件告警时,用刚学的python来写告警邮件脚本. 由于时间有限,我只对关键步骤做截图,对zabbix的基本配置略过. python代码如下 1 #!/usr/bin/pytho ...

  6. 使用SQL语句使数据从坚向排列转化成横向排列(排班表)

    知识重点: 1.extract(day from schedule01::timestamp)=13 Extract 属于 SQL 的 DML(即数据库管理语言)函数,同样,InterBase 也支持 ...

  7. zabbix监控告警Received empty response from Zabbix Agent Assuming that agent dropped connection

    zabbix监控告警Received empty response from Zabbix Agent Assuming that agent dropped connection错误 查看zabbi ...

  8. Google Optimization Tools实现员工排班计划Scheduling【Python版】

    上一篇介绍了<使用.Net Core与Google Optimization Tools实现员工排班计划Scheduling>,这次将Google官方文档python实现的版本的完整源码献 ...

  9. 使用.NET Core与Google Optimization Tools实现员工排班计划Scheduling

    上一篇说完<Google Optimization Tools介绍>,让大家初步了解了Google Optimization Tools是一款约束求解(CP)的高效套件.那么我们用.NET ...

  10. zabbix邮件告警之 通过shell脚本发送告警

    说明:本文讲如何通过shell脚本实现zabbix发送告警邮件,共有5步1.设置mailx账号:是配置mailx的发信账号2.zabbix服务器端编写邮件发送脚本:是增加zabbix的告警方式,增加通 ...

随机推荐

  1. 力扣1(java&python)-两数之和(简单)

    题目: 给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 target  的那 两个 整数,并返回它们的数组下标. 你可以假设每种输入只会对应一个答案.但是, ...

  2. 龙蜥社区开源 coolbpf,BPF 程序开发效率提升百倍 | 龙蜥技术

    简介: coolbpf,可以酷玩的BPF!来看看让BPF加了双翅膀的它究竟有多硬核? 文/系统运维 SIG(Special Interest Group) 引言 BPF 是一个新的动态跟踪技术,目前这 ...

  3. 使用AirFlow调度MaxCompute

    简介: airflow是Airbnb开源的一个用python编写的调度工具,基于有向无环图(DAG),airflow可以定义一组有依赖的任务,按照依赖依次执行,通过python代码定义子任务,并支持各 ...

  4. [Mobi] 什么是手机 Root 和 Magisk、Magisk App

    手机进行 Root 操作就是让我们能够拥有超级权限,包括被手机厂商所禁止的一些操作. 传统 Root 手段会修改系统文件,因而一些安全性要求较高的 App 会禁止自己在 Root 过的手机上运行. M ...

  5. 【AI新趋势期刊#2】AI发明计算机算法,如何给大模型排行,照片秒变二维码,视频一键动漫风

    前言 每天都要浏览大量AI相关新闻,是不是感到信息量爆炸,有效信息少? 这么多新产品和新工具,到底哪些是真正是有价值的,哪些只是浮躁的一时热点? 想参与AI产品和工具的开发,从哪里能够获得大量的灵感和 ...

  6. ITIL4服务价值系统(SVS)与莫比乌斯环:无限服务优化的拓扑之旅

    莫比乌斯环:单一而无限的象征 莫比乌斯环,这个拓扑学上的奇观,以其独特的一体两面特性,完美地映射了ITIL4服务价值系统的精髓.它象征着无限.统一和连续性,提示我们看待事物时应超越传统二元对立的视角, ...

  7. 使用.NET源生成器(SG)实现一个自动注入的生成器

    DI依赖注入对我们后端程序员来说肯定是基础中的基础了,我们经常会使用下面的代码注入相关的service services.AddScoped<Biwen.AutoClassGen.TestCon ...

  8. linux-centos7.6-gpt-uefi安装

    目录 linux-centos7.6-gpt-uefi安装 一.需要 二.环境 三.vm新建虚拟机系统环境 四.开始安装 linux-centos7.6-gpt-uefi安装 一.需要 安装的系统适用 ...

  9. jeecgboot项目swagger2在线接口转word

    1.先找到接口文档地址 2.根据url获取接口数据 3.利用在线工具进行转换生成word 在线工具地址:在线swagger转word文档  生成的word文档如下:  

  10. flex布局方案

    参考:https://blog.csdn.net/weixin_39717076/article/details/82586915