Cloud Alert 的部分应用部署在阿里云上,使用了多方面的监控服务:

  • 阿里自身的ECS服务器和网站。

  • Zabbix 监控服务器应用程序。

  • OneAPM 的应用级监控。

  • 腾讯云拨测,做网站监控。

腾讯云和阿里云的网站监控,总体来说腾讯云的云拨测告警延迟大一些。所以我们就强烈要求 Cloud Test 云测开发网站监控功能,这里就不打广告了。

使用过程中存在一些问题:

  • 监控工具多,告警不是很方面集中跟踪,所以需要集中告警平台。

  • 漏告警,深更半夜基本上很容易遗漏。阿里云监控告警仅告一次,不小心就漏了。毕竟不会挨个短信/邮件去跟踪。

Cloud Alert 自身就是集中告警云平台,所以我们自己就把阿里云告警和其他监控工具的接入进来,并且设置了告警自动升级策略,运维同学(也是开发)配置下短信、微信、电话、邮件通知。

  • 告警集中,目前支持了10多种方式:Zabbix 、Nagios 、Open-Falcon 、阿里云 、腾讯云、OneAPM 、监控宝、 vSphere 、 Solarwinds 、 Cacti 等工具。

  • 通知必达,个人和团队。支持微信、短信、电话、邮件等方式通知到人、如果没有人处理自动升级,总能找到人。解决漏告警问题。

接入阿里云监控很简单:

是通过在阿里云中配置Webhook URL的方式,将阿里云接入到Cloud Alert

1、进入Cloud Alert中点击集成-监控工具-阿里云

2、填写应用名称,点击保存生成appKey

3、将回调连接填写到阿里云控制台->云监控->报警服务->报警规则->修改页面,点击保存即可。

# URL格式

http://api.aiops.com/alert/api/event/aliyun/--/  --处填入您新建应用时生成的appkey

接下来设置下分派策略,这里设置了2个层次,一线有2人,一个组,以及一个轮流的排班,如果15分钟没有处理,会升级到2线。(测试环境)配置参考下方:

最后,设置下自己的通知方法,目前支持微信、短信、电话、邮件,个人偏爱微信,电话是终极利器。界面如下图。

如果告警被确认就不会继续发送其他提醒。微信版告警截图如下:

有了Cloud Alert电话报警,再也不怕遗漏告警了的更多相关文章

  1. 运维告警排班太复杂?试试Cloud Alert智能告警排班

    前言: 之前的几篇文章有说过,通过智能告警平台Cloud Alert,将指定条件的告警以多样化的通知方式,通知到指定的人,其中的通知的方式包含电话.短信.邮件.微信.APP.钉钉等. 本篇文章就来说下 ...

  2. Zabbix集成Cloud Alert(睿象云)实现电话短信预警

    Zabbix 集成 睿象云智能告警平台 CA ( Cloud Alert ) 一 .简介与前期了解 Cloud Alert 通过应用,接入监控系统/平台的告警,集中管理您的告警,统一分派通知,统一分析 ...

  3. Kubernetes+Promethues+Cloud Alert实践分享

    前言 容器集群管理系统 Kubernetes(简称K8s),为容器化的应用提供部署运行.容器编排.负载均衡.服务发现和动态伸缩等一系列完整功能,Prometheus 对 K8s 支持非常棒,能够自动发 ...

  4. Cloud Alert 实现告警智能降噪,成功规避告警风暴

    # 前言 睿象云前段时间发表了一篇[< Zabbix 实现电话.邮件.微信告警通知的实践分享>](https://www.toutiao.com/i6734876723126469127/ ...

  5. 应对告警风暴,Cloud Alert 实现告警风暴智能降噪

    前言 睿象云前段时间发表了一篇< Zabbix 实现电话.邮件.微信告警通知的实践分享>的技术文章.它帮助我们非常轻松地支持了各种告警通知方式,但是存在一个严重的问题,我们经常接到各种相类 ...

  6. 微信告警如何配置?用Cloud Alert快速实现微信告警

    在当下互联网蓬勃发展的时代里,微信已经成为了人们生活中不可分割的一部分.作为苦逼的运维人员,我们自然也得跟得上时代的步伐,将微信添加进告警的通知方式里.如果能够将告警消息第一时间发送到微信中,更清楚地 ...

  7. Zabbix + Cloud Alert 实践分享

    前言 如果要问老牌开源监控工具泰斗,当zabbix莫属.之前已分享过 [Kubernetes+Promethues+Cloud Alert实践分享],本篇将继续分享 Zabbix + Cloud Al ...

  8. zabbix 集成cloud alert

    1.       了解 Cloud Alert 通过应用,接入监控系统/平台的告警,集中管理您的告警,统一分派通知,统一分析.这个平台最先了解和使用是在 2017 年下半年,之前的名称叫 oneits ...

  9. Zabbix 关联onealert实现电话报警

    Zabbix 关联onealert实现电话报警 系统环境:Linux Centos 7.4 应用版本:Zabbix 3.0.22 OneAlert官方地址:http://www.onealert.co ...

随机推荐

  1. Oracle和MySql之间SQL区别(等效转换以及需要注意的问题)

    本篇博文是Oracle和MySQL之间的等效SQL转换和不同,目前市面上没有转换两种SQL的工具,小编觉得以后也不一定会有,于是在业余时间整理了一下,如果有什么错误之处请留言告知,小编也是刚入门的小白 ...

  2. linux(centos8):用fallocate快速生成大文件

    一,fallocate的用途? 1,用途 我们有时需要用大文件来测试下载速度, 有时需要用大文件来覆盖磁盘空间, 如果在网上搜索,很多文章讲的是使用dd等工具, 事实上linux系统已经内置了生成大文 ...

  3. centos8平台搭建mysql8数据库主从同步

    一,两台服务器的规划 a服务器:主机名:yjweb ip: 121.122.123.47 角色:主库 server-id:1 j服务器:主机名: os3 ip: 121.122.123.134 角色: ...

  4. nginx安全: 配置http基本验证(Basic Auth)(nginx 1.18.0)

    一,http基本验证的作用: 1,http基本身份验证会从浏览器弹出登录窗口, 简单明了,容易理解, 对于面向终端用户的前台来说,不够友好, 但对于内部员工操作的后台还是很有用,通常作为一层安全措施应 ...

  5. 单元测试之道Java版——读书笔记

    单元测试知道Java版读书笔记 首先我们必须要知道我们所写的代码,它的功能是什么,如果我们不了解代码的行为,那么也就无从测试. 我们测试的目的,是为了我们整个程序架构的稳定,代码其实就是欧文要实现功能 ...

  6. influxdb集群部署

    环境准备 influxdb enterprise运行条件最低需要三个meta nodes节点以及两个data nodes Meta nodes之间使用TCP和Raft一致性协议通信,默认端口为8089 ...

  7. pyqt5屏幕坐标系

    我们直接用代码去理解屏幕坐标系 import sys from PyQt5.QtWidgets import QHBoxLayout,QMainWindow,QApplication,QPushBut ...

  8. bash xshell 特性

    1.tab键补全 2.命令行常用快捷键: ctrl键+ c    #取消当前操作 ctrl键+ d    #退出当前用户登录 ctrl键+ a    #光标移动到光标所在行的行首 ctrl键+ e  ...

  9. Redis学习笔记(九)——集群

     一.概述 Redis Cluster与Redis3.0.0同时发布,以此结束了Redis无官方集群方案的时代. Redis Cluster是去中心化,去中间件,也就是说,集群中的每个节点都是平等的关 ...

  10. cookie和webstorage

    HTML 5 Web 存储 HTML5 提供了两种在客户端存储数据的新方法: localStorage - 没有时间限制的数据存储 <!DOCTYPE html> <html> ...