Flashduty 作为功能完备的事件OnCall中心,可以接入云上、云下不同监控系统,统一做告警降噪分派、认领升级、排班协同,已经得到众多先进企业的认可。我们采访了一些典型客户代表,了解他们的痛点、选型考虑和未来展望,集成本系列文章,以飨读者。

本次采访的是来自益丰大药房的高级运维工程师张望。益丰大药房是一家连锁零售药房企业,有上万家门店,官网是https://www.yfdyf.com/,已于主板上市,股票代码:603939,颇具规模。

Question:张望老师您好,请问在选择 Flashduty 之前,贵司是如何做告警事件管理和触达的呢?

Answer:我们内部有多套不同的监控系统,用于机器和网络设备监控的 Zabbix,用于中间件和应用监控的 Prometheus + Nightingale,同时也使用了多家云厂商的云监控,用于云资源的监控。

不同的监控系统都会发出告警,但是缺少了统一的告警聚合降噪、认领升级能力,Zabbix、Prometheus、Nightingale 我们主要发企微告警,云监控主要打电话发短信。因为主要告警消息在企微群里,缺少比较好的认领机制,有时告警不能及时处理酿成故障,这是我们之前的主要痛点。

另外就是有时会短期触发特别多告警出来,而且是不同监控系统产生,重要的不重要的告警混杂在一长串的企微消息里,看起来费劲,也容易忽略重要告警。这多个监控系统中,Prometheus 生态的 Alertmanager 会有一定的降噪能力,但是需要维护 yaml 配置,容易出错,不方便管理,整体就感觉比较苦恼。

Question:您内部的告警事件现在都迁移到 Flashduty 了么?目前效果如何?是否有一些建议给我们?

Answer:是的,主要监控系统的告警事件都推到 Flashduty 了。目前整体效果还不错。上次我们大数据团队提的那个需求,希望在推告警事件给 Flashduty 时,携带一些自定义的通知人和升级逻辑,我看你们也抽象为产品能力支持了,大数据团队负责人钱哥也表示效果符合预期。

Question:您在调研事件 OnCall 产品时应该也看过其他竞品,最终选择 Flashduty 的原因可否分享一二?

Answer:是的,因为公司要求必须要对比多家产品,我们深度调研了两个产品,另外也考虑自研,整体算是三个方案一起决策。自研的话比较可控,就是担心人员流动之后后面留下烂摊子,另外事件中心不是我们的核心业务产品方向,我们主要是做药房生意的,这类辅助类功能,老板也不愿意投入过多人力。外采的产品性价比还可以,所以最终决定外采。

对比市面上的产品之后最终选择 Flashduty,主要是感觉你们的 UI 还挺现代化的,告警分派、认领升级也比较灵活,对我们是够用了。另外大数据团队提的需求你们响应很及时,这也是个加分项。

另外我们也在用 Nightingale,之前也做过一些交流,感觉你们在监控告警这块比较专业,这也是一个小的加分项。

Question:感谢张望老师,对于后面的产品方向和合作方面,您是否有一些建议给到我们呢?

Answer:我们内部同事聊天的时候,普遍觉得你们有个优点可以保持下去,就是愿意随着客户一起迭代、一起成长。其实我们团队在公司内部也做了很多年监控了,也还是会间歇性有一些新需求新想法,一个系统没法说一旦落地就永远不动了。能够不断迭代,持续优化产品,能够持续支持客户的业务发展、支持客户的新想法落地,我觉得非常关键,这一点希望你们可以保持下去。

关于Flashduty

️ Flashduty 中心化告警处理,在正确的时间通知正确的人

每一分钟都很关键,降低故障时间,就是赚钱

️ 您常用的监控系统,我们都可以集成

告警事件的及时处理,对于线上稳定性保障至关重要。一款中心式的告警事件 OnCall 中心,去除告警风暴,确保告警不遗漏,还能分析故障处理的MTTA、MTTR等效率指标,先进的团队需要拥有,快来免费体验吧:https://flashcat.cloud/product/flashduty/

Flashduty 案例分享 - 益丰大药房的更多相关文章

  1. 老李案例分享:Weblogic性能优化案例

    老李案例分享:Weblogic性能优化案例 POPTEST的测试技术交流qq群:450192312 网站应用首页大小在130K左右,在之前的测试过程中,其百用户并发的平均响应能力在6.5秒,性能优化后 ...

  2. 性能调优案例分享:Mysql的cpu过高

    性能调优案例分享:Mysql的cpu过高   问题:一个系统,Mysql数据库,数据量变大之后.mysql的cpu占用率很高,一个测试端访问服务器时mysql的cpu占用率为15% ,6个测试端连服务 ...

  3. [转载]DevOps在传统企业的落地实践及案例分享

    内容来源:2017年6月10日,优维科技高级解决方案架构师黄星玲在“DevOps&SRE 超越传统运维之道”进行<DevOps在传统企业的落地实践及案例分享>演讲分享.IT 大咖说 ...

  4. mysql的"双1设置"-数据安全的关键参数(案例分享)

    mysql的"双1验证"指的是innodb_flush_log_at_trx_commit和sync_binlog两个参数设置,这两个是是控制MySQL 磁盘写入策略以及数据安全性 ...

  5. MySQL数据库详解之"双1设置"的数据安全的关键参数案例分享

    mysql的"双1验证"指的是innodb_flush_log_at_trx_commit和sync_binlog两个参数设置,这两个是是控制MySQL 磁盘写入策略以及数据安全性 ...

  6. 前端案例分享(一):CSS+JS实现流星雨动画

    目录 引言 1.效果图 2.源码 3.案例解析 4.小问题 5.结语 引言        平常会做一些有意思的小案例练手,通常都会发到codepen上,但是codepen不能写分析.        所 ...

  7. 易普优APS高级计划排程系统系列提纲:行业知识,业务建模,排程算法,计划可视化,平台框架,案例分享

    专注于高级计划排程系统研发与实施10来年了,国内外各种APS软件基本都研究过,这里列个提纲主要从6个方面跟大家一起讨论分享,欢迎大家鼓掌或拍砖 易普优APS高级计划排程系统系列001:行业知识,APS ...

  8. CODING 携手 Thoughtworks 助力老百姓大药房打造”自治、自决、自动”的敏捷文化

    老百姓大药房是中国具有影响力的药品零售连锁企业,中国药品零售企业综合竞争力百强冠军.中国服务业 500 强企业.湖南省百强企业. 自 2001 年创立以来,现已成功开发了湖南. 陕西.浙江.江苏等 * ...

  9. Gradio入门到进阶全网最详细教程[一]:快速搭建AI算法可视化部署演示(侧重项目搭建和案例分享)

    Gradio入门到进阶全网最详细教程[一]:快速搭建AI算法可视化部署演示(侧重项目搭建和案例分享) 常用的两款AI可视化交互应用比较: Gradio Gradio的优势在于易用性,代码结构相比Str ...

  10. ArcGIS Add-in插件开发从0到1及实际案例分享

    同学做毕设,要求我帮着写个ArcGIS插件,实现功能为:遍历所有图斑,提取相邻图斑的公共边长及其他属性(包括相邻图斑的ID),链接到属性表中.搞定后在这里做个记录.本文分两大部分: ArcGIS插件开 ...

随机推荐

  1. 迁移 Nacos 和 ZooKeeper,有了新工具

    简介: 注册中心迁移在行业中主要有两个方案,一个是双注册双订阅模式(类似数据库双写),一个是 Sync 模式(类似于数据库 DTS):MSE 同时支持了两种模式,对于开通 MSE 服务治理客户,MSE ...

  2. 浅谈RSocket与响应式编程

    ​简介: RSocket是高效一个二进制的网络通讯协议,能够满足很多场景下使用.另外,RSocket也是一个激进的响应式捍卫者,激进到连API都跟响应式无缝集成.本文我们将和大家分享RSocket与响 ...

  3. [GPT] php 报错 Unsupported operand types

    Unsupported operand types 这个错误通常发生在使用了不支持的操作数类型时.例如,当您尝试对两个不同类型的值执行算术运算时,就会出现这个错误. 例如,如果您尝试将字符串与数字相加 ...

  4. 2019-7-3-Roslyn-理解-msbuild-的清理过程

    title author date CreateTime categories Roslyn 理解 msbuild 的清理过程 lindexi 2019-07-03 18:21:25 +0800 20 ...

  5. 2019-7-2-WPF-通过-ReadyToRun-提升性能

    title author date CreateTime categories WPF 通过 ReadyToRun 提升性能 lindexi 2019-07-02 10:29:55 +0800 201 ...

  6. B/S 结构系统的 缓存机制(Cookie) 以及基于 cookie 机制实现 oa 十天免登录的功能

    B/S 结构系统的 缓存机制(Cookie) 以及基于 cookie 机制实现 oa 十天免登录的功能 @ 目录 B/S 结构系统的 缓存机制(Cookie) 以及基于 cookie 机制实现 oa ...

  7. vue子组件给父组件传值

    子组件: <template> <div class="app"> <input @click="sendMsg" type=&q ...

  8. ansible系列(23)--ansible的when控制语句

    目录 1 when控制语句 1.1 根据不同操作系统安装相同的软件 1.2 为不同centos版本安装httpd软件 1.3 为特定的主机添加Nginx仓库 1.4 判断服务是否正常运行 1 when ...

  9. JSON字符串数据转换指定实体对象数据

    一.引入需要的maven依赖 <dependency> <groupId>org.projectlombok</groupId> <artifactId> ...

  10. three.js教程4-Group层级模型

    1.组对象Group.层级模型-形成树状结构 //创建两个网格模型mesh1.mesh2 const geometry = new THREE.BoxGeometry(20, 20, 20); con ...