面上有很多优秀的 OS 级监控系统 (比如 falcon), 这些监控系统主要聚焦在 CPU/IO/Mem/Disk 和应用端口, falcon 甚至可以监控到 JVM. 但对于应用系统内部的一些监控, 比如程序的 exception/接口性能/调用链, 这些系统级的监控系统就不太好用了.
大众点评开源的 cat, 就是一个为数不多的面向应用的监控系统, 而且应该最好的一个.

======================
cat 使用场景:
======================
亮点:
1. [Event 类]: 使用 cat 收集程序抛出的 exception. cat 有报错大盘界面.
2. [Transaction 类]: 性能监控, 跨越边界的行为往往会引起性能问题.
3. [Event 类]: 实时监某系统访问频率.
4. [Transaction 类]: 分布式调用链监控, 这在微服务架构中尤其重要.
其他场景:
1. [Heatbeat 类]: 监控业务系统自身的一些指标, 比如 cpu/io 等. 程序需要主动定期执行心跳汇报指令.
2. [Metric 类]: 监控单位时间内的一些业务指标, 这些指标可以是累加计数类, 也可以是数值类. 对于累加计数类,

Cat 提供发送 alert 功能, 我们可以将报警以邮件/微信形式发送出去.

======================
Cat 内部机制:
======================
1. 业务应用: 业务应用通过 cat 的客户端进行埋点.
2. cat 客户端 (Cat-client): cat 客户端负责将埋点消息以队列形式传递到 cat 消费机.
cat 客户端和 cat 消费机之间是通过 TCP 长连接方式通讯的, 另外又是异步的消息队列, 所以性能很好.
3. cat 消费机 (Cat-consumer): cat 消费机不断地从网络中取出消息树, 然后转到服务端的消费队列中.
4. 控制台 (cat-home): cat-home 负责 Web UI 展现, 所有的 cat 节点都可作为控制台.
5. 告警端 (alarm-machine), 启动告警线程, 进行规则匹配, 发送告警信息, cat 集群中只有一个节点可以作为告警机.
6. 任务机 (job-machine), 做一些离线的任务,合并天、周、月等报表, cat 集群中只有一个节点可以作为任务机.
7. cat 原始日志转储 (Cat-consumer 组件之一), cat 原始日志转储可以认为是一个特殊的报表分析器, 它不生成报表, 仅仅是将消息存储到本地文件系统.

cat 所有服务器组件, 包括 cat-consumer 和 cat-home , 都是运行在同一个 JVM 内部的, 所以每个 cat 服务端既可以作为 consumer, 也可以作为 home, 另外一个 cat 集群可以跨多个数据中心.

实时报表: CAT 会生成每小时的报表, 对于当前小时, 是基于内存的, 所以 cat 能显示实时报表, 即使是多台机器构成的 cat 集群, 在报表上呈现的也是所有机器汇总, 而不是单台机器的汇总. cat 会展现单位时间内指标的总和, 对于数值类 metric, cat 会自动计算平均值等统计指标.

c

消息树可以嵌套

======================
Message-ID 格式
======================
Message-ID 格式: applicationName-ip-time-seq
第一段:是应用名 applicationName, 所以 applicationName 取名不要太长, 以减少网络开销.
第二段:是当前这台机器的 IP 的 16 进制格式.
第三段:是系统当前时间除以小时得到的整点数.
第四段:是表示当前这个客户端在当前小时的顺序递增号 (AtomicInteger 自增,每小时结束后重置).

======================
参考
======================

深入详解美团点评CAT跨语言服务监控(一) CAT简介与部署
https://blog.csdn.net/caohao0591/article/details/80693289
官网:
http://unidal.org/ http://cat.meituan.com/
发布历史
http://unidal.org/cat/r/home?op=view&docName=release
源码和文档
https://github.com/dianping/cat
透过 CAT,来看分布式实时监控系统的设计与实现
http://www.chanpin100.com/article/45629
深度剖析开源分布式监控 CAT
https://tech.meituan.com/CAT_in_Depth_Java_Application_Monitoring.html
大众点评CAT开源监控系统剖析
https://www.cnblogs.com/yeahwell/p/cat.html

点评cat系列-简介的更多相关文章

  1. 点评cat系列-服务器开发环境部署

    我们有三种部署方式:1. docker 部署2. 采用官方的 war 包部署. 3. 源码部署 很显然 docker 部署是最简单的, 我尝试了多次, 都在 cat docker 容器镜像的编译过程失 ...

  2. 点评cat系列-应用集成

    ========================消息的基本属性========================消息的几个属性:type: 定义消息的 category, 比如 SQL 或 RPC 或 ...

  3. 深入详解美团点评CAT跨语言服务监控(一) CAT简介与部署

    前言: CAT是一个实时和接近全量的监控系统,它侧重于对Java应用的监控,除了与点评RPC组件融合的很好之外,他将会能与Spring.MyBatis.Dubbo 等框架以及Log4j 等结合,支持P ...

  4. 美团点评CAT监控平台研究

    1. 美团点评CAT监控平台研究 1.1. 前言 此文根据我对官方文档阅读并记录整理所得,中间可能会穿插一些自己的思考和遇坑 1.2. 简介 CAT 是基于 Java 开发的实时应用监控平台,为美团点 ...

  5. 深入详解美团点评CAT跨语言服务监控(六)消息分析器与报表(一)

    大众点评CAT微服务监控架构对于消息的具体处理,是由消息分析器完成的,消息分析器会轮训读取PeriodTask中队列的消息来处理,一共有12类消息分析器,处理后的结果就是生成各类报表. 消息分析器的构 ...

  6. 深入详解美团点评CAT跨语言服务监控(四)服务端消息分发

    这边首先介绍下大众点评CAT消息分发大概的架构如下: 图4 消息分发架构图 分析管理器的初始化 我们在第一章讲到服务器将接收到的消息交给解码器(MessageDecoder)去做解码最后交给具体的消费 ...

  7. 深入详解美团点评CAT跨语言服务监控(三)CAT客户端原理

    cat客户端部分核心类 message目录下面有消息相关的部分接口 internal目录包含主要的CAT客户端内部实现类: io目录包含建立服务端连接.重连.消息队列监听.上报等io实现类: spi目 ...

  8. 深入详解美团点评CAT跨语言服务监控(二) CAT服务端初始化

    Cat模块 Cat-client : cat客户端,编译后生成 cat-client-2.0.0.jar ,用户可以通过它来向cat-home上报统一格式的日志信息,可以集成到 mybatis.spr ...

  9. 大众点评cat实时监控简介及部署

    简介 背景 CAT(Central Application Tracking)是由吴其敏(前大众点评首席架构师,现携程架构负责人)主导设计基于Java开发打造的实时应用监控平台,为大众点评网提供了全面 ...

随机推荐

  1. 【实战代码】PHP实现读取一个1G的文件大小

    本文地址:http://www.cnblogs.com/aiweixiao/p/7535351.html 欢迎关注我的微信公众号哈 “ 程序员的文娱情怀” http://t.cn/RotyZtu [背 ...

  2. 线程池工厂方法newScheduledThreadPool(),计划任务

    package com.thread.test.ThreadPool; import java.util.concurrent.Executors; import java.util.concurre ...

  3. 单元测试(qunit)

    <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <meta http ...

  4. Cordova入门系列(三)Cordova插件调用

    版权声明:本文为博主原创文章,转载请注明出处 上一章我们介绍了cordova android项目是如何运行的,这一章我们介绍cordova的核心内容,插件的调用.演示一个例子,通过cordova插件, ...

  5. 使用Mycat构建MySQL读写分离、主从复制、主从高可用

    数据库读写分离对于大型系统或者访问量很高的互联网应用来说,是必不可少的一个重要功能. 从数据库的角度来说,对于大多数应用来说,从集中到分布,最基本的一个需求不是数据存储的瓶颈,而是在于计算的瓶颈,即S ...

  6. 7年,OpenStack从入门到放弃|送书

    七年之痒这个词,大家经常说,不过起源,估计就不是谁都清楚.这是梦露的一部影片的名字,后来大家发现无论是企业,家庭,甚至政府,都在第七年时间段上面临各种麻烦. OpenStack存在的问题,其实已经不是 ...

  7. 打包优化实践(如何Code Spliting)

    项目地址:ReactSPA 使用 webpack 插件找出占用空间较大的包 开发环境中可使用 analyze-webpack-plugin 观察各模块的占用情况.以该项目为例:浏览器中输入 http: ...

  8. Swagger 配置

    放行 , 不拦截. @Configuration open class MyWebMvcConfig : WebMvcConfigurationSupport() { override fun add ...

  9. flask(三)之Flask-SQLAlchemy

    01-介绍 Flask-SQLAlchemy是一个Flask扩展,简化了在Flask应用中使用SQLAlchemy的操作.SQLAlchemy提供了高层ORM,也提供了使用数据库原生SQL的低层功能. ...

  10. 深入剖析Redis系列:Redis数据结构与全局命令概述

    前言 Redis 提供了 5 种数据结构.理解每种数据结构的特点,对于 Redis 的 开发运维 非常重要,同时掌握 Redis 的 单线程命令处理 机制,会使 数据结构 和 命令 的选择事半功倍. ...