1. Network Traffic Basic 每个接口的基本网络信息 type: GraphUnit: bytesrecv {{device}} 各个网络接口的下载量 recv lo: 本地环回接口recv eth0: 以太网接口recv docker0: docker0 网络接口metrics: rate(node_network_receive_bytes_total{instance=~"$node:$port",job=~"$job"}[5m]) tra…
1. CPU Busy :收集所有 cpu 内核 busy 状态占比 type: SinglestatUnit: perent(0-100)(所有 cpu使用情况 - 5分钟内 cpu 空闲的平均值) / 所有 cpu使用情况metrics: (((count(count(node_cpu_seconds_total{instance=~\"$node:$port\",job=~\"$job\"}) by (cpu))) - avg(sum by (mode)(ir…
1. CPU Basic cpu 的基本信息 /proc/stat type: GraphUnit: shortBusy System: cpu 处于核心态的占比 metrics: sum by (instance)(rate(node_cpu_seconds_total{mode="system",instance=~"$node:$port",job=~"$job"}[5m])) * 100 Busy User: cpu 处于用户态的占比 m…
Basic CPU / Mem / Disk Info https://www.cnblogs.com/qianyuliang/p/10479515.html Basic CPU / Mem / Disk Gauge   https://www.cnblogs.com/qianyuliang/p/10479553.html Basic CPU / Mem Graph    https://www.cnblogs.com/qianyuliang/p/10479585.html Basic Net…
Prometheus简介 什么是 Prometheus Prometheus是一个开源监控报警系统和时序列数据库 主要功能 多维数据模型(时序由 metric 名字和 k/v 的 labels 构成) 灵活的查询语句(PromQL) 无依赖存储,支持 local 和 remote 不同模型 采用 http 协议,使用 pull 模式,拉取数据,简单易懂 监控目标,可以采用服务发现或静态配置的方式 支持多种DashBoard,图形化友好 核心组件 Prometheus Server, 主要用于抓取…
Golang 基于Prometheus Node_Exporter 开发自定义脚本监控 公司是今年决定将一些传统应用从虚拟机上迁移到Kubernetes上的,项目多而乱,所以迁移工作进展缓慢,为了建立统一的监控平台,我们使用的是在Kubernetes集群内部署Prometheus-operator,不得不说Prometheus-operator对k8s的监控支持的非常好,helm安装后会把Prometheus.Alertmanger.Grafana.以及NodeExporter都给安装完成,打开…
Prometheus Promtheus是一个时间序列数据库,其采集的数据会以文件的形式存储在本地中,因此项目目录下需要一个data目录,需要我们自己创建,下面会讲到 下载 下载好的.tar.gz包放到自己想要安装的目录下 方式一:官网下载最新版,使用Xftp放到Linux系统自己想要安装的目录下即可  方法二:Linux使用wget下载 wget https://github.com/prometheus/prometheus/releases/download/v2.29.1/prometh…
Basic CPU / Mem / Disk Info 1. CPU Cores 物理 CPU 的核数 cat /proc/cpuinfo| grep "cpu cores"| uniq type:SinglestatUnit: shortmetrics: count(count(node_cpu_seconds_total{instance=~\"$node:$port\",job=~\"$job\"}) by (cpu)) 2. Total…
Disk Datail /proc/diskstats 1. Disk IOps Completed type: GraphUnit: I/O ops/sec(iops)Label: IO read(-)/write(+){{device}} - Reads completed: 每个磁盘分区每秒读完成次数 metrics: irate(node_disk_reads_completed_total{instance=~"$node:$port",job=~"$job&quo…
1. CPU type: GraphUnit: shortmax: "100"min: "0"Label: PercentageSystem - cpu 在内核模式下执行的进程占比 metrics: sum by (mode)(irate(node_cpu_seconds_total{mode="system",instance=~"$node:$port",job=~"$job"}[5m])) * 100…