prometheus安装和使用记录

# prometheus
mkdir -m=777 -p /data/{download,app_logs,app/prometheus}

cd /data/download

wget https://github.com/prometheus/prometheus/releases/download/v2.45.0-rc.0/prometheus-2.45.0-rc.0.linux-amd64.tar.gz

tar xvfz prometheus-*.tar.gz
ln -s /data/download/prometheus-2.45.0-rc.0.linux-amd64/prometheus /usr/bin/prometheus
cp /data/download/prometheus-2.45.0-rc.0.linux-amd64/prometheus.yml /data/app/prometheus/prometheus.yml 
prometheus --config.file=/data/app/prometheus/prometheus.yml --web.listen-address=:9090 --web.enable-lifecycle --storage.tsdb.path=/data/app/prometheus/data >>/data/app_logs/prometheus.log 2>&1 &

# node_exporter 在需要监控的服务器里安装
mkdir -m=777 -p /data/{download,app_logs,app/prometheus}
cd /data/download
wget https://github.com/prometheus/node_exporter/releases/download/v1.6.0/node_exporter-1.6.0.linux-amd64.tar.gz
tar xvfz node_exporter*
ln -s /data/download/node_exporter-1.6.0.linux-amd64/node_exporter /usr/bin/node_exporter
# 启动node_exporter,服务器暴露的端口是8080，同时服务器里有其他服务占用了8080端口，可以使用nginx将node_exporter获取指标的api暴露出去
# location /metrics {
#     proxy_pass http://127.0.0.1:9000/metrics;
# }
node_exporter --web.listen-address 127.0.0.1:9000 >>/data/app_logs/node_exporter.log 2>&1 &
# 添加node_exporter之后，需要更新prometheus.xml添加targets，然后运行：curl -X PUT http://server_address:port/-/reload重新加载配置文件

# alert_manager可以和prometheus安装到同一台服务器
cd /data/download
wget https://github.com/prometheus/alertmanager/releases/download/v0.25.0/alertmanager-0.25.0.linux-amd64.tar.gz
tar xvfz alertmanager*
ln -s /data/download/alertmanager-0.25.0.linux-amd64/alertmanager /usr/bin/alertmanager
cp /data/download/alertmanager-0.25.0.linux-amd64/alertmanager.yml /data/app/prometheus/alertmanager.yml
alertmanager --config.file=/data/app/prometheus/alertmanager.yml --web.listen-address 127.0.0.1:9001 >>/data/app_logs/node_exporter.log 2>&1 &
# 将alert_manager的地址添加到prometheus.yml里的alertmanagers的targets里，然后运行：curl -X PUT http://server_address:port/-/reload重新加载配置文件

测试报警邮件功能：设置如果安装exporter的服务器内存占用率超过50%或者tcp timewait超过10的时候就发邮件（在实际工作中需要设置一个合适的条件）：

prometheus.yml里添加rule_files的路径：

# my global config

global:

  scrape_interval: 15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.

  evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.

  # scrape_timeout is set to the global default (10s).

# Alertmanager configuration

alerting:

  alertmanagers:

    - static_configs:

        - targets:

          - 127.0.0.1:9001

# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.

rule_files:

  # - "first_rules.yml"

  # - "second_rules.yml"

  - "/data/app/prometheus/alert.rules.yml"

# A scrape configuration containing exactly one endpoint to scrape:

# Here it's Prometheus itself.

scrape_configs:

  # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.

  - job_name: "prometheus"

    # metrics_path defaults to '/metrics'

    # scheme defaults to 'http'.

    scrape_interval: 5s

    static_configs:

            - targets: ["node1_ip:8080"]

            - targets: ["node2_ip:8080"]

              labels:

                groups: 'container'

alert.rules.yml里添加具体的rule，node_socket_TCP_tw这些具体的指标通过http://node_exporter_ip:port/metrics可以获取到

groups:

- name: tcp-alert-group

  rules:

  - alert: TcpTimeWait

    expr: node_sockstat_TCP_tw > 10

    for: 10m

    labels:

      severity: warning

    annotations:

      summary: tcp time wait more than 10

      description: please check node_sockstat_TCP_tw metric

  - alert: MemoryUse

    expr: (node_memory_MemTotal_bytes-node_memory_MemFree_bytes-node_memory_Buffers_bytes-node_memory_Cached_bytes)/node_memory_MemTotal_bytes > 0.5

    for: 10m

    labels:

      severity: warning

    annotations:

      summary: memory use more than 50% for 10 min

      description: please check memory use

alertmanager.yml里配置告警邮件的信息：

global:

  resolve_timeout: 5m

  smtp_smarthost: your_smpt_host:port

  smtp_from: alertmanager@your_email_domain

  smtp_require_tls: false

route:

  group_by: ['alertname']

  group_wait: 30s

  group_interval: 5m

  repeat_interval: 10m

  receiver: 'email'

receivers:

  - name: 'email'

    email_configs:

    - to: 'receiver_email'

      send_resolved: true

yml文件一旦更新，需要重新加载配置：curl -X PUT http://server_address:port/-/reload

在Prometheus的界面可以看到添加的alert：

当alert的条件满足后，alertmanager就会发邮件

grafana的安装和启动：

# grafana可以和prometheus里安装到同一台服务器

yum install -y https://dl.grafana.com/enterprise/release/grafana-enterprise-10.0.0-1.x86_64.rpm

# grafana默认启动的端口号是3000，如果服务器没有暴露3000端口的话，需要修改grafana的配置文件

sed -i 's/3000/8080/g' /usr/share/grafana/conf/defaults.ini

grafana server >> /data/app_logs/grafana.log 2>&1 &

# grafana数据保存地址：/var/lib/grafana.db

grafana启动之后就可以在浏览器上打开对应的地址，初次登录用户名和密码：admin/admin

Data sources里添加prometheus，grafana和prometheus启动在同一台服务器里的话，地址就可以用localhost

添加dashboard，在Explore里可以查询指标并且添加到dashboard

cpu使用率：avg(1-irate(node_cpu_seconds_total{mode="idle"}[1m])) by(instance)

内存使用率：(node_memory_MemTotal_bytes-node_memory_MemFree_bytes-node_memory_Buffers_bytes-node_memory_Cached_bytes)/node_memory_MemTotal_bytes

tcp连接数：node_sockstat_TCP_alloc

dashboard：

注意点：

1.prometheus启动的时候添加--web.enable-lifecycle才允许通过调用/-/reload接口重新加载配置文件
2.prometheus启动的时候指定一个固定的数据存放位置--storage.tsdb.path=/data/app/prometheus/data，如果数据存放位置不一致，启动后查不到历史数据，历史数据做备份的话，prometheus启动的服务器还可以变更
3.grafana的数据保存地址：/var/lib/grafana.db，定期做备份，服务器发生系统错误无法使用的时候，在新的服务器里同步/var/lib/grafana.db文件之后，启动grafana之前的配置不会丢失

prometheus安装和使用记录的更多相关文章

xp硬盘安装Fedora14 过程记录及心得体会（fedora14 live版本680M 和fedora14 DVD版本3.2G的选择）
这次电脑奔溃了,奇怪的是直接ghost覆盖c盘竟然不中.之前电脑上硬盘安装的fedora14操作系统,也是双系统.不知道是不是这个问题,记得同学说过,在硬盘装fedora之后,要手动修改c盘隐藏的那个 ...
Microsoft SQL server2017初次安装与使用记录
Microsoft SQL server2017初次安装与使用记录学校数据库课程以Microsoft SQL server为例, 由于老师给的软件版本和我的window10不兼容,选择官网的最新版2 ...
利用cocoapods管理开源项目，支持 pod install安装整个流程记录（github公有库）
利用cocoapods管理开源项目,支持 pod install安装整个流程记录(github公有库),完成预期的任务,大致有下面几步: 1.代码提交到github平台 2.创建.podspec 3. ...
CentOS7+CDH5.14.0安装全流程记录，图文详解全程实测-总目录
CentOS7+CDH5.14.0安装全流程记录,图文详解全程实测-总目录: 0.Windows 10本机下载Xshell,以方便往Linux主机上上传大文件 1.CentOS7+CDH5.14.0安 ...
SAP S4HANA1610/Fiori安装过程全记录
经历各种坑,从硬件到文件,终于安装成功. 有需要安装或使用S4HANA(含Fiori)的同学可以参考. 安装文件分享给大家链接:http://pan.baidu.com/s/1mi7LfIS 密码: ...
linux安装MySQL5.7记录
目录 linux安装MySQL5.7记录 1. 在根目录下创建文件夹/software和数据库数据文件/data/mysql 2. 从官网下载相应的MySQL版本 3. 解压并移动到/software ...
[企业化NET]Window Server 2008 R2[1]-服务器基本安装即问题解决记录
1. 服务器基本安装即问题解决记录 √ 2. SVN环境搭建和客户端使用 2.1 服务端和客户端安装 √ 2.2 项目建立与基本使用 √ 2.3 基本冲突解决, ...
Prometheus安装
Prometheus安装下载地址: https://prometheus.io/download/ 现在时间是: 2019.09.07 安装环境: Linux centos7 minimal 虚拟机 ...
Prometheus 安装
目录简介安装部署环境准备安装配置环境变量配置启动简介 prometheus存储的是时序数据,即按相同时序(相同名称和标签),以时间维度存储连续的数据的集合. 时序(time serie ...
Prometheus 安装Alertmanager集成
Prometheus 安装Alertmanager集成 # 下载地址地址1:https://prometheus.io/download/ 地址2:https://github.com/promet ...

随机推荐

ChatGPT 与 Midjourney 强强联手，让先秦阿房宫重现辉煌！
Midjourney 是一款非常特殊的 AI 绘画聊天机器人,它并不是软件,也不用安装,而是直接搭载在 Discord 平台之上,所有的功能都是通过调用 Discord 的聊天机器人程序实现的.要想使 ...
[数据库/MySQL]数据库备份与升级：MySQL Percona(RPM) 5.7.24-27 升级到 5.7.31-34
1 数据库升级方式:RPM包方式升级 [亲测有效] 环境 OS: CENTOS 7 DB: MYSQL 5.7.24-27 1.1 数据库备份备份以防止升级失败备份数据库的2个主要方法: 1)用M ...
LeeCode 942 增减字符串匹配
LeeCode 942 题目描述: 由范围 [0,n] 内所有整数组成的 n+1 个整数的排列序列可以表示为长度为 n 的字符串 s ,其中: 如果 perm[i] < perm[i + 1] ...
Linux（四）软件包管理
软件包管理 1 RPM 简介 RPM(RedHat Package Manager),是红帽系linux操作系统的软件包管理工具,类似于windows中的setup.exe能够进行软件包的更新.卸载. ...
Java SpringBoot 7z 压缩、解压
Java SpringBoot 7z 压缩.解压 cmd 7z 文件压缩 7z压缩测试添加依赖 <dependency> <groupId>org.apache.common ...
STM32下载ELF文件、最小可执行bin文件测试
1.STM32能下载ELF格式的文件吗? 答:可以.因为所谓的bin文件就是ELF文件的.text代码段. 当然前提是下载工具能识别ELF文件格式,STM32下载ELF文件并不意味着STM32可以把E ...
C# implicit隐式转换
今天看书,上面介绍implicit和explicit相对冷门,用的较少. 这个implicit类型虽然冷门,但真的很有用.我在自己的项目里就用了这个上Demo, 1 public partial c ...
#Python assign赋值，新增列操作
MySQL对时间戳的格式化
时间转时间戳 select unix_timestamp('2022-02-22 22:22:22'); 时间戳转时间 select from_unixtime(1645539742); 格式化 SE ...
express服务器框架
Express 为了提高开发效率,我们在开发过程中,都会尽量使用别人已经开发好的第三方模块,而我们想要快速实现服务器端的开发,推荐一个当下比较流行的框架:Express Express 作为开发框架, ...

prometheus安装和使用记录

prometheus安装和使用记录的更多相关文章

随机推荐

热门专题