alertmanager与exporters.cadvisor一样,都是独立于prometheus项目,这里我们也使用docker方式部署alertmanager. 1.下载镜像 镜像地址:https://hub.docker.com/r/prom/alertmanager/tags [root@prometheus-server ~]# docker pull prom/alertmanager 2.运行 ## 创建容器映射目录,存放配置文件[root@prometheus-server ~]…
前面几个篇幅,我们介绍了alertmanger报警配置,在实际运维过程中,我们都会遇到,报警的重复发送,以及报警信息关联性报警.接下来我们就介绍下通过alertmanger对告警信息的收敛.一.告警分组(Grouping)1.1 定义三个报警规则: 文中为了实验验证,告警值设置比较小,实际生产中,应该跟据业务的实际使用场景,来确定合理的告警值 [root@prometheus-server ~]# vim /etc/prometheus/rules/node_alerts.yml groups:…
redis监控,prometheus需要使用redis_exporter客户端. 这里我们采用docker方式部署,既可以部署在redis所在服务器,也可以部署在其他机器: docker镜像地址:https://hub.docker.com/r/oliver006/redis_exporter/tags 1.下载镜像 [root@izbp1hjhm96yi3k68wi59rz ~]# docker pull oliver006/redis_exporter 2.运行服务 [root@izbp1h…
1.下载安装 node_exporter服务需要在三台机器都安装,这里我们以一台机器为例: 地址:https://prometheus.io/download/ ### 另外两个节点部署时,需要先创建脚本中运行用户prometheus[root@prometheus-server ~]# wget https://github.com/prometheus/node_exporter/releases/download/v0.18.1/node_exporter-0.18.1.linux-amd…
规划: IP 角色 版本 10.10.0.13 prometheus-server 2.10 10.10.0.11 node_exporter 0.18.1 10.10.0.12 node_exporter 0.18.1 1.下载 官网:https://prometheus.io/download/ [root@prometheus-server ~]# wget https://github.com/prometheus/prometheus/releases/download/v2.10.0…
grafana我们这里采用docker方式部署 1.下载镜像 镜像官网地址:https://hub.docker.com/r/grafana/grafana/tags [root@prometheus-server ~]# docker pull grafana/grafana:latest 2.启动 [root@prometheus-server ~]# docker run \ -d \ -p : \ --name=grafana \ -v /etc/localtime:/etc/local…
Prometheus监控docker容器运行状态,我们用到cadvisor服务,cadvisor我们这里也采用docker方式直接运行. 1.下载镜像 [root@prometheus-server ~]# docker pull google/cadvisor 2.运行 cadvisor我们需要运行在docker宿主机上(与node_exporter类似),然后通过HTTP方式供Prometheus获取数据 [root@prometheus-server ~]# docker run \ --…
学习了一段时间的saltstack,是时候记录下了.友提:学习环境是两台centos_7.2_x64机器 系统初始化: 两台机器执行以下脚本即可(友提:两台服务器的主机名配置在/etc/hosts中,这个就不写入脚本中了) yum install wget -y cd /etc/yum.repos.d && rm -rf * wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.r…
Prometheus Operator不同于Prometheus,Prometheus Operator是 CoreOS 开源的一套用于管理在 Kubernetes 集群上的 Prometheus 控制器,它是为了简化在 Kubernetes 上部署.管理和运行 Prometheus 和 Alertmanager 集群. 官方提供的架构图: kubernetes也在官方的github上关于使用prometheus监控的建议: 地址:https://github.com/kubernetes/ku…
OpenStack从入门到放弃 目录: 为何选择云计算/云计算之前遇到的问题 什么是云计算 云服务模式 云应用形式 传统应用与云感知应用 openstack及其相关组件介绍 flat/vlan/gre/vxlan介绍 分布式存储ceph介绍 openstack mitaka三节点部署实战 一:为何选择云计算/云计算之前遇到的问题 一.有效解决硬件单点故障问题 单点故障是指某个硬件的故障造成网站某个服务的中断.要真正解决这个问题,需要为每个硬件准备冗余,这不仅大大增加了硬件购置成本,而且部署与维护…