kubernetes1.11.1 部署prometheus

部署前提：已经安装好了kubernetes的集群，版本是1.11.1，是用kubeadm部署的。

2台虚拟机：master：172.17.1.36 node1：172.17.1.40

prometheus 是kubernetes 监控，可以监控k8s的核心指标以及自定义指标

起官方地址：https://github.com/kubernetes/kubernetes/tree/release-1.11/cluster/addons/prometheus

第一步：

把官方所有的yaml文件下载下来

for i in alertmanager-configmap.yaml alertmanager-deployment.yaml alertmanager-pvc.yaml alertmanager-service.yaml kube-state-metrics-deployment.yaml kube-state-metrics-rbac.yaml kube-state-metrics-service.yaml node-exporter-ds.yml node-exporter-service.yaml prometheus-configmap.yaml prometheus-rbac.yaml prometheus-service.yaml prometheus-statefulset.yaml ;do wget https://raw.githubusercontent.com/kubernetes/kubernetes/release-1.11/cluster/addons/prometheus/$i;done

里面文件具体分为：alertmanager， kube-state-metrics，node-export，prometheus，4个组件，最好是创建4个文件夹，把对应的yaml文件分类下，好处理

整个prometheus 我安装在一个名称空间，先创建个名称空间prom kubectl create ns prom

最开始安装的是node-export，它的作用是收集节点的数据，被prometheus采集的。

官方提供的node-export的yaml文件都是安装在kube-system的名称空间，所以需要修改下

node-exporter-ds.yml 如下：

apiVersion: extensions/v1beta1

kind: DaemonSet

metadata:

  name: node-exporter

  namespace: prom   #这是修改成prom

  labels:

    k8s-app: node-exporter

    kubernetes.io/cluster-service: "true"

    addonmanager.kubernetes.io/mode: Reconcile

    version: v0.15.2

spec:

  updateStrategy:

    type: OnDelete

  template:

    metadata:

      labels:

        k8s-app: node-exporter

        version: v0.15.2

      annotations:

        scheduler.alpha.kubernetes.io/critical-pod: ''

    spec:

#      priorityClassName: system-node-critical    #这行注释，否则创建会报错，具体的原因我还没擦到

      tolerations:                    #加行master节点的污点容忍度，否则不会再master节点创建pod

      - key: node-role.kubernetes.io/master

      containers:

        - name: prometheus-node-exporter

          image: "prom/node-exporter:v0.15.2"

          imagePullPolicy: "IfNotPresent"

          args:

            - --path.procfs=/host/proc

            - --path.sysfs=/host/sys

          ports:

            - name: metrics

              containerPort:

              hostPort:

          volumeMounts:

            - name: proc

              mountPath: /host/proc

              readOnly:  true

            - name: sys

              mountPath: /host/sys

              readOnly: true

          resources:

            limits:

              cpu: 10m

              memory: 50Mi

            requests:

              cpu: 10m

              memory: 50Mi

      hostNetwork: true

      hostPID: true

      volumes:

        - name: proc

          hostPath:

            path: /proc

        - name: sys

          hostPath:

            path: /sys

node-exporter-service.yaml 文件只要修改名称空间就可以了，kubectl apply -f node-exporter-ds.yml node-exporter-service.yaml

如上，pod 核service创建完成。

第二部：部署prometheus

首先prometheus 需要持久存储数据的，官方给的yaml文件中需要设置一个18G的大小的pv，这里我用的是nfs类型的存储，设置pv大小事20G

再master节点安装nfs：

yum install nfs-utils

vim /etc/exports

创建文件夹 mkdir /data

systemctl start nfs && systemctl enable nfs

注意：node节点要执行 yum install nfs-utils ，否则会出现挂载不上的情况，原因事没有nfs的文件类型

创建pv

apiVersion: v1

kind: PersistentVolume

metadata:

  name: pv01

  namespace: prom

  labels:

    name: pv01

spec:

  nfs:

    path: /data/

    server: 172.17.1.36

  accessModes: ["ReadWriteOnce","ReadWriteMany"]

  capacity:

    storage: 20Gi

kubectl apply -f pro_pv.yaml

这是绑定后的图

安装prometheus 有以下4个文件：

prometheus-configmap.yaml prometheus-rbac.yaml 这2个文件只要修改下名称空间就可以了， prometheus-service.yaml 我添加了type，这样外网可以fangwen

如下：

kind: Service

apiVersion: v1

metadata:

  name: prometheus

  namespace: prom  #这里修改
 labels:

    kubernetes.io/name: "Prometheus"

    kubernetes.io/cluster-service: "true"

    addonmanager.kubernetes.io/mode: Reconcile

spec:

  type: NodePort #添加这type
  ports:

    - name: http

      port:

      protocol: TCP

      targetPort:

  selector:

    k8s-app: prometheus

prometheus-statefulset.yaml

apiVersion: apps/v1

kind: StatefulSet

metadata:

  name: prometheus

  namespace: prom    #这里修改成prom
  labels:

    k8s-app: prometheus

    kubernetes.io/cluster-service: "true"

    addonmanager.kubernetes.io/mode: Reconcile

    version: v2.2.1

spec:

  serviceName: "prometheus"

  replicas:

  podManagementPolicy: "Parallel"

  updateStrategy:

   type: "RollingUpdate"

  selector:

    matchLabels:

      k8s-app: prometheus

  template:

    metadata:

      labels:

        k8s-app: prometheus

      annotations:

        scheduler.alpha.kubernetes.io/critical-pod: ''

    spec:

#      priorityClassName: system-cluster-critical #这样注销
      serviceAccountName: prometheus

      initContainers:

      - name: "init-chown-data"

        image: "busybox:latest"

        imagePullPolicy: "IfNotPresent"

        command: ["chown", "-R", "65534:65534", "/data"]

        volumeMounts:

        - name: prometheus-data

          mountPath: /data

          subPath: ""

      containers:

        - name: prometheus-server-configmap-reload

          image: "jimmidyson/configmap-reload:v0.1"

          imagePullPolicy: "IfNotPresent"

          args:

            - --volume-dir=/etc/config

            - --webhook-url=http://localhost:9090/-/reload

          volumeMounts:

            - name: config-volume

              mountPath: /etc/config

              readOnly: true

          resources:

            limits:

              cpu: 10m

              memory: 10Mi

            requests:

              cpu: 10m

              memory: 10Mi

        - name: prometheus-server

          image: "prom/prometheus:v2.2.1"

          imagePullPolicy: "IfNotPresent"

          args:

            - --config.file=/etc/config/prometheus.yml

            - --storage.tsdb.path=/data

            - --web.console.libraries=/etc/prometheus/console_libraries

            - --web.console.templates=/etc/prometheus/consoles

            - --web.enable-lifecycle

          ports:

            - containerPort:

          readinessProbe:

            httpGet:

              path: /-/ready

              port:

            initialDelaySeconds:

            timeoutSeconds:

          livenessProbe:

            httpGet:

              path: /-/healthy

              port:

            initialDelaySeconds:

            timeoutSeconds:

          # based on  running nodes with  pods each

          resources:

            limits:

              cpu: 200m

              memory: 1000Mi

            requests:

              cpu: 200m

              memory: 1000Mi

          volumeMounts:

            - name: config-volume

              mountPath: /etc/config

            - name: prometheus-data

              mountPath: /data

              subPath: ""

      terminationGracePeriodSeconds:

      volumes:

        - name: config-volume

          configMap:

            name: prometheus-config

  volumeClaimTemplates:

  - metadata:

      name: prometheus-data

    spec:

      accessModes:

        - ReadWriteOnce

      resources:

        requests:

          storage: "16Gi"

应用这4个文件， kubectl apply -f .

可以外文172.17.1.40：30793来访问prometheus，

prometheus 本身自己有web 页面，其也有很多生成的查询条件

第三部：部署kube-state-metrics ，这个组件的作用事将prometheus收集的数据，转换成kubernetes 可以设别的数据类型

应用这3个文件。修改的地方是名称空间，kube-state-metrics-deployment.yaml这个文件要注释下面的一行：

查看下pod的状态

说明安装成功了

第四步：安装prometheus-adapter,这个组件的作用是整合收集的数据到api

github 地址 https://github.com/DirectXMan12/k8s-prometheus-adapter

下载这些文件

需要修改下这些文件的名称空间

应用这个文件之前，需要创建一个secret，文件中有用到这个，并且是kubernetes集群ca证书签署的创建的secret

创建证书：

/etc/kubernetes/pki 在这个目录创建

(umask 077;openssl genrsa -out serving.key 2048) 创建私钥
openssl req -new -key serving.key -out serving.csr -subj "/CN=serving" 生产证书自签请求
openssl x509 -req -in serving.csr -CA ./ca.crt -CAkey ./ca.key -CAcreateserial -out serving.crt -days 3650 生成证书

创建一个secret
kubectl create secret generic cm-adapter-serving-certs --from-file=serving.crt=./serving.crt --from-file=serving.key=./serving.key

应用这些文件 kubectl apply -f .

有这个api说明安装成功了

可以起个代理测试下如下：

kubectl proxy --port=8080

curl http://localhost:8080/apis/custom.metrics.k8s.io/v1beta1

第五步：部署grafana

yaml文件如下：

 apiVersion: extensions/v1beta1

 kind: Deployment

 metadata:

   name: monitoring-grafana

   namespace: prom

 spec:

   replicas:

   template:

     metadata:

       labels:

         task: monitoring

         k8s-app: grafana

     spec:

       containers:

       - name: grafana

         image: k8s.gcr.io/heapster-grafana-amd64:v5.0.4

         ports:

         - containerPort:

           protocol: TCP

         volumeMounts:

         - mountPath: /etc/ssl/certs

           name: ca-certificates

           readOnly: true

         - mountPath: /var

           name: grafana-storage

         env:

 #        - name: INFLUXDB_HOST

 #          value: monitoring-influxdb

         - name: GF_SERVER_HTTP_PORT

           value: ""

           # The following env variables are required to make Grafana accessible via

           # the kubernetes api-server proxy. On production clusters, we recommend

           # removing these env variables, setup auth for grafana, and expose the grafana

           # service using a LoadBalancer or a public IP.

         - name: GF_AUTH_BASIC_ENABLED

           value: "false"

         - name: GF_AUTH_ANONYMOUS_ENABLED

           value: "true"

         - name: GF_AUTH_ANONYMOUS_ORG_ROLE

           value: Admin

         - name: GF_SERVER_ROOT_URL

           # If you're only using the API Server proxy, set this value instead:

           # value: /api/v1/namespaces/kube-system/services/monitoring-grafana/proxy

           value: /

       volumes:

       - name: ca-certificates

         hostPath:

           path: /etc/ssl/certs

       - name: grafana-storage

         emptyDir: {}

 ---

 apiVersion: v1

 kind: Service

 metadata:

   labels:

     # For use as a Cluster add-on (https://github.com/kubernetes/kubernetes/tree/master/cluster/addons)

     # If you are NOT using this as an addon, you should comment out this line.

     kubernetes.io/cluster-service: 'true'

     kubernetes.io/name: monitoring-grafana

   name: monitoring-grafana

   namespace: prom

 spec:

   type: NodePort

   # In a production setup, we recommend accessing Grafana through an external Loadbalancer

   # or through a public IP.

   # type: LoadBalancer

   # You could also use NodePort to expose the service at a randomly-generated port

   # type: NodePort

   ports:

   - port:

     targetPort:

   selector:

     k8s-app: grafana

需要用到

k8s.gcr.io/heapster-grafana-amd64:v5.0.4 这个镜像，要翻墙下

应用grafana 文件

说明安装成功

grafana的界面

总结：Prometheus部署步骤有点多，我是安装github的提供的文件安装的，期间遇到各种各样的问题，都吐血了。在出现作错误的时候，首先要看log日志，一般情况都能解决，要么就是版本的问题。以后写个排错的，不然自己长时间也忘了怎么弄。也没仔细排版，以后在整理吧！

kubernetes1.11.1 部署prometheus的更多相关文章

Kubernetes1.16下部署Prometheus+node-exporter+Grafana+AlertManager 监控系统
Prometheus 持久化安装我们prometheus采用nfs挂载方式来存储数据,同时使用configMap管理配置文件.并且我们将所有的prometheus存储在kube-system #建议 ...
kubernetes1.15极速部署prometheus和grafana
关于prometheus和grafana prometheus负责监控数据采集,grafana负责展示,下图来自官网: 环境信息硬件:三台CentOS 7.7服务器 kubernetes:1.15 ...
kubernetes---CentOS7安装kubernetes1.11.2图文完整版
转载请注明出处:kubernetes-CentOS7安装kubernetes1.11.2图文完整版架构规划 k8s至少需要一个master和一个node才能组成一个可用集群. 本章我们搭建一个mas ...
在Kubernetes下部署Prometheus
使用ConfigMaps管理应用配置当使用Deployment管理和部署应用程序时,用户可以方便了对应用进行扩容或者缩容,从而产生多个Pod实例.为了能够统一管理这些Pod的配置信息,在Kuber ...
suse 12 二进制部署 Kubernetets 1.19.7 - 第11章 - 部署coredns组件
文章目录 1.11.0.部署coredns 1.11.1.测试coredns功能 suse 12 二进制部署 Kubernetes 集群系列合集: suse 12 二进制部署 Kubernetets ...
kubernetes之监控Operator部署Prometheus（三）
第一章和第二章中我们配置Prometheus的成本非常高,而且也非常麻烦.但是我们要考虑Prometheus.AlertManager 这些组件服务本身的高可用的话,成本就更高了,当然我们也完全可以用 ...
k8s部署prometheus
https://www.kancloud.cn/huyipow/prometheus/527092 https://songjiayang.gitbooks.io/prometheus/content ...
【集群监控】Docker上部署Prometheus+Alertmanager+Grafana实现集群监控
Docker部署下载 sudo yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.re ...
基于k8s集群部署prometheus监控ingress nginx
目录基于k8s集群部署prometheus监控ingress nginx 1.背景和环境概述 2.修改prometheus配置 3.检查是否生效 4.配置grafana图形基于k8s集群部署pro ...

随机推荐

【LOJ】#3097. 「SNOI2019」通信
LOJ#3097. 「SNOI2019」通信费用流,有点玄妙显然按照最小路径覆盖那题的建图思路,把一个点拆成两种点,一种是从这个点出去,标成\(x_{i}\),一种是输入到这个点,使得两条路径合成 ...
Web应用中访问WEB-INF下的资源
WEB-INF目录是出于保护资源文件的目的,只能我们开发人员自己查看不可以通过URL直接访问的: 有时候我们也想直接访问WEB-INF中的资源,那就需要用到请求转发了(重定向redirect是不可以的 ...
Excel2016 保存\复制卡死问题解决
遇到的问题: 工作中经常碰到一些Excel表, 复制一行, 再粘贴要等5s以上才能显示成功. 保存一下文档, 也会出现页面白屏卡死的情况, 经过网上多个帖子进行操作依旧无解, 最后找到了自己的方法得以 ...
eclipse导入maven空项目,eclipse导入时不识别maven项目
经常我们在网上下载的一些开源项目中,想要导入eclipse中,却发现eclipse不识别这个项目,这时候怎么办呢? 解决办法多种多样,我这里举例出最实用的2种: 1.在项目的根目录中加入.classp ...
怎样创建一个独立于当前文档的新的Document对象
使用: document.implementation. 如下所示, 新创建的Document对象可以正常使用相关属性和方法, 然后将它的根节点与当前文档的根节点做一个替换. var doc = do ...
C# 中使用正则表达式 Regex.Matches方法的几个应用[转]
用于正则表达式的 Regex.Matches静态方法的几种用法: //①正则表达式 = > 匹配字符串 string Text = @"This is a book , this is ...
ELinq学习一
ELinq安装:在Nuget控制台中输入:install-package ELinq一.ELinq与DLinq和EF的功能差异二.数据库对照表三.CRUD操作1.插入(Insert)(1)简单形式 ...
SSM框架警告/错误集合
警告: 1.使用Eclipse的Spring Elements组件的时候发现会提示有警告:Expect at least one bean match() 解决办法:项目可以正常运行,未有报错,在其他 ...
js中数组方法及分类
数组的方法有很多,这里简单整理下常用的21种方法,并且根据它们的作用分了类,便于记忆和理解. 根据是否改变原数组,可以分为两大类,两大类又根据不同功能分为几个小类一.操作使原数组改变 1.数组的 ...
ELECTRON 打包
安装electron-packager cnpm install electron-packager -g 配置package.json "scripts": { "st ...

kubernetes1.11.1 部署prometheus

kubernetes1.11.1 部署prometheus的更多相关文章

随机推荐

热门专题