博客地址:http://www.moonxy.com

一、前言

集群搭建好以后,在日常中就要对集群的使用情况进行监控,对于一个多节点集群,由于网络连接问题,出现宕机、脑裂等异常情况都是有可能发生的。Elasticsearch 提供了 Cat APICluster API,可以方便地获取集群的健康情况、集群状态、节点状态、索引统计等信息。

二、集群 API

2.1 Cat API

cat API 官方参考文档:cat APIs

JSON is great… for computers. Even if it’s pretty-printed, trying to find relationships in the data is tedious. Human eyes, especially when looking at an ssh terminal, need compact and aligned text. The cat API aims to meet this need.

All the cat commands accept a query string parameter help to see all the headers and info they provide, and the /_cat command alone lists all the available commands.

包括如下 API:

常用的主要有:cat allocation、cat count、cat health、cat master、cat nodes、cat plugins、cat shards 和 cat templates 等,下面主要讲解这几个。

1)cat allocation

cat allocation 命令可以查看每个节点分片的分配数量以及它们所使用的硬盘空间大小。

GET /_cat/allocation?v

返回结果如下:

2)cat count

cat count 命令可以快速查询整个集群或者单个索引的文档数量(count)。

GET /_cat/count?v

返回结果如下:

查看单个索引的文档数量:

GET /_cat/count/books?v

返回结果如下:

3)cat health

cat health 命令用于显示集群的健康信息。

GET /_cat/health?v

返回结果如下:

4)cat master

显示出 master节点的节点 ID、绑定的 IP 和节点名。

GET /_cat/master?v

返回结果如下:

5)cat nodes

查看集群的拓扑结构。

GET /_cat/nodes?v

返回结果如下:

6)cat  plugins

用于查看每一个节点所运行插件的信息。

GET /_cat/plugins?v

返回结果如下:

7)cat shards

用于查看节点包含的分片信息,包含一个分片是主分片还是一个副本分片、文档的数量、硬盘上占用的字节数、节点所在的位置等信息。

GET /_cat/shards/books?v

返回结果如下:

注意,分片序号从 0 开始,prirep 这一列中,p 代表主分片(primary),r 代表副本分片(replicate)。

8)cat templates

用于查看集群中的模板。

GET /_cat/templates?v

如果不存在模板,则返回为空,参数 v 表示显示表头。

2.2 Cluster API

Cluster APIs 官方参考文档:Cluster APIs

包括如下 API:

常用的有 Cluster Health、Cluster State、Cluster Stats、Nodes Stats 和 Nodes Info 等,下面主要讲解这几个。

1)Cluster Health

查看集群的健康信息:

GET _cluster/health

返回结果如下:

{
"cluster_name": "Banon",
"status": "green",
"timed_out": false,
"number_of_nodes": 2,
"number_of_data_nodes": 2,
"active_primary_shards": 34,
"active_shards": 68,
"relocating_shards": 0,
"initializing_shards": 0,
"unassigned_shards": 0,
"delayed_unassigned_shards": 0,
"number_of_pending_tasks": 0,
"number_of_in_flight_fetch": 0,
"task_max_waiting_in_queue_millis": 0,
"active_shards_percent_as_number": 100
}

参数说明:

cluster_name:集群名称;

status:集群的健康状态;

timed_out:是否超时;

number_of_nodes:节点数,包括 master 节点和 data 节点;

number_of_data_nodes:data 节点数;

active_primary_shards:活动的主分片;

active_shards:所有活动的分片数,包括主分片和副本分片;

relocating_shards:正在发生迁移的分片;

initializing_shards:正在初始化的分片;

unassigned_shards:没有被分配的分片;

delayed_unassigned_shards:延迟未被分配的分片;

number_of_pending_tasks:master 节点任务队列中的任务数;

number_of_in_flight_fetch:正在进行迁移的分片数量;

task_max_waiting_in_queue_millis:队列中任务的最大等待时间;

active_shards_percent_as_number:活动分片的百分比;

上面的命令用于获取整个集群的健康信息,也可以增加参数(索引名称),获取一个或多个索引的健康信息,如下:

green所有的主分片和副本分片都可用

yellow所有的主分片可用,但存在不可用的副本分片

red存在不可用的主分片

2)Cluster State

集群状态 API 可以对整个集群的信息进行一个全面的了解,包括集群信息、集群中每个节点的信息、元数据、路由表等。

GET _cluster/state

返回如下结果:

如上图 nodes 所示,表示此集群有两个节点,红色方框中分别为两个节点的 id(nodeId)。

3)Cluster Stats

集群统计 API 用于从集群中获取各种统计信息。主要包括两部分,一部分是索引层面,包含分片数、存储大小、内存使用情况等指标,另一部分是节点层面,包含节点数量、节点角色、操作系统、jvm 版本、内存、CPU、安装的插件等指标。

GET _cluster/stats

4)Nodes Stats

Cluster Nodes Stats(集群节点统计信息)API 可以获取集群中一个或者多个节点的统计信息。

GET _nodes/stats

返回结果如下:

由于内容太长,所以对每个节点进行了折叠。

也可以根据 nodeId 获取指定节点的统计信息:

GET _nodes/6n3douACShiPmlA9j2soBw,XwSysHCaQdmRAyp2D6NHLw/stats

当然也可以通过节点名称来获取节点的统计信息:

GET _nodes/masternode/stats

5)Nodes Info

Cluster Nodes Info API 可以获取集群中一个或多个节点的信息,包括设置、操作系统、虚拟机、线程池等信息。

GET _nodes
GET _nodes/masternode
GET _nodes/os,jvm

os、jvm 表示只查看节点的 os 和 jvm 信息。

三、监控插件

Bigdesk 监控插件是 Elasticsearch 的一个集群监控工具,可以通过它来查看 ES 集群的各种状态,比如:CPU、内存使用情况、JVM 信息、索引信息、搜索情况、HTTP 连接数、磁盘系统信息等。

Bigdesk 托管在 GitHub 上,项目地址:https://github.com/hlstudio/bigdesk。下载代码后,进入 bigdesk-master/_site 目录下,打开 index.html,在 ES node REST endpoint 输入框中输入 Elastsearch 集群节点的连接地址和端口即可。

界面如下所示:

主要包括如下五部分:

Summary、Indices、Thread Pools、OS & JVM & Process & Transport、File system

Elastic Stack 笔记(九)Elasticsearch5.6 集群管理的更多相关文章

  1. elasticsearch5.0集群+kibana5.0+head插件插件的安装

    elasticsearch5.0集群+kibana5.0+head插件插件的安装 es集群的规划: 两台16核64G内存的服务器: yunva_etl_es1  ip:1.1.1.1 u04es01. ...

  2. 《Apache Kafka实战》读书笔记-调优Kafka集群

    <Apache Kafka实战>读书笔记-调优Kafka集群 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.确定调优目标 1>.常见的非功能性要求 一.性能( ...

  3. Docker Swarm Mode 学习笔记(创建 Swarm 集群)

    Swarm 集群由管理节点与工作节点组成. 初始化集群 使用命令:docker swarm init 如果你的 Docker 主机有多个网卡, 拥有多个 IP 地址, 必须使用 --advertise ...

  4. 学习笔记(4)——实验室集群管理结点IP配置

    经过验证,集群管理结点mgt的IP配置应为如下所示: [root@mgt zmq]# ifconfig//外部网卡 eth0 Link encap:Ethernet HWaddr 5C:F3:FC:E ...

  5. Spark学习笔记5:Spark集群架构

    Spark的一大好处就是可以通过增加机器数量并使用集群模式运行,来扩展计算能力.Spark可以在各种各样的集群管理器(Hadoop YARN , Apache Mesos , 还有Spark自带的独立 ...

  6. Redis学习笔记(二):Redis集群

    集群通过分片(sharding)来进行数据共享,并提供复制和故障转移功能.   1.节点 一个节点就是一个运行在集群模式下的Redis服务器.启动Redis服务器时,通过判断cluster-enabl ...

  7. kubernetes实战(九):k8s集群动态存储管理GlusterFS及使用Heketi扩容GlusterFS集群

    1.准备工作 所有节点安装GFS客户端 yum install glusterfs glusterfs-fuse -y 如果不是所有节点要部署GFS管理服务,就在需要部署的节点上打上标签 [root@ ...

  8. Redis学习笔记(十七) 集群(上)

    Redis集群是Redis提供的分布式数据库方案,集群通过分片来进行数据共享,并提供复制和故障转移操作. 一个Redis集群通常由多个节点组成,在刚开始的时候每个节点都是相互独立的,他们处于一个只包含 ...

  9. elasticsearch系列八:ES 集群管理(集群规划、集群搭建、集群管理)

    一.集群规划 搭建一个集群我们需要考虑如下几个问题: 1. 我们需要多大规模的集群? 2. 集群中的节点角色如何分配? 3. 如何避免脑裂问题? 4. 索引应该设置多少个分片? 5. 分片应该设置几个 ...

随机推荐

  1. 解决OneNote同步出错

    问题: onenote同步出现黄色叹号. 解决: 分析: 对每个分区进行设置密码,不能设置的证明该分区有问题.(可能不只一个分区卡同步) 解决方法: 1,将有问题的分区分制一份,然后删掉原来的分区 2 ...

  2. Kendo-Grid for Vue API and Template

    写此博客的原因:在做项目时前端用的vue,后端用的jfinal.在前端veu中调用了kendo grid插件,但是在官方文档中对kendo grid for vue 的api和template都不太详 ...

  3. Hbase多版本(version)数据写入和读取

    1. 首先创建一个支持多版本的hbase表 create }   2.put几条测试数据 put ','f1:name','jack1' put ','f1:name','jack2' 3.读取多版本 ...

  4. 番茄日志发布1.0.3版本-增加Kafka支持

    番茄日志(TomatoLog)能做什么 可能你是第一次听说TomatoLog,没关系,我可以从头告诉你,通过了解番茄日志,希望能帮助有需要的朋友,番茄日志处理将大大降低你采集.分析.处理日志的过程. ...

  5. ASP.NET Core on K8S深入学习(7)Dashboard知多少

    本篇已加入<.NET Core on K8S学习实践系列文章索引>,可以点击查看更多容器化技术相关系列文章. 在第二篇<部署过程解析与Dashboard>中介绍了如何部署Das ...

  6. Spring Cloud Zuul的动态路由怎样做?集成Nacos实现很简单

    一.说明 网关的核心概念就是路由配置和路由规则,而作为所有请求流量的入口,在实际生产环境中为了保证高可靠和高可用,是尽量要避免重启的,所以实现动态路由是非常有必要的:本文主要介绍实现的思路,并且以Na ...

  7. C# 读取Word内容控件

    在Word中,借助内容控件,可设计出具有特定功能的文档或模板.以下表格中简单介绍了几种常用的内容控件. 名称 简介 下拉列表内容控件 下拉列表包含了一个预先定义好的列表.和组合框不同的是下拉列表不允许 ...

  8. 关于ionic 打包后 background-image 无法显示 的问题

    这几天费劲心思,终于把ionic 项目打包生成 本地app,但是安卓手机安装以后,我所有的雪碧图的 icon ,竟然无法显示:到处搜索答案,都没有什么可行的,都是说什么ionic版本不对,androi ...

  9. sql server创建序列sequence

    1.创建一个序列对象 CREATE SEQUENCE [schema_name . ] sequence_name START WITH <constant> INCREMENT BY & ...

  10. Docker swarm 获取service的container信息

    我们可以通过docker service create创建服务,例如: docker service create --name mysql mysql:latest 服务创建好后,如何来获取该ser ...