1. ###################ElasticSearch监控指标梳理###########################
  2. #author:lugh1 #
  3. #date:2021-09-26 #
  4. #description:ES监控指标 #
  5. ###################ElasticSearch监控指标梳理###########################
  6.  
  7. ##集群
  8. status #集群状态green、yellow、red
  9. number_of_nodes #集群节点个数
  10. active_primary_shards #正常的主分片数量
  11. active_shards #正常的分片数
  12. relocating_shards #正在迁移的分片数
  13. initializing_shards #刚刚创建的分片数
  14. unassigned_shards #未分配的分片数
  15. nodes.count #节点数量
  16. indices.count #总的索引数量
  17. indices.shards.total #总分片数
  18. indices.docs.count #总的文档数
  19. indices.store.size_in_bytes #总存储大小
  20. indices.fielddata.memory_size_in_bytes #用于fielddata的内存总大小
  21. indices.query_cache.memory_size_in_bytes #用于查询缓存的总内存大小
  22. indices.segments.count #段总数量
  23. #如上内容可以通过/_cat/_health和/_cluster/stats查看
  24.  
  25. ##查询
  26. indices.search.query_total #查询总数
  27. indices.search.query_time_in_millis #查询总时间
  28. indices.search.query_current #当前正在进行的查询数量
  29. indices.search.fetch_total #提取总数
  30. indices.search.fetch_time_in_millis #花费在提取上的总时间
  31. indices.search.fetch_current #当前正在进行的提取数
  32.  
  33. ##索引
  34. indices.indexing.index_total #索引的文件总数
  35. indices.indexing.index_time_in_millis #索引文档总时间
  36. indices.indexing.index_current #目前索引的文件数量
  37. indices.refresh.total #索引刷新总数
  38. indices.refresh.total_time_in_millis #刷新指数的总时间
  39. indices.flush.total #索引刷新总数到磁盘
  40. indices.flush.total_time_in_millis #将索引刷新到磁盘上的总时间
  41. merges.current_docs #目前的合并。合并目前正在处理中
  42. merges.total_docs #合并总数。合并总数的计数
  43. merges.total_stopped_time_in_millis #合并花费的总时间。合并段的所有时间的聚合
  44.  
  45. ##节点
  46. nodes.roles #比如masternode,datanode
  47. nodes.indices.docs #每个节点内存的文档数
  48. nodes.indices.store #节点耗用了多少物理存储
  49. nodes.indices.indexing #节点索引相关指标
  50. nodes.indices.merges #包括了 Lucene 段合并相关的信息。它会告诉你目前在运行几个合并,合并涉及的文档数量,正在合并的段的总大小,以及在合并操作上消耗的总时间
  51. nodes.indices.search #在活跃中的搜索( open_contexts )数量、查询的总数量、以及自节点启动以来在查询上消耗的总时间
  52. nodes.indices.fielddata #接近于 0。因为 fielddata 不是缓存,任何驱逐都消耗巨大,应该避免掉。如果你在这里看到驱逐数,你需要重新评估你的内存情况,fielddata 限制
  53. nodes.indices.segments #展示这个节点目前正在服务中的 Lucene 段的数量
  54. nodes.indices.memory #统计值展示了 Lucene 段自己用掉的内存大小。这里包括底层数据结构,比如倒排表,字典,和布隆过滤器等。
  55. nodes.thread.pool #节点线程池相关指标
  56. nodes.breaks #熔断相关指标,有总熔断以及查询熔断和fielddata熔断等
  57.  
  58. ##机器
  59. nodes.os.cpu.percent #CPU使用率
  60. nodes.os.cpu.load_averager #负载
  61. nodes.os.mem #内存使用相关指标
  62. nodes.os.swap #Swap使用相关指标
  63. nodes.process.open_filedescriptors #打开的文件描述符
  64. nodes.fs #文件系统相关指标,比如IO,读写,磁盘存储和目录等
  65. nodes.http.current_open #http连接当前打开数
  66. 网络流出/流入字节数,tcp连接等
  67.  
  68. ##JVM&GC
  69. nodes.jvm.gc.collectors.young.collection_count #年轻代垃圾回收总数
  70. nodes.jvm.gc.collectors.young.collection_time_in_millis #年轻代垃圾回收耗时
  71. nodes.jvm.gc.collectors.old.collection_count #年老代垃圾回收总数
  72. nodes.jvm.gc.collectors.old.collection_time_in_millis #年老代垃圾回收耗时
  73. nodes.jvm.mem.heap_used_percent #当前JVM堆占比
  74. nodes.jvm.mem.heap_committed_in_bytes #已提交的JVM堆量
  75. nodes.jvm.threads #jvm线程相关指标
  76. nodes.jvm.classes #jvm类加载相关指标
  77.  
  78. ##其他
  79. 正在运行的任务数,运行时间,任务类型,运行节点等 #/_cat/tasks
  80. 每个索引的状态,health,主副分片,文档数,存储的大小等 #/_cat/indices
  81. 排队的任务数量 #/_cat/pending_tasks
  82.  
  83. 参考:
  84. https://blog.csdn.net/wuzhiwei549/article/details/83211715
  85. https://www.elastic.co/guide/cn/elasticsearch/guide/current/_cluster_health.html
  86. https://blog.csdn.net/prestigeding/article/details/89815143

  

es相关监控指标梳理的更多相关文章

  1. 关于kafka生产者相关监控指标的理解(未解决)

    关于生产者相关的监控指标含义的理解,希望大神帮忙进行确定下.     这边找了官网,看了网上各样的资料,但都无法帮我理解监控项目相关含义.     相关的监控项目是从jconsole获取的,并接入到了 ...

  2. ES相关信息

    漫画版原理介绍 搜索引擎的核心:倒排索引 elasticsearch 基于Lucene的,封装成一个restful的api,通过api就可进行操作(Lucene是一个apache开放源代码的全文检索引 ...

  3. 【转载】apache kafka系列之-监控指标

    原文地址:http://blog.csdn.net/lizhitao/article/details/24581907 1.监控目标 1.当系统可能或处于亚健康状态时及时提醒,预防故障发生 2.报警提 ...

  4. apache kafka系列之-监控指标

    apache kafka中国社区QQ群:162272557 1.监控目标 1.当系统可能或处于亚健康状态时及时提醒,预防故障发生 2.报警提示 a.短信方式 b.邮件 2.监控内容 2.1 机器监控 ...

  5. Linux CPU监控指标

    Linux CPU监控指标 Linux提供了非常丰富的命令可以进行CPU相关数据进行监控,例如:top.vmstat等命令.top是一个动态显示过程,即可以通过用户按键来不断刷新当前状态.如果在前台执 ...

  6. Hadoop记录- zookeeper 监控指标

    目前zookeeper获取监控指标已知的有两种方式: 1.通过zookeeper自带的 four letter words command 获取各种各样的监控指标 2.通过JMX Client连接zo ...

  7. Linux记录-linux系统常用监控指标

    1.Linux运维基础采集项 做运维,不怕出问题,怕的是出了问题,抓不到现场,两眼摸黑.所以,依靠强大的监控系统,收集尽可能多的指标,意义重大.但哪些指标才是有意义的呢,本着从实践中来的思想,各位工程 ...

  8. MySQL 监控指标

    为了排查问题,对数据库的监控是必不可少的,在此介绍下 MySQL 中的常用监控指标. 简介 MySQL 有多个分支版本,常见的有 MySQL.Percona.MariaDB,各个版本所对应的监控项也会 ...

  9. Linux实战教学笔记19:Linux相关网络知识梳理

    第十九节 Linux相关网络知识梳理 标签(空格分隔): Linux实战教学笔记-陈思齐 一,前言 一个运维有时也要和网络打交道,所以具备最基本的网络知识,对一个运维人员来说是必要的.但,对于我们的工 ...

随机推荐

  1. flutter查看安全码SHA1

    最近flutter技术调研高德地图插件时,要用到安全码,可以打开cmd,键入一下命令查看.(注意路径用户名yourusernamehere改为自己的) keytool -list -v -keysto ...

  2. ES6中新增的数组知识记录

    JSON数组格式转换 let json = { '0': 'hello', '1': 'I am ', '2': 'michael', length:3 } 这就是一个JSON数组格式,跟普通的JSO ...

  3. C# 异步锁

    参考网址: https://www.cnblogs.com/Alicia-meng/p/13330640.html 使用SemaphoreSlim 实现 当多个任务或线程并行运行时,难以避免的对某些有 ...

  4. 徒手撸一个简单的RPC框架

    来源:https://juejin.im/post/5c4481a4f265da613438aec3 之前在牛逼哄哄的 RPC 框架,底层到底什么原理得知了RPC(远程过程调用)简单来说就是调用远程的 ...

  5. SpringBoot中自定义错误页面

    错误页面定制(在有模板引擎的情况下): 有模板的支持下: 在templates文件夹下 建立 error文件夹 在error文件夹下 404.html 500.html 4xx.html (名字就叫4 ...

  6. JDBC中级篇(MYSQL)——模拟从数据库中上传下载附件

    注意:其中的JdbcUtil是我自定义的连接工具类:代码例子链接: package b_blob_clob; import java.io.BufferedOutputStream; import j ...

  7. 战胜了所有对手,却输给了时代。MVVM--jQuery永远的痛。

    前言 第二次浏览器战争中,随着以 Firefox 和 Opera 为首的 W3C 阵营与 IE 对抗程度的加剧,浏览器碎片化问题越来越严重,不同的浏览器执行不同的标准,对于开发人员来说这是一个恶梦.为 ...

  8. 手动设置IDEA失效的配置文件

  9. 云原生数据库 TDSQL-C 产品概述、产品优势、应用场景

    云原生数据库 TDSQL-C(Cloud Native Database TDSQL-C,TDSQL-C)是腾讯云自研的新一代高性能高可用的企业级分布式云数据库.融合了传统数据库.云计算与新硬件技术的 ...

  10. jquery/vue/react前端多语言国际化翻译方案指南

    ❝ 本文章共3470字,预计阅读时间5-10分钟. ❞ 国际化-前言 每个开发者能希望编写的程序可以让全世界的用户使用,它要求从产品中抽离所有地域语言,国家/地区和文化相关的元素.换种说法,「应用程序 ...