Elasticsearch7.X ILM索引生命周期管理(冷热分离)

一、“索引生命周期管理”概述

Elasticsearch索引生命周期管理指:Elasticsearch从设置、创建、打开、关闭、删除的全生命周期过程的管理。

二、为什么要使用“索引生命周期管理”

1、ELK集群之前的索引模式,通过app_name和日期区分,随着时间累积,索引数量逐渐增多,造成服务器内存、CPU、IO等指标上涨;

2、需要创建额外定时任务执行索引删除脚本,这种方式无法避免kafka重复消费造成的大量已删除索引重建,并无法用脚本按日期删除;

3、根据日志查询和存储的特点,将数据冷热分离,热数据使用高性能磁盘提高写入与查询效率,温数据只做查询不影响数据写入性能,冷数据用OSS等低价存储作为归档节约存储成本。

三、面临的问题

1、ES生命周期策略要紧密贴合业务模型

2、数据冷热节点和生命周期策略需要合理规划

3、数据高可用性规划(单纯日志场景对数据可用性并不高,可以规划0副本索引,减小系统开销)

四、配置方法及原理

1、生命周期管理的本质--RollOver

当现有索引被认为太大或太旧时,滚动索引API将别名滚动到新索引。该API接受一个别名和一个条件列表。别名必须只指向一个索引。如果索引满足指定条件,则创建一个新索引,并将别名切换到指向新索引的位置

2、使用场景

RollOver适合存放日志数据、索引非常大、索引实时导入数据等场景

在索引模板配置好索引的setting、mapping等参数,然后配置好_rollover规则,es会帮助你处理剩余的事情

索引生命周期管理使用了rollover的特性,将rollover分成四个阶段。

3、四个阶段

ES索引生命周期管理分为4个阶段:hot、warm、cold、delete,其中hot主要负责对索引进行rollover操作,warm、cold、delete分别对rollover后的数据进一步处理

阶段 描述
hot 主要处理时序数据的实时写入
warm 可以用来查询,但是不再写入
cold 索引不再有更新操作,并且查询也会很少
delete 数据将被删除

注意:上述四个阶段不是必须同时存在

4、配置方法

实现索引生命周期,必须同时存在如下要素,缺一不可,上述四个阶段可以根据实际情况配置,并为ES数据节点添加相应的标签。

配置项 描述
节点标签 配置数据节点标签,区分热节点、温节点以及冷节点
生命周期策略 定义热阶段的大小、最大文档数或最大时长,温阶段是否缩小索引、冷阶段存在时长及删除周期
索引模板引用生命周期策略 模板中指定引用的生命周期策略,按模板规则创建索引后,加载生命周期策略
索引模板指定调度节点 将新建索引分片都分配到热节点
4.1、节点
热节点

这种类型的数据节点执行集群内所有的操作,节点存储的数据经常被查询,属于IO、CPU密集型操作,因而需要CPU比较空闲和装有高性能IO读写的磁盘(如SSD)的服务器支撑。

  1. #配置方法
  2. vim /data/app/elasticsearch/config/elasticsearch.yml
  3.  
  4. #每个热节点加入如下配置并重启服务
  5. node.attr.box_type: hot
  6. node.attr.rack: rack1
  7. #这两项配置是为节点增加标签,具体名称并不是写死的,与后面模板和策略配置有关
温节点

这种类型的数据节点处理不太常用的索引(比如前一天的日志数据),这种数据查询的实时性不算高,索引为只读索引,不会有写入操作,因此不需要SSD磁盘存储,降低存储成本。

  1. #配置方法
  2. vim /data/app/elasticsearch/config/elasticsearch.yml
  3.  
  4. #每个温节点加入如下配置并重启服务
  5. node.attr.box_type: warm
  6. node.attr.rack: rack1
冷节点

冷节点数据适合作为归档使用,比温节点查询还要少(比如半月以上的归档日志),这种类型数据一般很少查询,并不会消耗CPU性能及IO,但是存储容量会很大,需要更低成本的存储,例如OSS或S3;ES可以使用经过fuse协议挂载的对象存储作为后端存储。

  1. #配置方法
  2. vim /data/app/elasticsearch/config/elasticsearch.yml
  3.  
  4. #每个温节点加入如下配置并重启服务
  5. node.attr.box_type: cold
  6. node.attr.rack: rack1
4.2、生命周期策略

配置方法:

1、利用Kibana新建策略并指定到模板

打开Kibana--->管理--->索引生命周期策略

创建策略

保存策略并在创建模板后添加到模板中

2、调用ESApi将策略写入ES

  1. curl -XPUT -H "content-type:application/json" http://es_addr:9200/_ilm/policy/test_policy \
  2.  
  3. -d "{
  4. "policy": {
  5. "phases": {
  6. "hot": {
  7. "min_age": "0ms",
  8. "actions": {
  9. "rollover": {
  10. "max_age": "1h",
  11. "max_size": "10mb",
  12. "max_docs": 50000
  13. },
  14. "set_priority": {
  15. "priority": 100
  16. }
  17. }
  18. },
  19. "warm": {
  20. "min_age": "0ms",
  21. "actions": {
  22. "allocate": {
  23. "number_of_replicas": 0,
  24. "include": {},
  25. "exclude": {},
  26. "require": {
  27. "box_type": "warm"
  28. }
  29. },
  30. "shrink": {
  31. "number_of_shards": 3
  32. },
  33. "set_priority": {
  34. "priority": 50
  35. }
  36. }
  37. },
  38. "cold": {
  39. "min_age": "1h",
  40. "actions": {
  41. "freeze": {},
  42. "allocate": {
  43. "include": {},
  44. "exclude": {},
  45. "require": {
  46. "box_type": "cold"
  47. }
  48. },
  49. "set_priority": {
  50. "priority": 0
  51. }
  52. }
  53. },
  54. "delete": {
  55. "min_age": "2h",
  56. "actions": {
  57. "delete": {}
  58. }
  59. }
  60. }
  61. }"
4.3、索引模板

以下为索引模板配置,要有以下配置项策略才会生效,其他选项如字段mapping等请参考官方文档

  1. PUT _template/my_template
  2. {
  3. "index_patterns": ["test-*"],
  4. "settings": {
  5. "number_of_shards": 5,
  6. "number_of_replicas": 0,
  7. "index.lifecycle.name": "test_policy", #指定索引生命周期策略名称
  8. "index.lifecycle.rollover_alias": "test-alias", #指定rollover别名(索引写入与读取时所用的名称)
  9. "routing.allocation.require.box_type": "hot" #指定索引新建时所分配的节点(此项不指定会默认分配到所有节点)
  10. }
  11. }

注意:索引创建的名称应该是以 “-00001”等可自增长的字段结尾,否则策略不生效,es指定所以的别名写入

Elasticsearch7.X ILM索引生命周期管理(冷热分离)的更多相关文章

  1. Elasticsearch 索引生命周期管理 ILM 实战指南

    文章转载自:https://mp.weixin.qq.com/s/7VQd5sKt_PH56PFnCrUOHQ 1.什么是索引生命周期 在基于日志.指标.实时时间序列的大型系统中,集群的索引也具备类似 ...

  2. Logstash & 索引生命周期管理(ILM)

    Grok语法 Grok是通过模式匹配的方式来识别日志中的数据,可以把Grok插件简单理解为升级版本的正则表达式.它拥有更多的模式,默认,Logstash拥有120个模式.如果这些模式不满足我们解析日志 ...

  3. Elastic 使用索引生命周期管理实现热温冷架构

    Elastic: 使用索引生命周期管理实现热温冷架构 索引生命周期管理 (ILM) 是在 Elasticsearch 6.6(公测版)首次引入并在 6.7 版正式推出的一项功能.ILM 是 Elast ...

  4. ElasticSearch——索引生命周期管理

    从ES6.6开始,Elasticsearch提供索引生命周期管理功能,索引生命周期管理可以通过API或者kibana界面配置,详情参考[index-lifecycle-management] 本文仅通 ...

  5. 这么简单的ES索引生命周期管理,不了解一下吗~

    对于日志或指标(metric)类时序性强的ES索引,因为数据量大,并且写入和查询大多都是近期时间内的数据.我们可以采用hot-warm-cold架构将索引数据切分成hot/warm/cold的索引.h ...

  6. Elasticsearch索引生命周期管理方案

    一.前言 在 Elasticsearch 的日常中,有很多如存储 系统日志.行为数据等方面的应用场景,这些场景的特点是数据量非常大,并且随着时间的增长 索引 的数量也会持续增长,然而这些场景基本上只有 ...

  7. Elasticsearch索引生命周期管理探索

    文章转载自: https://mp.weixin.qq.com/s?__biz=MzI2NDY1MTA3OQ==&mid=2247484130&idx=1&sn=454f199 ...

  8. ES 7.13版本设置索引模板和索引生命周期管理

    第一步:索引管理中查看都有哪些索引文件,然后添加索引模式(后面的日期用*表示) 第二步:索引生命周期管理 自带的有一个log,就使用这个,不用再新建了,根据需求修改里面的配置就行了 第三步:添加索引模 ...

  9. ELK 索引生命周期管理

    kibana 索引配置 管理索引 点击设置 --- Elasticsearch 的 Index management 可以查看 elk 生成的所有索引 (设置,Elasticsearch ,管理) 配 ...

随机推荐

  1. 多语言工作者の十日冲刺<5/10>

    这个作业属于哪个课程 软件工程 (福州大学至诚学院 - 计算机工程系) 这个作业要求在哪里 团队作业第五次--Alpha冲刺 这个作业的目标 团队进行Alpha冲刺--第五天(05.04) 作业正文 ...

  2. keycode 大全:

  3. MongoDB副本集replica set (二)--副本集环境搭建

    (一)主机信息 操作系统版本:centos7 64-bit 数据库版本   :MongoDB 4.2 社区版 ip hostname 192.168.10.41 mongoserver1 192.16 ...

  4. 【解读】Http协议

    一.HTTP简介 1.HTTP协议,即超文本传输协议(Hypertext transfer protocol).是一种详细规定了浏览器和万维网(WWW = World Wide Web)服务器之间互相 ...

  5. 相邻元素之间的margin合并问题

    任何元素都可以设置border 设置宽高可能无效 行内元素设置padding,margin上下是无效的,左右是有效的 外边距合并:指的是,当两个垂直外边距相遇时,它们将形成一个外边距. 合并后的外边距 ...

  6. Java实现第十一届蓝桥杯JavaB组 省赛真题

    试题 A: 指数计算 本题总分:5 分 [问题描述] 7 月 1 日是建党日,从 1921 年到 2020 年, 已经带领中国人民 走过了 99 年. 请计算:7 ^ 2020 mod 1921,其中 ...

  7. jira仪表盘的建立与共享

    一般在项目测试阶段,可以通过jira仪表盘清晰的展示bug的各个状态的数量,各个开发人员的bug数量. 有效督促开发解决问题. 也为测试日报提供了良好的数据支持,减少人工统计的工作量. 1.建议筛选器 ...

  8. day54 js基础

    目录 一.变量 二.数据类型 1 数值类型(number) 2 字符类型(string) 3 字符类型常用方法 4 布尔值(boolean) 5 null与undefined 6 对象 7 运算符 8 ...

  9. day12 文件操作(下)

    目录 一.x模式(控制文件操作模式,与rwa同级) 1 特点 2 格式 二.b模式(控制文件读写内容的模式,与t同级) 1.b模式和t模式的区别 2 b模式应用 3 循环读取文件 三.文件操作的其他方 ...

  10. requests接口自动化3-url里带参数的get请求:params

    url里带参数的get请求:用params传参 #2.带参数的get请求,把参数写成字典格式,用params传参 para2={"type":"math"} r ...