Elasticsearch集群管理之添加、删除节点

1、问题抛出

1.1 新增节点问题

我的群集具有黄色运行状况，因为它只有一个节点，因此副本保持未分配状态，我想要添加一个节点，该怎么弄？

1.2 删除节点问题

假设集群中有5个节点，我必须在运行时删除2个节点。 那么如何在不影响指数的情况下完成？

我有接近10 Gb/hour的连续数据流，这些数据正在连续写入并索引化。 重新平衡会对此有所影响吗？

本文就从上面两个问题说起，将相关知识点串起来，内容较长，阅读时间5分钟+。

2、知识点

2.1 Master节点的职责

主节点的主要作用之一是确定将哪些分片分配给哪些节点，以及何时在节点之间移动分片以重新平衡集群。

2.2 分片分配发生的时机

分片分配是将分片分配给节点的过程。这可能发生在集群初始恢复，副本分配，重新平衡或添加或删除节点期间。

2.3 控制分配/重新平衡分片操作的常见设置

2.3.1 分配分片设置

cluster.routing.allocation.enable

目的：启用或禁用特定种类的分片的分配。

all - （默认值）允许为所有类型的分片分配分片。

primaries - 仅允许分配主分片的分片。

new_primaries -仅允许为新索引的主分片分配分片。

none - 任何索引都不允许任何类型的分配分片。

重新启动节点时，此设置不会影响本地主分片的恢复。

假设重新启动的节点的分配ID与群集状态中的某个活动分配ID匹配，若该节点具有未分配的主分片的副本，则会立即恢复该主分片，

2.3.2 平衡分片设置

cluster.routing.rebalance.enable

目的：为特定类型的分片启用或禁用重新平衡。

允许控制群集范围内允许的并发分片重新平衡数。默认为2.请注意，此设置仅控制由于群集中的不平衡而导致的并发分片重定位数。此设置不会因分配过滤或强制感知而限制分片重定位。

2.3.3 权重因子设置

cluster.routing.allocation.balance.shard

目的：定义节点（float）上分配的分片总数的权重因子。默认为0.45f。提高这一点会增加均衡群集中所有节点的分片数量的趋势。

cluster.routing.allocation.balance.index

目的：定义在特定节点（float）上分配的每个索引的分片数量的权重因子。默认为0.55f。提高这一点会增加在集群中所有节点上均衡每个索引的分片数的趋势。

cluster.routing.allocation.balance.threshold

目的：应执行的操作的最小优化值（非负浮点数）。默认为1.0f。提高此选项将导致群集在优化分片平衡方面不那么积极。

2.4 基于磁盘的分片分配

在确定是将新分片分配给该节点还是主动从该节点拷贝分片到其他节点之前，Elasticsearch会考虑节点上的可用磁盘空间。

2.5 磁盘的三个默认警戒水位线

cluster.routing.allocation.disk.watermark.low

低警戒水位线——默认为磁盘容量的85％。

Elasticsearch不会将分片分配给使用磁盘超过85％的节点。它也可以设置为绝对字节值（如500mb），以防止Elasticsearch在小于指定的可用空间量时分配分片。此设置不会影响新创建的索引的主分片，或者特别是之前任何从未分配过的分片。

cluster.routing.allocation.disk.watermark.high

高警戒水位线——默认为磁盘容量的90％。

Elasticsearch将尝试从磁盘使用率超过90％的节点重新分配分片。它也可以设置为绝对字节值，以便在节点小于指定的可用空间量时将其从节点重新分配。此设置会影响所有分片的分配，无论先前是否分配。

cluster.routing.allocation.disk.watermark.flood_stage

洪水警戒水位线——默认为磁盘容量的95％。

Elasticsearch对每个索引强制执行只读索引块（index.blocks.read_only_allow_delete）。这是防止节点耗尽磁盘空间的最后手段。一旦有足够的可用磁盘空间允许索引操作继续，就必须手动释放索引块。

cluster.info.update.interval

Elasticsearch应该多久检查一次群集中每个节点的磁盘使用情况。 默认为30秒。

磁盘的分片分配综合样例配置如下：

PUT _cluster/settings

{

  "transient": {

    "cluster.routing.allocation.disk.watermark.low": "100gb",

    "cluster.routing.allocation.disk.watermark.high": "50gb",

    "cluster.routing.allocation.disk.watermark.flood_stage": "10gb",

    "cluster.info.update.interval": "1m"

  }

}

2.6 索引/节点层面的分片分配

可用的动态集群设置如下，其中{attribute}指的是任意节点属性：

cluster.routing.allocation.include.{attribute}——至少包含

cluster.routing.allocation.require.{attribute}——全部包含

cluster.routing.allocation.exclude.{attribute}——非、排除操作

3、添加节点

添加注意事项：

ES必须版本号一致，举例：Elasticsearch V6.4.1。

和新配置过Elasticsearch节点一致，以下仅介绍最快的方法。

步骤1：拷贝原有节点的ES相关文件到新机器。

步骤2：修改核心配置文件jvm.options和elasticsearch.yml。

    注意1：jvm注意结合实际机器的内存进行合理化配置。取值：Min（32GB，机器内存一半）。

    注意2：根据分配的角色（Master/data/client）配置。

    注意3：集群名称必须和预先的机器一致。

    注意4：避免脑裂，合理化如下配置

curl -XPUT 'localhost:9200/_cluster/settings' -d'

{

"transient": {

"discovery.zen.minimum_master_nodes": 3

}

}

    注意5：启动报错，根据出错做相关修改。

步骤3：访问9200端口验证成功与否。

4、删除节点

注意事项：

1、节点数目少的时候，一定要注意脑裂问题。

2、脑裂问题必要的时候需要更新：elasticsearch.yml 中的 minimum_master_nodes。

4.1 方案一——停启集群分片自动分配

步骤1：暂停数据写入程序

步骤2：关闭集群shard allocation

#关闭集群分片自动分配

PUT _cluster/settings

{

  "persistent": {

    "cluster.routing.allocation.enable": "none"

  }

}

步骤3：手动执行POST /_flush/synced

#打开集群分片自动分配

POST /_flush/synced

步骤4：重启结点

步骤5：重新开启集群shard allocation

#打开集群分片自动分配

PUT _cluster/settings

{

  "persistent": {

    "cluster.routing.allocation.enable": "all"

  }

}

步骤6：等待recovery完成，集群health status变成green

步骤7：重新开启数据写入程序

以上7步骤系参考Wood大叔总结。

4.2 方案二——排除停用节点

步骤1 排除停用节点

您可以通过告知群集将其从分配中排除来停用节点。

PUT _cluster/settings

{

  "transient" : {

    "cluster.routing.allocation.exclude._ip" : "10.0.0.1"

  }

}

这将导致Elasticsearch将该节点上的分片分配给其余节点，而不会将群集状态更改为黄色或红色（即使您的副本数设置为0）。

重新分配所有分片后，您可以关闭节点并执行您需要执行的任何操作。完成后，Elasticsearch将再剩余节点上再次重新平衡分片。

步骤2 检查集群健康状态

curl -XGET 'http://ES_SERVER:9200/_cluster/health?pretty'

如果没有节点relocating，则排除节点已经被安全剔除，可以考虑关闭节点。

步骤3 判定数据是否还存在

查看节点上是否还有文档存在。

curl -XGET 'http://ES_SERVER:9200/_nodes/NODE_NAME/stats/indices?pretty'

上述三步，能保证节点稳妥删除。

Elasticsearch集群管理之添加、删除节点的更多相关文章

elasticsearch集群管理工具head插件(转)
elasticsearch-head是一个elasticsearch的集群管理工具,它是完全由html5编写的独立网页程序,你可以通过插件把它集成到es 插件安装方法1: 1.elasticsearc ...
Elasticsearch集群管理工具head插件安装
Elasticsearch-head是一个elasticsearch的集群管理工具,它是完全由html5编写的独立网页程序,你可以通过插件把它集成到es.或直接下载源码,在本地打开index.html ...
Elasticsearch集群管理
第7章深入Elasticsearch集群启动一个Elasticsearch节点时,该节点会开始寻找具有相同集群名字并且可见的主节点.如果找到主节点,该节点加入一个已经组成了的集群:如果没有找到, ...
Elasticsearch集群管理
ES通过设置[节点的名字]和[集群的名字],就能自动的组织相同集群名字的节点加入到集群中,并使很多的技术对用户透明化. 如果用户想要管理查看集群的状态,可以通过一些REST API来实现. 其他的ES ...
elasticsearch 集群管理（集群规划、集群搭建、集群管理）
一.集群规划搭建一个集群我们需要考虑如下几个问题: 1. 我们需要多大规模的集群? 2. 集群中的节点角色如何分配? 3. 如何避免脑裂问题? 4. 索引应该设置多少个分片? 5. 分片应该设置几个 ...
redis集群扩容（添加新节点）
一.创建节点(接上文) 1.在H1服务器/root/soft目录下创建7002目录 2.将7001目录的配置文件redis.conf拷贝到7002,并修改配置文件的端口 3.进入 redis-5.0. ...
Elasticsearch集群问题,导致主master节点发现不了node节点
个人博客:https://blog.sharedata.info/ 最新需要配置es集群采用5个分片和1个副片,正好是11台机器,而只保留一份备份所以只需要5*2=10台机器方案:1.1台作为mast ...
大快搜索DKhadoop集群管理平台添加节点的步骤说明
Hadoop作为搭建大数据处理平台的重要“基石”,关于它的分析和讲解的文章已经有很多了.Hadoop本身是一分布式的系统,因此在安装的时候,需要多每一个节点进行组建的安装.并且由于是开源软件,其安装过 ...
大规模Elasticsearch集群管理心得
转载:http://elasticsearch.cn/article/110 ElasticSearch目前在互联网公司主要用于两种应用场景,其一是用于构建业务的搜索功能模块且多是垂直领域的搜索,数据 ...

随机推荐

【炼丹Trick】EMA的原理与实现
在进行深度学习训练时,同一模型往往可以训练出不同的效果,这就是炼丹这件事的玄学所在.使用一些trick能够让你更容易追上目前SOTA的效果,一些流行的开源代码中已经集成了不少trick,值得学习一番. ...
攻防世界MISC进阶区—48-51
48.Become_a_Rockstar 得到无类型文件,010 Editor打开为几段话,看到标示性的NCTF{),怀疑是用脚本加密后的结果,网上查了一下,得知Rockstar是一种语言,用rock ...
Active Backup for Business激活
依次执行 https://IP地址:5001/webapi/auth.cgi?api=SYNO.API.Auth&method=Login&version=1&account= ...
from Crypto.Cipher import AES报错
python 在 Windows下使用AES时要安装的是pycryptodome 模块 pip install pycryptodome python 在 Linux下使用AES时要安装的是pyc ...
20220722-Java构造器
Java构造器知识总结来源:B站韩顺平老师Java入门教学代码示例 class Person { int age; String name; public Person(int pAge, Str ...
flex 我所理解不够深刻的内容
1.align-items属性父元素 align-items属性定义项目在交叉轴上如何对齐. flex-start:交叉轴的起点对齐. flex-end:交叉轴的终点对齐. center:交叉轴 ...
html的基础01
1.什么是网页 2.常用的浏览器有哪些 3.web标准是什么 1.什么是网页 2.常用的浏览器 360.百度那些都是国产浏览器,内核一样,以上六个都是国际浏览器,不同厂商生产(但IE和Edge都是 ...
Linux—搭建Apache(httpd)服务
1.httpd简介? http是Apache超文本传输协议服务器的主程序.它是一个独立的后台进程,能够处理请求的子进程和线程. http常用用的两个版本是httpd-2.2和httpd-2.4 Cen ...
以寡治众各个击破，超大文件分片上传之构建基于Vue.js3.0+Ant-desgin+Tornado6纯异步IO高效写入服务
原文转载自「刘悦的技术博客」https://v3u.cn/a_id_218 分治算法是一种很古老但很务实的方法.本意即使将一个较大的整体打碎分成小的局部,这样每个小的局部都不足以对抗大的整体.战国时期 ...
Java面试题(六)--Redis
1 Redis基础篇 1.简单介绍一下Redis优点和缺点? 优点: 1.本质上是一个 Key-Value 类型的内存数据库,很像memcached 2.整个数据库统统加载在内存当中进行操作,定期通过 ...

Elasticsearch集群管理之添加、删除节点

Elasticsearch集群管理之添加、删除节点的更多相关文章

随机推荐

热门专题