Elasticsearch：Node 介绍 - 7.9 之后版本

文章转载自：https://elasticstack.blog.csdn.net/article/details/110947372

在 Elastic Stack 7.9 之后的发布中，我们可以直接在 Elasticsearch 的配置文件中配置 Node 的角色（node roles）。这是一个新的变化。在 7.9 发布版之前，我们使用 node.master: true 这样的方式来定义一个 master 节点，但是从 7.9 开始之后，我们也可以使用另外一个方法来定义一个 master 节点。我们可以通过 node.roles 来定义一个 master 节点。但是这两种方法只可以选其一，不能两种方法同时使用。从 7.9 发布后，建议使用 node.roles 来定义 node 的角色。在今天的文章中，我来介绍 node.roles。

Node

每当你启动 Elasticsearch 实例时，你都在启动节点。连接的节点的集合称为群集。如果你正在运行 Elasticsearch 的单个节点，那么你将拥有一个节点的集群。

默认情况下，群集中的每个节点都可以处理 HTTP 和 Transport 流量。 Transport 层专门用于节点之间的通信。 HTTP 层由 REST 客户端使用。

所有节点都知道群集中的所有其他节点，并且可以将客户端请求转发到适当的节点。

默认情况下，节点为以下所有类型：master-eligible, data, ingest 和（如果可用）machine learning。所有 data 节点也是 transform 节点。

友情提示：随着集群的增长，特别是如果你有大量机器学习工作或连续转换，请考虑将专用于 master-eligible 节点与专用 data 节点，machine learning 节点和 transform 节点分离。

Node roles

你可以通过设置 node.roles 来定义节点的角色。如果你未配置此设置，则该节点默认具有以下角色：

master

data

data_content

data_hot

data_warm

data_cold

ingest

ml

remote_cluster_client

注意：如果你设置 node.roles，那么 node 将被分配为指定的角色。

Master-eligible node

具有 master role（默认）的节点，这使其有资格被选作控制群集的主节点。

Data node

具有 data role 的节点（默认）。数据节点保存数据并执行与数据相关的操作，例如 CRUD，搜索和聚合。具有数据角色的节点可以填充任何专门的数据节点角色。

Ingest node

具有 ingest role 的节点（默认）。摄入节点能够将提取管道应用于文档，以便在建立索引之前转换和丰富文档。在繁重的摄取负载下，使用专用的摄取节点并且不包含具有master role 或 data role 的节点中的摄取角色是有意义的。

Remote-eligible node

具有 remote_cluster_client 角色（默认）的节点，这使其有资格充当远程客户端。默认情况下，集群中的任何节点都可以充当跨集群客户端并连接到远程集群。

Machine learning node

具有 xpack.ml.enabled 和 ml 角色的节点，这是 Elasticsearch 默认发布中的默认行为。如果要使用机器学习功能，则集群中必须至少有一个机器学习节点。有关机器学习功能的更多信息，请参阅 Elastic Stack 中的机器学习。你也可以在我之前的文章 “Elastic：菜鸟上手指南” 找到一个机器学习的章节。

    重要提示：如果你使用 OSS 发布版，千万不要添加 ml 角色，否则该节点将无法启动。

Transform node

具有 transform role 的节点。如果要使用转换，则群集中至少有一个转换节点。有关更多信息，请参见变换设置和变换数据。

注意：Coordnating node - 协调节点。

诸如搜索请求或批量索引请求之类的请求可能涉及保存在不同数据节点上的数据。例如，搜索请求在两个阶段中执行，这两个阶段由接收客户请求的节点（即协调节点）协调。

在分散阶段，协调节点将请求转发到保存数据的数据节点。每个数据节点在本地执行该请求，并将其结果返回到协调节点。在收集阶段，协调节点将每个数据节点的结果缩减为单个全局结果集。

每个节点都隐式地是一个协调节点。这意味着通过 node.roles 具有明确的空角色列表的节点将仅充当协调节点，无法禁用。结果，这样的节点需要具有足够的内存和 CPU 才能处理收集阶段。协调节点的定义为： node.roles: []

Master-eligible node

主节点负责集群范围内的轻量级操作，例如创建或删除索引，跟踪哪些节点是集群的一部分以及确定将哪些 shard 分配给哪些节点。拥有稳定的主节点对于群集健康非常重要。

任何一个非 voting-only 节点且具有 master-eligible 属性的节点可以通过 master election process，使其成为主节点。

重要提示：主节点必须有权访问 data/ 目录（就像数据节点一样），因为这是节点重新启动之间保持群集状态的位置。

专有 master-eligible node

一旦一个 master-eligible 节点被选举为 master 节点，它需要履行其职责以保持资源集群的健康。如果当选主节点因为其他繁重的任务使之超负荷运行，那么集群可能不能很好地工作。特别是，建立索引数据和搜索数据可能会占用大量资源，因此，在大型或高吞吐量群集中，最好避免使用 master-eligible 节点来执行诸如索引和搜索之类的任务。你可以通过将三个节点配置为专用 master-eligible 节点来完成此操作。专用 master-eligible 节点仅具有 master role，从而使他们可以专注于管理集群。尽管主节点还可以充当协调节点，并将搜索和索引请求从客户端路由到数据节点，但最好不要为此目的使用专用的 master 节点。

要创建专用的符合主机资格的节点，请设置：

node.roles: [ master ]

Voting-only master-eligible node

仅投票的 master-eligible 节点是参与 master 选举但不会充当集群的主节点。特别是，仅投票节点可以在选举中充当决胜局。

使用术语 “master eligible” 来描述仅投票的节点似乎令人困惑，因为这样的节点实际上根本没有资格成为主机。这个术语是历史的一个不幸后果：主节点资格是那些参加选举，并在集群状态发布执行某些任务，只有投票节点具有相同的责任，即使他们永远不能成为当选的主节点。

要将符合条件的主节点配置为仅投票节点，请在角色列表中包括 master 和 voting_only。例如，创建 voting_only 以及数据节点：

node.roles: [ data, master, voting_only ]

重要提示：voting_only 需要 Elasticsearch 的默认发布版，并且在 OSS 发布中不支持该角色。如果使用 OSS 发行版并添加 voting_only 角色，则该节点将无法启动。还要注意，只有具有 master 节点才能被标记为具有 voting_only 角色。

高可用性（HA）群集至少需要三个主节点，其中至少两个不是 voting_only 节点。即使其中一个节点发生故障，这样的群集也将能够选举一个主节点。

由于 voting_only 节点从来不会担任集群主节点，和真正的主节点相比较，他们可能需要需要较少的堆和一个不太强大的 CPU。但是，所有 master-eligible 节点（包括 voting_only 节点）都需要相当快的持久性存储以及到集群其余部分的可靠且低延迟的网络连接，因为它们位于发布集群状态更新的关键路径上。

具有 voting_only 的 master-eligible 节点也可以充当群集中的其他角色。例如，一个节点既可以是数据节点，又可以是 voting_only 的 master-eligible 节点。专用的 voting_only master-eligible 是不具备群集中的其他任何角色。要在默认发布中，创建专用的 voting_only master-eligible 节点，请设置：

node.roles: [ master, voting_only ]

Data node

数据节点包含包含你已建立索引的文档的分片。数据节点处理与数据相关的操作，例如 CRUD，搜索和聚合。这些操作是 I/O，内存和 CPU 密集型的。监视这些资源并在过载时添加更多数据节点非常重要。

具有专用数据节点的主要好处是将 master 和 data 角色分开。

要创建专用数据节点，请设置：

node.roles: [ data ]

在多层（multi-tier）部署体系结构中，你可以使用专门的数据角色将数据节点分配给特定的层：data_content，data_hot，data_warm 或 data_cold。一个节点可以属于多个层，但是具有专用数据角色之一的节点不能具有通用数据角色。

Content data node

Content data 节点容纳用户创建的内容。它们启用 CRUD，搜索和聚合之类的操作。

要创建专用的 content 节点，请设置：

node.roles: [ data_content ]

Hot data node

Hot data 数据节点在输入 Elasticsearch 时会存储时间序列数据。热层必须能够快速进行读写操作，并且需要更多的硬件资源（例如 SSD 驱动器）。

要创建专用的 hot 节点，请设置：

node.roles: [ data_hot ]

Warm data node

Warm data 节点存储的索引不再定期更新，但仍在查询中。查询量通常比索引处于热层时的频率低。性能较低的硬件通常可用于此层中的节点。

要创建专用的 Warm 节点，请设置：

node.roles: [ data_warm ]

Cold data node

Cold data 节点存储只读索引，该索引的访问频率较低。该层使用性能较低的硬件，并且可能会利用可搜索的快照索引来最大程度地减少所需的资源。

要创建专用的 cold 节点，请设置：

node.roles: [ data_cold ]

Coordinating only node

如果一个节点不担任 master 节点的职责，不保存数据，也不预处理文档，那么这个节点将拥有一个仅可路由请求，处理搜索缩减阶段并分配批量索引的协调节点。本质上，仅协调节点可充当智能负载平衡器。

仅协调节点可以通过从 data 和 master-eligible 节点上分担大量的协调角色从而使大型集群受益。他们加入群集并像其他所有节点一样接收完整的群集状态，并且使用群集状态将请求直接路由到适当的位置。

警告：在集群中添加过多的仅协调节点会增加整个集群的负担，因为选择的主节点必须等待每个节点的集群状态更新确认！仅协调节点的好处不应被夸大-数据节点可以很高兴地达到相同的目的。

要创建专用的协调节点，请设置：

node.roles: [ ]

Remote-eligible node

默认情况下，集群中的任何节点都可以充当跨集群客户端并连接到远程集群。连接后，你可以使用跨集群搜索来搜索远程集群。你还可以使用跨集群复制在集群之间同步数据。

node.roles: [ remote_cluster_client ]

Machine learning node

机器学习功能提供了机器学习节点，该节点运行作业并处理机器学习 API 请求。如果 xpack.ml.enabled 设置为 true，并且该节点不具有 ml 角色，则该节点可以处理 API 请求，但不能运行作业。

如果要在群集中使用机器学习功能，则必须在所有符合主机资格的节点上启用机器学习（将 xpack.ml.enabled 设置为true）。如果要在客户端（包括 Kibana）中使用机器学习功能，则还必须在所有协调节点上启用它。如果你只有 OSS 发行版，请不要使用这些设置。

有关这些设置的更多信息，请参阅机器学习设置。

要在默认发布中创建专用的机器学习节点，请设置：

node.roles: [ ml ]

xpack.ml.enabled: true

在默认的情况下， xpack.ml.enabled 已经被启动。

Transform node

转换节点运行转换并处理转换 API 请求。如果你只有 OSS 发行版，请不要使用这些设置。有关更多信息，请参见转换设置。

要在默认分发中创建专用的变换节点，请设置：

node.roles: [ transform ]

改变一个节点的角色

每个数据节点在磁盘上维护以下数据：

分配给该节点的每个分片的分片数据，

与分配给该节点的每个分片相对应的索引元数据，以及

集群范围的元数据，例如设置和索引模板。

同样，每个 master-eligible 节点都会在磁盘上维护以下数据：

集群中每个索引的索引元数据，以及

集群范围的元数据，例如设置和索引模板。

每个节点在启动时都会检查其数据路径的内容。如果发现意外数据，它将拒绝启动。这是为了避免导入可能导致群集健康状态变红的不必要的悬挂索引。更准确地说，如果没有 data role 的节点在启动时在磁盘上找到任何分片数据，它们将拒绝启动，而没有 master 和 data 角色的节点如果在启动时在磁盘上具有任何索引元数据，则将拒绝启动。

可以通过调整节点的 elasticsearch.yml 文件并重新启动来更改其角色。这称为重新利用节点。为了满足上述对意外数据的检查，在启动没有 data 或 master 角色的节点时，你必须执行一些额外的步骤来准备要重新使用的节点。

如果要通过删除 data 角色来重新利用数据节点，则应首先使用分配过滤器将所有分片数据安全地迁移到群集中的其他节点上。

如果要使节点既无 data 角色又 master 主角色，则最简单的方法是使用空数据路径和所需角色启动一个全新的节点。你可能会发现使用分配过滤器首先将分片数据迁移到集群中其他位置最安全。

如果无法执行这些额外的步骤，则可以使用 elasticsearch-node 重新利用工具删除任何阻止节点启动的多余数据。

Elasticsearch：Node 介绍 - 7.9 之后版本的更多相关文章

第三百五十九节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)介绍以及安装
第三百五十九节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)介绍以及安装 elasticsearch(搜索引擎)介绍 ElasticSearch是一个基于 ...
三十八 Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)介绍以及安装
elasticsearch(搜索引擎)介绍 ElasticSearch是一个基于Lucene的搜索服务器.它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口.Elasticse ...
全文搜索引擎Elasticsearch详细介绍
我们生活中的数据总体分为两种:结构化数据和非结构化数据. 结构化数据:也称作行数据,是由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理.指具有固 ...
ElasticSearch - Node
elasticSearch node 的配置如下: # Every node can be configured to allow or deny being eligible as the mast ...
ubuntu14.0 安装 node v8.11.1(任意版本)
由于众所周知的原因,通过node官网下载速度十分慢,我这里通过淘宝镜像安装 node8.11.1,其他版本同理. node版本淘宝镜像地址:https://npm.taobao.org/mirrors ...
[51CTO]给您介绍Windows10各大版本之间区别
给您介绍Windows10各大版本之间区别随着win10的不断普及和推广,越来越多的朋友想安装win10系统了,但是很多朋友不知道win10哪个版本好用,为了让大家能够更好的选择win10系统版本, ...
Elasticsearch 为何要在 7.X版本中去除type 的概念
背景说明 Elasticsearch是一个基于Apache Lucene(TM)的开源搜索引擎.无论在开源还是专有领域,Lucene可以被认为是迄今为止最先进.性能最好的.功能最全的搜索引擎库. El ...
〈一〉ElasticSearch的介绍
目录什么是ElasticSearch 核心能力 ES的搜索核心搜索引擎选择搜索的处理补充: 小节总结: 基本学习环境搭建如何操作ElasticSearch 下载.安装和运行(Based Wi ...
Elasticsearch 基础介绍
# Elasticsearch简介 ## 基础概念 Elasticsearch由Shay banon在2004年进行初步开发,并且在2010年2月发布第一个版本. 此后Shay banon在2 ...

随机推荐

angr原理与实践（一）——原理
1本文系原创,转载请说明出处关注微信公众号信安科研人,获取更多的原创安全资讯编辑网上已经有很多介绍angr的官方文档的博客,但是怎么去用angr做一次有意义且成就感满满的分析的教程很少 ...
Identity Server 4使用OpenID Connect添加用户身份验证(三)
一.说明基于上一篇文章中的代码进行继续延伸,只需要小小的改动即可,不明白的地方可以先看看本人上一篇文章及源码: Identity Server 4资源拥有者密码认证控制访问API(二) GitHub ...
USB转串口参数配置功能
当使用USB转串口芯片时,在部分场合下需要修改芯片内部的USB参数以满足其应用需要.常见如: 系统下使用多个USB转串口芯片,区分使用各芯片. 修改厂商ID.产品ID.厂商字符串,使用客户自有ID和信 ...
OPC UA分布式IO模块
OPC UA IO模块对工业物联网的影响 OPC UA IO模块是指IO模块支持OPC UA协议,可以直接与OPC Client进行通信,这样就可以从OPC Client上直接远程通过以太网对IO口进 ...
MySQL为什么"错误"选择代价更大的索引
欢迎来到 GreatSQL社区分享的MySQL技术文章,如有疑问或想学习的内容,可以在下方评论区留言,看到后会进行解答 MySQL优化器索引选择迷思. 高鹏(八怪)对本文亦有贡献. 1. 问题描述群 ...
PerfView专题 (第三篇)：如何寻找 C# 中的 VirtualAlloc 内存泄漏
一:背景上一篇我们聊到了如何用 PerfView 去侦察 NTHeap 的内存泄漏,这种内存泄漏往往是用 C 的 malloc 或者 C++ 的 new 分配而不释放所造成的,这一篇我们来聊一下由 ...
MySQL 数据定义语句
表相关修改表名 alter table grade rename hang; 新增表字段 alter table grade add `name` varchar(100); 修改表字段类型 alt ...
Electron学习（四）之应用程序打包
highlight: a11y-dark 写在前面人真的是会变得越来越懒的,也正是人的惰性吧,真的是很讽刺. 关于这个应用程序的开发,断更了很久,但是代码部分还算没落下吧,终于在周一.周二终把这个应 ...
这12款idea插件，能让你代码飞起来
前言基本上每个程序员都会写代码,但写代码的速度不尽相同. 为什么有些人,一天只能写几百行代码? 而有些人,一天可以写几千行代码? 有没有办法,可以提升开发效率,在相同的时间内,写出更多的代码呢? 今 ...
InnoDB_锁总结
1. 查询会对资源添加共享锁加了共享锁的资源不可以被修改:但可以被查询(也是会在资源上再加共享锁) 2. 数据修改会对资源添加排他锁加了排他锁的资源只能被持有这个排他锁的事务读取和修改,其他事务读 ...

Elasticsearch：Node 介绍 - 7.9 之后版本

Elasticsearch：Node 介绍 - 7.9 之后版本的更多相关文章

随机推荐

热门专题