ElasticSearch之Merge

Elasticsearch的shard，即对应Lucene的index。

Lucene的index由多个segment组成。

segment是index保存数据的最小单位，不支持修改。

Elasticsearch在运行过程中，启动后台任务，周期性检测并将占用空间小的segment自动合并至大一些的segment，避免存在过多的segment对象，同时在合并过程中，会剔除掉已删除的记录。

合并操作的过程可能消耗较多的资源，比如CPU和I/O，因此在合并操作运行的过程中，Elasticsearch会自动调整合并操作的吞吐量，优先保证其它业务的正常运行。

Elasticsearch提供了ConcurrentMergeScheduler作为合并操作的调度器，管理合并操作的产生和运行。

ConcurrentMergeScheduler在新的线程中提交合并操作，同时控制合并操作的并发数。当合并操作占用的线程的数量达到index.merge.scheduler.max_thread_count，ConcurrentMergeScheduler将后续待执行的合并操作放至队列中，避免合并操作占用过多的资源，影响其它操作。

相关参数

index.merge.scheduler.max_thread_count

在一个shard上执行merge操作时允许使用的线程的数量。

默认值为Math.max(1, Math.min(4, node.processors / 2))。

修改参数的取值，执行命令如下：

curl -X PUT "https://localhost:9200/_settings?pretty" -H 'Content-Type: application/json' -d'

{

    "index.merge.scheduler.max_thread_count": 2

}

' --cacert $ES_HOME/config/certs/http_ca.crt -u "elastic:ohCxPH=QBE+s5=*lo7F9"

假如当前没有创建index，则报错信息如下：

{

  "error" : {

    "root_cause" : [

      {

        "type" : "index_not_found_exception",

        "reason" : "no such index [[]]",

        "index_uuid" : "_na_",

        "index" : "[]"

      }

    ],

    "type" : "index_not_found_exception",

    "reason" : "no such index [[]]",

    "index_uuid" : "_na_",

    "index" : "[]"

  },

  "status" : 404

}

假如当前已有创建好的index，执行结果的样例，如下：

{

  "acknowledged" : true

}

相关资料

ElasticSearch之Merge的更多相关文章

elasticsearch index 之merge
merge是lucene的底层机制,merge过程会将index中的segment进行合并,生成更大的segment,提高搜索效率.segment是lucene索引的一种存储结构,每个segment都 ...
段合并 segments merge 被删除的文档的删除时间
2.5 段合并每个索引分为多个“写一次,读多次”的段 write once and read many times segments 建立索引时,一个段写入磁盘以后就不能更新:被删除的文档的信息存 ...
记一次Elasticsearch OOM的优化过程——基于segments force merge 和 store type 转为 niofs
首选,说明笔者的机器环境(不结合环境谈解决方案都是耍流氓): cpu 32核,内存128G,非固态硬盘: RAID0 (4T * 6),单节点,数据量在700G到1800G,索引15亿~21亿.敖丙大 ...
Elasticsearch Java 虚拟机配置详解
Elasticsearch对Java虚拟机进行了预先的配置.通常情况下,因为这些配置的选择还是很谨慎的,所以你不需要太关心,并且你能立刻使用ElasticSearch. 但是,当你监视ElasticS ...
ElasticSearch详解与优化设计
简介概念安装部署 ES安装数据索引索引优化内存优化 1简介 ElasticSearch(简称ES)是一个分布式.Restful的搜索及分析服务器,设计用于分布式计算:能够达到实时搜索,稳定, ...
Elasticsearch 的坑爹事——记录一次mapping field修改过程
Elasticsearch 的坑爹事本文记录一次Elasticsearch mapping field修改过程团队使用Elasticsearch做日志的分类检索分析服务,使用了类似如下的_mapp ...
elasticsearch运维实战之2 - 系统性能调优
elasticsearch性能调优集群规划独立的master节点,不存储数据, 数量不少于2 数据节点(Data Node) 查询节点(Query Node),起到负载均衡的作用 Linux系统参 ...
(转)ElasticSearch学习
ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎.设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便.支持通过HTTP使用JSON进行数据索引 ...
ElasticSearch已经配置好ik分词和mmseg分词(转)
ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎.设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便.支持通过HTTP使用JSON进行数据索引 ...
elasticsearch基础
elastic使用lucene建立索引的步骤中,需要文件系统缓存需要同步到磁盘上.(多个segment->commit文件来维护) 当建立历史数据时,并不要求太高的实时性时,可以减小(默认1s) ...

随机推荐

文心一言 VS 讯飞星火 VS chatgpt （90）-- 算法导论8.3 3题
三.用go语言,利用归纳法来证明基数排序是正确的.在你所给出的证明中,在哪里需要假设所用的底层排序算法是稳定的? 文心一言: 基数排序是一种非比较型整数排序算法,其通过在每一位上进行比较来排序.基数排 ...
UM 百度富文本编辑器自定义图片上传路径
UM 百度富文本编辑器自定义图片上传路径因为公司要做图文编辑,选择了UM,但是直接存入Tomcat根目录下,不满足业务需求需要存入服务器上. 一.需要注意的是在um的JSP目录下已经存在了Uploa ...
xmind文件数据解析重构成mindmap可识别数据
[需求背景] 测试平台开发中,需要引入前端mindmap模块,进行在线xmind实时解析并前端展示 [卡点难点] 选取什么库进行xmind解析如何转换成mindmap可以识别的数据 [xmind解析 ...
关于 Python 字符串切片的小领悟
1. 什么是 Python 字符串切片? 例如存在字符串 str2 = "abcd1234" ,有以下简单的切片应用. str2[0] # a str2[0:3] # abc st ...
Unity - UIWidgets 6. 显示列表
为了更贴近游戏实际ui的效果和使用环境, 从而讨论上一节遗留的问题, 列表显示是必不可少的参考修改之前的HomeRoute, private Widget CreateListTest() { L ...
服务器没有开放3306端口远程访问MySQL数据库方法
一.前言当装有MySQL的服务器为了防止数据库被黑,提高安全性,把3306端口禁止掉,禁止对外访问,我之前写过一篇是借助跳板机的SSH隧道来访问实现安全,这种情况依然需要开放3306端口和使用一 ...
Python JSON 使用指南：解析和转换数据
JSON 是一种用于存储和交换数据的语法.JSON 是文本,使用 JavaScript 对象表示法编写. Python 中的 JSON Python 有一个内置的 json 包,可用于处理 JSON ...
deepin解决文件管理器打不开和桌面黑屏的问题
总结 deepin 的优点是上手非常容易, 但截止当前(2021-6-24)的使用来说稳定性还不是非常好. 今天就遇到了无法显示桌面的问题,可以参照如下解决办法.只需使用红色框中的命令即可. 图片转载 ...
vue 中如何使用axios调用接口
首先后端采用的是restful形式,分为了 1.post(添加)请求, 2.delect(删除)请求, 3.put(修改)请求, 4.get(查询)请求, 在vue里项目里,npm i axios - ...
Verilog HDL门级建模
Verilog HDL内部定义了12个基本门级元件可以直接用,用这些门级原件直接对逻辑图进行描述,称为门级建模. 每个门输入可能是逻辑0,逻辑1,不确定态x和高阻态z四个值之一. 1.多输入门主要有 ...

ElasticSearch之Merge

ElasticSearch之Merge的更多相关文章

随机推荐

热门专题