elasticsearch 基础语法总结

1. es 使用 restful 风格的 api

　　备注： es 的 api 格式基本是这个样请求方式 /索引名/文档名/id?参数，但是还有很多不是这样的请求，比如 _cat api 等等........

2. 查询所有索引 get /_cat/indices

3.查看节点健康 get /_cat/health?v

4.？v 的意思显示列出项的title

5.?pretty 结果 json 格式化的方式输出

6.添加索引 put /test1

7. 添加一条 docment（如果已经存在那么久全部覆盖）

PUT /test1/d1/1

{

"age":1,

"name":"zs",

"bri":"2018-08-08"

}

　　备注1：如果已经存在就全覆盖修改。

　　备注2:如果只需要插入，不修改着在后面加上 /_create (这时候会提示已经存在),post 不能带_create

8.修改一条文档

POST /test1/d1/2

{

  "age":1,

  "name":"zs",

  "bri":"2018-08-08"

}

　　备注: post 虽然叫做修改，但是在带有id 的情况下和 put 几乎一样（id 存在就是全量修改，不存在就是新增）。

　　备注2: 可以使用 POST /test1/d1 不带id 的方式自动生成id，put 不支持不带id的写法。

　　备注3 post 可以指定_update ,并且可以带_create。

　　备注4：post 可以部分更新专用名字 partial update

POST /test1/d1/5/_update

{

  "doc":{

    "age":2

  }

}

9.删除一条文档 DELETE test1/d1/5

10. 删除一条索引 DELETE test1

11. 关于 primary shard 和 replica shard 的解释

　　 primary shard：se 对数据进行切片，吧一个索引的数据分成多份，每一份数据就是一个 primary shard， primary shard 的数量只能在创建索引的时候指定，因为后期修改 primary shard 数量会乱文档id 计算文档所在 shard 的结果。

　　 replica shard: 副本节点，多个副本节点可以提高数据的安全性，并且可以分担 primary shard 的查询负载。

　　备注: 修改只能发生在 primary shard ，查询可以发生在任意 shard 。

12.查询单条文档 get user/student/2

13. 搜索文档 get user/_search 或者 get user/syudent/_search

　　备注：查询可以不指定 type 的类型

14 url 的查询 get user/_search?-q=name2 ，+q是默认的，-q便是不存在这样的数据

　　备注：没有指定查询字段，使用的一个特俗的包含全部字段的字段查询的。

15 指定字段 url 的查询 get user/student/_search?q=name:n5

　　备注：+q=name:n5&q=name:n5

16 url query 的方式很难应复杂查询所以我们一般使用 json 格式的请求体的方式

　　备注：es restful 风格api 的 get 请求支持请求体

17 查询所有

get /user/student/_search

{

    "query":{

      "match_all": {}

    }

}

18 指定字段查询

get /user/student/_search

{

    "query":{

      "match": {

        "name": "n5"

      }

    }

}

19 范围查询

get /user/student/_search

{

    "query":{

      "range": {

        "bri": {

          "gte": 10,

          "lte": 20

        }

      }

    }

}

20 多条件的复合查询

get /user/student/_search

{

    "query":{

      "bool": {

        "must": [

          { "match": {

            "FIELD": "TEXT"

          }}

        ],

        "should": [

          {"match": {

            "FIELD": "TEXT"

          },

          "match": {

            "FIELD": "TEXT"

          }

          }

        ],

        "minimum_should_match": 1

      }

    }

}

备注：bool 里面的都是一些条件，must 必须瞒足，should 只要要满足 minimum_should_match 个条件是ture ，filter 只是过滤不计入评分。

21: 查询非分页

get /user/student/_search

{

    "query":{

      "match_all": {}

    },

    "from":3,

    "size":2

}

　　备注：深分页问题，效率会很低，劲量避免深分页。

　　备注2：深分页：如果要查询出每页 100 条，的第 100 页数据数据（ 9900 - 10000 ），如果是去5 个节点查询，那么会在每个节点查询出第 9900- 10000 条数据，然后汇总到坐标几点，然后排序后取出 9900-10000 条，这样做非常占资源。

22. scoll 游标查询，指定 scroll=时间，指定保存的分钟数，第一次发起请求放回的不是数据，而是 _scroll_id ，后面通过 _scroll_id 去请求数据，非常适合大批量查询。

get /user/student/_search?scroll=1m

{

    "query":{

      "match_all": {}

    },

    "size":2

}

GET /_search/scroll

{

    "scroll": "1m",

    "scroll_id" : "DnF1ZXJ5VGhlbkZldGNoBQAAAAAAAAIuFkRMbVZ0WFdvU1ZHWEJuelFIQk4tdFEAAAAAAAACLBZETG1WdFhXb1NWR1hCbnpRSEJOLXRRAAAAAAAAAi0WRExtVnRYV29TVkdYQm56UUhCTi10UQAAAAAAAAO1FlQwSkJqVng5UVpPUTIwbWw0a0NKV3cAAAAAAAADthZUMEpCalZ4OVFaT1EyMG1sNGtDSld3"

}

备注：游标查询是在 es 里面缓存了结果，然后一次一次的去取所以发起第一次请求的时候只有 size ，没有from ，后面的请求只有 scroll_id 和 scroll 时间

23: 只显示指定结果（ _source ）

GET /user/_search

{

  "query": {

    "match_all": {}

  },

  "_source": ["bri"]

}

24： post_filter 和 query 的区别，语法上没区别，唯一的在于 filter 不评分，所以 filter 比 query 快很多，filter 和query 可以共存。

GET /user/_search

{

  "post_filter": {

    "match_all": {}

  },

  "_source": ["bri"]

}

25 聚合函数球了平均值和总数量

GET  user/student/_search

{

  "query": {

    "match_all": {}

  },

  "aggs": {

    "total_count": {

      "value_count": {

        "field": "age"

      }

    },

    "pjz":{

      "avg": {

        "field": "age"

      }

    }

  }

}

26:分组

GET  user/student/_search

{

  "query": {

    "match_all": {}

  },

  "aggs": {

    "fz": {

      "terms": {

        "field": "age"

      }

    }

  }

}

27 ：遇到 Fielddata is disabled on text fields by default 异常的解决方案

　　因为text类型默认没有正排索引，所以不支持排序和聚合，遇到这种异常的时候需要制定开启正排索引。

　　倒排索引用于搜索，正排索引用于排序和聚合。

28：开启正排索引的方法。

put user/_mapping/student/

{

  "properties": {

    "sex": {

      "type":"text",

      "fielddata":true

    }

  }

}

29: 批查询 api mget

#批量查询

GET /_mget

{

  "docs":[

    {

      "_index":"user",

      "_type":"student",

      "_id":1

    },

    {

      "_index":"user",

      "_type":"student",

      "_id":2

    },

    {

      "_index":"user",

      "_type":"student",

      "_id":2

    }

  ]

}

备注：mget 如果请求url 里面有 index 和 type 后面的请求体里面就可以不写 index 和type

如:

#批量查询

GET /user/_mget

{

  "docs":[

    {

      "_type":"student",

      "_id":1

    },

    {

      "_type":"student",

      "_id":2

    },

    {

      "_type":"student",

      "_id":21111111

    }

  ]

}

30 批处理 bulk

　　　　　　bulk的格式：action：index/create/update/delete 后面如果有请求体就跟上请求体

GET _bulk

{"create":{"_index":"user","_type":"student","_id":"100"}}

{ "name": "zhaoer","age": 7,  "sex": "nn"}

{"update":{"_index":"user","_type":"student","_id":"100"}}

{"doc":{ "name": "zhaoer","age": 7,  "sex": "nn"}}

{"delete":{"_index":"user","_type":"student","_id":"100"}}

{"index":{"_index":"user","_type":"student"},"_id":"100"}

{"doc":{ "name": "zhaoer","age": 7,  "sex": "nn"}}

　　备注：delete 没有请求体。

　　备注2：create 和 update 只有在指定的状态才能成功 create 创建，update 更新。

　　备注3 ，批处理中的一个失败不影响其他的执行。

　　备注4 ，update 需要 doc 包一层

　　备注5 ，index 有create 和 update 的功能，并且支持又或者没有 doc 包一层都支持。

31 ，es 的删除是是假删除并且在下一次merge的时候真删除

32，es的并发处理，使用的乐观锁在后面加上 version

POST  /user/student/1?version=3

{

  "name":"zyk",

  "age":0

}

备注：只有version = 当前记录的version的时候才能修改成功

33.es 可以自动控制 vserion 通过，version_type指定，

version_type=external 要求 version 大于当前的version ，

version_type=internal 这个是默认值 ，必须等于当前的值
version_type=external_gte 大于等于当前的version
version_type=force 已经废弃了不能用了，我也不知道以前什么意思，提升， Validation Failed: 1: version type [force] may no longer be used

POST  /user/student/1?version_type=external&version=505

{

  "name":"zyk",

  "age":0

}

34 ,使用 consistency 指定写一致性的等级 (可能废除了，在6.0 不生效)

consistency=one 只要主节点活着就可以写

consistency=all 所有主节点和副本节点都活着

consistency=quorun 所有主节点都活着，并且有超过一半的节点（primary shard + replica shard ）活着，这个是默认值,而且只有在有副本节点的时候才生效

等待这时候可以指定 timeout 来指定等待时间timeout=30s

35 查询索引的设置

GET /user/_settings

36 查看索引的 mapping

GET user/_mapping

37动态的 mapping es 或根据第一次存入的数据，动态的决定这个字段的 mapping 类型，并且决定索引行为,后面类型不符合就没法存入，mapping 里面的类型不能修改，只能添加新的。

put /test2/t/1

{

  "age":1,

  "name":"name",

  "bri":"2017-09-09",

  "isDel":true,

  "amount":0.1

}

GET /test2/_mapping

38, 指定 mapping 只能给新的索引指定，或者个新的字段指定

PUT /test2/_mapping/t

{

  "properties": {

          "age": {

            "type": "long"

          },

          "amount": {

            "type": "float"

          },

          "bri": {

            "type": "date"

          },

          "isDel": {

            "type": "boolean"

          },

          "name": {

            "type": "text",

            "fields": {

              "keyword": {

                "type": "keyword",

                "ignore_above": 256

              }

            }

          }

        }

}

39,指定索引的 setting

PUT test3

{

   "settings": {

      "index": {

        "number_of_shards": "3",

        "number_of_replicas": "1"

      }

    }

}

PUT test4/_settings

{

  "index": {

        "number_of_replicas": "4"

      }

}

　　备注：number_of_shards 不能修改

40：mapping 里面 keyword 的可以指定 text 的子类型

41：如果字段类型是 json ，那么这个字段的类型就是 object ，或者说是docment 这时候 mapping 里面是映射了一个property

42 es 2.X 的时候string 现在改成 keyword 和 text ，keyword 是存不分词的的关键数据，text 存大数据，要分词，

　　可以个text 类型指定fields 来指定一个不分词的原文，用于排序聚合

 "name": {

            "type": "text",

            "fields": {

              "keyword": {

                "type": "keyword"

              }

            }

          }

　　备注：和2.X的 raw 类似。

43，query phase 指的的查询的查询请求，->坐标节点分发请求到对应 shard ，然后结果汇总到坐标节点的过程。

44， fetch phase 指的是查询结果的doc id 到各个 shard 取文档的过程。

45 通过 preference 指定取那些节点查询。

　　preference = _primary,_primart_first,_local,_only_node:xyz,_prefer_node:xyz,_shard:2,3

46 . timeout 指定多少时间之内要返回，到了时间一定会返回，即便没有查询完，只返回查到的部分。

47. routing ，默认是通过id 路由的。可以让类似的结果在同一个 shard 上。

curl -XPOST 'http://localhost:9200/store/order?routing=user123' -d '

{

    "productName": "sample",

    "customerID": "user123"

}'

48 searche_type

1、query and fetch
向索引的所有分片（shard）都发出查询请求，各分片返回的时候把元素文档（document）和计算后的排名信息一起返回。这种搜索方式是最快的。因为相比下面的几种搜索方式，这种查询方法只需要去shard查询一次。但是各个shard返回的结果的数量之和可能是用户要求的size的n倍。

2、query then fetch（默认的搜索方式）
如果你搜索时，没有指定搜索方式，就是使用的这种搜索方式。这种搜索方式，大概分两个步骤，第一步，先向所有的shard发出请求，各分片只返回排序和排名相关的信息（注意，不包括文档document)，然后按照各分片返回的分数进行重新排序和排名，取前size个文档。然后进行第二步，去相关的shard取document。这种方式返回的document可能是用户要求的size的n倍,此处勘误，这是原博客中的错误，经测试 query then fetch 方式返回的数量就是查询是 setSize()的数量

3、DFS query and fetch
这种方式比第一种方式多了一个初始化散发(initial scatter)步骤，有这一步，据说可以更精确控制搜索打分和排名。这种方式返回的document与用户要求的size是相等的。同样勘误 DFS query and fetch 返回结果的数量是分片数*size

4、DFS query then fetch
比第2种方式多了一个初始化散发(initial scatter)步骤。这种方式返回的document与用户要求的size是相等的。

49 Bouncing Results

　　搜索同一query，结果ES返回的顺序却不尽相同，这就是请求轮询到不同分片，而未设置排序条件，相同相关性评分情况下，由于评分采用的算法时TF(term frequency)和IDF(inverst document frequecy) 算出的总分在不同的shard上时不一样的，那么就造成了默认按照_score的分数排序，导致会出现结果不一致的情况。查询分析时将所有的请求发送到所有的shard上去。可用设置preference为字符串或者primary shard插叙等来解决该问题。preference还可以指定任意值，探后通过这个值算出查询的节点

50 type 其实就是一个隐藏的 field

51 mapping root object 就是指索引mapping 的json对象

52 给索引取一个名字

　　put user/_aliases/user_al

　　或者：

POST /_aliases

{

  "actions": [

    {

      "add": {

        "index": "user",

        "alias": "user_a"

      }

    },

    {

      "add": {

        "index": "user",

        "alias": "user_b"

      }

    }

  ]

}

　　备注：对个索引可以使用同一个别名

53 查询别名

　　get /user/_alias

54 删除别名

POST /_aliases

{

  "actions": [

    {

      "remove": {

        "index": "user",

        "alias": "user_a"

      }

    },

    {

      "remove": {

        "index": "test",

        "alias": "user_b"

      }

    }

  ]

}

55 自定义分词器

PUT /user5

{

  "settings":{

    "analysis": {

      "char_filter": {

        "my_char_filter":{

          "type":"mapping",

          "mappings":["&=> and"]

        }

      },

      "filter": {

        "my_filter":{

          "type":"stop",

          "stopwords":["the","a"]

        }

      },

      "analyzer": {

        "my_analyzer":{

          "type":"custom",

          "char_filter":[ "my_char_filter" ],

          "filter":["my_filter"],

          "tokenizer":"standard"

        }

      }

    }

  }

}

　　解释：定义了一个 char_filter 名叫 my_char_filter，类型是 mapping 把& 转成 and

　　　　定义了一个 filter 名叫 my_filter ，类型是停用词，把 the ，a 去掉

　　　　定义了一个分析器名叫 my_analyzer, 类型是自定义，它使用了 char_filter 是 my_char_filter ,它使用的 filter 是 my_filter ,它使用的分词器是标准分词器。

例子二：

PUT /user9

{

  "settings":{

    "analysis": {

      "char_filter": {

        "my_char_filter":{

          "type":"mapping",

          "mappings":["& => and", "pingguo => pingg"]

        }

      },

      "filter": {

        "my_filter":{

          "type":"stop",

          "stopwords":["the","a"]

        }

      },

      "analyzer": {

        "my_analyzer":{

          "type":"custom",

          "char_filter":[ "my_char_filter" ],

          "filter":["my_filter"],

          "tokenizer":"standard"

        }

      }

    }

  }

}

GET /user9/_analyze

{

  "analyzer":"my_analyzer",

  "text":" a d&og is in the house pingguo"

}

56 自定义动态mapping

PUT my_index1

{

  "mappings": {

    "_doc":{

      "dynamic":"strict",

      "properties":{

        "name":{

          "type":"text"

        },

        "user":{

          "type":"object",

          "dynamic":"true"

        }

      }

    }

  }

}

GET my_index1/_doc/1

{

 "name":"name1",

 "user":{

   "name":"n1",

   "age":10

 },

 "age":2

}

　mapping的第一层，也就是 properties的那一层，不允许动态映射，有新的字段就报错，

　user的那一层，允许动态映射，有新的字段就根据新的第一次的值，指定类型。

　　dynamic = false 的时候会存进去，但是我试了一次，不管 1 还是 "1"都可以存进去，但是也可以查看得到，但是好像搜索不到。

57 document 写入原理

　　每次写请求写入到内存 buffer ，当写到一定程度的时候，刷新，buffer 写到 lucene 的 segment，大概1 秒一次。segment 会吧数据写到 oscache ，然后执行 fsysc 命令吧欧式chache 写到disk中。删除的时候是加删除，在index segment 中创建一个.del文件,在一定时候index segment 合并的时候，会删除这个del文件。更新，先执行删除，然后在执行插入。值得注意的是，没个一秒 buffer 提交一次，并且产生一个新的 segment，而且，这时候会出发 segment 到 oscache 的提交。数据提交到 os cache 的以后就可以搜索到了，所以这就是 1 秒近实时的原因。可以给index指定刷新的时间。 refresh_interval，并且 es 还会写 tranlog（写buffer的同时）文件，这个文件可以避免丢失。每次提交会创建一个tranlog 文件，提交完成会删除原来的 tranlog 文件。在提交以后记录会写到新的 tranlog 中。

58. 查看一段文本是在某个分词器上是怎么分词的。

GET /user/_analyze

{

  "analyzer": "standard",

  "text":  " a dog is in the house"

}

59 : 给指定字段指定指定的分词器

put /user3/_mapping/student

{

  "properties":{

    "name":{

      "type":"text",

      "analyzer":"standard"

    }

  }

}

60: dynamic 策略三种，true （遇到陌生字段就 dynamic mapping ），false（遇到陌生字段就忽略），strict（遇到陌生字段就报错）

61：post /my_index/_optimize?max_num_segments=1

　　手动使索引 merge

elasticsearch 基础语法总结的更多相关文章

Swift与C#的基础语法比较
背景: 这两天不小心看了一下Swift的基础语法,感觉既然看了,还是写一下笔记,留个痕迹~ 总体而言,感觉Swift是一种前后端多种语言混合的产物~~~ 做为一名.NET阵营人士,少少多多总喜欢通过对 ...
iOS-----正则表达式的基础语法
正则表达式简单语法总结一.什么是正则表达式从概念上来说,正则表达式也是一门小巧而精炼的语言,它可以用来简化检索特定的字符串,替换特定字符等功能,有许多开发语言工具,都内嵌支持正则表达式.那么一个正 ...
python之最强王者（2）——python基础语法
背景介绍:由于本人一直做java开发,也是从txt开始写hello,world,使用javac命令编译,一直到使用myeclipse,其中的道理和辛酸都懂(请容许我擦干眼角的泪水),所以对于pytho ...
emmet 系列（1）基础语法
emmet 系列(1)基础语法 emmet 是一个能显著提升开发html和css开发效率的web开发者工具 emmet基本上目前已知的编辑器都有相应的插件,各个编辑器的emmet插件的下载地址:点我下 ...
Scala基础语法（一）
如果你之前是一名 Java 程序员,并了解 Java 语言的基础知识,那么你能很快学会 Scala 的基础语法. Scala 与 Java 的最大区别是:Scala 语句末尾的分号 ; 是可选的. 我 ...
Java基础语法
java基础学习总结——基础语法1 一．标识符
javascript中正则表达式的基础语法
× 目录 [1]定义 [2]特点 [3]元字符[4]转义字符[5]字符组[6]量词[7]括号[8]选择[9]断言[10]模式[11]优先级[12]局限性前面的话正则表达式在人们的印象中可能是一堆无 ...
Swift基础语法学习总结(转)
Swift基础语法学习总结 1.基础 1.1) swift还是使用// 和/* */ 来注释,并且/* */允许多行注释. 1.2) swift使用print和println打印,它的传参是一个泛型 ...
黑马程序员——OC语言基础语法面向对象的思想
Java培训.Android培训.iOS培训..Net培训.期待与您交流! (以下内容是对黑马苹果入学视频的个人知识点总结)(一)基础语法 1)关键字 @interface.@implementati ...

随机推荐

xampp 忘记密码的处理方式.
网上看到一些方法: 大部分是第一种: 方法一这个方法, 我使用的时候没有生效. -------------- 后来看到另外一种方法 . 直接替换user表的三个文件. 这个方法成功了. xam ...
训练の Bessie的体重问题
Bessie的体重问题题目描述 Bessie像她的诸多姊妹一样,因为从Farmer John的草地吃了太多美味的草而长出了太多的赘肉.所以FJ将她置于一个及其严格的节食计划之中.她每天不能吃多过H ...
python 模块基础和常用的模块
模块的定义一个模块就是以.py结尾的python 文件,用来从逻辑上组织python代码.注意,模块名和变量名一样开头不能用数字,可以是双下划线和字母. 为什么要用模块? 将一些复杂的需要重复使用的 ...
JAVA个人小程序GUI篇-收银（标签、按钮、复选框、下拉标、文本域、表格······）
如果用eclipse需先装载windowsbuild //导入包 import java.awt.BorderLayout; import java.awt.EventQueue; import ja ...
又一个opengl教程，多多益善
http://ogldev.atspace.co.uk/index.html http://wiki.jikexueyuan.com/project/modern-opengl-tutorial/tu ...
【转载】火爆的996.ICU项目正在酝酿开源许可证禁止996公司使用
原文地址: https://www.cnbeta.com/articles/tech/832449.htm ---------------------------------------------- ...
【opencv基础】linux系统卸载opencv
找到opencv某个版本的源码文件,进入build目录: cd opencv_build sudo make uninstall cd .. sudo rm -r build sudo rm -r / ...
通过putty进行端口映射并且启动jupyter notebook
通过内网穿透之后,一般而言,我们访问内网中的机器在ubuntu下一句命令: ssh name@阿里云 -p 6000即可进行访问,其中-p是表示端口号:同样的通过windows下的putty也可修改对 ...
spring的multipartResolver和java后端获取的MultipartHttpServletRequest方法对比（附：遇到的坑）
转载:https://www.cnblogs.com/yskcoder/p/4718198.html 这两天在用spring进行上传上遇到问题,今天进行了问题的排查,这个过程也增加了我看spring源 ...
Linux 针对nginx日志文件做ip防刷限制
针对nginx日志做ip访问限制 1.cat /var/log/server/nginx/access.log| awk -F '?' '/optionid/{print $1}'|awk '{pri ...

elasticsearch 基础 语法总结

elasticsearch 基础 语法总结的更多相关文章

随机推荐

热门专题

elasticsearch 基础语法总结

elasticsearch 基础语法总结的更多相关文章