Elasticsearch入门学习重点笔记

必记知识点

　　Elasticsearch可以接近实时的搜索和存储大量数据。Elasticsearch是一个近实时的搜索平台。这意味着当你导入一个文档并把它变成可搜索的时间仅会有轻微的延时。

　　文档是基本存储单元，以json格式存储，比如说一个用户信息，类似数据库里的单条数据。索引是多个同一类文档的集合，类似数据库里的表。Elasticsearch支持集群部署，一台服务器是一个节点，多个节点组成一个集群，每个节点有唯一节点名，同一集群里的节点有共同的集群名称。索引可以分片和复制，类似数据库的水平分片和主从复制，主索引分片和复制分片需要在不同的节点，来保证高可用。

　　Elasticsearch的api为rest风格，可以通过url增删改查，格式为：<REST Verb> /<Index>/<Type>/<ID>

　　REST Verb为：PUT、DELETE、GET、POST

　　Index为索引

　　Type为索引里的文档，如doc

　　ID为文档的id，可以在创建文档时定义，和数据库表的id类似，当将文档加入索引时，ID部分并不是必须的。如果没有指定，Elasticsearch将会生产一个随机的ID，然后使用它去索引文档。Elasticsearch生成的ID将会在API调用成功后返回。

　　PUT:

　　示例： PUT /customer/doc/1?pretty 请求将会将一个ID为1的文档加入customer索引。curl命令：curl -XPUT 'localhost:9200/customer/doc/1?pretty&pretty' -H 'Content-Type: application/json' -d' { "name": "John Doe" } '

　　如果我们再次执行上面的请求，Elasticsearch将会根据相同的ID更新之前的文档。

　　DELETE:

　　删除ID为2的文档： curl -XDELETE 'localhost:9200/customer/doc/2?pretty&pretty'

　　POST:

　　当我们没有明确指定ID的时候，我们需要使用POST方法代替PUT来发送请求。curl -XPOST 'localhost:9200/customer/doc?pretty&pretty' -H 'Content-Type: application/json' -d' { "name": "Jane Doe" } '

　　如下的例子演示如何去更新我们的之前ID为1的文档,

curl -XPOST 'localhost:9200/customer/doc/1/_update?pretty&pretty' -H 'Content-Type: application/json' -d'

{

"doc": { "name": "Jane Doe" }

}

'

　　GET:

　　获取ID为2的文档： curl -XGET 'localhost:9200/customer/doc/2?pretty&pretty'

　　批处理_bulk

　　在一个批操作中创建了两个文档：

curl -XPOST 'localhost:9200/customer/doc/_bulk?pretty&pretty' -H 'Content-Type: application/json' -d'

{"index":{"_id":"1"}}

{"name": "John Doe" }

{"index":{"_id":"2"}}

{"name": "Jane Doe" }

'

　　先更新ID为1的文档，然后删除ID为2的文档：

curl -XPOST 'localhost:9200/customer/doc/_bulk?pretty&pretty' -H 'Content-Type: application/json' -d'

{"update":{"_id":"1"}}

{"doc": { "name": "John Doe becomes Jane Doe" } }

{"delete":{"_id":"2"}}

'

　　查询语言

　　执行搜索有两种基础的方式，一种是在请求的URL中加入参数来实现，另一种方式是将请求内容放到请求体中。使用请求体可以让你的JSON数据以一种更加可读和更加富有展现力的方式发送。

curl -XGET 'localhost:9200/bank/_search?pretty' -H 'Content-Type: application/json' -d'

{

  "query": { "match_all": {} }

}

'

　　query 部分告诉我们我们的查询定义是什么，match_all 部分简单指定了我们想去执行的查询类型，意思就是在索引中搜索所有的文档。

　　除了query参数，我们还可以通过其他的参数影响搜索结果。 sort来指定搜索结果的顺序，from 参数(从0开始)指定了从哪个文档索引开始，size 参数指定了从from指定的索引开始返回多少个文档，用来分页。

curl -XGET 'localhost:9200/bank/_search?pretty' -H 'Content-Type: application/json' -d'

{

  "query": { "match_all": {} },

  "_source": ["account_number", "balance"]

}

'

　　_source指定需要返回的属性名。示例演示了如何返回两个属性，account_number 和 balance (在_source中)：

　　match，它可以被认为是基本的属性搜索查询(就是通过特定的一个或多个属性来搜索)。

curl -XGET 'localhost:9200/bank/_search?pretty' -H 'Content-Type: application/json' -d'

{

  "query": { "match": { "account_number": 20 } }

}

'

　　match_phrase，将返回所有address中包含“mill lane”的文档。

curl -XGET 'localhost:9200/bank/_search?pretty' -H 'Content-Type: application/json' -d'

{

  "query": { "match_phrase": { "address": "mill lane" } }

}

'

　　bool 查询允许我们使用布尔逻辑将小的查询组成大的查询。bool must 子句指定了所有匹配文档必须满足的条件。

GET /bank/_search

{

  "query": {

    "bool": {

      "must": [

        { "match": { "address": "mill" } },

        { "match": { "address": "lane" } }

      ]

    }

  }

}

　　如下示例组合两个match查询并且返回所有address属性中包含 “mill” 或 “lane” 的账户文档，bool should 子句指定了匹配文档只要满足其中的任何一个条件即可匹配。

curl -XGET 'localhost:9200/bank/_search?pretty' -H 'Content-Type: application/json' -d'

{

  "query": {

    "bool": {

      "should": [

        { "match": { "address": "mill" } },

        { "match": { "address": "lane" } }

      ]

    }

  }

}

'

　　如下示例组合两个match查询并且返回所有address属性中既不包含 “mill” 也不包含 “lane” 的账户文档，bool must_not 子句指定了其中的任何一个条件都不满足时即可匹配。

curl -XGET 'localhost:9200/bank/_search?pretty' -H 'Content-Type: application/json' -d'

{

  "query": {

    "bool": {

      "must_not": [

        { "match": { "address": "mill" } },

        { "match": { "address": "lane" } }

      ]

    }

  }

}

'

　　我们可以在一个bool查询中同时指定must，should和must_not子句。此外，我们也可以在一个bool子句中组合另一个bool来模拟任何复杂的多重布尔逻辑。

　　bool 查询也支持 filter 子句，它允许我们可以在不改变得分计算逻辑的的情况下限制其他子句匹配的查询结果。为了示例说明，让我们介绍一下range 查询，它允许我们通过一个值区间来过滤文档。这个通常用在数值和日期过滤上。

curl -XGET 'localhost:9200/bank/_search?pretty' -H 'Content-Type: application/json' -d'

{

  "query": {

    "bool": {

      "must": { "match_all": {} },

      "filter": {

        "range": {

          "balance": {

            "gte": 20000,

            "lte": 30000

          }

        }

      }

    }

  }

}

'

　　执行聚合

　　类似SQL的聚合函数，如下的例子将账户按state进行分组，然后按count降序(默认)返回前10组(默认)states，计算每个state分组的平均账户余额

curl -XGET 'localhost:9200/bank/_search?pretty' -H 'Content-Type: application/json' -d'

{

  "size": 0,

  "aggs": {

    "group_by_state": {

      "terms": {

        "field": "state.keyword"

      },

      "aggs": {

        "average_balance": {

          "avg": {

            "field": "balance"

          }

        }

      }

    }

  }

}

'

　　还有很多其它的聚合功能在这里我们就不去详细介绍了。如果你想了解更多，可以参考https://blog.csdn.net/hololens/article/details/78932628

Elasticsearch入门学习重点笔记的更多相关文章

入门学习webpack笔记
注意事项: 1.预热知识:前端模块化.commonJS最好提前了解.commonJS语法最好熟悉. 2.commonJS中,module表示当前模块,module.exports(或者exports) ...
SpringMVC入门学习案例笔记
一.数据库环境用mysql,数据库建表语句如下: /* SQLyog v10.2 MySQL - 5.1.72-community : Database - mybatis ************* ...
【零基础入门学习Python笔记013】元祖：戴上了枷锁的列表
元组:戴上了枷锁的列表因为和列表是近亲关系.所以元祖和列表在实际使用上是很相似的. 本节主要通过讨论元素和列表究竟有什么不同学习元祖. 元组是不可改变元素的.插入.删除或者排序都不能够.列表能够随意 ...
【零基础入门学习Python笔记012】一个打了激素的数组3
列表的一些经常使用操作符比較操作符逻辑操作符连接操作符反复操作符成员关系操作符 +表示两个连接.*表示复制. list中"+"两边的类型必须一致. 演示样例: water ...
ElasticSearch 入门总结
ElasticSearch 入门本篇为 ElasticSearch 入门学习总结笔记,课程视频地址:ElasticSearch 入门一.ElasticSearch 简介 1.1.什么是Elasti ...
Elasticsearch7.X 入门学习第八课笔记-----索引模板和动态模板
原文:Elasticsearch7.X 入门学习第八课笔记-----索引模板和动态模板版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接: ...
Hadoop入门学习笔记---part3
2015年元旦,好好学习,天天向上.良好的开端是成功的一半,任何学习都不能中断,只有坚持才会出结果.继续学习Hadoop.冰冻三尺,非一日之寒! 经过Hadoop的伪分布集群环境的搭建,基本对Hado ...
Hadoop入门学习笔记---part2
在<Hadoop入门学习笔记---part1>中感觉自己虽然总结的比较详细,但是始终感觉有点凌乱.不够系统化,不够简洁.经过自己的推敲和总结,现在在此处概括性的总结一下,认为在准备搭建ha ...
Hadoop入门学习笔记---part1
随着毕业设计的进行,大学四年正式进入尾声.任你玩四年的大学的最后一次作业最后在激烈的选题中尘埃落定.无论选择了怎样的选题,无论最后的结果是怎样的,对于大学里面的这最后一份作业,也希望自己能够尽心尽力, ...

随机推荐

eval()方法与str()方法
eval()方法与str()方法 #_author:Administrator#date:2019/10/31 a={ 'q':{'xxx':3456}}#将一个字典转换成一个字符串a=str(a)p ...
String相加解析
Java代码 package com.utils.test; public class TestObject { public static void main(String[] args) { St ...
17多校6 HDU - 6102
题意:给一个排列p,m次查询l,r,\(\sum_{i=l}^r\sum_{j=i+1}^r\sum_{k=j+1}^r[gcd(p_i,p_j)==p_k]p_k\) 题解:离线,枚举右端点,对于每 ...
0809NOIP模拟测试赛后总结
终于有点脸单独建一个随笔写一下考试总结了…… T1一眼组合数学,推了一会儿式子发现恐怕是容斥.突然害怕,于是开始大力dp. 然后骗了70分走人hhh. T2挂了……又读错题了……以为必须相邻,然后就原 ...
[复习]平衡树splay
明天要考试了…… 出来写一个splay的复习总结. 怕忘…… ^废话^ 以下内容学习自yyb大神的博客, 由于yyb大神内容不全, 部分是博主本人自行脑补... 这个模板还是比较全的^-^ ^又是一堆 ...
Ionic3 demo TallyBook 实例1
1.创建项目 ionic start TallyBook blank 创建一个空的项目 ionic cordova platform add android 添加andorid平台 io ...
jquery ajax 放在重复点击事件beforeSend方法
防止重复数据在实际项目开发中,提交表单时常常由于网络或者其原因,用户点击提交按钮误认为自己没有操作成功,进而会重复提交按钮操作次数,如果页面前端代码没有做一些相应的处理,通常会导致多条同样的数据插入数 ...
NSLayoutConstraint 开源框架
https://github.com/cloudkite/Masonry Masonry is a light-weight layout framework which wraps AutoLayo ...
运行第一个python程序，python 变量，常量，注释
一.运行第一个python程序: print('Hello,world') 保存为.py文件在cmd窗口: python3x:python py文件路径回车 python2x:python p ...
<每日一题>题目23：桶排序
''' 桶排序:最快最简单的排序缺点:最占内存类型:分布式排序 ''' import cProfile import random def bucketSort(nums): #选出最大的数 ma ...

Elasticsearch入门学习重点笔记

Elasticsearch入门学习重点笔记的更多相关文章

随机推荐

热门专题