ElasticSearch 交互使用

Curl 命令

# 建立索引

[root@dbtest01 ~]# curl -XPUT 'http://10.0.0.121:9200/test'

# 插入数据

[root@dbtest01 ~]# curl -XPUT 'localhost:9200/student/user/1?pretty' -H 'Content-Type: application/json' -d '{"name": "wqh","gender":"male","age":"18","about":"I will carry you","interests":["cs","it"]}'

ES-Head 插件

谷歌浏览器安装 ES-Head 插件，点击下载

将解压后的文件夹拖入谷歌浏览器扩展程序界面即可

部署 Kibana

安装 Kibana

# 上传代码包

[root@dbtest01 ~]# rz kibana-6.6.0-x86_64.rpm

# 安装

[root@dbtest01 ~]# rpm -ivh kibana-6.6.0-x86_64.rpm

配置 Kibana

[root@dbtest01 ~]# vim /etc/kibana/kibana.yml

[root@dbtest01 ~]# grep "^[a-Z]" /etc/kibana/kibana.yml

# 进程的端口

server.port: 5601

# 监听地址

server.host: "10.0.0.121"

# 指定 ES 地址

elasticsearch.hosts: ["http://127.0.0.1:9200"]

# Kibana 也会创建索引

kibana.index: ".kibana"

启动 Kibana

# 启动 Kibana

[root@dbtest01 ~]# systemctl start kibana.service

# 验证

[root@dbtest01 ~]# netstat -lntp

tcp        0      0 10.0.0.121:5601          0.0.0.0:*               LISTEN      88636/node

浏览器访问页面

# 访问 http://10.0.0.121:5601 ， Kibana 启动速度较慢

ElasticSearch 数据操作

创建索引

# 语法：

PUT /<index>

# 示例：

PUT /laowang

PUT xiaowang

创建数据

ES 存储数据三个必要构成条件，每一条数据必须有以下的数据结构，

构成条件	说明
_index	索引（数据存储的地方）
_type	类型（数据对应的类）
_id	数据唯一标识符

# 语法

PUT /<index>/_doc/<_id>

POST /<index>/_doc/

PUT /<index>/_create/<_id>

POST /<index>/_create/<_id>

index：索引名称，如果索引不存在，会自动创建

_doc：类型

<_id>：唯一识别符，创建一个数据时，可以自定义ID，也可以让他自动生成

指定 ID 插入数据（PUT）

PUT /student/user/3

{

  "name": "zzz",

  "gender": "male",

  "age": "23",

  "about": "abcdefg",

  "interests": [

    "sturdy",

    "dddddd"

  ]

}

# 一般不用此方式插入数据

# —— 需要修改 ID 值

# —— 当指定 ID 时，插入数据时会查询数据对比 ID 值，若 ID 相同，则会覆盖更新原来的数据

随机 ID 插入数据（POST）

# ES 会随机生成一个较长字符串作为此条数据的唯一 ID 标识

POST /student/user/

{

  "name":"xiaoliu",

  "gender":"female"

}

添加指定字段

# 推荐使用方法

POST /student/user/

{

  "id":"1",

  "name":"xiaoliu",

  "gender":"female"

}

查询数据

简单查询

# 查看所有索引信息

GET /_all

GET _all

# 查看所有索引的数据

GET /_all/_search

# 查看指定索引信息

GET /student

# 查看指定索引的数据

GET /student/_search

# 查看指定数据

GET /student/user/1

条件查询（Term，Match）

①. — term 代表完全匹配，也就是精确查询，搜索前不会再对搜索词进行分词，例如，我们要搜索标题（title）为 "北京烤鸭" 的所有文档：

# 方法一：

GET /news/_search

{

  "query": {

    "term": {

      "title": {

        "value": "北京烤鸭"

      }

    }

  }

}

# 可以省略 value 行，与 Key 合并到一行

GET /news/_search

{

  "query": {

    "term": {		       <-------- 使用 term 匹配，适用于精确查找

      "title":"北京烤鸭"        <------- 简写，并为一行

    }

  }

}

②. — match 代表模糊匹配，先对搜索词进行分词，例如，我们要搜索标题（title）为 "北京烤鸭" 的文档时，会先将 "北京烤鸭" 分词为 "北京" 和 "烤鸭"，符合两者其一的，都会取到结果：

# 方法二：

GET /news/_search

{

  "query": {

    "match": {			<-------- 使用 match 匹配，适用于模糊查找

      "title": "北京烤鸭"

    }

  }

}

多条件查询（Bool）

Bool 查询现在包括四种子句：must，filter，should，must_not

①. — must 查询：查询条件必须全部满足，类似 SELECT 语句中的 AND：

# 查询条件必须全部满足

GET /student/_search

{

  "query": {

    "bool": {

      "must": [

        {

          "term": {

            "age": {

              "value": "23"

            }

          }

        },

        {

          "term": {

            "name": {

              "value": "wqh"

            }

          }

        }

      ]

    }

  }

}

②. — filter 查询：查询条件必须全部满足，类似 SELECT 语句中的 AND，与 must 不同的是，不会计算相关性分数：

# 跟 must 一样，在数据量很大时，比 must 查询快一点，因为不用计算相关分

GET /student/_search

{

  "query": {

    "bool": {

      "filter": [

        {

          "term": {

            "age": {

              "value": "23"

            }

          }

        },

        {

          "term": {

            "name": {

              "value": "wqh"

            }

          }

        }

      ]

    }

  }

}

③. — should 查询：查询条件满足其一即可，类似 SELECT 语句中的 OR，会计算相关性分数：

# 多条件查询时，查询条件只要有一个满足就可以

GET /student/_search

{

  "query": {

    "bool": {

      "should": [

        {

          "term": {

            "age": {

              "value": "23"

            }

          }

        },

        {

          "term": {

            "name": {

              "value": "wqh"

            }

          }

        }

      ]

    }

  }

}

④. — must_not 查询：查询条件必须不满足，类似 SELECT 语句中的 NOT，会计算相关性分数：

# must_not 中的条件，必须全部不满足

GET /student/_search

{

  "query": {

    "bool": {

      "must_not": [

        {

          "term": {

            "age": {

              "value": "23"

            }

          }

        },

        {

          "term": {

            "name": {

              "value": "wqh"

            }

          }

        }

      ]

    }

  }

}

⑤. — must + should 查询：

# 查询年龄是 23岁 或者年龄是 18岁 并且名字是 wqh 的数据

GET /student/_search

{

  "query": {

    "bool": {

      "should": [

        {

          "term": {

            "age": {

              "value": "23"

            }

          }

        },

        {

          "bool": {

            "must": [

              {

                "term": {

                  "age": {

                    "value": "18"

                  }

                }

              },

              {

                "term": {

                  "name": {

                    "value": "xiaozi"

                  }

                }

              }

            ]

          }

        }

      ]

    }

  }

}

⑥. — 范围查询：

GET /student/_search

{

  "query": {

    "bool": {

      "must": [

        {

          "range": {

            "age": {

              "gte": 20,

              "lte": 25

            }

          }

        }

      ]

    }

  }

}

修改数据

# 修改数据时指定 ID 修改

PUT /student/user/1

{

  "name":"雾山火行",

  "gender":"male",

  "age":"18"

}

# 注意，修改数据时，除了要修改的值，其他字段的值也要带上，否则原有的其他字段会丢失

PUT /student/user/2

{

  "name":"wqh",

  "gender":"male",

  "age":"19"

}

删除数据

# 删除指定 ID 数据

DELETE /student/user/4

# 删除索引（别瞎删，可以用 ES-head 关闭索引）

DELETE /student

Query Context（不带 Filter）与 Filter Context

①. — Query Context 即指所有不使用 Bool 查询中的 Filter（过滤器）的上下文查询

②. — Filter Context 指 Bool 查询中，使用 Filter（过滤器）的上下文查询

查询在 Query 查询上下文和 Filter 过滤器上下文中，执行的操作是不一样的：

①. — 查询上下文：是在使用 query 进行查询时的执行环境，比如使用 search 的时候。

在查询上下文中，查询会回答这个问题——“这个文档是否匹配，它的相关度高么？”

ES中索引的数据都会存储一个 _score 分值，分值越高就代表越匹配。即使 lucene 使用倒排索引，对于某个搜索的分值计算还是需要一定的时间消耗。

②. — 过滤器上下文：在使用 filter 参数时候的执行环境，比如在 bool 查询中使用 Must_not 或者 filter

在过滤器上下文中，查询会回答这个问题——“这个文档是否匹配？”

它不会去计算任何分值，也不会关心返回的排序问题，因此效率会高一点。

另外，经常使用过滤器，ES会自动的缓存过滤器的内容，这对于查询来说，会提高很多性能。

总而言之：

①. — 查询上下文：查询操作不仅仅会进行查询，还会计算分值，用于确定相关度；

②. — 过滤器上下文：查询操作仅判断是否满足查询条件，不会计算得分，查询的结果可以被缓存，所以速度快

所以，根据实际的需求是否需要获取得分，考虑性能因素，选择不同的查询子句；如果不需要获得查询词条的相关性分数，尽量使用 Filter 。

参考：

Bool 查询

Query 与 Filter 的区别