前言

Elasticsearch中当我们设置Mapping（分词器、字段类型）完毕后，就可以按照设定的方式导入数据。

有了数据后，我们就需要对数据进行检索操作。根据实际开发需要，往往我们需要支持包含但不限于以下类型的检索：
1）精确匹配，类似mysql中的 “=”操作；
2）模糊匹配，类似mysql中的”like %关键词% “查询操作；
3）前缀匹配；
4）通配符匹配；
5）正则表达式匹配；
6）跨索引匹配；
7）提升精读匹配。

细数一下，我们的痛点在于：
1）ES究竟支持哪些检索操作？
2）如何实现ES精确值检索、指定索引检索、全文检索？

这些就是本文着重参考ES最新官方文档，针对ES5.X版本探讨的内容。

0、检索概览

检索子句的行为取决于查询应用于过滤(filter)上下文还是查询/分析(query)上下文。

过滤上下文——对应于结构化检索

）核心回答的问题是：“这个文档是否符合这个查询条款？” 

）答案是简单的是或否，不计算分数。 

）过滤器上下文主要用于过滤结构化数据。类似于Mysql中判定某个字段是否存在：

例如：

a. 时间戳字段：是否属于2015年或2016年？
b. 状态字段：是否设置为“已发布”？

经常使用的过滤器将被Elasticsearch**自动缓存，以加快性能**。

分析上下文——对应于全文检索
1）核心回答了“本文档与此查询子句是否匹配？”的问题。

2）除了决定文档是否匹配之外，查询子句还会计算一个_score，表示文档与其他文档的匹配程度。

综合应用场景如下：

GET /_search

{  "query": {  "bool": {  "must": [

  { "match": { "title": "Search" }},

  { "match": { "content": "Elasticsearch" }}

  ],  "filter": [

  { "term": { "status": "published" }},

  { "range": { "publish_date": { "gte": "2015-01-01" }}}

  ]

  }

  }

}

以上检索，title中包含”Search”并且content中包含 “Elasticsearch”，status中精确匹配”published”，并且publish_date 大于“2015-01-01”的全部信息。以下，以“脑图”的形式直观展示检索分类：

以下内容的原文需要参考ES官方文档（随着版本变化，后续会有更新）

1、结构化检索

针对字段类型：日期、时间、数字类型，以及精确的文本匹配。
结构化检索特点：
* 1）结构化查询，我们得到的结果总是非是即否，要么存于集合之中，要么存在集合之外。
* 2）结构化查询不关心文件的相关度或评分；它简单的对文档包括或排除处理。

1.1 精确值查找

1.1.1 单个精确值查找（term query）

term 查询会查找我们指定的精确值。term 查询是简单的，它接受一个字段名以及我们希望查找的数值。

想要类似mysql中如下sql语句的查询操作：

SELECT document FROM products WHERE price = 20;
DSL写法：

GET /my_store/products/_search

{

  "query" : {

  "term" : {

  "price" :

  }

  }

}

当进行精确值查找时，我们会使用过滤器（filters）。过滤器很重要，因为它们执行速度非常快，不会计算相关度（直接跳过了整个评分阶段）而且很容易被缓存。如下：使用 constant_score 查询以非评分模式来执行 term 查询并以一作为统一评分。

GET /my_store/products/_search

{

  "query" : {

  "constant_score" : {

  "filter" : {

  "term" : {

  "price" :

  }

  }

  }

  }

}

注意：5.xES中，对于字符串类型，要进行精确值匹配。需要讲类型设置为text和keyword两种类型。mapping设置如下：

POST testindex/testtype/_mapping

{

   "testtype ":{

  "properties":{

  "title":{

  "type":"text",

  "analyzer":"ik_max_word",

  "search_analyzer":"ik_max_word",

  "fields":{

  "keyword":{

  "type":"keyword"

  }

  }

  }

}

}

1.1.2 布尔过滤器

一个 bool 过滤器由三部分组成：

{

   "bool" : {

      "must" :     [],

      "should" :   [],

      "must_not" : [],

      "filter":    []

   }

}

must ——所有的语句都必须（must）匹配，与 AND 等价。

must_not ——所有的语句都不能（must not）匹配，与 NOT 等价。
should ——至少有一个语句要匹配，与 OR 等价。
filter——必须匹配，运行在非评分&过滤模式。
就这么简单！当我们需要多个过滤器时，只须将它们置入 bool 过滤器的不同部分即可。

举例：

GET /my_store/products/_search

{

  "query" : {

  "filtered" : {

  "filter" : {

  "bool" : {

  "should" : [

  { "term" : {"price" : }},

  { "term" : {"productID" : "XHDK-A-1293-#fJ3"}}

  ],

  "must_not" : {

  "term" : {"price" : }

  }

  }

  }

  }

  }

}

1.1.3 多个值精确查找（terms query）

{

  "terms" : {

  "price" : [, ]

  }

}

如上，terms是包含的意思，包含20或者包含30。
如下实现严格意义的精确值检索， tag_count代表必须匹配的次数为1。

GET /my_index/my_type/_search

{

  "query": {

  "constant_score" : {

  "filter" : {

  "bool" : {

  "must" : [

  { "term" : { "tags" : "search" } },

  { "term" : { "tag_count" :  } }

  ]

  }

  }

  }

  }

}

1.2 范围检索（range query）

range 查询可同时提供包含（inclusive）和不包含（exclusive）这两种范围表达式，可供组合的选项如下：

gt: > 大于（greater than）

lt: < 小于（less than）

gte: >= 大于或等于（greater than or equal to）

lte: <= 小于或等于（less than or equal to）

类似Mysql中的范围查询：

SELECT document

FROM   products

WHERE  price BETWEEN  AND

ES中对应的DSL如下：

GET /my_store/products/_search

{

  "query" : {

  "constant_score" : {

  "filter" : {

  "range" : {

  "price" : {

  "gte" : ,

  "lt" :

  }

  }

  }

  }

  }

}

1.3 存在与否检索（exist query）

mysql中，有如下sql：
SELECT tags FROM posts WHERE tags IS NOT NULL;

ES中，exist查询某个字段是否存在：

GET /my_index/posts/_search

{

    "query" : {

        "constant_score" : {

            "filter" : {

                "exists" : { "field" : "tags" }

            }

        }

    }

}

https://blog.csdn.net/laoyang360/article/details/77623013 1.3接着往下面开始

Elasticsearch检索分类详解的更多相关文章

（转）dp动态规划分类详解
dp动态规划分类详解转自:http://blog.csdn.NET/cc_again/article/details/25866971 动态规划一直是ACM竞赛中的重点,同时又是难点,因为该算法时间 ...
Elasticsearch SQL用法详解
Elasticsearch SQL用法详解 mp.weixin.qq.com 本文详细介绍了不同版本中Elasticsearch SQL的使用方法,总结了实际中常用的方法和操作,并给出了几个具体例子 ...
【Java】Lucene检索引擎详解
基于Java的全文索引/检索引擎——Lucene Lucene不是一个完整的全文索引应用,而是是一个用Java写的全文索引引擎工具包,它可以方便的嵌入到各种应用中实现针对应用的全文索引/检索功能. L ...
elasticsearch 安装配置详解
一.安装简单的安装与启动于前文ElasticSearch初探(一)已有讲述,这里不再重复说明. 二.启动 1.自带脚本启动 1)bin/elasticsearch,不太任何参数,默认在前端启动 2) ...
ELK学习笔记之ElasticSearch的索引详解
0x00 ElasticSearch的索引和MySQL的索引方式对比 Elasticsearch是通过Lucene的倒排索引技术实现比关系型数据库更快的过滤.特别是它对多条件的过滤支持非常好,比如年龄 ...
【打分策略】Elasticsearch打分策略详解与explain手把手计算
一.目的一个搜索引擎使用的时候必定需要排序这个模块,一般情况下在不选择按照某一字段排序的情况下,都是按照打分的高低进行一个默认排序的,所以如果正式使用的话,必须对默认排序的打分策略有一个详细的了解才 ...
【elasticsearceh】elasticsearch.yml配置文件详解
主要内容如下: cluster.name: elasticsearch 配置es的集群名称,默认是elasticsearch,es会自动发现在同一网段下的es,如果在同一网段下有多个集群,就可以用这个 ...
Elasticsearch的Search详解
介绍 ES不是新技术,是将全文检索和数据分析.分布式整合到一起. 基于lucene开发,提供简单的restful api接口.java api接口.其他语言开发接口等. 实现了分布式的搜索引擎和分析引 ...
Elasticsearch删除操作详解
文章转载自: https://mp.weixin.qq.com/s?__biz=MzI2NDY1MTA3OQ==&mid=2247484022&idx=1&sn=7a4de21 ...

随机推荐

软件测试人员需要精通的开发语言（4）--- Java
接下来说下,当下最火的语言 - Java.Java是一种可以撰写跨平台应用程序的面向对象的程序设计语言.Java 技术具有卓越的通用性.高效性.平台移植性和安全性,广泛应用于PC.数据中心.游戏控制台 ...
php总结6——自定义函数、引用传值
6.1 自定义函数 function 函数名称(参数[=默认值],参数[=默认值]...){ 函数体 [return val]; } 1) 无参数无返回 2) 有参数无返回 3) 有参数有返回函数中 ...
python数据分析之Pandas：汇总和计算描述统计
pandas对象拥有一组常用的数学和统计方法,大部分都属于约简和汇总统计,用于从Series中提取单个的值,或者从DataFrame中的行或列中提取一个Series.相比Numpy而言,Numpy都是 ...
svn 出现冲突时可以使用 meld . 命令合并。而git的冲突合并详见内容
1.可以在任意目录使用 git mergetool --tool-help 查看 git 所支持的merge tools. 2.可以使用如下配置去设置merge tool 和 diff tool ...
ABAP screen
Instance One : SELECTION-SCREEN BEGIN OF BLOCK B1 WITH FRAME TITLE TEXT-100. SELECTION-SCREEN BEGIN ...
java集合讲解干货集
文章都来自网络,收集后便于查阅. 1.Java 集合系列01之总体框架 2.Java 集合系列02之 Collection架构 3.Java 集合系列03之 ArrayList详细介绍(源码解析)和 ...
AppStore App申请审核加速
容芳志大牛一直是我学习的榜样分类: iOS开发经验技巧2014-11-12 09:40 409人阅读评论(0) 收藏举报有没有遇到上线后发现很严重的bug这种情况,修复bug后提交审核又是漫长 ...
解决webpack不能匹配post请求的问题
解决webpack不能匹配post请求的问题 webpack的dev-server只能匹配get请求,在本地做本地数据的时候会很不方便. 可以使用如下两种办法解决: 1.在webpack.config ...
在Linux下创建7种类型的文件
在测试的时候有时会需要每种类型的文件,在系统中进行搜索都会找到,当然最方便的还是手动创建它们进行测试使用. 普通文件: $ touch regular 目录: $ mkdir directory 符号 ...
《C prime plus (第五版）》 ---第11章字符串和字符串函数---3
字符串函数总结: 下面是头文件 string.h 中定义的函数: 序号函数 & 描述 1 void *memchr(const void *str, int c, size_t n)在参数 ...

Elasticsearch检索分类详解

前言