Elasticsearch 5.0 中term 查询和match 查询的认识

Elasticsearch 5.0 关于term query和match query的认识

一、基本情况

前言：term query和match query牵扯的东西比较多，例如分词器、mapping、倒排索引等。我结合官方文档中的一个实例，谈谈自己对此处的理解

string类型在es5.*分为text和keyword。text是要被分词的，整个字符串根据一定规则分解成一个个小写的term，keyword类似es2.3中not_analyzed的情况。

string数据put到elasticsearch中，默认是text。

NOTE:默认分词器为standard analyzer。"Quick Brown Fox!"会被分解成[quick,brown,fox]写入倒排索引

term query会去倒排索引中寻找确切的term，它并不知道分词器的存在。这种查询适合keyword 、numeric、date
match query知道分词器的存在。并且理解是如何被分词的

总的来说有如下：

term query 查询的是倒排索引中确切的term
match query 会对filed进行分词操作，然后在查询

二、测试（1）

准备数据：

POST /termtest/termtype/1

{

  "content":"Name"

}

POST /termtest/termtype/2

{

  "content":"name city"

}

查看数据是否导入

GET /termtest/_search

{

  "query":

  {

    "match_all": {}

  }

}

结果：

{

  "took": 1,

  "timed_out": false,

  "_shards": {

    "total": 5,

    "successful": 5,

    "failed": 0

  },

  "hits": {

    "total": 2,

    "max_score": 1,

    "hits": [

      {

        "_index": "termtest",

        "_type": "termtype",

        "_id": "2",

        "_score": 1,

        "_source": {

          "content": "name city"

        }

      },

      {

        "_index": "termtest",

        "_type": "termtype",

        "_id": "1",

        "_score": 1,

        "_source": {

          "content": "Name"

        }

      }

    ]

  }

}

如上说明，数据已经被导入。该处字符串类型是text，也就是默认被分词了

做如下查询：

POST /termtest/_search

{

  "query":{

    "term":{

      "content":"Name"

    }

  }

}

结果

{

  "took": 1,

  "timed_out": false,

  "_shards": {

    "total": 5,

    "successful": 5,

    "failed": 0

  },

  "hits": {

    "total": 0,

    "max_score": null,

    "hits": []

  }

}

分析结果：因为是默认被standard analyzer分词器分词，大写字母全部转为了小写字母，并存入了倒排索引以供搜索。term是确切查询，

必须要匹配到大写的Name。所以返回结果为空

POST /termtest/_search

{

  "query":{

    "match":{

      "content":"Name"

    }

  }

}

结果

{

  "took": 2,

  "timed_out": false,

  "_shards": {

    "total": 5,

    "successful": 5,

    "failed": 0

  },

  "hits": {

    "total": 2,

    "max_score": 0.2876821,

    "hits": [

      {

        "_index": "termtest",

        "_type": "termtype",

        "_id": "1",

        "_score": 0.2876821,

        "_source": {

          "content": "Name"

        }

      },

      {

        "_index": "termtest",

        "_type": "termtype",

        "_id": "2",

        "_score": 0.25811607,

        "_source": {

          "content": "name city"

        }

      }

    ]

  }

}

分析结果: 原因（1）：默认被standard analyzer分词器分词，大写字母全部转为了小写字母，并存入了倒排索引以供搜索，

原因（2）：match query先对filed进行分词，分词为"name",再去匹配倒排索引中的term

三、测试（2）

下面是官网实例官网实例

导入数据

PUT my_index

{

  "mappings": {

    "my_type": {

      "properties": {

        "full_text": {

          "type":  "text"

        },

        "exact_value": {

          "type":  "keyword"

        }

      }

    }

  }

}

PUT my_index/my_type/1

{

  "full_text":   "Quick Foxes!",

  "exact_value": "Quick Foxes!"

}

先指定类型，再导入数据

full_text: 指定类型为text，是会被分词
exact_value: 指定类型为keyword，不会被分词
full_text：会被standard analyzer分词为如下terms [quick,foxes],存入倒排索引
exact_value：只有[Quick Foxes!]这一个term会被存入倒排索引

做如下查询

GET my_index/my_type/_search

{

  "query": {

    "term": {

      "exact_value": "Quick Foxes!"

    }

  }

}

结果：

{

  "took": 1,

  "timed_out": false,

  "_shards": {

    "total": 5,

    "successful": 5,

    "failed": 0

  },

  "hits": {

    "total": 1,

    "max_score": 0.2876821,

    "hits": [

      {

        "_index": "my_index",

        "_type": "my_type",

        "_id": "1",

        "_score": 0.2876821,

        "_source": {

          "full_text": "Quick Foxes!",

          "exact_value": "Quick Foxes!"

        }

      }

    ]

  }

}

exact_value包含了确切的Quick Foxes!，因此被查询到

GET my_index/my_type/_search

{

  "query": {

    "term": {

      "full_text": "Quick Foxes!"

    }

  }

}

结果：

{

  "took": 4,

  "timed_out": false,

  "_shards": {

    "total": 5,

    "successful": 5,

    "failed": 0

  },

  "hits": {

    "total": 0,

    "max_score": null,

    "hits": []

  }

}

full_text被分词了，倒排索引中只有quick和foxes。没有Quick Foxes!

GET my_index/my_type/_search

{

  "query": {

    "term": {

      "full_text": "foxes"

    }

  }

}

结果：

{

  "took": 2,

  "timed_out": false,

  "_shards": {

    "total": 5,

    "successful": 5,

    "failed": 0

  },

  "hits": {

    "total": 1,

    "max_score": 0.25811607,

    "hits": [

      {

        "_index": "my_index",

        "_type": "my_type",

        "_id": "1",

        "_score": 0.25811607,

        "_source": {

          "full_text": "Quick Foxes!",

          "exact_value": "Quick Foxes!"

        }

      }

    ]

  }

}

full_text被分词，倒排索引中只有quick和foxes，因此查询foxes能成功

GET my_index/my_type/_search

{

  "query": {

    "match": {

      "full_text": "Quick Foxes!"

    }

  }

}

结果：

{

  "took": 3,

  "timed_out": false,

  "_shards": {

    "total": 5,

    "successful": 5,

    "failed": 0

  },

  "hits": {

    "total": 1,

    "max_score": 0.51623213,

    "hits": [

      {

        "_index": "my_index",

        "_type": "my_type",

        "_id": "1",

        "_score": 0.51623213,

        "_source": {

          "full_text": "Quick Foxes!",

          "exact_value": "Quick Foxes!"

        }

      }

    ]

  }

}

match query会先对自己的query string进行分词。也就是"Quick Foxes!"先分词为quick和foxes。然后在去倒排索引中查询，此处full_text是text类型，被分词为quick和foxes

因此能匹配上。

Elasticsearch 5.0 中term 查询和match 查询的认识的更多相关文章

[Elasticsearch] 全文搜索 (一) 基础概念和match查询
全文搜索(Full Text Search) 现在我们已经讨论了搜索结构化数据的一些简单用例,是时候开始探索全文搜索了 - 如何在全文字段中搜索来找到最相关的文档. 对于全文搜索而言,最重要的两个方面 ...
Python Elasticsearch api，组合过滤器，term过滤器，正则查询，match查询，获取最近一小时的数据
Python Elasticsearch api 描述:ElasticSearch是一个基于Lucene的搜索服务器.它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口.下 ...
Elasticsearch 5.x 关于term query和match query的认识
http://blog.csdn.net/yangwenbo214/article/details/54142786 一.基本情况前言:term query和match query牵扯的东西比较多, ...
Elasticsearch中的Term查询和全文查询
目录前言 Term 查询 exists 查询 fuzzy 查询 ids 查询 prefix 查询 range 查询 regexp 查询 term 查询 terms 查询 terms_set 查询 t ...
Elasticsearch 7.0 正式发布，盘他！
Elastic{ON}北京分享了Elasticsearch7.0在Speed,Scale,Relevance等方面的很多新特性. 比快更快,有传说中的那么牛逼吗?盘他! 通过本文,你能了解到: Ela ...
Elasticsearch 7.0 发布都有哪些新特性
了解about云知识星球 .pcb{margin-right:0} 问题导读 1.Elasticsearch&Kibana 7.哪些需要修改? 2.Elasticsearch7 有哪些新特性? ...
elasticsearch 查询（match和term）
elasticsearch 查询(match和term) es中的查询请求有两种方式,一种是简易版的查询,另外一种是使用JSON完整的请求体,叫做结构化查询(DSL). 由于DSL查询更为直观也更为简 ...
（转载）elasticsearch 查询（match和term）
原文地址:https://www.cnblogs.com/yjf512/p/4897294.html elasticsearch 查询(match和term) es中的查询请求有两种方式,一种是简易版 ...
（转）Elasticsearch查询规则------match和term
es种有两种查询模式,一种是像传递URL参数一样去传递查询语句,被称为简单搜索或查询字符串(query string)搜索,比如 GET /megacorp/employee/_search //查询 ...

随机推荐

LINUX篇，设置MYSQL远程访问实用版
每次设置root和远程访问都容易出现问题, 总结了个通用方法, 关键在于实用 step1: # mysql -u root mysql mysql> Grant all privileges o ...
c#与java的区别
经常有人问这种问题,用了些时间java之后,发现这俩玩意除了一小部分壳子长的还有能稍微凑合上,基本上没什么相似之处,可以说也就是马甲层面上的相似吧,还是比较短的马甲... 一般C#多用于业务系统的开发 ...
【社工】NodeJS 应用仓库钓鱼
前言城堡总是从内部攻破的.再强大的系统,也得通过人来控制.如果将入侵直接从人这个环节发起,那么再坚固的防线,也都成为摆设. 下面分享一个例子,利用应用仓库,渗透到开发人员的系统中. 应用仓库应用仓 ...
Android中手机录屏并转换GIF的两种方式
之前在博文中为了更好的给大家演示APP的实现效果,本人了解学习了几种给手机录屏的方法,今天就给大家介绍两种我个人用的比较舒服的两种方法: (1)配置adb环境后,使用cmd命令将手机界面操作演示存为视 ...
异常处理汇总 ~ 修正果带着你的Net飞奔吧！
经验库开源地址:https://github.com/dunitian/LoTDotNet 异常处理汇总-服务器 http://www.cnblogs.com/dunitian/p/4522983 ...
shell简介
Shell作为命令语言,它交互式地解释和执行用户输入的命令:作为程序设计语言,它定义了各种变量和参数,并提供了许多在高级语言中才具有的控制结构,包括循环和分支. shell使用的熟练程度反映了用户对U ...
Linux上如何查看物理CPU个数，核数，线程数
首先,看看什么是超线程概念超线程技术就是利用特殊的硬件指令,把两个逻辑内核模拟成两个物理芯片,让单个处理器都能使用线程级并行计算,进而兼容多线程操作系统和软件,减少了CPU的闲置时间,提高的CPU的 ...
代码的坏味道（22）——不完美的库类(Incomplete Library Class)
坏味道--不完美的库类(Incomplete Library Class) 特征当一个类库已经不能满足实际需要时,你就不得不改变这个库(如果这个库是只读的,那就没辙了). 问题原因许多编程技术都建 ...
C#——传值参数(2)
//我的C#是跟着猛哥(刘铁猛)(算是我的正式老师)<C#语言入门详解>学习的,微信上猛哥也给我讲解了一些不懂得地方,对于我来说简直是一笔巨额财富,难得良师! 这次与大家共同学习C#中的 ...
移动应用App测试与质量管理一
测试工程师基于Html的WebApp测试, 现在一些移动App混Html5 HTML5性能测试兼容性整理后的脑图测试招聘弱化大量技术考察看重看问题的高度看重潜力测试经验质量管理专项 ...

Elasticsearch 5.0 中term 查询和match 查询的认识

Elasticsearch 5.0 关于term query和match query的认识

一、基本情况

二、测试（1）

三、测试（2）

Elasticsearch 5.0 中term 查询和match 查询的认识的更多相关文章

随机推荐

热门专题