四十五 Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的bool组合查询

bool查询说明

filter:[],字段的过滤，不参与打分
must:[],如果有多个查询，都必须满足【并且】
should:[],如果有多个查询，满足一个或者多个都匹配【或者】
must_not:[],相反查询词一个都不满足的就匹配【取反，非】

# bool查询

# 老版本的filtered已经被bool替换

#用 bool 包括 must should must_not filter 来完成

#格式如下：

#bool:{

#     "filter":[],      字段的过滤，不参与打分

#     "must":[],        如果有多个查询，都必须满足【并且】

#     "should":[],      如果有多个查询，满足一个或者多个都匹配【或者】

#     "must_not":[],    相反查询词一个都不满足的就匹配【取反，非】

#}

建立测试数据

#建立测试数据

POST jobbole/job/_bulk

{"index":{"_id":1}}

{"salary":10,"title":"python"}

{"index":{"_id":2}}

{"salary":20,"title":"Scrapy"}

{"index":{"_id":3}}

{"salary":30,"title":"Django"}

{"index":{"_id":4}}

{"salary":40,"title":"Elasticsearch"}

bool组合查询——最简单的filter过滤查询之term查询，相当于等于

过滤查询到salary字段等于20的数据

可以看出执行两个两个步骤，先查到所有数据，然后在查到的所有数据过滤查询到salary字段等于20的数据

# bool查询

# 老版本的filtered已经被bool替换

#用 bool 包括 must should must_not filter 来完成

#格式如下：

#bool:{

#     "filter":[],      字段的过滤，不参与打分

#     "must":[],        如果有多个查询，都必须满足

#     "should":[],      如果有多个查询，满足一个或者多个都匹配

#     "must_not":[],    相反查询词一个都不满足的就匹配

#}

#简单过滤查询

#最简单的filter过滤查询

#如果我们要查salary字段等于20的数据

GET jobbole/job/_search

{

  "query": {

    "bool": {                   #bool组合查询

      "must":{                  #如果有多个查询词，都必须满足

        "match_all":{}          #查询所有字段

      },

      "filter": {               #filter过滤

        "term": {               #term查询，不会将我们的搜索词进行分词，将搜索词完全匹配的查询

          "salary": 20          #查询salary字段值为20

        }

      }

    }

  }

}

#简单过滤查询

#最简单的filter过滤查询

#如果我们要查salary字段等于20的数据

GET jobbole/job/_search

{

  "query": {

    "bool": {

      "must":{

        "match_all":{}

      },

      "filter": {

        "term": {

          "salary": 20

        }

      }

    }

  }

}

bool组合查询——最简单的filter过滤查询之terms查询，相当于或

过滤查询到salary字段等于10或20的数据

# bool查询

# 老版本的filtered已经被bool替换

#用 bool 包括 must should must_not filter 来完成

#格式如下：

#bool:{

#     "filter":[],      字段的过滤，不参与打分

#     "must":[],        如果有多个查询，都必须满足

#     "should":[],      如果有多个查询，满足一个或者多个都匹配

#     "must_not":[],    相反查询词一个都不满足的就匹配

#}

#简单过滤查询

#最简单的filter过滤查询

#如果我们要查salary字段等于20的数据

#过滤salary字段值为10或者20的数据

GET jobbole/job/_search

{

  "query": {

    "bool": {

      "must":{

        "match_all":{}

      },

      "filter": {

        "terms": {

          "salary":[10,20]

        }

      }

    }

  }

}

注意：filter过滤里也可以用其他基本查询的

_analyze测试查看分词器解析的结果
analyzer设置分词器类型ik_max_word精细化分词，ik_smart非精细化分词
text设置词

#_analyze测试查看分词器解析的结果

#analyzer设置分词器类型ik_max_word精细化分词，ik_smart非精细化分词

#text设置词

GET _analyze

{

  "analyzer": "ik_max_word",

  "text": "Python网络开发工程师"

}

GET _analyze

{

  "analyzer": "ik_smart",

  "text": "Python网络开发工程师"

}

bool组合查询——组合复杂查询1
查询salary字段等于20或者title字段等于python、salary字段不等于30、并且salary字段不等于10的数据

# bool查询

# 老版本的filtered已经被bool替换

#用 bool 包括 must should must_not filter 来完成

#格式如下：

#bool:{

#     "filter":[],      字段的过滤，不参与打分

#     "must":[],        如果有多个查询，都必须满足【并且】

#     "should":[],      如果有多个查询，满足一个或者多个都匹配【或者】

#     "must_not":[],    相反查询词一个都不满足的就匹配【取反，非】

#}

# 查询salary字段等于20或者title字段等于python、salary字段不等于30、并且salary字段不等于10的数据

GET jobbole/job/_search

{

  "query": {

    "bool": {

      "should": [

        {"term":{"salary":20}},

        {"term":{"title":"python"}}

      ],

      "must_not": [

        {"term": {"salary":30}},

        {"term": {"salary":10}}]

    }

  }

}

bool组合查询——组合复杂查询2
查询salary字段等于20或者title字段等于python、salary字段不等于30、并且salary字段不等于10的数据

# bool查询

# 老版本的filtered已经被bool替换

#用 bool 包括 must should must_not filter 来完成

#格式如下：

#bool:{

#     "filter":[],      字段的过滤，不参与打分

#     "must":[],        如果有多个查询，都必须满足【并且】

#     "should":[],      如果有多个查询，满足一个或者多个都匹配【或者】

#     "must_not":[],    相反查询词一个都不满足的就匹配【取反，非】

#}

# 查询title字段等于python、或者、(title字段等于elasticsearch并且salary等于30)的数据

GET jobbole/job/_search

{

  "query": {

    "bool": {

      "should":[

        {"term":{"title":"python"}},

        {"bool": {

          "must": [

            {"term": {"title":"elasticsearch"}},

            {"term":{"salary":30}}

          ]

        }}

      ]

    }

  }

}

bool组合查询——过滤空和非空

#建立数据

POST bbole/jo/_bulk

{"index":{"_id":"1"}}

{"tags":["search"]}

{"index":{"_id":"2"}}

{"tags":["search","python"]}

{"index":{"_id":"3"}}

{"other_field":["some data"]}

{"index":{"_id":"4"}}

{"tags":null}

{"index":{"_id":"1"}}

{"tags":["search",null]}

处理null空值的方法

获取tags字段，值不为空并且值不为null的数据

# bool查询

# 老版本的filtered已经被bool替换

#用 bool 包括 must should must_not filter 来完成

#格式如下：

#bool:{

#     "filter":[],      字段的过滤，不参与打分

#     "must":[],        如果有多个查询，都必须满足【并且】

#     "should":[],      如果有多个查询，满足一个或者多个都匹配【或者】

#     "must_not":[],    相反查询词一个都不满足的就匹配【取反，非】

#}

#处理null空值的方法

#获取tags字段，值不为空并且值不为null的数据

GET bbole/jo/_search

{

  "query": {

    "bool": {

      "filter": {

        "exists": {

          "field": "tags"

        }

      }

    }

  }

}

获取tags字段值为空或者为null的数据，如果数据没有tags字段也会获取

# bool查询

# 老版本的filtered已经被bool替换

#用 bool 包括 must should must_not filter 来完成

#格式如下：

#bool:{

#     "filter":[],      字段的过滤，不参与打分

#     "must":[],        如果有多个查询，都必须满足【并且】

#     "should":[],      如果有多个查询，满足一个或者多个都匹配【或者】

#     "must_not":[],    相反查询词一个都不满足的就匹配【取反，非】

#}

#获取tags字段值为空或者为null的数据，如果数据没有tags字段也会获取

GET bbole/jo/_search

{

  "query": {

    "bool": {

      "must_not": {

        "exists": {

          "field": "tags"

        }

      }

    }

  }

}

四十五 Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的bool组合查询的更多相关文章

第三百六十五节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的基本查询
第三百六十五节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的基本查询 1.elasticsearch(搜索引擎)的查询 elasticsearch是功能 ...
第三百六十四节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的mapping映射管理
第三百六十四节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的mapping映射管理 1.映射(mapping)介绍映射:创建索引的时候,可以预先定义字 ...
第三百五十九节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)介绍以及安装
第三百五十九节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)介绍以及安装 elasticsearch(搜索引擎)介绍 ElasticSearch是一个基于 ...
五十 Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现我的搜索以及热门搜索
第三百七十一节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现我的搜索以及热门我的搜素简单实现原理我们可以用js来实现,首先用js获取到 ...
第三百七十节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现搜索结果分页
第三百七十节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现搜索结果分页逻辑处理函数计算搜索耗时在开始搜索前:start_time ...
第三百六十九节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现搜索功能
第三百六十九节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现搜索功能 Django实现搜索功能 1.在Django配置搜索结果页的路由映 ...
第三百六十六节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的bool组合查询
第三百六十六节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的bool组合查询 bool查询说明 filter:[],字段的过滤,不参与打分must:[] ...
第三百六十三节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的mget和bulk批量操作
第三百六十三节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的mget和bulk批量操作注意:前面讲到的各种操作都是一次http请求操作一条数据,如果想 ...
第三百六十节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的基本概念
第三百六十节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的基本概念 elasticsearch的基本概念 1.集群:一个或者多个节点组织在一起 2.节点 ...

随机推荐

面向对象 - 1.封装之如何实现属性的隐藏/2.封装的意义/3.封装与扩展性/4.property的使用
1.封装之如何实现属性的隐藏封装: __x=1 # 把数据属性隐藏 (如何实现隐藏) 类定义阶段 __开头发生了变形 __x --> _A__x特点: 1.在类外部无法直接:obj.__Attr ...
Spring 的IOC容器之XML方式
1. Spring 入门 1.1 概述 Spring 是一个分层的 JavaEE 轻量级开源框架; Spring 的核心是控制反转(IOC)和面向切面(AOP); 1.2 特点方便解耦,简化开发; ...
CNI Proposal 摘要
原文连接:https://github.com/containernetworking/cni/blob/master/SPEC.md General consideration CNI的想法是先让容 ...
linux c编程：读写锁
什么是读写锁读写锁其实还是一种锁,是给一段临界区代码加锁,但是此加锁是在进行写操作的时候才会互斥,而在进行读的时候是可以共享的进行访问临界区的为什么需要读写锁有时候,在多线程中,有一些公共数据修改的 ...
正向代理、Nginx（反向代理、负载均衡、静态资源服务器）
淘宝tengine文档(本质就是淘宝版的Nginx) http://tengine.taobao.org/book/index.html
android学习四---Activity和Intent
1.android项目资源深入了解在深入学习android之前,先好好玩玩手机上的应用,大部分程序都有一个图标,点开图标,程序启动,一定时间后,程序会跳转到第一个界面,比如手机QQ,点开图标,会跳出 ...
批量处理任务进度条控制—基于BackgroundWorker
今天要做一个批量处理图层数据的功能,希望在处理任务过程中,各个任务都能在进度条中显示自己的当前进度,决定继续使用强大易用的BackgroundWorker组件.通过在RunWorkerComplete ...
SignalTap II进阶学习
1. 多级触发有时候我们可能需要利用多个信号(最多10个)依次触发后,观察特定的值.这这时候我们可以增加触发条件来满足我们的需求. 多个触发信号如上图所示,只有依次发生SW[0]上升沿. SW[1] ...
oracle external密码验证
什么是external密码验证当OS user 中存在和DB user 同名的用户时直接使用和DB user 同名的OS user 可以不输入密码直接登录数据库, [oracle@zxrac1 ...
Differences between Python2 and Python3
@1:str, repr和反引号是Python将值转为字符串的3种方法repr创建一个字符串,它以合法的Python表达式的形式表示该字符串.Python2还有反引号`,但Python3中没有反引号, ...

四十五 Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的bool组合查询

四十五 Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的bool组合查询的更多相关文章

随机推荐

热门专题