【ES】学习6-多字段搜索1

本系列的笔记都来自：https://elasticsearch.cn/book/elasticsearch_definitive_guide_2.x/multi-field-search.html

下面的语句通过boost提高了title和author的权重。如果不加boost字段，则title，author，bool会各占1/3的权重。

GET /_search

{

  "query": {

    "bool": {

      "should": [

        { "match": {

            "title":  {

              "query": "War and Peace",

              "boost":

        }}},

        { "match": {

            "author":  {

              "query": "Leo Tolstoy",

              "boost":

        }}},

        { "bool":  {

            "should": [

              { "match": { "translator": "Constance Garnett" }},

              { "match": { "translator": "Louise Maude"      }}

            ]

        }}

      ]

    }

  }

}

最佳字段：指评分时选择多个查询子条件中得到的最高分，而不是做加权平均。用dis_max实现。

{

    "query": {

        "dis_max": {

            "queries": [

                { "match": { "title": "Brown fox" }},

                { "match": { "body":  "Brown fox" }}

            ]

        }

    }

}

如果一个文档的title字段有brown fox，但body字段没有，该文档会得到更高的分数。

而title和body各有一个brown的文档则会得到较低的分数。

如果不用dis_max，则结果会反过来。因为默认的方式对分数做了加权平均，第一个文档的分数会被没有匹配的body拖累。

tie_breaker:中和dis_max和bool

tie_breaker 参数提供了一种 dis_max 和 bool 之间的折中选择，它的评分方式如下：

获得最佳匹配语句的评分 _score 。
将其他匹配语句的评分结果与 tie_breaker 相乘。
对以上评分求和并规范化。

有了 tie_breaker ，会考虑所有匹配语句，但最佳匹配语句依然占最终结果里的很大一部分。

{

    "query": {

        "dis_max": {

            "queries": [

                { "match": { "title": "Quick pets" }},

                { "match": { "body":  "Quick pets" }}

            ],

            "tie_breaker": 0.3

        }

    }

}

multi_match：多个字段匹配相同字符串，有best_fields 、 most_fields 和 cross_fields （最佳字段、多数字段、跨字段）等模式。

{

    "multi_match": {

        "query":                "Quick brown fox",

        "type":                 "best_fields",    #默认值，可不填

        "fields":               [ "title", "body" ],

        "tie_breaker":          0.3,

        "minimum_should_match": "30%"

    }

}

该语句等价于：

{

  "dis_max": {

    "queries":  [

      {

        "match": {

          "title": {

            "query": "Quick brown fox",

            "minimum_should_match": "30%"

          }

        }

      },

      {

        "match": {

          "body": {

            "query": "Quick brown fox",

            "minimum_should_match": "30%"

          }

        }

      },

    ],

    "tie_breaker": 0.3

  }

}

字段名称可以模糊匹配：

{

    "multi_match": {

        "query":  "Quick brown fox",

        "fields": "*_title"

    }

}

单个字段权重提升：

{

    "multi_match": {

        "query":  "Quick brown fox",

        "fields": [ "*_title", "chapter_title^2" ]

    }

}

chapter_title 这个字段的 boost 值为 2 ，而其他两个字段 book_title 和 section_title 字段的默认 boost 值为 1 。

【ES】学习6-多字段搜索1的更多相关文章

ElasticSearch 学习记录之ES查询添加排序字段和使用missing或existing字段查询
ES添加排序在默认的情况下,ES 是根据文档的得分score来进行文档额排序的.但是自己可以根据自己的针对一些字段进行排序.就像下面的查询脚本一样.下面的这个查询是根据productid这个值进行排 ...
Es学习第六课， ES基本搜索_search
前面几课ES的基本概念.安装和分词都讲过了,下面我们就来实战一下ES的核心功能-搜索,这节课我们主要讲的是基本搜索 _search(注意:ES的关键字都要加前缀_,所以我们在定义索引.类型名称时不要带 ...
ES学习笔记
ES学习 1. 安装 1.1 ES 安装配置 curl -O https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-5. ...
elasticsearch多字段搜索
https://blog.csdn.net/Ricky110/article/details/78888711 多字段搜索多字符串查询boost 参数 “最佳” 值,较为简单的方式就是不断试错,比较合 ...
[Elasticsearch] 多字段搜索 (五) - 以字段为中心的查询
以字段为中心的查询(Field-centric Queries) 上述提到的三个问题都来源于most_fields是以字段为中心(Field-centric),而不是以词条为中心(Term-centr ...
[Elasticsearch] 多字段搜索 (一) - 多个及单个查询字符串
多字段搜索(Multifield Search) 本文翻译自官方指南的Multifield Search一章. 查询很少是只拥有一个match查询子句的查询.我们经常需要对一个或者多个字段使用相同或者 ...
es站内站内搜索笔记（一）
es站内站内搜索笔记(一) 第一节: 概述使用elasticsearch进行网站搜索,es是当下最流行的分布式的搜索引擎及大数据分析的中间件,搜房网的主要功能:强大的搜索框,与百度地图相结合,实现地 ...
[Elasticsearch2.x] 多字段搜索 (一) - 多个及单个查询字符串 <译>
多字段搜索(Multifield Search) 本文翻译自官方指南的Multifield Search一章. 查询很少是只拥有一个match查询子句的查询.我们经常需要对一个或者多个字段使用相同或者 ...
Es 学习笔记 (1)
目录前言什么是es? es数据组织类比应用场景核心概念集群节点(node) 索引(Index) 文档类型(Type) 文档(Document) Mapping 核心简单域类型分片(sha ...
【转载】Lucene.Net无障碍学习和使用：搜索篇
在上一篇中,我们初步理解了索引的增删改查基本操作.本文着重介绍一下常用的搜索,以及搜索结果的排序和分页.本文的搜索主要是基于前一篇介绍的文本文件的索引,建议下载最后改进的demo对照着看阅读本文,同时 ...

随机推荐

Linux命令之ln
ln命令(是l不是i注意了) 用处:建立链接,分为软链接和硬链接用法:下面讲示例: 一.硬链接我想给profile文件建立一个硬链接(硬链接就是把这个文件复制一份的意思) 硬链接hard建好了, ...
学习windows编程 day4 之多边矩形填充
#include <windows.h> #include <math.h> LRESULT CALLBACK WndProc(HWND hwnd, UINT message, ...
Spark记录-阿里巴巴开源工具DataX数据同步工具使用
1.官网下载下载地址:https://github.com/alibaba/DataX DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL.Oracle.SqlSe ...
WebLogic 中的基本概念【转】
完全引用自: WebLogic 中的基本概念 WebLogic 中的基本概念上周参加了单位组织的WebLogic培训,为了便于自己记忆,培训后,整理梳理了一些WebLogic的资料,会陆续的发出来, ...
java序列化深拷贝【转】
java深拷贝序列化和反序列化合成在一起的方法CloneUtils import java.io.ByteArrayInputStream; import java.io.ByteArrayOutp ...
python 创建实例--待完善
今天好好琢磨一下 python 创建实例的先后顺序一. 就定义一个普通类 Util (默认)继承自 object,覆写 new ,init 方法 class Util(object): def __ ...
bootstrap modal垂直居中（转）
根据博友的经验,总结后请使用方法一就行了一,修改bootstrap.js 源码原来的: Modal.prototype.adjustDialog = function () { ].scrollH ...
UBUNTU18.4环境下使用更好用的搜索引擎（无奈，只能起这样的标题）
初步安装更新软件源 sudo apt-get update 安装pip (一个安装和管理 Python 包的工具) sudo apt-get install python-pip sudo apt- ...
JS的call方法的作用解释，简单易懂
先看看关于call()的官方解释,“调用一个对象的一个方法,以另一个对象替换当前对象.”,看了这样的解释,或许让你更摸不着头脑了.看例子: var x = "我是全局变量"; // ...
spring mvc常用配置
<?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.sp ...

【ES】学习6-多字段搜索1

【ES】学习6-多字段搜索1的更多相关文章

随机推荐

热门专题