ElasticSearch(十)Elasticsearch检索出的数据列表按字段匹配的优先顺序及搜索单词拼音一部分搜不到数据

检索出的数据列表按字段匹配的优先顺序

一、举例

比如，发布一篇文章，文章包括基本的字段包括标题、发布时间、点击率、关键字、内容。当在页面中输入“教育”搜索关键词，会检索出指定字段包括“教育”的所有数据，举例：

id         title             keyword                   content

           纳税       继续教育,赡养父母,房屋贷款            教育,子女

           上学         义务教育                      好好学习天天向上

           毕业         好好工作好好学习                  结束教育教育

有以上三条数据，如果按照默认的ES检索机制，会按照最多匹配的优先级，比如，id为1的keyword和content字段都包括教育关键字，id为1的会排在最前面，同时id为2和3的，id3更有匹配度，包括两个教育关键字，可能ES给检出的数据排序为1、3、2(这里只是猜测，懒得动手了)

二、需求

在公司需求中有这么一个要求，首先，检索数据会先检索出关键字(keyword)的数据，点击加载更多按钮，再检索关键字(keyword)和内容(content)同时包括的数据，并且匹配关键字的优先展示在前面。

如果不了解ES强大的童鞋可能会在检索出所有数据的时候然后再把数据处理一遍。BUT，ES的排序机制是很强大的，我在根据公司产品需求搜了各种相关的帖子，一边了解一边实践，最终走通了产品需求想要的效果。

三、代码

$query = new \Elastica\Query();

$MultiMatch_obj = new \Elastica\Query\MultiMatch();

$MultiMatch_obj->setQuery($keyword);

if ($search_type == 'default') {

    //这里是首先默认加载匹配关键字的列表

    $MultiMatch_obj->setFields(array('keywords'));

} else {

    //点击加载更多匹配出包括关键字和内容的列表

    $MultiMatch_obj->setTieBreaker(0.3);

    //设定Breaker

    $MultiMatch_obj->setType('best_fields');

    //开启best_fields

    $MultiMatch_obj->setFields(array('keywords^901209','content'));

    //要优先的keywords 加一个^，后面还跟一个数字（数字随便写的，我觉得比content大就可以了，content应该也是可以跟^数字的 $MultiMatch_obj->setOperator('or');

    $MultiMatch_obj->setMinimumShouldMatch('30%'); //这里还需要设定

}

$query->setQuery($MultiMatch_obj); //命中全部纪录

四、参考

https://www.cnblogs.com/bonelee/p/6827068.html
https://www.cnblogs.com/clonen/p/6674922.html

https://www.cnblogs.com/yjf512/p/4897294.html

五、手册

Elasticsearch权威指南（中文版）

解决ES搜索拼音字母的一部分搜不到数据

问题通：https://elasticsearch.cn/question/5418

   　　　　　　$Wildcard_query1 = new \Elastica\Query\Wildcard('keywords',"*". $keyword."*");

            $Wildcard_query2 = new \Elastica\Query\Wildcard('title',"*". $keyword."*");

            $Wildcard_query3 = new \Elastica\Query\Wildcard('content',"*". $keyword."*");

            $query->addShould($Wildcard_query1)->addShould($Wildcard_query2)->addShould($Wildcard_query3);

ElasticSearch(十)Elasticsearch检索出的数据列表按字段匹配的优先顺序及搜索单词拼音一部分搜不到数据的更多相关文章

用Elasticsearch做大规模数据的多字段、多类型索引检索
本文同时发布在我的个人博客之前尝试了用mysql做大规模数据的检索优化,可以看到单字段检索的情况下,是可以通过各种手段做到各种类型索引快速检索的,那是一种相对简单的场景. 但是实际应用往往会复杂一些 ...
ES 21 - Elasticsearch的高级检索语法 (包括term、prefix、wildcard、fuzzy、boost等)
目录 1 term query - 索引词检索 1.1 term query - 不分词检索 1.2 terms query - in检索 2 prefix query - 前缀检索 3 wildca ...
用 mongodb + elasticsearch 实现中文检索
而 elasticsearch 可以很好的支持各种语言的全文检索,但我们暂时又不想切换到 elasticsearch 作为后端数据库. 当然,可以在 web 应用中存储数据的时候,再主动写一份到 ...
SQL学习之Insert的特殊用法(插入检索出的数据,表之间的数据复制)
1.插入检索出的数据 select * from dbo.Customers_1
python 使用 elasticsearch 常用方法（检索）
#记录es查询等方法 #清楚数据 curl -XDELETE http://xx.xx.xx.xx:9200/test6 #初始化数据 curl -H "Content-Type: appl ...
基于Elasticsearch进行地理检索，计算距离值
实现步骤: 1.定义属性 [Serializable] public class Coordinate { public double Lat { get; ...
pb中sql语句用to_char查询出来数据，居然无法检索出数据，oracle数据库，这是什么原因?
/*这样dw_modified总是无法检索出正确的结果*/ ') into :is_recoder_old_sn from emra03 where szybh01 = :as_pat_id and ...
解决Javascript大数据列表引起的网页加载慢/卡死问题。
在一些网页应用中,有时会碰到一个超级巨大的列表,成千上万行,这时大部份浏览器解析起来就非常痛苦了(有可能直接卡死). 也许你们会说可以分页或动态加载啊?但是有可能需求不允许分页,动态加载?网络的延迟也 ...
ElasticSearch(一)ElasticSearch的应用场景及为什么要选择ElasticSearch？
先了解一下数据的分类结构化数据又可以称之为行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据.其实就是可以能够用数据或者统一的结构加以表示的数据.比如在数据表存储商品的库存,可以用整型表示 ...

随机推荐

get与post请求问题
req.url可以获取请求路径: 为避免浏览器自身发送的'/favicon.ico'的影响,获取路径后可利用if(req.url=='/favicon.ico') return ;处理 url.pa ...
解决 ASP.NET Core 自定义错误页面对 Middleware 异常无效的问题
我们基于 Razor Class Library 实现了自定义错误页面的公用类库(详见之前的随笔),但是在实际使用时发现如果在 middleware 中发生了异常,则不能显示自定义错误页面,而是返回默 ...
CS（计算机科学）知识体
附录 A CS( 计算机科学)知识体计算教程 2001 报告的这篇附录定义了计算机科学本科教学计划中可能讲授的知识领域.该分类方案的依据及其历史.结构和应用的其 ...
Linux系统的命令应该如何记?
Linux入门篇: 很多刚入门的同学,就像无头的苍蝇一样,到处找视频.书籍.网站帖子之类的学习方式,视频虽然讲得详细,但是时间的投入也是巨大的,播放时间,练习时间,加起来很吓人,其实啊很少有人能坚持把 ...
WPF DataGrid分页功能实现代码
在Silverlight中DataGrid分页可以结合DataPager控件很容易实现,但是在WPF中没有类似的,需要手动实现这样一个控件: 1.创建一个UserControl,DP.xaml,代码如 ...
kubernetes in action - Overview
传统的应用都是“monoliths”,意思就是大应用,即所有逻辑和模块都耦合在一起的这样明显很挺多问题的,比如只能scale up,升级必须整体升级,扩容所以我们就想把大应用,broken dow ...
How to disable transparent hugepages (THP) on Red Hat Enterprise Linux 7
How to disable transparent hugepages (THP) on Red Hat Enterprise Linux 7 $ Solution 已验证 - 已更新2017年六月 ...
python pip出错问题解决记录
今天安装一下requests模块,遇到网络问题 pip install requests Retrying (Retry(total=4, connect=None, read=None, redir ...
C++ opencv调用resize修改插值方式遇到的坑
opencv提供的热死则函数原型如下:void resize(InputArray src, OutputArray dst, Size dsize, double fx=0, double fy=0 ...
简单的linux使用命令
1 查看日志异常 tail -f 实时查看日志文件 tail -f 日志文件logtail - 100f 实时查看日志文件后一百行tail -f -n 100 catalina.out linux查 ...

ElasticSearch(十)Elasticsearch检索出的数据列表按字段匹配的优先顺序及搜索单词拼音一部分搜不到数据

ElasticSearch(十)Elasticsearch检索出的数据列表按字段匹配的优先顺序及搜索单词拼音一部分搜不到数据的更多相关文章

随机推荐

热门专题