ES 20 - 查询Elasticsearch中的数据 (基于DSL查询, 包括查询校验match + bool + term)
1 什么是DSL
DSL: Domain Specific Language, 领域特定语言, 指的是专注于某个应用程序领域的、具有高度针对性的计算机语言.
Query String 与 Query DSL之间的区别:
Query String: 在请求的URL后直接拼接查询条件;
Query DSL: 在请求的Request Body中携带查询条件.
DSL功能强大, 可以构建复杂的查询、过滤、聚合条件, 所以这种查询方式的用途最广.
2 _validate - 校验查询语句是否合法
对于复杂的查询, 很有必要在查询前使用validate API
进行验证, 保证DSL语句的正确有效:
// 要查询name中包含"java"的文档:
GET shop/it_book/_validate/query?explain
{
"query": {
"math": { // 错误的查询名称, 应该是match
"name": "java"
}
}
}
// 校验结果:
{
"valid": false,
"error": "org.elasticsearch.common.ParsingException: no [query] registered for [math]"
}
// 修改math为match后, 校验结果为:
{
"valid": true,
"_shards": {
"total": 1,
"successful": 1,
"failed": 0
},
"explanations": [
{
"index": "shop",
"valid": true, // 校验通过, DSL有效
"explanation": "+name:java #_type:it_book" // 查询条件, +表示必须存在
}
]
}
3 match query - 匹配查询
3.1 简单功能示例
3.1.1 查询所有文档
GET shop/it_book/_search
{
"query": {
"match_all": {}
}
}
3.1.2 查询满足一定条件的文档
查询name中包含"java"的文档, 同时按照价格升序排序:
GET shop/it_book/_search
{
"query": {
"match": {
"name": "java"
}
},
"sort": [
{
"price": {"order": "asc"}
}
]
}
3.1.3 分页查询文档
GET shop/it_book/_search
{
"query": {
"match_all": {}
},
"from": 0, // 开始记录数, 起始数为0
"size": 1 // 页大小, 即每页显示的记录数
}
3.1.4 指定返回的结果中包含的字段
GET shop/it_book/_search
{
"query": {
"match_all": {}
},
"_source": [
"name", // 显示商品名称
"price" // 显示商品价格
]
}
3.2 精确查询 - match_phrase
不同的数据类型在建立倒排索引时, 有的会作为full text处理, 有的作为exact value处理.
对查询串分词时, 使用的分析器(analyzer)必须和创建index时使用的相同, 否则将检索不到准确的数据.
3.2.1 精确匹配 - exact value
常见的exact value类型有date - 日期类型.
ES检索时, 不会对String进行分词, 而是完全根据String的值去精确匹配, 查找相应的文档.
在DSL中, 通过match_phrase
短语匹配达到精确匹配的目的 —— 不会对查询串进行分词, 而是直接精确匹配查找.
示例: 查询name中包含"thinking in java"的文档, 不会对查询串进行分词:
GET shop/_search
{
"query": {
"match_phrase": {
"name": "thinking in java"
}
}
}
3.2.2 全文搜索 - full text
常见的full text类型有: text - 文本串.
ES检索时, 会对检索串进行分词, 包括缩写、时态、同义词等转换手段, 然后根据分词结果与倒排索引进行匹配, 查找相应的文档.
索引中只要有任意一个相关field的分词 匹配拆分后的词, 这个文档就可以出现在结果中, 只是匹配度越高的排名越靠前.
示例: 查询name中包含"thinking in java"的文档, 会将查询串拆分为"think", "in", "java"三个词:
GET shop/_search
{
"query": {
"match": {
"name": "thinking in java"
}
}
}
3.3 控制匹配规则 - operator
operator
操作符, 用来指定ES对分词后的词项如何进行检索过滤. 选项有:
and, 作用 == match_phrase, 即全部匹配;
or, 作用 == match, 即部分匹配.
使用示例:
GET shop/_search
{
"query": {
"match": {
"name": { // 要查询的field
"query": "编程思想",
"operator": "or" // 操作符
}
}
}
}
3.4 指定命中的百分比 - minimum_should_match
minimum_should_match
用来指定最少要匹配多少比例的分词, 才算符合条件并返回结果.
示例: 搜索name中包含"并发编程的艺术", 被拆分成"并发", "编程", "艺术"等词, 现在要求至少匹配50%的分词, 可以这样:
GET shop/_search
{
"query": {
"match": {
"name": {
"query": "并发编程的艺术",
"minimum_should_match": "50%"
}
}
}
}
当然这种需求也可以用 must、must_not、should 匹配同一个字段的方式进行组合查询.
3.5 多字段的匹配 - multi_match
multi_match
用来对多个字段同时进行匹配: 任意一个字段中存在相应的分词, 就可作为结果返回.
示例 ① : 查询 name 或 desc 字段中包含 "面试经典" 的文档 —— 会对查询串进行分词:
GET shop/_search
{
"query": {
"multi_match": {
"query": "面试经典",
"fields": [
"name",
"desc"
]
}
}
}
示例 ② : 查询 name 或 desc 字段中同时包含 "面试经典" 的文档 —— 不对查询串进行分词:
GET shop/_search
{
"query": {
"multi_match": {
"query": "面试经典",
"type": "cross_fields", // 还有best_fields、most_fields、phrase、phrase_prefix选项
"operator": "and", // 全部匹配, or是部分匹配
"fields": [
"name",
"desc"
]
}
}
}
4 bool query - 布尔查询(真假查询)
bool query, 顾名思义, 就是 真假/有无 查询. 包括4个子查询:
① must - 必须匹配, 类似于SQL中的
=
;
② must_not - 必须不匹配, 类似于SQL中的!=
;
③ should - 不强制匹配, 类似于SQL中的or
;
④ filter - 过滤, 将满足一定条件的文档筛选出来.
除filter之外, 每个子查询都会根据自己的条件计算出每个文档的相关度分数, 然后bool综合所有分数, 合并为一个.
4.1 简单功能示例
GET shop/_search
{
"query": {
"bool": {
"must":[
{ "match": { "name": "Java" } }
],
"must_not": [
{ "match": { "desc": "编程" } }
],
"should": [
{ "match": { "publisher": "机械工业" } }
],
"filter": {
"bool": {
"must": [
{ "range": { "date": { "gte": "2010-01-01" }}},
{ "range": { "price": { "lte": 99.00 }}}
]
}
}
}
}
}
4.2 嵌套使用bool query
GET shop/_search
{
"query": {
"bool": {
"should": [
{ "term": { "name.keyword": "Java编程思想" } },
{
"bool": {
"must": [
{ "term": { "product_desc": "刷头" } }
]
}
}
]
}
}
}
4.3 直接filter操作 - 使用constant_score
如果不指定query条件而直接filter, 将抛出
no [query] registered for [filter]
, 此时通过constant_score
即可实现直接filter.
GET shop/_search
{
"query": {
"constant_score": {
"filter": {
"range": { "price": { "gte": 80 } }
}
}
}
}
4.4 指定should的匹配个数 - minimum_should_match
如果组合查询中没有must
, 就会至少匹配一个should
.
可以通过 minimum_should_match
指定匹配的should
的个数.
GET shop/_search
{
"query": {
"bool": {
"should": [
{ "match": { "name": "java" } },
{ "match": { "desc": "编程"} },
{ "match": { "price": 109 } }
],
"minimum_should_match": 2
}
}
}
参考资料
版权声明
出处: 博客园 马瘦风的博客(https://www.cnblogs.com/shoufeng)
感谢阅读, 如果文章有帮助或启发到你, 点个[好文要顶
ES 20 - 查询Elasticsearch中的数据 (基于DSL查询, 包括查询校验match + bool + term)的更多相关文章
- 使用Hive或Impala执行SQL语句,对存储在Elasticsearch中的数据操作(二)
CSSDesk body { background-color: #2574b0; } /*! zybuluo */ article,aside,details,figcaption,figure,f ...
- 使用Hive或Impala执行SQL语句,对存储在Elasticsearch中的数据操作
http://www.cnblogs.com/wgp13x/p/4934521.html 内容一样,样式好的版本. 使用Hive或Impala执行SQL语句,对存储在Elasticsearch中的数据 ...
- 使用Hive读取ElasticSearch中的数据
本文将介绍如何通过Hive来读取ElasticSearch中的数据,然后我们可以像操作其他正常Hive表一样,使用Hive来直接操作ElasticSearch中的数据,将极大的方便开发人员.本文使用的 ...
- Elasticsearch:如何把Elasticsearch中的数据导出为CSV格式的文件
本教程向您展示如何将数据从Elasticsearch导出到CSV文件. 想象一下,您想要在Excel中打开一些Elasticsearch中的数据,并根据这些数据创建数据透视表. 这只是一个用例,其中将 ...
- ES 16 - 对Elasticsearch中的索引数据进行增删改查 (CRUD)
目录 1 创建document 1.1 创建时手动指定id 1.2 创建时自动生成id 2 查看document 2.1 根据id查询文档 2.2 通过_source字段控制查询结果 3 修改docu ...
- ES之六:ElasticSearch中Filter和Query的异同
如下例子,查找性别是女,所在的州是PA,过滤条件是年龄是39岁,balance大于等于10000的文档: { "query": { "bool": { &quo ...
- 如何用Excel直接查询Oracle中的数据
将Oracle中查询的数据保存为Excel文件,通常使用的是PL/SQL Developer. 其实,Excel可直接写SQL语句查询Oracle中数据,在这里,用到ODBC驱动.详细步骤如下: 一. ...
- 如何用Excel直接查询Oracle中的数据(转)
将Oracle中查询的数据保存为Excel文件,通常使用的是PL/SQL Developer. 其实,Excel可直接写SQL语句查询Oracle中数据,在这里,用到ODBC驱动.详细步骤如下: 一. ...
- MySQL_(Java)分页查询MySQL中的数据
MySQL_(Java)使用JDBC向数据库发起查询请求 传送门 MySQL_(Java)使用JDBC创建用户名和密码校验查询方法 传送门 MySQL_(Java)使用preparestatement ...
随机推荐
- Method and system for providing security policy for linux-based security operating system
A system for providing security policy for a Linux-based security operating system, which includes a ...
- VS2017 Linux 上.NET Core调试
调试Linux 上.NET Core Visual Studio 2017 通过SSH 调试Linux 上.NET Core 应用程序. 本文环境 开发环境:Win10 x64 Visual Stud ...
- 他们实际上控制的定义很easy5/12
尊重原创转载请注明:From AigeStudio(http://blog.csdn.net/aigestudio)Power by Aige 侵权必究! 炮兵镇楼 近期龙体欠安.非常多任务都堆着,虽 ...
- Dictionary(数据字典)
数据字典:Dictionary对象用于在结对的名称/值中存储信息(等同于键和项目),其可作为传参使用. C# Dictionary字典类的使用方法 //定义字典 Dictionary<strin ...
- 西门子S7报文解析
1.报文的基本格式 1.1 第1和第2个字节是:固定报文头03 00,这里我们就用到三种报文: a.初始化 b. 读 c.写,都是这种格式: 1.2 第3和第4个字节是:整个报文的长度: 其它部分就是 ...
- python栈--字符串反转,括号匹配
栈的实现: # 定义一个栈类 class Stack(): # 栈的初始化 def __init__(self): self.items = [] # 判断栈是否为空,为空返回True def isE ...
- 用java写的后台方法可以提供给C#调用吗?(转)
最近和公司搞C#的同事联合搞了一个项目,我把我这边的数据加密之后传给C#,然后C#在对接收到的数据解密.可是问题来了,我这边用JAVA加密的数据C#的同事怎么也解密不出来,于是我就想到了可不可以将JA ...
- DLL动态库的创建,隐式加载和显式加载
动态库的创建 打开VS,创建如下控制台工程,工程命名为DllTest: 在弹出的对话框中选择"DLL"后单击"完成"按钮: 在工程中新建DllTest.h和Dl ...
- ASP.NET Core 基础教程-约定 - ASP.NET Core 基础教程 - 简单教程,简单编程
原文:ASP.NET Core 基础教程-约定 - ASP.NET Core 基础教程 - 简单教程,简单编程 ASP.NET Core 基础教程-约定 因为 ASP.NET Core 是可以跨平台的 ...
- WPF实现抽屉效果
原文:WPF实现抽屉效果 界面代码(xaml): <Window x:Class="TransAnimation.MainWindow" xmlns="http:/ ...