elasticsearch定义了两种查询方式:

  一、索引(index)、type、document 相关语句

    1、列出所有索引的状态  GET /_cat/indices?v  

health status index    uuid                   pri rep docs.count docs.deleted store.size pri.store.size
yellow open my_index SOgui_yKSXacTlMHQQht9w 5 1 5 0 14.3kb 14.3kb
yellow open bank tzxmtSQhQsqWFfzVjmaK_A 5 1 1008 1 504.9kb 504.9kb
yellow open schools SG4nAwtJTcOXCcnf7-mq8w 5 1 0 0 1.2kb 1.2kb
yellow open teacher od83pADqTGSk4_TzfGP1ww 5 1 3 0 10.8kb 10.8kb
yellow open student oTQ3KElZRzKb3UphMQV41w 5 1 0 0 1.2kb 1.2kb
yellow open my_store 1e57BmarQ-OQWr5EZFXu5A 5 1 4 0 11.9kb 11.9kb 

    2、查询索引详细信息  

GET /index1,index2     查询索引index1和索引index2的基本信息
GET /_all 查询所有的基本信息
GET /s* 使用通配符来查询所有以s开头的索引信息

    3、创建索引 (新版本一个index只能有一个type)

      setting中可以设置索引的主分片数number_of_shards默认为5,和主分片的副本数number_of_replicas默认是1;

      mapping中主要设置各个type的映射关系。

PUT /my_index
{
"settings": { ... any settings ... },
"mappings": {
"type_one": { ... any mappings ... },
"type_two": { ... any mappings ... },
...
}
}

...

PUT /index1
{
"mappings": {
"tweet" : {
"properties" : {
"tweet" : {
"type" : "text",
"analyzer": "english"
},
"date" : {
"type" : "date"
},
"name" : {
"type" : "text"
},
"user_id" : {
"type" : "long"
}
}
}
}
}   

    4、删除索引

DELETE /{index}  
DELETE /_all
DELETE /*

    5、在索引的映射中增加一个字段的映射

PUT /gb/_mapping/tweet
{
"properties" : {
"tag" : {
"type" : "text",
"index": "false"
}
}
}

    6、查看某个type的映射关系  GET /{index}/_mapping/{type}

GET /gb/_mapping/tweet

///返回
{
"gb": {
"mappings": {
"tweet": {
"properties": {
"date": {
"type": "date"
},
"name": {
"type": "text"
},
"tag": {
"type": "text",
"index": false
},
"tweet": {
"type": "text",
"analyzer": "english"
},
"user_id": {
"type": "long"
}
}
}
}
}
}

    7、在索引文档中添加或者替换文档,在添加的时候id并不是必须的,如果没有设置id,则会随机产生一个id

PUT /{index}/{type}/{id}
{
"filed":"value"
}

    8、更新索引中文档的内容

POST /{index}/{type}/{id}/_update
{
"doc":{
"name":"kyle",
"age":
}
}

    9、删除文档  DELETE /{index}/{type}/{id}

    10、批处理

POST /teacher/chinese/_bulk
{"index":{"_id":""}}
{"name": "John Doe" }
{"index":{"_id":""}}
{"name": "Jane Doe" } POST /teacher/chinese/_bulk
{"update":{"_id":""}}
{"doc": { "name": "jimmy" } }
{"delete":{"_id":""}} POST /_bulk
{ "delete": { "_index": "website", "_type": "blog", "_id": "" }}
{ "create": { "_index": "website", "_type": "blog", "_id": "" }}
{ "title": "My first blog post" }
{ "index": { "_index": "website", "_type": "blog" }}
{ "title": "My second blog post" }
{ "update": { "_index": "website", "_type": "blog", "_id": "", "_retry_on_conflict" : } }
{ "doc" : {"title" : "My updated blog post"} }

    11、批量导入大量数据(注意文本的最后要空一行)  curl -H "Content-Type: application/json" -XPOST "localhost:9200/bank/account/_bulk?pretty&refresh" --data-binary "@accounts.json"

{"index":{"_id":""}}
{"account_number":,"balance":,"firstname":"Amber","lastname":"Duke","age":,"gender":"M","address":"880 Holmes Lane",
"employer":"Pyrami","email":"amberduke@pyrami.com","city":"Brogan","state":"IL"} {"index":{"_id":""}}
{"account_number":,"balance":,"firstname":"Hattie","lastname":"Bond","age":,"gender":"M","address":"671 Bristol Street",
"employer":"Netagy","email":"hattiebond@netagy.com","city":"Dante","state":"TN"}

    12、查询文档数 

GET /_count   ///查询所有文档数
GET /index/_count ///查询index中文档数
GET /index/type/_count ///查询type中的文档

    13、创建新的文档而不是覆盖有两种做法,创建成功会返回

PUT /website/blog/?op_type=create
{ ... } PUT /website/blog//_create
{ ... }

    14、使用脚本对文档进行更新,在原有的基础上加1,upsert表示如果没有该字段就初始化为1,retry_on_conflict=5表示更新失败后还要重试5次,因为有些操作是不在意执行的先后顺序的

POST /bank/account//_update?retry_on_conflict=
{ "script" : "ctx._source.balance+=1", "upsert": { "balance": } }

  二、简单查询:使用GET请求在URL后面携带参数来进行简单的查询

    1、GET /bank/account/_search?_source=account_number,balance,&size=1&from=0&q=account_number:44

//这是查询返回的结果
{
"took": 2, //执行整个搜索请求耗费了多少毫秒
"timed_out": false, //查询是否超时
"_shards": { //表示查询中参与分片的总数,以及这些分片成功了多少个失败了多少个
"total": 5,
"successful": 5,
"skipped": 0,
"failed": 0
},
"hits": { //所有查询到的结果
"total": 1008, //表示匹配到的文档总数
"max_score": 1, //结果中最大的评分
"hits": [
{
"_index": "bank", // 索引名称
"_type": "account", //type名称
"_id": "25", //id名称
"_score": 1, //评分
"_source": { //存储的数据源信息
"account_number": 25,
"balance": 40540,
"firstname": "Virginia",
"lastname": "Ayala",
"age": 39,
"gender": "F",
"address": "171 Putnam Avenue",
"employer": "Filodyne",
"email": "virginiaayala@filodyne.com",
"city": "Nicholson",
"state": "PA"
}
}
]
}
}

  2、同时查询多索引多类型的数据

    /_search在所有的索引中搜索所有的类型

    /gb/_search在 gb 索引中搜索所有的类型

    /gb,us/_search在 gb 和 us 索引中搜索所有的文档

    /g*,u*/_search在任何以 g 或者 u 开头的索引中搜索所有的类型

    /gb/user/_search在 gb 索引中搜索 user 类型

    /gb,us/user,tweet/_search在 gb 和 us 索引中搜索 user 和 tweet 类型

    /_all/user,tweet/_search在所有的索引中搜索 user 和 tweet 类型

  3、不查询文档的元数据,只查询source部分的数据  GET /{index}/{type}/{id}/_source

GET /bank/account/44/_source

//返回
{
"account_number": 44,
"balance": 34487,
"firstname": "Aurelia",
"lastname": "Harding",
"age": 37,
"gender": "M",
"address": "502 Baycliff Terrace",
"employer": "Orbalix",
"email": "aureliaharding@orbalix.com",
"city": "Yardville",
"state": "DE"
}

  三、请求体查询:使用HTTP请求来发送json数据进行查询

    1、查询所有的文档,默认评分是1,可以通过设置boost来,由于有些代理服务器不支持GET请求带请求体,所以实际中还是要用POST请求。

GET /bank/account/_search
{
"query": {
"match_all": {"boost":1.2}
  }
}

    2、分页查询所有文档

GET /bank/account/_search
{
"query": {
"match_all": {}
},
"from": ,
"size":
}

    3、查询gender为M的账户,只显示account_number,gender,balance三个字段,通过balance倒序排列,从第一条开始查,页大小为20

GET /bank/account/_search
{
"query":{
"match": {
"gender":"M"
}
},
"_source":[
"account_number",
"gender",
"balance"
],
"sort": [
{
"balance": "desc"
}
],
"from":,
"size": }

    4、全文检索,索引中只要有任意一个匹配拆分后词就可以出现在结果中,只是匹配度越高的排越前面

GET /bank/account/_search
{
"query":{
"match": {
"address":"street"
}
}
}

    上面的操作是默认为or,可以设置operator为and,这样就必须要所有的词都要匹配

GET /bank/account/_search
{
"query":{
"match": {
"address":{
"query":"171 Putnam",
"operator":"and"
}
}
}
}

    5、短语搜索,查询首先将查询字符串解析成一个词项列表,然后对这些词项进行搜索,但只保留那些包含 全部 搜索词项,且 位置 与搜索词项相同的文档。就相当于拿查询字符串直接去文档里面找

GET /_search
{
"query": {
"match_phrase" : {
"message" : "this is a test"
}
}
}

    6、match_phrase_prefix和match_phrase一样,不过它可以允许文本的最后一项使用前缀匹配。

GET /_search
{
"query": {
"match_phrase_prefix" : {
"message" : {
"query" : "quick brown f",
"max_expansions" :
}
}
}
}

     7、可以匹配多字段,如下可以使用*还作为通配符进行匹配,使用^符号来对匹配字段的权重进行增加^3就是权重增加三倍。

GET /_search
{
"query": {
"multi_match" : {
"query": "this is a test",
"fields": [ "subject^3", "message*" ]
}
}
}

    8、短语匹配,但是允许中间间隔几个词,slop为几就是允许间隔几个词,几个词之间离的越近分数越高

GET /bank/account/_search
{
"query":{
"match_phrase": {
"address":{
"query":"171 Avenue",
"slop":"1"
}
}
}
}

    9、取回多个文档

///不同的index、不同的type
GET /_mget
{
"docs" : [
{
"_index" : "index1",
"_type" : "type1",
"_id" : 2
},
{
"_index" : "index2",
"_type" : "type2",
"_id" : 1,
"_source":[
"filed1",
"filed2"
]
}
]
}

..

///相同的index,不同的type
GET /{index}/_mget
{
"docs" : [
{"_type":"type1","_id" : 2},
{"_type":"type2", "_id" :1 }
]
}

...

///相同的index和type,不同的id
GET /{index}/{type}/_mget
{
"ids":[1,2]
}

  10、term查找被用于精确值 匹配,这些精确值可能是数字、时间、布尔或者那些 not_analyzed 的字符串。term 查询对于输入的文本不 分析 ,所以它将给定的值进行精确查询。

注意:如果要用term查找某个字段的值,要避免这个字段没有被分词,否则可能无法匹配到

GET /bank/account/_search
{
"query":{
"term": {
"address": "171"
}
}
}

    11、terms查询和 term查询一样,但它允许你指定多值进行匹配。如果这个字段包含了指定值中的任何一个值,那么这个文档满足条件。terms 查询对于输入的文本不分析。它查询那些精确匹配的值(包括在大小写、重音、空格等方面的差异)。

GET /bank/account/_search
{
"query":{
"terms": {
"address": [ "Banker", "171", "Street"]
}
}
}

    12、exists和missing查询,分别用来判断是否存在或者缺失。

///查询是否存在field_name这个字段
GET /my_index/posts/_search
{
"query" : {
"constant_score" : {
"filter" : {
"exists" : { "field" : "field_name" }
}
}
}
}

    13、组合查询,因为很多时候查询条件都比较复杂,这时就需要使用bool来将多个查询组合起来。bool接收一下参数

      must文档 必须 匹配这些条件才能被包含进来。

      must_not文档 必须不 匹配这些条件才能被包含进来。

      should如果满足这些语句中的任意语句,将增加 _score ,否则,无任何影响。它们主要用于修正每个文档的相关性得分。

      filter必须 匹配,但它以不评分、过滤模式来进行。这些语句对评分没有贡献,只是根据过滤标准来排除或包含文档。filter中也可以嵌套bool

GET /bank/account/_search
{
"query": {
"bool": {
"must":{
"match": { "address": "street" }
},
"must_not": {
"match": { "balance": "47406" }
},
"should": [
{ "match": { "balance": "3150" }}
],
"filter": {
"range": {
"age": { "gte":30 }
}
}
}
}
}

...

//bool过滤器可以嵌套使用
GET /my_store/products/_search
{
"query" : {
"filtered" : {
"filter" : {
"bool" : {
"should" : [
{ "term" : {"productID" : "KDKE-B-9947-#kL5"}},
{ "bool" : {
"must" : [
{ "term" : {"productID" : "JODL-X-1937-#pV7"}},
{ "term" : {"price" : 30}}
]
}}
]
}
}
}
}
}

    14、constant_score查询:它被经常用于你只需要执行一个 filter 而没有其它查询(例如,评分查询)的情况下。可以使用它来取代只有 filter 语句的 bool 查询。在性能上是完全相同的,但对于提高查询简洁性和清晰度有很大帮助。 

GET /bank/account/_search
{
"query": {
"constant_score": {
"filter": {
"term": { "age": 30 }
}
}
}
}

    15、验证查询:验证查询语句是否正确。

GET /bank/account/_validate/query
{
"query": {
"constant_score": {
"filter": {
"term": { "age": 30 }
}
}
}
}

    16、确保查询的字段与输入的字段完全匹配,最好的方式是增加并索引另一个字段, 这个字段用以存储该字段包含词项的数量。

GET /my_index/my_type/_search
{
"query": {
"constant_score" : {
"filter" : {
"bool" : {
"must" : [
{ "term" : { "tags" : "search" } },
{ "term" : { "tag_count" : 1 } }
]
}
}
}
}
}

    17、范围查找range,如果对字符串进行比较,那么是数字<大写字母<小写字母,字符从头开始比较,和js一样。

    range的主要参数为:  

      gt> 大于(greater than)

      lt< 小于(less than)

      gte>= 大于或等于(greater than or equal to)

      lte<= 小于或等于(less than or equal to)

GET /my_store/products/_search
{
"query" : {
"constant_score" : {
"filter" : {
"range" : {
"price" : {
"gte" : 20,
"lt" : 40
}
}
}
}
}
}

..

///对于时间方面的范围可以通过now来表示当前时间,下面表示最近一个小时之内
"range" : {
"timestamp" : {
"gt" : "now-1h"
}
} ///可以通拿过||符号后面跟一个日期表达式来表示日期,下面表示小于2014-01-01
"range" : {
"timestamp" : {
"gt" : "2014-01-01 00:00:00",
"lt" : "2014-01-01 00:00:00||+1M"
}
}

    18、设置最小匹配度  后面可以是数字也可以是百分比

GET /my_index/my_type/_search
{
"query": {
"match": {
"title": {
"query": "quick brown dog",
"minimum_should_match": "75%"
}
}
}
}

    19、通过boost来提升权限,boost默认值为1

GET /_search
{
"query": {
"bool": {
"must": {
"match": {
"content": {
"query": "full text search",
"operator": "and"
}
}
},
"should": [
{ "match": {
"content": {
"query": "Elasticsearch",
"boost": 3
}
}},
{ "match": {
"content": {
"query": "Lucene",
"boost": 2
}
}}
]
}
}
}

    20、dis_max最大化查询:将任何与任一查询匹配的文档作为结果返回,但只将最佳匹配的评分作为查询的评分结果返回 。如果某一个field中匹配到了尽可能多的关键词,那么就应被排在前面;而不是尽可能多的field匹配到了少数的关键词排在前面。

{
"query": {
"dis_max": {
"queries": [
{ "match": { "title": "Brown fox" }},
{ "match": { "body": "Brown fox" }}
]
}
}
}

    21、tie_breaker :上面的dis_max只是将最佳匹配分数作为分数有时并不合理,所以用tie_breaker来设置其他匹配分数的权重,那么最后的分数就是所有分数的总和,tie_breaker的值为0到1。

{
"query": {
"dis_max": {
"queries": [
{ "match": { "title": "Quick pets" }},
{ "match": { "body": "Quick pets" }}
],
"tie_breaker": 0.3
}
}
}

    22、使用multi_match查询,多匹配查询的类型有多种,其中的三种恰巧与 三个场景对应,即: best_fields 、 most_fields 和 cross_fields (最佳字段、多数字段、跨字段)。我们可以使用multi_match来对查询语句进行简化。multi_match中尽量避免使用no_analyzed字段。

///原始查询
{
"dis_max": {
"queries": [
{
"match": {
"title": {
"query": "Quick brown fox",
"minimum_should_match": "30%"
}
}
},
{
"match": {
"body": {
"query": "Quick brown fox",
"minimum_should_match": "30%"
}
}
},
],
"tie_breaker": 0.3
}
} ///简化后的查询
{
"multi_match": {
"query": "Quick brown fox",
"type": "best_fields",
"fields": [ "title", "body" ],
"tie_breaker": 0.3,
"minimum_should_match": "30%"
}
}

    23、多数字段查询most_field,根据字面上可知匹配的时候要尽可能将匹配了更多字段的文档返回过来,所有的字段都参与评分。

GET /my_index/_search
{
"query": {
"multi_match": {
"query": "jumping rabbits",
"type": "most_fields",
"fields": [ "title^10", "title.std" ]
}
}
}

    24、cross_field跨字段查询,将所有的字段看作是一个大的字段,然后去查询。

GET /books/_search
{
"query": {
"multi_match": {
"query": "peter smith",
"type": "cross_fields",
"fields": [ "title^2", "description" ]
}
}
}

    25、使用临近度提高相关度

GET /my_index/my_type/_search
{
"query": {
"bool": {
"must": {
"match": {
"title": {
"query": "quick brown fox",
"minimum_should_match": "30%"
}
}
},
"should": {
"match_phrase": {
"title": {
"query": "quick brown fox",
"slop": 50
}
}
}
}
}
}

    26、prefix前缀查询:默认状态下, prefix 查询不做相关度评分计算,它只是将所有匹配的文档返回,并为每条结果赋予评分值 1 。

GET /my_index/address/_search
{
"query": {
"prefix": {
"postcode": "W1"
}
}
}

    27、通配符查询wildcard:允许指定匹配的正则式。它使用标准的 shell 通配符查询: ? 匹配任意字符, * 匹配 0 或多个字符。

GET /my_index/address/_search
{
"query": {
"wildcard": {
"postcode": "W?F*HW"
}
}
}

    28、正则表达式查询Regexp:

GET /my_index/address/_search
{
"query": {
"regexp": {
"postcode": "W[0-9].+"
}
}
}

    29、查询时输入即搜索match_phrase_prefix,就是在原有match_phrase的基础上将查询字符串的最后一个词作为前缀使用,来进行模糊匹配。

///参数 max_expansions 控制着可以与前缀匹配的词的数量,它会先查找第一个与前缀 bl 匹配的词,然后依次查找搜集与之匹配的词(按字母顺序),直到没有更多可匹配的词或当数量超过 max_expansions 时结束。
{
"match_phrase_prefix" : {
"brand" : {
"query": "walker johnnie bl",
"slop": 10,
"max_expansions":50
}
}
}

  

ES 常用的查询语句介绍的更多相关文章

  1. [转] 常用SQL查询语句

    sunada  的原文地址 常用SQL查询语句 一.简单查询语句 1. 查看表结构 SQL>DESC emp; 2. 查询所有列 SQL>SELECT * FROM emp; 3. 查询指 ...

  2. SQL注入之MySQL常用的查询语句

    MySQL是一种使用很广的数据库,大部分网站都是用MySQL,所以熟悉对MySQL数据库的注入很重要. 首先来说下MySQL注入的相关知识点 在MySQL5.0版本之后,MySQL默认在数据库存放一个 ...

  3. ElasticSearch 7.X版本19个常用的查询语句

    整理一篇常用的CRUD查询语句,之前这篇文件是在17年左右发表的,从英文翻译过来,现在采用7.x 版本进行实验,弃用的功能或者参数,我这边会进行更新,一起来学习吧. 为了演示不同类型的 Elastic ...

  4. 常用SQL查询语句

    一.简单查询语句 1. 查看表结构 SQL>DESC emp; 2. 查询所有列 SQL>SELECT * FROM emp; 3. 查询指定列 SQL>SELECT empmo, ...

  5. mysql一些常用的查询语句总结

    工作中会遇到一些比较有用的mysql查询语句,有了它,可以对mysql进行更全面的维护和管理,下面就写一下我记录的 1.按照字段ru_id查询dsc_order_goods表中ru_id出现次数由多到 ...

  6. MySQL开发中常用的查询语句总结

    1.查询数值型数据: SELECT * FROM tb_name WHERE sum > 100; 查询谓词:>,=,<,<>,!=,!>,!<,=>, ...

  7. sql server 常用的查询语句

    最近在加强sql 语句的学习,整理一下基本语法,现在记录下 select * from dbo.cangku where city='河南' select  distinct(city), cangk ...

  8. 测试工作常用SQL查询语句

    一.查询数值型数据: SELECT * FROM tb_name WHERE sum > 100; 查询谓词:>,=,<,<>,!=,!>,!<,=>, ...

  9. 关于MySQL常用的查询语句

    一查询数值型数据: SELECT * FROM tb_name WHERE sum > 100; 查询谓词:>,=,<,<>,!=,!>,!<,=>,= ...

随机推荐

  1. winserver-查看登陆日志

    Abstract 先要开启登陆审核,在查看登陆日志. 开启审核 运行 secpol.msc 日志查看 windowslog 下的security 管理员成功登陆后的eventid:4776,4648, ...

  2. SQL Server数据库漏洞评估了解一下

    SQL Server Management Studio 17.4或更高版本的SSMS中提供了SQL Server漏洞侦测(VA)功能,此功能允许SQL Server扫描您的数据库以查找潜在的安全漏洞 ...

  3. Go语言打造以太坊智能合约测试框架(level1)

    传送门: 柏链项目学院 Go语言打造以太坊智能合约测试框架 前言 这是什么? 这是一个基于go语言编写的,自动化测试以太坊智能合约的开发框架,使用此框架,可以自动化的部署合约,自动测试合约内的功能函数 ...

  4. pandas.DataFrame的pivot()和unstack()实现行转列

    示例: 有如下表需要进行行转列: 代码如下: # -*- coding:utf-8 -*- import pandas as pd import MySQLdb from warnings impor ...

  5. saiku环境搭建

    说明:搭建saiku环境,BI展示工具. 环境说明: os:windows7 jdk:jdk1.6.0_43 tomcat:apache-tomcat-7.0.62 saiku:saiku-ui-2. ...

  6. 将Windows Server 2016 打造成工作站(20161030更新)

    将Windows Server 2016 打造成工作站(20161030更新) 一.基础设置 1.1.关闭自动弹窗:   「开始菜单」 - 「服务器管理器」 - 「仪表板」(或 Win + R或CMD ...

  7. 数据库升级到mysql5.7出现的1067 - Invalid default value for '字段名' (docker版)

    docker run -d --name xxx mysql:5.7 docker container cp xxx:/etc/mysql/mysql.conf.d .   // 取出mysql中的配 ...

  8. Azure按订阅,资源组,资源类型导出所有资源powershell命令

    一般可以借助powershell命令来读取资源:例如:1, 读取某个订阅下的资源:$subscriptionID = "xxxxxxxx"Set-AzureRmContext $s ...

  9. SQL 行转列的运用

    适用场景:需要将行数据转换成列数据 例子: 现在有一个学生的成绩表 但是我们需要将每个学生的成绩汇集到一条数据上,这时候就可以用到行转列. 代码如下 一.不使用  PIVOT SELECT ),[St ...

  10. 算法01 C语言设计

    8.21 #include <stdio.h> void bubbleSort(int **p, int n); int main(void){ int a[100]; int *b[10 ...