facets接口可以根据query返回统计数据,其中的 terms_stats 是分组统计,根据key的情况返回value的统计数据,类似group by的意思。

"terms_stats" : { "key_field" : "", "value_field" : "" }

例子:查询每个ip的请求执行时间

查询语句:

   1: {
   2:     "size": 0,
   3:     "facets": {
   4:         "ips_stats": {
   5:             "terms_stats": {
   6:                 "key_field": "nginx_log.@fields.ip",
   7:                 "value_field": "nginx_log.@fields.request_time",
   8:                 "size": 5
   9:             }
  10:         }
  11:     }
  12: }

说明:

  • 第2行的 size 表示 hits 命中的返回0条;
  • 第3行的facets,第5行的terms_stats 是做分组查询的必要关键字。
  • 第4行的 ips_stats 是对这个分组查询的命名,可以自己随便起。
  • 第6行 key_field 表示对 nginx_log.@fields.ip 字段进行分组。
  • 第7行 value_field 表示 对 nginx_log.@fields.request_time 的值进行分组后的运算。
  • 第8行的 size 表示分组运算,最多返回多少行。

这个例子的查询结果如下,这里简单起见,只返回了2条。:

   1: {
   2:     "took": 35641,
   3:     "timed_out": false,
   4:     "_shards": {
   5:         "total": 5,
   6:         "successful": 5,
   7:         "failed": 0
   8:     },
   9:     "hits": {
  10:         "total": 193109307,
  11:         "max_score": 1,
  12:         "hits": []
  13:     },
  14:     "facets": {
  15:         "ips_stats": {
  16:             "_type": "terms_stats",
  17:             "missing": 0,
  18:             "terms": [
  19:                 {
  20:                     "term": "180.149.157.110",
  21:                     "count": 1871112,
  22:                     "total_count": 1871112,
  23:                     "min": 0.016,
  24:                     "max": 80.306,
  25:                     "total": 545853.1529999943,
  26:                     "mean": 0.2917266058899704
  27:                 },
  28:                 {
  29:                     "term": "59.49.225.22",
  30:                     "count": 515179,
  31:                     "total_count": 515179,
  32:                     "min": 0,
  33:                     "max": 600.004,
  34:                     "total": 27793.9160000002,
  35:                     "mean": 0.053950017372602924
  36:                 }
  37:             ]
  38:         }
  39:     }
  40: }

从结果我们可以看到,我们对 每个ip的执行时间计算了 个数、最大最小值,平均值,合计的计算。

相关技术参考:http://stackoverflow.com/questions/16549001/elasticsearch-order-responses-and-then-facet/16568770

例子:按照每个ip的请求数排序

查询JSON

   1: {
   2:     "size": 0,
   3:     "facets": {
   4:         "time_stats": {
   5:             "terms_stats": {
   6:                 "key_field": "nginx_log.@fields.ip",
   7:                 "value_field": "nginx_log.@fields.request_time",
   8:                 "size": 2,
   9:                 "order": "total"
  10:             }
  11:         }
  12:     }
  13: }

只比上述查询多了一个 order 属性.输出结果格式跟上面一样,只不过是排好序的,就不罗列了.

例子:查询整个网站的执行时间

查询json:

   1: {
   2:     "query": {
   3:         "match_all": {}
   4:     },
   5:     "size": 0,
   6:     "facets": {
   7:         "stat1": {
   8:             "statistical": {
   9:                 "field": "nginx_log.@fields.request_time"
  10:             }
  11:         }
  12:     }
  13: }

说明:

  • 最初的查询条件我们没有写,意味着取全部,如果你想查询指定范围,可以在这里书写。第2-4行。第5行的size表示查询条件显示的数据条数。
  • statistical 是对一个数字字段做统计的facet。

结果:

   1: {
   2:     "took": 4824,
   3:     "timed_out": false,
   4:     "_shards": {
   5:         "total": 5,
   6:         "successful": 5,
   7:         "failed": 0
   8:     },
   9:     "hits": {
  10:         "total": 193109307,
  11:         "max_score": 1,
  12:         "hits": []
  13:     },
  14:     "facets": {
  15:         "stat1": {
  16:             "_type": "statistical",
  17:             "count": 142590544,
  18:             "total": 59320216.00531181,
  19:             "min": 0,
  20:             "max": 5347.085,
  21:             "mean": 0.4160178812790826,
  22:             "sum_of_squares": 14578358539.95768,
  23:             "variance": 102.06623708075713,
  24:             "std_deviation": 10.102783630304923
  25:         }
  26:     }
  27: }

这个方法的更多参考:

http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/search-facets-statistical-facet.html

ElasticSearch 分组查询的几个例子的更多相关文章

  1. ElasticSearch 分组查询

    curl -XPOST 'localhost:9200/bank/_search?pretty' -d ' { "size": 0, "aggs": { &qu ...

  2. ElasticSearch DSL 查询

    公号:码农充电站pro 主页:https://codeshellme.github.io DSL(Domain Specific Language)查询也叫做 Request Body 查询,它比 U ...

  3. 08章 分组查询、子查询、原生SQL

    一.分组查询 使用group by关键字对数据分组,使用having关键字对分组数据设定约束条件,从而完成对数据分组和统计 1.1 聚合函数:常被用来实现数据统计功能 ① count() 统计记录条数 ...

  4. SQL分组查询group by

    注意:select 后的字段,必须要么包含在group by中,要么包含在having 后的聚合函数里. 1. GROUP BY 是分组查询, 一般 GROUP BY 是和聚合函数配合使用 group ...

  5. SQL group by分组查询(转)

    本文导读:在实际SQL应用中,经常需要进行分组聚合,即将查询对象按一定条件分组,然后对每一个组进行聚合分析.创建分组是通过GROUP BY子句实现的.与WHERE子句不同,GROUP BY子句用于归纳 ...

  6. mongodb使用mongoose分组查询

    一个分组查询的例子: model.aggregate([{$match: ops}, {$unwind: '$details'}, {$sort: {create_at: -1}}, { $group ...

  7. SQL分组查询GroupBy

    一.分组查询1.使用group by进行分组查询在使用group by关键字时,在select列表中可以指定的项目是有限制的,select语句中仅许以下几项:〉被分组的列〉为每个分组返回一个值得表达式 ...

  8. Oracle和MySQL分组查询GROUP BY

    Oracle和MySQL分组查询GROUP BY 真题1.Oracle和MySQL中的分组(GROUP BY)有什么区别? 答案:Oracle对于GROUP BY是严格的,所有要SELECT出来的字段 ...

  9. Oracle_group by分组查询_深入

    Oracle_group by分组查询_深入 本文导读:在实际SQL应用中,经常需要进行分组聚合,即将查询对象按一定条件分组,然后对每一个组进行聚合分析.                    创建分 ...

随机推荐

  1. 以太坊 ERC20 与 ERC721 深度解密

    去年11月份的一段时间,Ethereum网络突然变的特别拥堵,原因是兴起了一款以太坊养猫的Dapp游戏,超级可爱的猫形象,再加上配种,繁殖和拍卖等丰富的玩法,风靡了币圈. 一时间币圈大大小小的人都在撸 ...

  2. [TC]Total Command显示文件夹大小

    在Windows下计算文件夹的大小 按下 Alt +Shift +Enter 将会计算当前目录下的文件夹大小. 关于TC相关的知识:TC(Total Commander)文件管理神器

  3. 关于Numba开源库(Python语法代码加速处理,看过一个例子,速度可提高6倍)

    关于Numba你可能不了解的七个方面 https://yq.aliyun.com/articles/222523 Python GPU加速 (很详细,有代码练习)https://blog.csdn.n ...

  4. LeetCode算法题-Number of Boomerangs(Java实现)

    这是悦乐书的第231次更新,第244篇原创 01 看题和准备 今天介绍的是LeetCode算法题中Easy级别的第98题(顺位题号是447).给定平面中的n个点都是成对不同的,"回旋镖&qu ...

  5. java操作elasticsearch实现query String

    1.CommonTersQuery: 指定字段进行模糊查询 //commonTermsQuery @Test public void test35() throws UnknownHostExcept ...

  6. 一个tomcat部署多个应用实例

    安装JDK7sudo apt-get install java7-jdk 安装tomcat7 Tomcat7下载地址http://mirror.bjtu.edu.cn/apache/tomcat/to ...

  7. 【English】20190306

    Delivery team交付团队consumption消费[kənˈsʌmpʃən] The Consulting Delivery team is focused on delivering va ...

  8. 寒假训练——搜索——C - Robot

    The Robot Moving Institute is using a robot in their local store to transport different items. Of co ...

  9. 在django中如何通过已有的mysql表生成django的model

    第一步:先是在项目中建立一个app:python manage.py startapp app01 第二步:python manage.py inspectdb > app01/models.p ...

  10. springcloud(十五):Spring Cloud 终于按捺不住推出了自己的服务网关 Gateway

    Spring 官方最终还是按捺不住推出了自己的网关组件:Spring Cloud Gateway ,相比之前我们使用的 Zuul(1.x) 它有哪些优势呢?Zuul(1.x) 基于 Servlet,使 ...