ElasticSearch 聚合函数

一、简单聚合

桶：简单来说就是满足特定条件的文档的集合。

指标：大多数指标是简单的数学运算（例如最小值、平均值、最大值，还有汇总），这些是通过文档的值来计算。

桶能让我们划分文档到有意义的集合，但是最终我们需要的是对这些桶内的文档进行一些指标的计算。分桶是一种达到目的的手段：它提供了一种给文档分组的方法来让我们可以计算感兴趣的指标。在实践中，指标能让你计算像平均薪资、最高出售价格、95%的查询延迟这样的数据。

例如，桶和指标可以类似映射成SQL查询语句

SELECT COUNT(color)   //相当于桶

FROM table

GROUP BY color       //相当于指标

桶在概念上类似于 SQL 的分组（GROUP BY），而指标则类似于 COUNT() 、 SUM() 、 MAX() 等统计方法。

 curl -XGET 'http://192.9.8.222:9200/wymlib/ym_literature/_search?pretty=true' -d '

 {

   "size": 0,

   "aggregations": {

     "popular_author": {

       "terms": {

         "field": "author"

       }

     }

   }

 }'

结果显示： 
1 {

   "took" : 2803,

   "timed_out" : false,

   "_shards" : {

     "total" : 5,

     "successful" : 5,

     "failed" : 0

   },

   "hits" : {

     "total" : 25,

     "max_score" : 0.0,

     "hits" : [ ]

   },

   "aggregations" : {     //1

     "popular_author" : { //2

       "doc_count_error_upper_bound" : 0,

       "sum_other_doc_count" : 0,

       "buckets" : [ {    //3

         "key" : "王阳明",

         "doc_count" : 4

       }, {

         "key" : "阳明",

         "doc_count" : 4

       }, {

         "key" : "胡",

         "doc_count" : 2

       }, {

         "key" : "大大",

         "doc_count" : 1

       }, {

         "key" : "建",

         "doc_count" : 1

       }, {

         "key" : "徐",

         "doc_count" : 1

       }, {

         "key" : "杰",

         "doc_count" : 1

       }, {

         "key" : "闯",

         "doc_count" : 1

       } ]

     }

   }

 }

//1 聚合操作被置于顶层参数 aggs 之下（如果你愿意，完整形式 aggregations 同样有效）。

//2 然后，可以为聚合指定一个我们想要名称，本例中是： popular_colors 。

//3 最后，定义单个桶的类型 terms(这里出现的是buckets) 。

注意：可能会注意到我们将 size 设置成 0 。我们并不关心搜索结果的具体内容，所以将返回记录数设置为 0 来提高查询速度。设置 size: 0 与 Elasticsearch 1.x 中使用 count 搜索类型等价。

二、基于metric的聚合

因为不是特别了解，我暂且将它理解为基于指标的聚合，后面如果发现不对，再来改正。

 curl -XGET 'http://192.9.8.222:9200/test_es_order_index/test_es_order_type/_search?pretty=true' -d '

 {

   "aggregations": {

     "sum_age": {

       "sum": {

         "field": "age"

       }

     }

   }

 }'

结果：（age 一个是29 一个是21求和后是50）

 "aggregations" : {

     "sum_age" : {

       "value" : 50.0

     }

   }

stats统计：

 curl -XGET 'http://192.9.8.222:9200/test_es_order_index/test_es_order_type/_search?pretty=true' -d '

 {

   "size":0,

   "aggregations": {

     "stats_age": {

       "stats": {

         "field": "age"

       }

     }

   }

 }'

结果（请求后会直接显示多种聚合结果）：

 {

   "took" : 2,

   "timed_out" : false,

   "_shards" : {

     "total" : 5,

     "successful" : 5,

     "failed" : 0

   },

   "hits" : {

     "total" : 7,

     "max_score" : 0.0,

     "hits" : [ ]

   },

   "aggregations" : {

     "stats_age" : {

       "count" : 2,

       "min" : 21.0,

       "max" : 29.0,

       "avg" : 25.0,

       "sum" : 50.0

     }

   }

 }

【Reference】

【1】 http://www.cnblogs.com/xing901022/p/4947436.html

【2】 https://www.elastic.co/guide/cn/elasticsearch/guide/current/_aggregation_test_drive.html

【3】 http://www.cnblogs.com/xing901022/p/4944043.html

ElasticSearch 聚合函数的更多相关文章

elasticsearch聚合函数
计算每个tag下的商品数量 GET /ecommerce/product/_search { "aggs": { //聚合 "group_by_tags": ...
elasticsearch 聚合函数 max double精度损失bug
测试样例数据{ "size" : 0, "query" : { "bool" : { "must" : { " ...
Elasticsearch聚合——aggregation
聚合提供了分组并统计数据的能力.理解聚合的最简单的方式是将其粗略地等同为SQL的GROUP BY和SQL聚合函数.在Elasticsearch中,你可以在一个响应中同时返回命中的数据和聚合结果.你可以 ...
ElasticSearch聚合（转）
ES之五:ElasticSearch聚合前言说完了ES的索引与检索,接着再介绍一个ES高级功能API – 聚合(Aggregations),聚合功能为ES注入了统计分析的血统,使用户在面对大数据提 ...
Elasticsearch聚合语句
聚合的范围是search query过滤出的数据四种聚合类型: 一.Bucketing 桶聚合,常规的分类然后计算每个分类的文档数量二.Metric 分类并对一组文档进行sum.avg等数学运算 ...
es的查询、排序查询、分页查询、布尔查询、查询结果过滤、高亮查询、聚合函数、python操作es
今日内容概要 es的查询 Elasticsearch之排序查询 Elasticsearch之分页查询 Elasticsearch之布尔查询 Elasticsearch之查询结果过滤 Elasticse ...
可以这样去理解group by和聚合函数
写在前面的话:用了好久group by,今天早上一觉醒来,突然感觉group by好陌生,总有个筋别不过来,为什么不能够select * from Table group by id,为什么一定不能是 ...
TSQL 聚合函数忽略NULL值
max,min,sum,avg聚合函数会忽略null值,但不代表聚合函数不返回null值,如果表为空表,或聚合列都是null,则返回null.count 聚合函数忽略null值,如果聚合列都是null ...
SQL Server 聚合函数算法优化技巧
Sql server聚合函数在实际工作中应对各种需求使用的还是很广泛的,对于聚合函数的优化自然也就成为了一个重点,一个程序优化的好不好直接决定了这个程序的声明周期.Sql server聚合函数对一组值 ...

随机推荐

Android开发学习笔记-实现联网检测程序版本
package com.frank.mobilesafe; import java.io.InputStream; import java.net.HttpURLConnection; import ...
图像中的artifacts
artifacts 瑕疵伪影(Artifacts) 伪影(Artifacts)-CT-基础术语 - 影像园 http://www.xctmr.com/baike/ct/c34b5413e305b45 ...
VC++调用MSFlexGrid的SetRow方法，出现异常“Invalid Row Value”
MSFlexGrid是微软提供的网格表格控件,SetRow方法用于设置当前焦点所在行. C++ Code 12345 void CMSFlexGrid::SetRow(long nNewVal ...
HTML5标签canvas制作动画
摘要: canvas可以绘制图像,自然而然的就可以制作动画,因为动画的每一帧都是图像.我们可以利用javascript的setInterval函数来实现动画效果. 下面是一个例子,小圆绕着红点圆心不停 ...
Hadoop教程(五)Hadoop分布式集群部署安装
Hadoop教程(五)Hadoop分布式集群部署安装 1 Hadoop分布式集群部署安装在hadoop2.0中通常由两个NameNode组成,一个处于active状态,还有一个处于standby状态 ...
java命令行操作
一直使用eclipse操作java程序,但RMI程序需要命令行操作,故研究了下java的命令行操作. javac 用于编译.java文件,生成.class文件假设文件夹dir下有pa.java和a. ...
vue-resource和vue-axios的简单使用方法
两者其实差别不大,都是基于es6的Promise对象实现的方法 vue-resource: main.js => import Vue from 'vue'; import VueResourc ...
switch和continue的关系
突然想到我们用 switch都是用 break return等关键字来配合,有没有一种情况下是用continue呢?而且如果真的出现了continue,结果是什么样的呢?
hadoop的Map阶段的四大步骤
深入理解map的几个阶段是怎样执行的.
HttpClient（二）-- 模拟浏览器抓取网页
一.设置请求头消息 User-Agent模拟浏览器 1.当使用第一节的代码来访问推酷的时候,会返回给我们如下信息: 网页内容:<!DOCTYPE html> <html> ...

ElasticSearch 聚合函数

ElasticSearch 聚合函数的更多相关文章

随机推荐

热门专题