Elasticsearch学习之查询去重

1. 实现查询去重、分页，例如：实现依据qid去重，createTime排序，命令行为：

GET  /nb_luban_answer/_search

{

  "query": {

    "match": {

      "status":

    }

  },

  "sort": [

    {

      "createTime": {

        "order": "desc"

      }

    }

  ],"aggs": {

    "qid": {

      "terms": {

        "field": "qid",

        "size":

      },"aggs": {

        "rated": {

          "top_hits": {

            "sort": [{

              "createTime": {"order": "desc"}

            }],

            "size":

          }

        }

      }

    }

  },

  "size": ,

  "from":

}

JAVA API

String indexName="nb_luban_answer";

        String typeName="luban_answer";

        AggregationBuilder aggregation =

                AggregationBuilders

                        .terms("agg").field("qid")

                        .subAggregation(

                                AggregationBuilders.topHits("top").addSort("createTime",SortOrder.DESC).setSize()

                        );

        SearchResponse sResponse = Tool.CLIENT.prepareSearch(indexName).setTypes(typeName)

                .setQuery(QueryBuilders.matchQuery("status",))

                .addSort("createTime", SortOrder.DESC)

                .addAggregation(aggregation)

                .execute().actionGet();

        Terms agg = sResponse.getAggregations().get("agg");

        for (Terms.Bucket entry : agg.getBuckets()) {

            String key = String.valueOf(entry.getKey()) ;

            long docCount = entry.getDocCount();

            System.out.println("key:"+ key +" doc_count:"+ docCount);

            TopHits topHits= entry.getAggregations().get("top");

            for (SearchHit hit : topHits.getHits()){

                System.out.println(" -> id: "+ hit.getId()+" createTime: "+hit.getSource().get("createTime"));

            }

        }

2. 取得某个索引中某个字段中的所有出现过的值

这种操作类似于使用SQL的SELECT UNIQUE语句。当需要获取某个字段上的所有可用值时，可以使用terms聚合查询完成：eg: select distinct street_name from table_name ;

GET /index_streets/_search?search_type=count

{

 "aggs": {

   "street_values": {

     "terms": {

       "field": "name.raw",

       "size":

     }

   }

 }

}

因为目标是得到name字段上的所有出现过的值，因此search_type被设置为了count，这样在返回的响应中不会出现冗长的hits部分。另外，查询的目标字段的索引类型需要设置为not_analyzed。所以上面的field指定的是name.raw。

3. 取得某个索引/类型下某个字段中出现的不同值的个数

这种操作类似于使用SQL的select count( * ) from (select distinct * from table)语句。当需要获取某个字段上的出现的不同值的个数时，可以使用cardinality聚合查询完成：

GET /index_streets/_search?search_type=count

{

  "aggs": {

    "uniq_streets": {

      "cardinality": {

        "field": "name.raw"

      }

    }

  }

}

因为目标是得到name字段上的所有出现过的值，因此search_type被设置为了count，这样在返回的响应中不会出现冗长的hits部分。另外，查询的目标字段如果是字符串类型的，那么其索引类型需要设置为not_analyzed。所以上面的field指定的是name.raw。

转自：https://blog.csdn.net/a422100210/article/details/60959450

Elasticsearch学习之查询去重的更多相关文章

ElasticSearch 学习记录之ES查询添加排序字段和使用missing或existing字段查询
ES添加排序在默认的情况下,ES 是根据文档的得分score来进行文档额排序的.但是自己可以根据自己的针对一些字段进行排序.就像下面的查询脚本一样.下面的这个查询是根据productid这个值进行排 ...
ElasticSearch 学习记录之父子结构的查询
父子结构父亲type属性查询子type 的类型父子结构的查询,可以通过父亲类型的字段,查询出子类型的索引信息 POST /product/_search { "query": ...
ELK 学习笔记之 elasticsearch bool组合查询
elasticsearch bool组合查询: 相当于sql:where _type = 'books' and (price = 500 or title = 'bigdata') Note: mu ...
Elasticsearch文档查询
简单数据集到目前为止,已经了解了基本知识,现在我们尝试用更逼真的数据集,这儿已经准备好了一份虚构的JSON,关于客户银行账户信息的.每个文档的结构如下: { , , "firstname& ...
ElasticSearch 学习记录之ES几种常见的聚合操作
ES几种常见的聚合操作普通聚合 POST /product/_search { "size": 0, "aggs": { "agg_city&quo ...
ElasticSearch 学习记录之ES短语匹配基本用法
短语匹配短语匹配故名思意就是对分词后的短语就是匹配,而不是仅仅对单独的单词进行匹配下面就是根据下面的脚本例子来看整个短语匹配的有哪些作用和优点 GET /my_index/my_type/_sea ...
ElasticSearch 学习记录之分布式文档存储往ES中存数据和取数据的原理
分布式文档存储 ES分布式特性屏蔽了分布式系统的复杂性集群内的原理垂直扩容和水平扩容真正的扩容能力是来自于水平扩容–为集群添加更多的节点,并且将负载压力和稳定性分散到这些节点中 ES集群特点 ...
ElasticSearch 学习记录之如任何设计可扩容的索引结构
扩容设计扩容的单元一个分片即一个 Lucene 索引 ,一个 Elasticsearch 索引即一系列分片的集合一个分片即为扩容的单元 . 一个最小的索引拥有一个分片. 一个只有一个分片的索引 ...
ElasticSearch 学习记录之ES高亮搜索
高亮搜索 ES 通过在查询的时候可以在查询之后的字段数据加上html 标签字段,使文档在在web 界面上显示的时候是由颜色或者字体格式的 GET /product/_search { "si ...

随机推荐

如何找回Ucenter创始人密码，账号无需修改
UCenter 创始人的密码非常重要,忘记或丢失后,就不能进入 UCenter 进行用户和数据的管理,也会对站点造成安全隐患.由于 UCenter 的密码是采用两次 md5 加一个随机数的形式加密的, ...
MarkDown 使用说明示例
一.标题一级标题二级标题三级标题四级标题五级标题六级标题一级标题这是 H2 这是 H3 一级和二级标题还有一种写法就是下面加横杆,同时超过2个的 = 和 - 都可以有效果. Thi ...
p12证书转keystore签名
java https://my.oschina.net/u/555639/blog/524821 AIR p12转keystore证书签名apk 2014年01月03日 ⁄ 移动探索 ⁄ 评论数 ...
【Deep Learning】RNN LSTM 推导
http://blog.csdn.net/Dark_Scope/article/details/47056361 http://blog.csdn.net/hongmaodaxia/article/d ...
vue实现点击关注之后及时更新列表
如图,我要实现点击关注之后列表及时更新成最新的列表. 思路很简单,主要是两点: 1.在点击关注之后去执行一个请求新的关注列表的action: 2.在vue组件中watch监听已关注列表和推荐关注列表 ...
MathType编辑粗体空心字的技巧
在用MathType公式编辑器编辑公式时,由于不同的使用需要,会有不同的字体要求.如果是正式的论文中的公式,一般公式只要求数学的国际使用规定就可以了,而如果是用在ppt等这种演示的文稿中,所要用到的字 ...
BIOS、EFI与UEFI详解
https://blog.csdn.net/Scythe666/article/details/79708293
Js页面刷新前提示-jquery页面刷新事件
//原理很简单,就是在body的onbeforeunload事件绑定函数,代码如下: document.body.onbeforeunload = function (event) { var c = ...
AngularJS------报错"The selector "app-user-item" did not match any elements"
原因:新建的组件没有在任何界面使用到解决方法:在界面使用该组件
Xcode文件被锁定：The file ".xcodeproj" could not be unlocked
同事从svn上面checkout项目到本地,通过xcode打开的时候提示的这个问题. The file "xcodeproj" could not be unlocked. Cou ...

Elasticsearch学习之查询去重

Elasticsearch学习之查询去重的更多相关文章

随机推荐

热门专题