Elasticsearch 实战

需求

假设现在有这么一个需求，系统接了很多的报文，需要提供全文检索，为了简化，报文目前只有类型，流水号，内容这三个字段。

索引设计

建立msg索引，映射规则如下

PUT /msg

{

	"mappings" : {

      "properties" : {

        "traceNo" : {

          "type" : "keyword"

        },

        "type" : {

          "type" : "keyword"

        },

        "content" : {

          "type" : "text"

        }

      }

    }

}

代码实现

交易VO

@Getter

@Setter

public class TradeVO {

    /**

     * 交易编号

     */

    private String tradeNo;

    /**

     * 成交金额

     */

    private Integer matchAmt;

    /**

     * 成交数量

     */

    private Integer matchQty;

}

报文实体

package com.wangtao.msgsearch.entity;

import lombok.AllArgsConstructor;

import lombok.Data;

import lombok.NoArgsConstructor;

@NoArgsConstructor

@AllArgsConstructor

@Data

public class Msg {

    /**

     * 0001: 交易所报文

     * 0002: 银行间报文

     * 0003: 场外报文

     * es类型: keyword

     */

    private String type;

    /**

     * 流水号

     * es类型: keyword

     */

    private String traceNo;

    /**

     * 报文内容

     * es类型: text

     */

    private String content;

}

查询VO

package com.wangtao.msgsearch.vo;

import lombok.Data;

@Data

public class MsgSearchVO {

    /**

     * 报文类型

     */

    private String type;

    /**

     * 流水号

     */

    private String traceNo;

    /**

     * 关键字, 从报文内容搜索

     */

    private String keyword;

    private Integer pageNo = 1;

    private Integer pageSize = 20;

}

索引创建

/**

 * 创建索引并指定映射

 */

@GetMapping("/createIndex")

public void createIndex() throws IOException {

    TypeMapping typeMapping = new TypeMapping.Builder()

        .properties("type", p -> p.keyword(k -> k))

        .properties("traceNo", p -> p.keyword(k -> k))

        .properties("content", p -> p.text(t -> t))

        .build();

    CreateIndexRequest createIndexRequest = new CreateIndexRequest.Builder()

        .index(INDEX_NAME)

        .mappings(typeMapping)

        .build();

    BooleanResponse booleanResponse = elasticsearchClient.indices().exists(e -> e.index(INDEX_NAME));

    if (booleanResponse.value()) {

        // 如果存在则删除

        elasticsearchClient.indices().delete(d -> d.index(INDEX_NAME));

    }

    elasticsearchClient.indices().create(createIndexRequest);

}

插入测试数据

/**

 * 准备数据

 */

private List<Msg> generateData() {

    Random random = new Random();

    List<Msg> msgList = new ArrayList<>();

    for (int i = 1; i <= 50; i++) {

        TradeVO tradeVO = new TradeVO();

        tradeVO.setTradeNo("T20220821" + String.format("%03d", i));

        tradeVO.setMatchAmt(random.nextInt(10000));

        tradeVO.setMatchQty(tradeVO.getMatchAmt());

        Msg msg = new Msg();

        msg.setTraceNo("M20220821" + String.format("%03d", i));

        msg.setType(MsgTypeEnum.ofOrdinal(i % 3).getValue());

        try {

            msg.setContent(objectMapper.writeValueAsString(tradeVO));

        } catch (JsonProcessingException e) {

            e.printStackTrace();

        }

        msgList.add(msg);

    }

    return msgList;

}

/**

 * 批量插入数据

 */

@GetMapping("/addData")

public List<Msg> addData() throws IOException {

    List<Msg> msgList = generateData();

    List<BulkOperation> bulkOperations = new ArrayList<>();

    for (int i = 1; i <= msgList.size(); i++) {

        Msg msg = msgList.get(i - 1);

        String finalI = i + "";

        BulkOperation bulkOperation = new BulkOperation.Builder()

            .index(o -> o.id(finalI).document(msg))

            .build();

        bulkOperations.add(bulkOperation);

    }

    BulkRequest bulkRequest = new BulkRequest.Builder()

        .index(INDEX_NAME)

        .operations(bulkOperations)

        .build();

    BulkResponse response = elasticsearchClient.bulk(bulkRequest);

    if (response.errors()) {

        log.error("batch insert has error!");

    }

    return msgList;

}

根据条件搜索

@PostMapping("/searchByCondition")

public List<Msg> searchByCondition(@RequestBody MsgSearchVO msgSearchVO) throws IOException {

    /*

     * 类型为keyword时, 记录建立倒排索引时不会进行分词

     * 查询时使用term关键字, 条件不会被分词

     *

     * 类型为text时, 记录建立倒排索引时会进行分词

     * 查询时使用match关键字, 条件也会被分词

     */

    log.info("args: {}", msgSearchVO);

    Integer from = (msgSearchVO.getPageNo() - 1) * msgSearchVO.getPageSize();

    List<Query> andQueryList = new ArrayList<>();

    if (StringUtils.isNotBlank(msgSearchVO.getType())) {

        Query byType = new TermQuery.Builder()

            .field("type")

            .value(msgSearchVO.getType())

            .build()._toQuery();

        andQueryList.add(byType);

    }

    if (StringUtils.isNotBlank(msgSearchVO.getTraceNo())) {

        Query byTraceNo = new TermQuery.Builder()

            .field("traceNo")

            .value(msgSearchVO.getTraceNo())

            .build()._toQuery();

        andQueryList.add(byTraceNo);

    }

    if (StringUtils.isNotBlank(msgSearchVO.getKeyword())) {

        Query byContent = new MatchQuery.Builder()

            .field("content")

            .query(msgSearchVO.getKeyword())

            .build()._toQuery();

        andQueryList.add(byContent);

    }

    Query query = new BoolQuery.Builder()

        .must(andQueryList)

        .build()._toQuery();

    SearchResponse<Msg> response = elasticsearchClient.search(

        s -> s.index(INDEX_NAME).from(from).size(msgSearchVO.getPageSize())

         .query(query),

         Msg.class

    );

    List<Hit<Msg>> hits = response.hits().hits();

    assert response.hits().total() != null;

    log.info("page count: {}", hits.size());

    log.info("total count: {}", response.hits().total().value());

    return hits.stream().map(Hit::source).collect(Collectors.toList());

}

源码

https://github.com/wangtaoj/elasticsearch-learning

Elasticsearch 实战的更多相关文章

ElasticSearch实战－入门
http://www.cnblogs.com/smartloli/ 1.概述今天接着<ElasticSearch实战-日志监控平台>一文来给大家分享后续的学习,在<ElasticS ...
ElasticSearch实战－日志监控平台
1.概述在项目业务倍增的情况下,查询效率受到影响,这里我们经过讨论,引进了分布式搜索套件——ElasticSearch,通过分布式搜索来解决当下业务上存在的问题.下面给大家列出今天分析的目录: El ...
ElasticSearch实战
ElasticSearch实战-入门 1.概述今天接着<ElasticSearch实战-日志监控平台>一文来给大家分享后续的学习,在<ElasticSearch实战-日志监控平台& ...
ElasticSearch实战－编码实践
1.概述前面在<ElasticSearch实战-入门>中给大家分享如何搭建这样一个集群,在完成集群的搭建后,今天给大家分享如何实现对应的业务功能模块,下面是今天的分享内容,目录如下所示: ...
I-team 博客全文检索 Elasticsearch 实战
一直觉得博客缺点东西,最近还是发现了,当博客慢慢多起来的时候想要找一篇之前写的博客很是麻烦,于是作为后端开发的楼主觉得自己动手丰衣足食,也就有了这次博客全文检索功能Elasticsearch实战,这里 ...
ElasticSearch实战系列二: ElasticSearch的DSL语句使用教程---图文详解
前言在上一篇中介绍了ElasticSearch集群和kinaba的安装教程,本篇文章就来讲解下 ElasticSearch的DSL语句使用. ElasticSearch DSL 介绍 Elastic ...
ElasticSearch实战系列三: ElasticSearch的JAVA API使用教程
前言在上一篇中介绍了ElasticSearch实战系列二: ElasticSearch的DSL语句使用教程---图文详解,本篇文章就来讲解下 ElasticSearch 6.x官方Java API的 ...
ElasticSearch实战系列四: ElasticSearch理论知识介绍
前言在前几篇关于ElasticSearch的文章中,简单的讲了下有关ElasticSearch的一些使用,这篇文章讲一下有关 ElasticSearch的一些理论知识以及自己的一些见解. 虽然本人是 ...
ElasticSearch实战系列五: ElasticSearch的聚合查询基础使用教程之度量(Metric)聚合
Title:ElasticSearch实战系列四: ElasticSearch的聚合查询基础使用教程之度量(Metric)聚合前言在上上一篇中介绍了ElasticSearch实战系列三: Elas ...
ElasticSearch实战系列六: Logstash快速入门和实战
前言本文主要介绍的是ELK日志系统中的Logstash快速入门和实战 ELK介绍 ELK是三个开源软件的缩写,分别表示:Elasticsearch , Logstash, Kibana , 它们都是 ...

随机推荐

9.【go-kit教程】go-kit集成Prometheus
在 Go kit 中集成 Prometheus 进行 API 监控可以帮助开发人员更好地了解系统的性能和行为,提高系统的可观察性和可靠性.下面是一个简单的示例,演示如何在 Go kit 中集成 Pro ...
在真实世界中观察目标治疗策略实施1年对初诊RA患者的影响
在真实世界中观察目标治疗策略实施1年对初诊RA患者的影响 Tan AL, et al. Rheumatology 2016.Present ID: 083. 背景:制订目标治疗(T2T)建议是要将获得 ...
STM32L4 Keil ST-Link 连接失败
ST-LINK 连接失败的因素,以我个人的经历而言有两种:一个是驱动问题,一个是插线问题.连接正常的情况如下图所示,SWDIO 能显示你的设备信息: 注意使用 SW 端口,JTAG 端口导致无法识别设 ...
普冉PY32系列(六) 通过I2C接口驱动PCF8574扩展的1602LCD
目录普冉PY32系列(一) PY32F0系列32位Cortex M0+ MCU简介普冉PY32系列(二) Ubuntu GCC Toolchain和VSCode开发环境普冉PY32系列(三) P ...
cximage总括功能讲解
CxImage的功能 Constructors 构造函数 Initialization 初始化 File 文件操作,主要是编解码 Generic 图像基本变化 DSP 图像处理操作 Paintin ...
element导航栏组件封装递归调用
element导航栏组件封装递归调用: https://blog.csdn.net/qq_21271511/article/details/109889934
kali日常快捷命令（用到就更新）
什么BASH命令? 在Linux上采用bash作为标准,基本上它描述了对带有".sh"扩展名的vi编辑器等文本的处理并执行. 与编程一样,它有许多函数,如变量,函数和算术处理,所以 ...
N63050 第十五周运维作业
第二十九天: 网络文件共享服务 1基于DB数据库文件实现FTP的虚拟用户 2基于MySQL数据库文件实现FTP的虚拟用户 3NFS服务的工作原理 4NFS共享服务实现详解 5实现NFS共享存储的LAM ...
mybatis批量查询
<foreach collection="list" item="item" open="(" separator=",&q ...
Vuforial 使用小计
1. 在使用扫图功能的时候, 上传图片审核处,要根据图片真实的宽度尺寸设置宽度. 2.做物体识别时,识别的物体最好是一个长方体或正方体,这样识别度高一些. 3.如果是其它物体识别要保证物体大一些,身体 ...

Elasticsearch 实战

需求

索引设计

代码实现

源码

Elasticsearch 实战的更多相关文章

随机推荐

热门专题