Elasticsearch快速入门案例

写在前面的话：读书破万卷，编码如有神
--------------------------------------------------------------------

参考内容：

　　《Elasticsearch顶尖高手系列-快速入门篇》，中华石杉

--------------------------------------------------------------------

主要内容包括：

es的document数据格式和数据库的关系型数据格式的区别
简单的集群管理
电商网站商品管理案例背景介绍
商品的CRUD操作(document 的CRUD操作 )

--------------------------------------------------------------------

1、es的document数据格式和数据库的关系型数据格式的区别

比如有如下的json:

 {

 "email":"zhangsan@sina.com",

 "first_name":"san",

 "last_name":"zhang",

 "info":{

     "bio":"curious and modest",

     "age":30,

     "interests":["bike","climb"]

     "join_date":"2017/01/01"

 }

 }

es的docuement可以直接用上面的json数据格式来表达。

但是在java中需要两个类来表达：

 public class Employee {

   private String email;

   private String firstName;

   private String lastName;

   private EmployeeInfo info;

 }

 private class EmployeeInfo {

   private String bio; // 性格

   private Integer age;

   private String[] interests; // 兴趣爱好

   private Date joinDate;

 }

可以看出employee对象里面包含了Employee类自己的属性，而且还有一个EmployeeInfo对象。

在数据库中的话，就需要两张表：employee表、employee_info表，将employee对象的数据重新拆开来，变成Employee数据和EmployeeInfo数据

employee表：email，first_name，last_name，join_date，4个字段
employee_info表：bio，age，interests，3个字段；此外还有一个外键字段，比如employee_id，关联着employee表。

我们就明白了es的document数据格式和数据库的关系型数据格式的区别：

应用系统的数据结构都是面向对象的，复杂的
对象数据存储到数据库中，只能拆解开来，变为扁平的多张表，每次查询的时候还得还原回对象格式，相当麻烦
ES是面向文档的，文档中存储的数据结构，与面向对象的数据结构是一样的，基于这种文档数据结构，es可以提供复杂的索引、全文检索、分析聚合等功能
es的document用json数据格式来表达

--------------------------------------------------------------------

2、简单的集群管理

（2.1）快速检查集群的健康状况

在Kibana中执行如下命令:　　GET _cat/health?v

 epoch      timestamp cluster                 status node.total node.data shards pri relo init unassign pending_tasks max_task_wait_time active_shards_percent

 1518657893 09:24:53  huobaopaocai-es-cluster yellow          1         1      1   1    0    0        1             0                  -                 50.0%

如何快速的了解集群的健康状态？ green、yellow、red

green: 每个索引的primary shard和replica shard都是active状态
yellow: 每个索引的primary shard都是active状态，但是部分replica shard不是active状态，处于不可用状态
red: 不是所有索引的primary shard都是active状态的，部分索引有数据丢失

为什么现在我们的是处于yellow状态？

　　我们现在就一个笔记本电脑，就启动了一个es进程，相当于就只有一个node。现在es中有一个index，就是kibana自己内置建立的index。由于默认的配置是给每个index分配5个primary shard和5个replica shard，而且primary shard和replica shard不能在同一台机器上（为了容错）。现在kibana自己建立的index是1个primary shard和1个replica shard。当前就一个node，所以只有1个primary shard被分配了和启动了，但是一个replica shard没有第二台机器去启动。

（2.2）快速查看集群中有些索引

在Kibana中执行如下命令:　　GET _cat/indices?v

 health status index   uuid                   pri rep docs.count docs.deleted store.size pri.store.size

 yellow open   .kibana CaxZ5uJGSJy3rCzv_3RIzQ   1   1          1            0      3.1kb          3.1kb

（2.3）简单的索引操作

创建索引： PUT /test_index?pretty

 {

   "acknowledged": true,

   "shards_acknowledged": true

 }

再次查看索引：

 GET _cat/indices?v

 health status index      uuid                   pri rep docs.count docs.deleted store.size pri.store.size

 yellow open   .kibana    CaxZ5uJGSJy3rCzv_3RIzQ   1   1          1            0      3.1kb          3.1kb

 yellow open   test_index i2LdlSIqRXCZQCLauVBiRw   5   1          0            0       650b           650b

删除索引： DELETE /test_index?pretty

{

  "acknowledged": true

}

再次查看索引:

 GET _cat/indices?v

 health status index   uuid                   pri rep docs.count docs.deleted store.size pri.store.size

 yellow open   .kibana CaxZ5uJGSJy3rCzv_3RIzQ   1   1          1            0      3.1kb          3.1kb

--------------------------------------------------------------------

3、电商网站商品管理案例背景介绍

有一个电商网站，需要为其基于ES构建一个后台系统，提供以下功能：

对商品信息进行CRUD操作
执行简单的结构化查询
可以执行简单的全文检索，以及复杂的phrase（短语）检索
对于全文检索的结果，可以进行高亮显示
对数据进行简单的聚合分析

--------------------------------------------------------------------

4、商品的CRUD操作(document 的CRUD操作 )

（4.1）新增商品：新增文档、建立索引

基本语法格式：

 PUT /index/type/id

 {

   "json数据"

 }

准备三条数据：

 PUT /ecommerce/product/1

 {

     "name" : "gaolujie yagao",

     "desc" :  "gaoxiao meibai",

     "price" :  30,

     "producer" :      "gaolujie producer",

     "tags": [ "meibai", "fangzhu" ]

 }

 PUT /ecommerce/product/2

 {

     "name" : "jiajieshi yagao",

     "desc" :  "youxiao fangzhu",

     "price" :  25,

     "producer" :      "jiajieshi producer",

     "tags": [ "fangzhu" ]

 }

 PUT /ecommerce/product/3

 {

     "name" : "zhonghua yagao",

     "desc" :  "caoben zhiwu",

     "price" :  40,

     "producer" :      "zhonghua producer",

     "tags": [ "qingxin" ]

 }

执行每条新增语句的结果：

 {

   "_index": "ecommerce",

   "_type": "product",

   "_id": "1",

   "_version": 1,

   "result": "created",

   "_shards": {

     "total": 2,

     "successful": 1,

     "failed": 0

   },

   "created": true

 }

(ps：es会自动建立index和type，不需要提前创建，而且es默认会对document每个field建立倒排索引，让其可以被搜索。)

用java来实现往es中添加docuemnt操作

Elasticsearch - java客户端连接

    @Autowired

    private ElasticsearchConstant elasticsearchConstant;

    /**

     * 新增es的docuemnt

     */

    @Test

    public void createDocumentTest() throws IOException {

        TransportClient client = elasticsearchConstant.getClient();

        IndexResponse response = client.prepareIndex(elasticsearchConstant.getEsIndex(), elasticsearchConstant.getEsType(),"1")

                .setSource(XContentFactory.jsonBuilder()

                        .startObject()

                        .field("name","gaolujie yagao")

                        .field("desc", "gaoxiao meibai")

                        .field("price", 30)

                        .field("producer", "gaolujie producer")

                        .endObject())

                .get();

        LOG.info(String.format("新增es的docuemnt结果: %s",response.toString()));

    }

执行结果:

2018-02-15 11:37:24  INFO [main] (EcommerceTest.java:56) createDocumentTest - 新增es的docuemnt结果: IndexResponse[index=ecommerce,type=product,id=1,version=1,result=created,shards={"total":2,"successful":1,"failed":0}]

（4.2）检索索引：检索文档

基本语法格式：

 GET /index/type/id

用java来实现查询es中docuemnt操作

Elasticsearch - java客户端连接

 @Autowired

 private ElasticsearchConstant elasticsearchConstant;

    /**

      * 查询es的document

      */

     @Test

     public void getDocumentTest() throws IOException{

         TransportClient client = elasticsearchConstant.getClient();

         GetResponse response = client.prepareGet(elasticsearchConstant.getEsIndex(), elasticsearchConstant.getEsType(), "1").get();

         LOG.info(String.format("查询es的docuemnt结果: %s",response.toString()));

     }

 执行结果:

 2018-02-15 11:42:19  INFO [main] (EcommerceTest.java:68) getDocumentTest - 查询es的docuemnt结果: {"_index":"ecommerce","_type":"product","_id":"1","_version":1,"found":true,"_source":{"name":"gaolujie yagao","desc":"gaoxiao meibai","price":30,"producer":"gaolujie producer"}}

（4.3）修改商品：替换文档

(ps:替换方式有一个不好：必须带上所有的field才能去进行信息的修改。)

（4.4）修改商品：更新文档

用java来实现编辑es中的docuement:

Elasticsearch - java客户端连接

 @Autowired

 private ElasticsearchConstant elasticsearchConstant;

     /**

      * 更新es的docuemnt

      * @throws IOException

      */

     @Test

     public void  updateDocument() throws IOException {

         TransportClient client = elasticsearchConstant.getClient();

         UpdateResponse updateResponse = client.prepareUpdate(elasticsearchConstant.getEsIndex(), elasticsearchConstant.getEsType(), "1")

                 .setDoc(jsonBuilder()

                         .startObject()

                         .field("name", "jiaqiang gaolujie yagao")

                         .endObject())

                 .get();

         LOG.info(String.format("更新es的docuemnt结果: %s",updateResponse.toString()));

     }

 运行结果:

 2018-02-15 15:55:13  INFO [main] (EcommerceTest.java:73) updateDocument - 更新es的docuemnt结果: UpdateResponse[index=ecommerce,type=product,id=1,version=2,result=updated,shards=ShardInfo{total=2, successful=1, failures=[]}]

（4.5）删除商品：删除文档

用java来实现删除es中的docuement:

Elasticsearch - java客户端连接

 @Autowired

 private ElasticsearchConstant elasticsearchConstant;

    /**

      * 删除es中的document

      */

     @Test

     public void deleteDocument(){

         TransportClient client = elasticsearchConstant.getClient();

         DeleteResponse response = client.prepareDelete(elasticsearchConstant.getEsIndex(), elasticsearchConstant.getEsType(), "1").get();

         LOG.info(String.format("删除es的docuemnt结果: %s",response.toString()));

     }

 运行结果:

 2018-02-15 16:00:04  INFO [main] (EcommerceTest.java:84) deleteDocument - 删除es的docuemnt结果: DeleteResponse[index=ecommerce,type=product,id=1,version=3,result=deleted,shards=ShardInfo{total=2, successful=1, failures=[]}]

Elasticsearch快速入门案例的更多相关文章

Part1-HttpClient快速入门案例
前言最近这段时间在学习爬虫方面的知识,接触了几个优秀的爬虫框架,也爬取了一些自己喜欢网站的信息.通过官网学习HttpClient的过程中,希望通过写此博客来巩固自己的学习,也为有需要的人提供学习帮助 ...
Elasticsearch快速入门和环境搭建
内容概述什么是Elasticsearch,为什么要使用它? 基础概念简介节点(node) 索引(index) 类型映射(mapping) 文档(doc) 本地环境搭建,创建第一个index 常用R ...
Elasticsearch学习之快速入门案例
1. document数据格式面向文档的搜索分析引擎 (1)应用系统的数据结构都是面向对象的,复杂的(2)对象数据存储到数据库中,只能拆解开来,变为扁平的多张表,每次查询的时候还得还原回对象格式,相 ...
ElasticSearch快速入门
知识储备学习ElasticSearch之前可以先了解一下lucene,这里是我整理的一篇关于lucene的笔记(传送门),对搜索框架有兴趣的还可以了解一下另一款企业级搜索应用服务器---solr(传 ...
Elasticsearch - 快速入门
Elasticsearch是基于Apache 2.0开源的实时.分布式.分析搜索引擎,相比Lucene,Elasticsearch的上手比较容易,这篇文章主要纪录Elasticsearch的基本概念和 ...
Elasticsearch 快速入门教程
面向文档应用中的对象很少只是简单的键值列表,更多时候它拥有复杂的数据结构,比如包含日期.地理位置.另一个对象或者数组. 总有一天你会想到把这些对象存储到数据库中.将这些数据保存到由行和列组成的关系数 ...
javaWeb el表达式和jstl快速入门案例
<%@page import="de.bvb.domain.Person"%> <%@page import="de.bvb.domain.Addres ...
3.1_springboot2.x检索之elasticsearch安装&快速入门
1.elasticsearch简介&安装 1.1.1.elasticsearch介绍我们的应用经常需要添加检索功能,开源的 ElasticSearch 是目前全文搜索引擎的首选.他可以快 ...
SpringBoot整合ActiveMQ快速入门
Spring Boot 具有如下特性: 为基于 Spring 的开发提供更快的入门体验开箱即用,没有代码生成,也无需 XML 配置.同时也可以修改默认值来满足特定的需求. 提供了一些大型项目中常见的 ...

随机推荐

脚本病毒分析扫描专题1-VBA代码阅读扫盲、宏病毒分析
1.Office Macor MS office宏的编程语言是Visual Basic For Applications(VBA). 微软在1994年发行的Excel5.0版本中,即具备了VBA的宏功 ...
41 - 数据库-pymysql41 - 数据库-pymysql-DBUtils
目录 1 Python操作数据库 2 安装模块 3 基本使用 3.1 创建一个连接 3.2 连接数据库 3.3 游标 3.3.1 利用游标操作数据库 3.3.2 事务管理 3.3.3 执行SQL语句 ...
Print Numbers by Recursion
Print numbers from 1 to the largest number with N digits by recursion. Notice It's pretty easy to do ...
MyEclipse中点击Deploy MyEclipse J2EE Project to Server无响应解决方法
问题: MyEclipse中点击Deploy MyEclipse J2EE Project to Server无响应解决方法: 如果工作空间的问题,那么需要删除你工作空间的一个文件就可以解决了.这个 ...
python基础--xml和configparse模块
1)XML模块 xml是实现不同语言或程序之间进行数据交换的协议,跟json差不多. 下面是xml的遍历查询删除修改和生成 # -*- coding:utf-8 -*- __author__ = 's ...
Hadoop（二）：MapReduce程序（Java）
Java版本程序开发过程主要包含三个步骤,一是map.reduce程序开发:第二是将程序编译成JAR包:第三使用Hadoop jar命令进行任务提交. 下面拿一个具体的例子进行说明,一个简单的词频统计 ...
java基础43 IO流技术（输入字节流/缓冲输入字节流）
通过File对象可以读取文件或者文件夹的属性数据,如果要读取文件的内容数据,那么我们就要使用IO技术. 一.输入字节流输入字节流的体系: -------| InputStream:所有输入字节流的 ...
JAVA复习笔记分布式篇：kafka
前言:第一次使用消息队列是在实在前年的时候,那时候还不了解kafka,用的是阿里的rocket_mq,当时觉得挺好用的,后来听原阿里的同事说rocket_mq是他们看来kafka的源码后自己开发了一套 ...
CF2B The least round way 题解
都是泪呀...↑ 题目传送门题意(直接复制了QWQ) 题目描述给定由非负整数组成的\(n \times n\)的正方形矩阵,你需要寻找一条路径: 以左上角为起点, 每次只能向右或向下走, 以右下角 ...
for循环练习--杨辉三角
package org.hanqi.zwxx; public class Yonghuisanjiao{ public static void main(String[] args) { // TOD ...

Elasticsearch快速入门案例

Elasticsearch快速入门案例的更多相关文章

随机推荐

热门专题