原文:Elasticsearch入门教程(二):Elasticsearch核心概念

版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。

基本概念介绍

Elasticsearch是一个基于Lucene构建的开源、分布式、RESTful的搜索引擎,能够实现近实时(NRT)搜索,稳定、可靠、安装方便。Elasticsearch 不仅是一种全文索引技术,也是一种面向文档型NOSQL数据库。一个采用Restful API标准的高扩展性和高可用性的实时数据分析的全文搜索工具。

名词解释

  • Cluster(集群):一个集群就是由一个或者多个node组成在一起,共同工作,共同分享整个数据具有负载均衡的集群

    • Node(节点):单个装有Elasticsearch服务并且提供故障转移和扩展的服务器,有一种节点被称为 “协调节点”
    • Index:索引或者称为索引库,Index相当于关系型数据库的Database。
    • Type:类型,这是索引下的逻辑划分,一般把有共性的文档放到一个类型里面,相当于关系型数据库的table。
    • Document(文档):文档,一个文档是一个可以被索引的基础信息单元, Json结构,这点跟MongoDB差不多。es是分布式的,所以一个文档会被分配到不同的节点上,一个文档究竟被分配到哪个分片上是通过这个公式来计算的 shard = hash(routing) % number_of_primary_shards,其中主分片是在创建索引时设置的,routing是一个变量,一般是文档的id,也可以通过api显示指定,通过控制routing的值来控制将文档分配到指定的分片上来
    • Field(字段):Field是Elasticsearch的最小单位,相当于数据的某一类
    • Mapping: 映射,用于定义json的结构,类似于关系型数据库中建表时定义的表的结构
  • Shards(分片):分片是一个功能完整的搜索引擎,一个分片是一个Lucene的实例。一般是应用程序和索引库进行交互,索引库和分片进行交互,分片分为主分片和副本分片(只是一个主分片的拷贝,副本分片作为硬件故障时保护数据不丢失的冗余备份,并为搜索和返回文档等读操作提供服务),Elasticsearch将索引分成若干份,每个部分就是一个shard,类似于藏宝图,一张藏宝图撕成多片,所有片拼接起来才是完整的一张图。
  • Replicas(复制):Replicas是索引一份或者多份的拷贝,为了防止数据的丢失和负载均衡

一个集群包含多个节点

一个节点就是一个es实例

一个实例可以有多个分片

一个分片就是一个lucene实例

// 例如将一篇文档比喻成一张图,将一张图分成4分,允许一份复制,即第三列是第二列的复制

// 假如某个数据丢失了,可以使用复制的图片

关系型数据库和ES的类比:

关系数据库 ⇒ 数据库(Database) ⇒ 表(Table) ⇒ 行(Row) ⇒ 列(Column)

Elasticsearch ⇒ 索引(Index) ⇒ 类型(Type) ⇒ 文档(Document) ⇒ 字段(Field)

ES存储中是按照:索引index->类型type->文档document->字段field 级别层次划分的.

ES集群可以包含多个索引,每个索引可以包含多个类型,每个类型可以包含多个文档,每个文档可以包含多个字段

倒排索引 Inverted index

倒排索引被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储文字的映射

// "我爱中国" 分词如下
token start_offset end_offset type position
我 0 1 CN_CHAR 0
爱 1 2 CN_CHAR 1
中国 2 4 CN_WORD 2 // “中国你好” 分词如下
token start_offset end_offset type position
中国 0 2 CN_WORD 0
你好 2 4 CN_WORD 1 // 分词表
WordID 分词
1 我
2 爱
3 中国
4 你好 // 文档表
DocID content
1 我爱中国
2 中国你好 // 倒排索引表
WordID 分词 文档1 文档2
1 我 √
2 爱 √
3 中国 √ √
4 你好 √ 如果查询”中国“就可以知道,中国在文档1和文档2中出现了,直接返回文档1和文档2中的内容 横向:可以知道每个分词都出现在哪些文档中了
纵向:每个文档都有哪些分词
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36

我的微信公众号:

Elasticsearch入门教程(二):Elasticsearch核心概念的更多相关文章

  1. Elasticsearch入门教程(六):Elasticsearch查询(二)

    原文:Elasticsearch入门教程(六):Elasticsearch查询(二) 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:h ...

  2. Elasticsearch入门教程(四):Elasticsearch文档CURD

    原文:Elasticsearch入门教程(四):Elasticsearch文档CURD 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接: ...

  3. Elasticsearch入门教程(三):Elasticsearch索引&映射

    原文:Elasticsearch入门教程(三):Elasticsearch索引&映射 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文 ...

  4. Elasticsearch入门教程(一):Elasticsearch及插件安装

    原文:Elasticsearch入门教程(一):Elasticsearch及插件安装 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:h ...

  5. Elasticsearch入门教程(五):Elasticsearch查询(一)

    原文:Elasticsearch入门教程(五):Elasticsearch查询(一) 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:h ...

  6. RabbitMQ入门教程(二):简介和基本概念

    原文:RabbitMQ入门教程(二):简介和基本概念 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn ...

  7. JasperReports入门教程(二):中文打印

    JasperReports入门教程(二):中文打印 背景 在上一篇中我们介绍了JasperReport的基本入门,也展示了一个报表.但是我们的示例都是使用的英文,如果我们把需要打印的数据改为中文会怎么 ...

  8. 无废话ExtJs 入门教程二十一[继承:Extend]

    无废话ExtJs 入门教程二十一[继承:Extend] extjs技术交流,欢迎加群(201926085) 在开发中,我们在使用视图组件时,经常要设置宽度,高度,标题等属性.而这些属性可以通过“继承” ...

  9. 无废话ExtJs 入门教程二十[数据交互:AJAX]

    无废话ExtJs 入门教程二十[数据交互:AJAX] extjs技术交流,欢迎加群(521711109) 1.代码如下: 1 <!DOCTYPE html PUBLIC "-//W3C ...

随机推荐

  1. 使用单调队列维护决策三元组实现决策单调性优化DP的一些细节

    以[BZOJ2687]交与并为例给出代码. #include <bits/stdc++.h> #define rin(i,a,b) for(register int i=(a);i< ...

  2. R_Studio(学生成绩)绘制频率分布直方图、分布饼图、折线比较图

    对“Gary.csv”中的成绩数据进行分布分析 (1)按0-59,60-69,70-79,80-89,90-100分组绘制高级语言程序设计成绩的频率分布直方图. (2)按0-59,60-69,70-7 ...

  3. Jmeter -- 添加断言,及断言结果

    步骤: 1. 添加响应断言(添加-断言-响应断言) Add -->  Assertions --> Response Assertion 2. 配置断言 判断响应内容中,是否包含关键字“禅 ...

  4. [BZOJ2002][洛谷P3203][Hnoi2010]Bounce 弹飞绵羊(LCT维护链长)

    luogu传送门 2002: [Hnoi2010]Bounce 弹飞绵羊 Time Limit: 10 Sec  Memory Limit: 259 MBSubmit: 16082  Solved:  ...

  5. 两种建立堆的方法HeapInsert & Heapify

    参考 堆排序中两种建堆方法的比较 第一种方法HeapInsert 它可以假定我们事先不知道有多少个元素,通过不断往堆里面插入元素进行调整来构建堆. 它的大致步骤如下: 首先增加堆的长度,在最末尾的地方 ...

  6. vue下实现input实现图片上传,压缩,拼接以及旋转

    背景 作为一名前端工作人员,相信大家在开发系统的时候,经常有遇到需要这么一种需求,就是需要为用户保存上传的图片,很多小白遇到这个问题的时候,都会虎躯一震,以为会是一个棘手的问题,当你读完这篇文章的时候 ...

  7. Zookeeper(六)服务器

    Zookeeper(六)服务器 zkServer.cmd中声明 首先启动QuorumPeerMain set ZOOMAIN=org.apache.zookeeper.server.quorum.Qu ...

  8. 【python】小型神经网络的搭建

    import numpy as np def sigmoid(x): # Sigmoid activation function: f(x) = 1 / (1 + e^(-x)) return 1 / ...

  9. 类组件(Class component)和函数式组件(Functional component)之间有何不同

    类组件不仅允许你使用更多额外的功能,如组件自身的状态和生命周期钩子,也能使组件直接访问 store 并维持状态当组件仅是接收 props,并将组件自身渲染到页面时,该组件就是一个 ‘无状态组件(sta ...

  10. vue 钩子函数中获取不到DOM节点

    原文链接:https://jingyan.baidu.com/article/f96699bbfe9c9d894f3c1b4b.html 两种解决方案: 1:官方解决方案: 受到 HTML 本身的一些 ...