【ELK学习】初识ElasticSearch

ES（elasticsearch) 是一个高可扩展的、开源的全文检索和分析引擎，它允许你存储、检索、分析海量数据，以一种快到近乎实时的速度。

ES用例场景：

　　使用ES存储商品目录、清单，提供检索、输入提示的服务。

　　使用ES收集日志或交易数据，且你想分析和挖掘这些数据来查看趋势、统计、总览和异常。可以使用Logstash来收集、聚合并且解析你的数据，然后将数据喂给ES，然后你就可以在ES中运行检索和聚合来挖掘任何你感兴趣的信息。

　　使用ES用于分析和商业智能的需求，可以快速调研、分析、可视化以及基于大数据即时提问。使用Kibana构建自定义的面板可以可视化你的数据切面，以不同的角度。

基本概念

　　NRT：几乎实时，指：从你索引一个文档的时间到它可以检索到的时间的延时（通常一秒）。

　　Cluster：集群，是一个或者多个节点（服务器）的集合。它们持有所有的数据，并且提供跨所有节点来联合索引和检索能力，一个集群默认有一个唯一的名字为“elasticsearch”，这个名字很重要，因为一个节点只能是集群的一部分，如果该节点通过它的名字设置加入集群。

　　Node：节点，是一个服务器，一个集群的一部分，存储数据，参与集群的索引和搜索能力。节点也有名字，默认是随机的UUID，可以自定义。一个节点可以配置加入一个指定的集群名，默认地，每隔节点被设置加入一个名为“elasticsearch”的集群，意味着，如果你在网络中启动多个节点（假设这些节点网络互通），它们会自动地形成一个集群（elasticsearch）。在单个节点，你可以想要多少就有多个节点，此外，如果没有其他elasticsearch节点在网络中，启动单个节点会自动形成一个集群（elasticsearch），该集群有一个节点。

　　Index：索引，是有某种程度相似特征的文档的集合。你可以有客户数据的索引，产品目录的索引，甚至其他数据的索引。一个索引有一个名字（全小写）。当执行索引、检索、更新、删除操作时，这个名字被用来引用索引。在单个集群中，你可以定义多个索引。

　　Document：文档，是可以被索引的信息的基本单元。文档被描述为JSON结构，这是一种普遍使用的互联网数据交换格式。虽然文档是物理驻留在索引中，一个文档实际上必须被索引/分配到索引中的一个类型中。

　　分片和复制：单个索引可能存储大量的数据，以至于超过单机的存储能力。例如十亿文档占据1TB的磁盘空间可能不太适合单机节点，或者也可能太慢以至于不能从单节点服务请求。为了解决这个问题，elasticsearch提供了分解索引为多个分片，当你创建一个索引你可以简单的定义分片的数量，每个碎片本身都是一个完全有效的、独立的“索引”，可以托管在集群中的任何节点。

　　分片是很重要的，有俩个主要原因：它允许你水平分割/扩展你的内容卷积；它允许你跨分片（可能在多个节点上）分发和并行化操作，以此提高性能和吞吐量。

一个分片是如何分发，以及它的文档是如何被聚合到检索请求的机制是完全由Elasticsearch管理，并对用户透明的。

　　在一个网络或云环境中，失败是随时可能发生的，高度推荐有一个故障转移机制以免单个分片或者节点下线或者消失（因某种原因），因此Elasticsearch允许你制作你的索引的一个或者多个拷贝，它被称之为“复制分片”，或者简单称之为“复制”。

　　复制是很重要的，有俩个主要原因：它提供了高可用性，以免分片或者节点失败，因此，需要注意一个复制分片不会和主分片分配到同一个节点，复制分片从主分片复制数据。它允许你扩展搜索卷和吞吐量，因为检索可以在所有复制分片上并发的执行。

　　总而言之，每个索引可以被分割成多个分片，每个索引也可以复制0次或多次。一旦复制，每个索引会有主分片（被复制的原始分片）和复制分片（主分片的拷贝）。分片和复制的数量在索引创建的时候定义，在创建之后你可以任意时刻动态修改，使用_shrink和_split apis改变已存在索引的分片数量。这个任务很重，预先规划好分片数量才是最佳办法。默认地，Elasticsearch中每个索引都分配了5个主分片和一个复制，意味着，如果你至少有俩个节点在集群中，你的索引会有五个主分片，以及另外五个复制分片（1个完全复制），总共每个索引十个分片。

注意：每个 Elasticsearch shard 是一个 Lucene index. 单个Lucene索引有最大文档数量。依据 LUCENE-5843, 文档数量限制为 2,147,483,519 (= Integer.MAX_VALUE - 128) documents. You can monitor shard sizes using the _cat/shards API.

【ELK学习】初识ElasticSearch的更多相关文章

ELK 学习笔记之 elasticsearch环境搭建
ELK概述: ElasticSearch是个开源分布式搜索引擎,它的特点有:分布式,零配置,自动发现,索引自动分片,索引副本机制,restful风格接口,多数据源,自动搜索负载等 Logstash是一 ...
ELK系列(1) - Elasticsearch + Logstash + Kibana + Log4j2快速入门与搭建用例
前言最近公司分了个ELK相关的任务给我,在一边学习一边工作之余,总结下这些天来的学习历程和踩坑记录. 首先介绍下使用ELK的项目背景:在项目的数据库里有个表用来存储消息队列的消费日志,这些日志用于开 ...
Elasticsearch系列---初识Elasticsearch
Elasticsearch是什么? Elasticsearch简称ES,是一个基于Lucene构建的开源.分布式.Restful接口的全文搜索引擎,还是一个分布式文档数据库.天生就是分布式.高可用.可 ...
ELK初学搭建(elasticsearch)
ELK初学搭建(elasticsearch) elasticsearch logstash kibana ELK初学搭建 elasticsearch 1.环境准备 centos6.8_64 mini ...
ELK 架构之 Elasticsearch、Kibana、Logstash 和 Filebeat 安装配置汇总（6.2.4 版本）
相关文章: ELK 架构之 Elasticsearch 和 Kibana 安装配置 ELK 架构之 Logstash 和 Filebeat 安装配置 ELK 架构之 Logstash 和 Filebe ...
ELK学习笔记（一）安装Elasticsearch、Kibana、Logstash和X-Pack
最近在学习ELK的时候踩了不少的坑,特此写个笔记记录下学习过程. 日志主要包括系统日志.应用程序日志和安全日志.系统运维和开发人员可以通过日志了解服务器软硬件信息.检查配置过程中的错误及错误发生的原因 ...
ELK学习记录二：elasticsearch、logstash及kibana的安装与配置
注意事项: 1.ELK版本要求5.X以上,本人使用版本:elasticsearch-6.0.0.kibana-6.0.0-linux-x86_64.logstash-6.0.0.tar 2.Elast ...
ELK学习记录一：初识ELK
ELK是elastic公司提供的一套完整的收集日志并分析展示的产品,分别表示Elasticsearch.Logstash和kibana. (官网截个图) 先来一段个人粗浅的认识: Elasticsea ...
ELK学习实验002：Elasticsearch介绍及单机安装
一简介 ElasticSearch是一个基于Luncene的搜索服务器.它提供了一个分布式多用户能力全文搜索引擎,基于RESTful web接口,ElsticSearch使用Java开发的,并作为A ...

随机推荐

【6.28校内test】T1 Jelly的难题1
Jelly的难题[题目链接] 废话一句:今天中考出成绩,感觉大家考的都超级棒,不管怎样,愿大家成为最好的自己. 好了废话完了,下面是题解部分: SOLUTION: 首先你可能发生的,是看不懂题: 定睛 ...
【7.9校内test】T2 极值问题
这个题真的,毫无思路的说,但是我们会打表啊: lz的打表之路: 当然是手写一个暴力啦(*^▽^*)! 然后滚去配置lemon测试一下暴力可以得多少分qwq: 是的40分呢! 然后其实看上面也能看出来一 ...
C++中组合和继承的概念及意义
1,继承在面向对象中具有举足轻重的地位,面向对象当中的很多高级技术都和继承是息息相关的,比如面向对象的高端课程<设计模式>中的每一种技术都和继承有关,因此我们非常有必要在学习 C++ 时, ...
loj 2778「BalticOI 2018」基因工程
loj luogu 这题和NOI那道向量内积一个套路首先考虑求两行的不同元素个数,可以转化成一个行向量\(a\)和列向量\(b\)相乘得到一个值.如果只有\(A,C\)两种字符,那么令对应权值\(A ...
如何把maven文件pom.xml中的java包下载下来
右击pom.xml文件,选择Run As-->Maven build- 在打开的页面中,如图输入"dependency:copy-dependencies",后点击" ...
java软件设计模式只单例设计模式
概述设计模式(Design pattern)是一套被反复使用.多数人知晓的.经过分类编目的.代码设计经验的总结.使用设计模式是为了可重用代码.让代码更容易被他人理解.保证代码可靠性. 毫无疑问,设计 ...
Python操作Redis，你要的都在这了！
Redis是一个基于内存的高效的键值型非关系型数据库,存取效率极高,而且支持多种存储数据结构,使用也非常简单.本节中,我们就来介绍一下Python的Redis操作,主要介绍RedisPy这个库的用法. ...
python-装饰器1
python-装饰器1 定义本质就是函数,(装饰其他函数)就是为其他函数添加附加功能原则:1.不能修改被装饰的函数的源代码2.不能修改被装饰的函数的调用方式 def logger(): print(' ...
新手的Linux zcat命令示例
Zcat是一个命令行实用程序,用于查看压缩文件的内容.它将压缩文件扩展为标准输出,允许您查看内容. 分类:Linux命令操作系统 2018-08-13 00:00:00 通常,使用gzip压缩的文件可 ...
三台mysql5.7服务器互作主从配置案例
一.架构三台msyql服务器221,222,223,每台服务器开两个实例,3306作为主库,3307作为另外一台服务器的从库二.每台服务器安装双实例参照:https://www.cnblogs. ...

【ELK学习】初识ElasticSearch

【ELK学习】初识ElasticSearch的更多相关文章

随机推荐

热门专题