【Elasticsearch学习之一】Elasticsearch
环境
虚拟机:VMware 10
Linux版本:CentOS-6.5-x86_64
客户端:Xshell4
FTP:Xftp4
jdk8
一、概念
ElasticSearch:
基于Lucene全文搜索框架;
实时的高扩展的分布式的开源搜索引擎;
Java开发,基于RESTful web接口;
Lucene是一个全文搜索框架,而不是应用产品。核心工作就是给搜索内容定位,使用方式:倒排索引。
何为倒排索引?
举个例子:有个文档,文档有以下两行数据
我是中国人(1)
中国是全球人口最多的国家,中国人也最多(2)
索引如下:
1,我 (1:1){0}:(第1行:出现1次){偏移量0}
2,中国 (1:1) {2},(2:2){0,15}:(第1行:出现1次){偏移量2},(第2行:出现2次){偏移量0和15}
输入源:对于要处理的数据,可以是文本文件,可以是数据库数据,也可以网页,我们将其抽象为Document文档,文档里可以定义多个Field,比如context、size、path等等,每个field都会设置三个设置:是否保存、是否分词、是否索引;
分词处理:根据设置,进行过滤,分词
倒排索引:根据设置,进行索引
存储:根据设置,对于需要保存的数据进行保存,比如文档路径;
ES和关系型数据库的数据对比:
二、ES集群搭建
方案
PCS101 196.168.123.101
PCS101 196.168.123.102
PCS101 196.168.123.103
java版本要求:最低1.7
第一步:创建ES运行用户,ES不允许使用root运行
#创建用户
[root@PCS101 ~]# useradd cluster
#设置用户密码
[root@PCS101 ~]# echo | passwd --stdin cluster
#root创建目录 root 用户创建 /opt/cluster/es(普通用户无法创建)
[root@PCS101 ~]# mkdir -p /opt/cluster/es (注意:此时的目录权限属于root)
#目录权限赋给新用户
在父目录cluster下执行: chown cluster:cluster es
第二步:上传elasticsearch-2.2.1.zip至/usr/local/src
#切换用户 使用cluster用户解压elasticsearch-2.2.1.zip包至es目录,保证es文件属于用户cluster:
[root@PCS101 src]# su cluster
[cluster@PCS101 src]$ unzip /usr/local/src/elasticsearch-2.2..zip -d /opt/cluster/es
第三步:修改配置文件
[cluster@PCS101 es]$ cd /opt/cluster/es/elasticsearch-2.2./config && ll
total
-rw-rw-r--. cluster cluster Jan elasticsearch.yml
-rw-rw-r--. cluster cluster Jan logging.yml
[cluster@PCS101 config]$ vi elasticsearch.yml
修改:
---------------cluster-------------------------
cluster.name: wjy-es
----------------node-------------------------------
node.name: PCS101 (分发后各节点修改)
----------------network--------------------------------
network.host: 196.168.123.101 (分发后修改)
http.port: (放开) #末尾增加防脑裂:
#关闭多播模式 来一台加一台
discovery.zen.ping.multicast.enabled: false
#按照自定义节点清单设置集群
discovery.zen.ping.unicast.hosts: ["196.168.123.101","196.168.123.102", "196.168.123.103"]
discovery.zen.ping_timeout: 120s
client.transport.ping_timeout: 60s
分发另外两个节点:
[cluster@PCS101 es]$ scp -r ./elasticsearch-2.2./ cluster@PCS102:`pwd`
[cluster@PCS101 es]$ scp -r ./elasticsearch-2.2./ cluster@PCS103:`pwd`
第四步:启动(ES启动比较慢)
#正常打印日志启动
[cluster@PCS101 bin]$ /opt/cluster/es/elasticsearch-2.2./bin/elasticsearch
#后台运行
[cluster@PCS101 bin]$ /opt/cluster/es/elasticsearch-2.2./bin/elasticsearch -d
验证:
[cluster@PCS101 ~]$ jps
Jps
Elasticsearch
访问三个节点,默认返回的是json串
http://196.168.123.101:9200
http://196.168.123.102:9200
http://196.168.123.103:9200
三、插件
上面访问返回的是json串,不太友好,这里安装图形可视化插件head,重启
第一步:ftp上传head插件包 拷贝至/opt/cluster/es/elasticsearch-2.2.1/下面
[root@PCS101 bin]$ cp -abr /usr/local/src/plugins/ /opt/cluster/es/elasticsearch-2.2./
[root@PCS101 bin]$ cd /opt/cluster/es/elasticsearch-2.2./plugins && chown -R cluster:cluster head
分发至102、103:
[root@PCS101 bin]$ su cluster && cd /opt/cluster/es/elasticsearch-2.2./plugins
[cluster@PCS101 plugins]$ scp -r ./head/ cluster@PCS102:`pwd`
[cluster@PCS101 plugins]$ scp -r ./head/ cluster@PCS103:`pwd`
第二步:重启
[cluster@PCS101 bin]$ /opt/cluster/es/elasticsearch-2.2./bin/elasticsearch -d
验证:
http://196.168.101:9200/_plugin/head?pretty
http://196.168.123.102:9200/_plugin/head?pretty
http://196.168.123.103:9200/_plugin/head?pretty
其他站点插件(以网页形式展现)
BigDesk Plugin (作者 Lukáš Vlček)
简介:这个主要提供的是节点的实时状态监控,包括jvm的情况,linux的情况,elasticsearch的情况
安装bin/plugin install lukas-vlcek/bigdesk
删除bin/plugin remove bigdesk
http://IP:9200/_plugin/bigdesk/
http://ip:9200/_cluster/state?pretty
Paramedic Plugin (作者 Karel Minařík)
简介:es监控插件
SegmentSpy Plugin (作者 Zachary Tong)
简介:查看es索引segment状态的插件
Inquisitor Plugin (作者 Zachary Tong)
简介:这个插件主要用来调试你的查询。
官网文档
elasticsearch详解
Elasticsearch实战干货
Lucene介绍与入门使用
196.168
【Elasticsearch学习之一】Elasticsearch的更多相关文章
- Elasticsearch学习之ElasticSearch 5.0.0 安装部署常见错误或问题
ElasticSearch 5.0.0 安装部署常见错误或问题 问题一: [--06T16::,][WARN ][o.e.b.JNANatives ] unable to install syscal ...
- Elasticsearch学习(5) Elasticsearch+logstash +filebeat+log4j的日志系统
最近需要使用Elasticsearch做一个日志系统,本文只介绍log4j内容同步到Elasticsearch,至于日志的查询和分类,会在后面介绍. 一.配置并打开Elasticsearch 这个操作 ...
- Elasticsearch 学习笔记 Elasticsearch及Elasticsearch head安装配置
一.安装与配置 1.到官网下载Elasticsearch,https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-5.6. ...
- ElasticSearch学习笔记-01 简介、安装、配置与核心概念
一.简介 ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎.设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便.支持通过HTTP使用JSON进 ...
- Elasticsearch学习随笔(一)--原理理解与5.0核心插件部署过程
最近由于要涉及一些安全运维的工作,最近在研究Elasticsearch,为ELK做相关的准备.于是把自己学习的一些随笔分享给大家,进行学习,在部署常用插件的时候由于是5.0版本的Elasticsear ...
- ElasticSearch 学习记录之ES几种常见的聚合操作
ES几种常见的聚合操作 普通聚合 POST /product/_search { "size": 0, "aggs": { "agg_city&quo ...
- ElasticSearch 学习记录之ES短语匹配基本用法
短语匹配 短语匹配故名思意就是对分词后的短语就是匹配,而不是仅仅对单独的单词进行匹配 下面就是根据下面的脚本例子来看整个短语匹配的有哪些作用和优点 GET /my_index/my_type/_sea ...
- ElasticSearch 学习记录之 分布式文档存储往ES中存数据和取数据的原理
分布式文档存储 ES分布式特性 屏蔽了分布式系统的复杂性 集群内的原理 垂直扩容和水平扩容 真正的扩容能力是来自于水平扩容–为集群添加更多的节点,并且将负载压力和稳定性分散到这些节点中 ES集群特点 ...
- ElasticSearch 学习记录之如任何设计可扩容的索引结构
扩容设计 扩容的单元 一个分片即一个 Lucene 索引 ,一个 Elasticsearch 索引即一系列分片的集合 一个分片即为 扩容的单元 . 一个最小的索引拥有一个分片. 一个只有一个分片的索引 ...
- ElasticSearch 学习记录之ES高亮搜索
高亮搜索 ES 通过在查询的时候可以在查询之后的字段数据加上html 标签字段,使文档在在web 界面上显示的时候是由颜色或者字体格式的 GET /product/_search { "si ...
随机推荐
- 知乎改版api接口之scrapy自动登陆
最近使用scrapy模拟登陆知乎,发现所有接口都发生变化了,包括验证码也发生了很大变化,通过抓包分析,记录下改版后的知乎模拟登陆,废话不多说,直接上代码,亲测有效 # -*- coding: utf- ...
- linux配置IP访问权限
允许访问vi /etc/hosts.allow添加(可以添加多行,其中“:allow”可以省率)sshd:192.168.81.*:allow #表示192.1 ...
- Dubbo服务化框架使用整理
一.垂直应用架构拆分 在应用架构的演进过程中,垂直应用架构因为开发便捷,学习成本低,对于实现业务功能的增删改查提供了高效的开发支持,有利于前期业务高速发展的的快速实现.但是随着系统业务功能的不断扩展和 ...
- Linux ifconfig 命令
在centos6 自带ifconfig 在centos7 默认不带ifconfig,需要自己安装 ifconfig命令用来配置或查看网卡接口,常见用法如下: 安装ifconfig命令 [root@my ...
- what's the 回撤
什么是“回撤”? “回撤”是个谓语,前面隐含了一个主语.一般来说,没有人说“亏损回撤”的,我们说的“回撤”,通常指“股价回撤”.“市值回撤”.“净值回撤”和“盈利回撤”. “股价回撤”是针对个股的,即 ...
- 火币网API文档——WebSocket API简介
WebSocket API简介 WebSocket协议是基于TCP的一种新的网络协议.它实现了客户端与服务器之间在单个 tcp 连接上的全双工通信,由服务器主动发送信息给客户端,减少了频繁的身份验证等 ...
- HBase单机模式安装
第一部分 安装前准备 1.安装hadoop 今天刚刚学了hbase的一点基础,准备安装Hbase实际操练一下.因为安装hbase的前提条件是已经成功安装了hadoop,而且hadoop的版本要和hba ...
- sublime使用手册
1.怎么批量选中开头和结尾?将光标定位到区域的开头,ctrl+alt+下键(一直按下键). 2.怎么打开和关闭tab的自动补全?preferences->settings->User{ & ...
- MySQL大表优化方案 Mysql的row_format(fixed与dynamic)
转自:https://mp.weixin.qq.com/s/VY69wWlrVLjRtKU7ULrYGw 当MySQL单表记录数过大时,增删改查性能都会急剧下降,可以参考以下步骤来优化: 单表优化 除 ...
- python变量交换及注释种类,注释注意事项/注释排查方法
#小练习作业 # texe1 = '能提笔安天下' # print(texe1) # string1 = '武能上' # string2 = '定乾坤' # print(string1,string2 ...