入门大数据---Elasticsearch搭建与应用

项目版本

构建需要：

JDK1.7
Elasticsearch2.2.1
junit4.10
log4j1.2.17
spring-context3.2.0.RELEASE
spring-core3.2.0.RELEASE
spring-beans3.2.0.RELEASE
spring-web3.2.0.RELEASE
spring-expression3.2.0.RELEASE
jstl1.2

运行需要：

JRE1.7
Tomcat8.x
Linux部署Elastisearch同开发版本一致。

一、功能简介

ElasticSearchByWeb是一个基于ElasticSearch技术开发的搜索项目。

提供了索引库的建立，数据的录入，搜索查询，web展示。

索引库效果图：

搜索效果图：

二、项目结构

├─.idea

│  ├─artifacts

│  ├─codeStyles

│  └─libraries

├─src

│  ├─main

│  │  ├─java

│  │  │  └─vip

│  │  │      └─shuai7boy

│  │  │          ├─controller （Spring MVC展示）

│  │  │          ├─model（用到的字段类）

│  │  │          ├─server（创建索引库，添加数据，搜索）

│  │  │          └─util（包括了分页工具类）

│  │  └─resources

│  └─test

│      └─java

└─web

    └─WEB-INF（项目配置）

三、Elasticsearch服务搭建

要想使用代码操作ES，必须先把ES服务器搭建起来。

这里准备了三台服务器node1，node2，node3练手。

上传文件

先将Elasticsearch2.2.1下载好的文件上传到node1下面的/opt/elasticsearch目录下。
创建用户

创建一个新的Linux用户，名称随意，我这里取名ryj（ES为了安全，不能直接使用root用户运行）。

切换到新创建的用户，解压文件。
```
su ryj

tar xxx.tar.gz
```

修改配置

进入到/config 修改elasticsearch.yml

cluster.name: ryj-es #设置集群名称

node.name: node1 #设置节点名称（一会分发到其它服务器记得修改）

network.host: 192.168.40.200 #设置服务器地址（一会分发到其它服务器记得修改）

http.port: 9200 #放开端口

#下面是防止脑裂部分

discovery.zen.ping.multicast.enabled: false

discovery.zen.ping.unicast.hosts: ["192.168.40.200:9300", "192.168.40.201:9300","192.168.40.202:9300"]

discovery.zen.ping_timeout: 120s

client.transport.ping_timeout: 60s

修改完后保存。

添加插件

在项目下创建plugins目录
- 将head插件放入plugins目录（提供词库浏览的web ui）
- 将ik插件放入plugins目录（提供中文分词）

修改完后分发到另外两台服务器

scp -r xxx ryj@node2:`pwd`

scp -r xxx ryj@node3:`pwd`

启动

在启动之前要确保都要切换到上面新创建的Linux用户下。
```
./bin/elasticsearch
```
浏览

测试每个节点是否启动成功使用9200端口，例如： http://node1:9200/

浏览分词库在上面的基础上加_plugin/head/，例如：http://node1:9200/_plugin/head/

上面的都正常无误后，接下来就是运行项目构建索引库操作了。

进入vip.shuai7boy.serve.IndexServer 下运行createIndex构建索引库。

进入vip.shuai7boy.serve.IndexServer 下运行addHtmlToES添加数据。

启动Tomcat进行搜索。

项目开源地址

系列传送门

入门大数据---Elasticsearch搭建与应用的更多相关文章

入门大数据---Elasticsearch是什么？
Elasticsearch是谁不重要,重要的是咱们都知道百度,谷歌这样的搜索巨头吧.它们的核心技术都利用了Elasticsearch,所以我们有必要对Elasticsearch了解下! 1.Elast ...
入门大数据---HDFS-HA搭建
一.简述上一篇了解了Zookeeper和HDFS的一些概念,今天就带大家从头到尾搭建一下,其中遇到的一些坑也顺便记录下. 1.1 搭建的拓扑图如下: 1.2 部署环境:Centos3.1,java1 ...
入门大数据---Storm搭建与应用
1.Storm在Linux环境配置主机名 tuge1 tuge2 tuge3 部署环境 Zookeeper/Nimbus Zookeeper/Supervisor Zookeeper/Supervi ...
入门大数据---Hbase搭建
环境介绍 tuge1 tuge2 tuge3 tuge4 NameNode NameNode DataNode DataNode ZooKeeper ZooKeeper ZooKeeper ZooKe ...
入门大数据---Kylin搭建与应用
由于Kylin官网已经是中文的了,而且写的很详细,这里就不再重述. 学习右转即可. 这里说个遇到的问题,当在Kylin使用SQL关键字时,要加上双引号,并且里面的内容要大写,这个和MySql有点区别需 ...
大数据平台搭建（hadoop+spark）
大数据平台搭建(hadoop+spark) 一.基本信息 1. 服务器基本信息主机名 ip地址安装服务 spark-master 172.16.200.81 jdk.hadoop.spark.sc ...
入门大数据---Flink学习总括
第一节初识 Flink 在数据激增的时代,催生出了一批计算框架.最早期比较流行的有MapReduce,然后有Spark,直到现在越来越多的公司采用Flink处理.Flink相对前两个框架真正做到了高 ...
大数据平台搭建-zookeeper集群的搭建
本系列文章主要阐述大数据计算平台相关框架的搭建,包括如下内容: 基础环境安装 zookeeper集群的搭建 kafka集群的搭建 hadoop/hbase集群的搭建 spark集群的搭建 flink集 ...
大数据平台搭建-kafka集群的搭建
本系列文章主要阐述大数据计算平台相关框架的搭建,包括如下内容: 基础环境安装 zookeeper集群的搭建 kafka集群的搭建 hadoop/hbase集群的搭建 spark集群的搭建 flink集 ...

随机推荐

点击label时text输入框被选中
当点击label标签时,能够选中与其对应的输入框,有2种方式,采用第一种时会产生太多的id,推荐第二种. <form action="03.php"> <labe ...
使用锚点定位不改变url同时平滑的滑动到锚点位置，不会生硬的直接到锚点位置
使用锚点定位不改变url同时平滑的滑动到锚点位置,不会生硬的直接到锚点位置对前端来说锚点是一个很好用的技术,它能快速定位到预先埋好的位置. 但是美中不足的是它会改变请求地址url,当用户使用了锚点的 ...
Java实现蓝桥杯算法训练字符串长度（IO无敌）
试题算法训练字符串长度问题描述输入一个字符串,输出其长度. 输入格式输入一个字符串输出格式输出字符串长度样例输入一个满足题目要求的输入范例. HelloWorld 样例输出 10 数 ...
（Java实现）删数问题
删数问题(需知道的数学定理) 给定n位正整数a,去掉其中任意k≤n 个数字后,剩下的数字按原次序排列组成一个新的正整数.对于给定的n位正整数a和正整数 k,设计一个算法找出剩下数字组成的新数最小的 ...
Java实现蓝桥杯VIP 算法训练最大值与最小值的计算
输入11个整数,计算它们的最大值和最小值. 样例输入 0 1 2 3 4 5 6 7 8 9 10 样例输出 10 0 import java.util.Scanner; public class 最 ...
本地存储 localStorage
本地存储localStorage 概念:window对象下面的属性,html5新增的,将5M大小的数据存储本地的浏览器上面. 浏览器支持存储5M大小本地存储localStorage特点本地存储属于 ...
【译】Introducing YARP Preview 1
1 YARP YARP是一个项目,用于创建反向代理服务器.它开始于我们注意到来自微软内部团队的一系列问题.他们要么为其服务构建反向代理,要么询问 API 和用于构建 API 的技术.因此我们决定让他们 ...
（四）进行HTTPS请求并进行(或不进行)证书校验(示例)
原文:https://blog.csdn.net/justry_deng/article/details/81042379 相关方法详情(非完美封装): /** * 根据是否是https请求,获取Ht ...
Django自定义500的错误显示信息
这个方法应该对Django version 2.2.4以后的版本都有效,因为我的项目是这个版本,其他版本我并没有测试. 首先找到Django的exception.py文件路径: C:\python_ ...
python生成批量格式化字符串
在学习tensorflow管道化有关操作时,有一个操作是先生成一个文件名队列.在书上使用了这样的代码: filenames = ['test%d.txt'%i for in in range(1,4) ...