ElasticSearch7.10.0入门学习
ElasticSearch完成最关键的一个功能就是 大数据搜索
官网:https://www.elastic.co/cn/elasticsearch/
简介
Elasticsearch 是一个分布式全文检索引擎
Lucene、Solr、ElasticSearch
- Lucene
- 是一套信息搜索工具jar包
- 包括了:索引结构、读写索引的工具、排序、搜索规则等等工具类
- 注意:不包括搜索引擎系统
- Solr
- 是基于Lucene做了一些封装和增强
- 通过对外提供Web-service的API接口
- ElasticSearch
- 是基于Lucene做了一些封装和增强
- 通过简单的Restful来隐藏Lucene的复杂性
安装
windows安装es
环境:jdk1.8及以上
在官网中可以进行下载,但是因为是外网,速度是极其的慢。而且可能安装失败,所以我们可以通过官网找到你要下载的版本,然后通过华为云镜像去下载。(下方链接)
ElasticSearch: https://mirrors.huaweicloud.com/elasticsearch/?C=N&O=D
在windows上安装es,很方便解压即可使用
解压的目录结构如下
bin 启动文件
config 配置文件
log4j 日志配置文件
jvm.options java虚拟机相关配置
elasticsearch.yml es配置文件 默认:9200端口
lib 相关jar包
log 日志
modules 功能模块
plugins 插件 比如ik分词器
启动
双击bin\elasticsearch.bat
在网页中就可以访问 http://localhost:9200/
安装可视化界面 elasticsearch-head
除了下面的安装方法,你也可以在谷歌浏览器中安装插件elasticsearch head
环境:nodejs
下载地址:https://github.com/mobz/elasticsearch-head
下载完成后,尽量将ElasticSearch相关工具放在统一目录下
cd elasticsearch-head #到路径下
npm install -g nrm #全局安装nrm 如果没有安装过安装一下
nrm use taobao #切换镜像
npm install #安装依赖
npm run start #启动项目
启动
在网页中就可以访问 http://localhost:9200/
但是,出现了跨域问题
在elasticsearch.yml
文件中配置,解决跨域。注意由于yml的格式问题,冒号后面需要加空格。
修改好配置文件之后重新启动elasticsearch
http.cors.enabled: true
http.cors.allow-origin: "*"
安装kibana
kibana可以将elasticsearch的数据通过友好的界面展示出来,提供实时的分析功能。
官网下载慢,和elasticsearch一样的解决方法,华为云镜像:https://mirrors.huaweicloud.com/kibana/?C=N&O=D
注意:需要保证版本和elasticsearch的版本一致
下载完成后,尽量将ElasticSearch相关工具放在统一目录下
启动
双击bin目录下的kibana.bat
如果说,你在英文方面不太擅长,kibana是支持汉化的
编辑器打开kibana解压目录/config/kibana.yml
,添加如下,然后冲洗kibana
i18n.locale: "zh-CN"
直接修改配置就可以实现汉化的原因是在kibana-7.10.0-windows-x86_64\x-pack\plugins\translations\translations
中存在了zh-CN.json
ES核心概念
elasticsearch是面向文档。一切都是json。
传统的关系型数据库和elasticsearch进行对比
DB | ElasticSearch |
---|---|
数据库 database | 索引 indices |
表 tables | types |
行 rows | 文档 documents |
字段 columns | fields |
elasticsearch中可以包含多个索引(数据库),每个索引中可以包含多个类型(表),每个类型下又包含多个文档(行),每个文档中又包含多个字段(列)。
IK分词器
分词:即把一段中文或者别的划分成一个个的关键字,默认的中文分词是将每个字看成一个词(不使用用IK分词器的情况下)。但是,这显然是不符合要求的,所以我们需要安装中文分词器ik来解决这个问题。
IK提供了两个分词算法: ik_smart
和ik_max_word
,其中ik_smart
为最少切分, ik_max_word
为最细粒度划分!
下载
版本要与ElasticSearch版本对应
下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases
安装
加压即可(但是我们需要解压到ElasticSearch的plugins目录下),然后压缩包进行删除
重启elasticsearch,可以看到加载了插件
测试
使用kibana的开发工具进行测试,注意:kibana开发工具执行的时候,需要将鼠标选中当前行,然后点击运行
从上面的例子中,感觉分词都比较正常,但是大多数,分词都满足不了我们的想法,如下例
那么,我们需要手动将该词添加到分词器的词典当中
添加自定义的词添加到扩展字典中
elasticsearch目录/plugins/elasticsearch-analysis-ik-7.10.0/config/IKAnalyzer.cfg.xml
我们会看到下面的内容
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict"></entry>
<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords"></entry>
<!--用户可以在这里配置远程扩展字典 -->
<!-- <entry key="remote_ext_dict">words_location</entry> -->
<!--用户可以在这里配置远程扩展停止词字典-->
<!-- <entry key="remote_ext_stopwords">words_location</entry> -->
</properties>
将扩展字典进行修改,然后在和IKAnalyzer.cfg.xml
的相同目录下,新建一个my.dic
,添加字典
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict">my.dic</entry>
重启ElasticSearch,再次使用kibana测试
可以看到加载了my.dic
Rest风格
基本Rest命令说明
method | url地址 | 描述 |
---|---|---|
PUT(创建,修改) | localhost:9200/索引名称/类型名称/文档id | 创建文档(指定文档id) |
POST(创建) | localhost:9200/索引名称/类型名称 | 创建文档(随机文档id) |
POST(修改) | localhost:9200/索引名称/类型名称/文档id/_update | 修改文档 |
DELETE(删除) | localhost:9200/索引名称/类型名称/文档id | 删除文档 |
GET(查询) | localhost:9200/索引名称/类型名称/文档id | 查询文档通过文档ID |
POST(查询) | localhost:9200/索引名称/类型名称/文档id/_search | 查询所有数据 |
基本操作
1、创建一个索引,添加
PUT /test1/type1/1
{
"name":"DJ同学",
"age":22
}
2、字段数据类型
- 字符串类型:text、keyword
- 数值型:long、Integer、short、byte、double、float、half float、scaled float
- 日期类型:date
- 布尔类型:boolean
- 二进制类型:binary
- ...
3、指定字段的类型(使用PUT)
类似于建库(建立索引和字段对应类型),也可看做规则的建立
PUT /test2
{
"mappings":{
"properties":{
"name":{
"type":"text"
},
"age":{
"type":"long"
},
"birthday":{
"type":"date"
}
}
}
}
4、获取3建立的规则
GET test2
5、获取默认信息
_doc
默认类型(default type),type 在未来的版本中会逐渐弃用,因此产生一个默认类型进行代替
PUT /test3/_doc/1
{
"name":"DJ同学",
"age":22,
"birthday":"2021-01-01"
}
GET test3
7、删除
删除索引 DELETE /索引名/~类型名~/文档id
根据需求来判断是删除索引还是删除文档记录!
DELETE test1
8、新增数据
PUT /test4/user/1
{
"name":"张三",
"grade":"大一"
}
9、修改数据
你可以使用put的创建命令,直接覆盖。下面提供了最新的修改方法
POST /test4/user/3/_update
{
"doc":{
"name":"赵四"
}
}
10、简单查询数据
GET /test4/user/2
GET /test4/user/_search?q=name:"张三"
11、复杂的查询select(排序,分页,高亮,模糊查询,精准查询)
test4索引中的内容如下
查询匹配
- sort 只能用于数字类型,而且所有的score会变成null
- _source 过滤字段,默认显示所有字段
GET /test4/user/_search
{
"query":{
"match": {
"name":"三三"
}
}
,"_source": ["name","desc"]
,"sort":[
{
"age":{
"order":"asc"
}
}]
,"from": 0
,"size": 1
}
多条件查询(bool)
must
相当于and
should
相当于or
must_not
相当于not (... and ...)
filter
过滤
GET /test4/user/_search
{
"query":{
"bool":{
"must":[
{
"match":{
"name":"三"
}
}
,
{
"match":{
"age":9
}
}
]
}
}
}
GET /test4/user/_search
{
"query":{
"bool":{
"must":[
{
"match":{
"name":"三"
}
}
]
,"filter":{
"range": {
"age": {
"gte": 0,
"lte": 20
}
}
}
}
}
}
精确查询
term
直接通过 倒排索引 指定词条查询- 适合查询 number、date、keyword ,不适合text
GET /test4/user/_search
{
"query": {
"term": {
"name":"张三"
}
}
}
高亮查询
GET test4/user/_search
{
"query": {
"match": {
"name":"张三"
}
}
,
"highlight": {
"fields": {
"name": {}
}
}
}
// 自定义前缀和后缀
GET test4/user/_search
{
"query": {
"match": {
"name":"张三"
}
}
,
"highlight": {
"pre_tags": "<p class='key' style='color:red'>",
"post_tags": "</p>",
"fields": {
"name": {}
}
}
}
集成springboot
Java High Level REST Client 高级客户端api测试
官网学习api:https://www.elastic.co/guide/en/elasticsearch/client/java-rest/7.x/java-rest-high.html
包括了索引和文档的CRUD,代码es-api https://gitee.com/dz138598/elasticsearch-study/tree/master/
实战
代码:https://gitee.com/dz138598/elasticsearch-study/tree/master/jd-project
ElasticSearch7.10.0入门学习的更多相关文章
- Bootstrap3.0入门学习系列
Bootstrap3.0入门学习系列规划[持续更新] 前言 首先在此多谢博友们在前几篇博文当中给与的支持和鼓励,以及在回复中提出的问题.意见和看法. 在此先声明一下,之前在下小菜所有的随笔文章中, ...
- Json.Net6.0入门学习试水篇
原文:Json.Net6.0入门学习试水篇 前言 JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式.简单地说,JSON 可以将 JavaScript 对象中 ...
- Bootstrap3.0入门学习系列教程
可视化布局:http://www.runoob.com/try/bootstrap/layoutit/ 1.浏览器兼容性:你可以去看看大牛的一篇文章http://www.cnblogs.com/lhb ...
- 【数据售卖平台】—— Vue2.0入门学习项目爬坑
前言:这个项目是我从零学习Vue2.0时用于练习基础知识的入门项目,包含了Vue2.0几乎所有项目都会用到的基础功能,是新手用来练手的好项目,这里温故知新对功能点做一个总结.github地址:http ...
- webpack3.10.0(入门系列基本概念1)
一.概念 webpack的核心是一个用于现代JavaScript应用程序的静态模块打包程序.当webpack处理您的应用程序时,它会递归地构建一个依赖图,其中包含应用程序所需的每个模块,然后将所有这些 ...
- Bootstrap3.0入门学习系列规划[持续更新]
详情请看http://aehyok.com/Blog/Detail/5.html 个人网站地址:aehyok.com QQ 技术群号:206058845,验证码为:aehyok 本文文章链接:http ...
- Protege5.0.0入门学习
OWL本体的重要组成部分 Individuals:个体,代表一个领域里面的对象.可以理解成一个类的实例(instances of classes). Properties:属性,是两个个体之间的双重联 ...
- Elasticsearch7.X 入门学习第九课笔记-----聚合分析Aggregation
原文:Elasticsearch7.X 入门学习第九课笔记-----聚合分析Aggregation 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. ...
- Elasticsearch7.X 入门学习第三课笔记----search api学习(URI Search)
原文:Elasticsearch7.X 入门学习第三课笔记----search api学习(URI Search) 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出 ...
随机推荐
- docker+compose+nginx+php
Docker 可以让开发者打包他们的应用以及依赖包到一个轻量级.可移植的容器中,然后发布到任何流行的 Linux 机器上,也可以实现虚拟化. 我用docker做什么? 快速搭建开发所需环境,测试实验新 ...
- 【odoo14】第十三章、网站开发(对外服务)
本章我们将介绍一些关于odoo web服务方面的基础知识.进阶的内容,将在第十四章介绍. odoo中的web请求是由python的werkzeug库驱动的.odoo为了操作方便,对werkzeug进行 ...
- visual studio 2019 + cmake 实现windows linux跨平台开发环境搭建
visual studio 2019开始支持cmake跨平台开发. 以前cmake项目需要先生成vs项目,然后vs直接使用vs项目开发.现在可以直接用vs2019创建或打开cmake项目. 使用vis ...
- P1223_排队接水(JAVA语言)
思路 根据短作业优先平均等待时间最短的常识(默默感叹一句操作系统没白学),将Ti从小到大排序后,计算平均等待时间输出 //水题 题目描述 有n个人在一个水龙头前排队接水,假如每个人接水的时间为Ti,请 ...
- 我的开源GIS解决方案之路
好久没更新了,因为我在--憋--大--招--,对,就是今天这篇. 今天跟大家分享一下我的开源GIS解决方案经历. --额-- 考虑到单聊技术解决方案你可能会很快睡着,所以我今天会把重点放在我封装地图A ...
- [源码解析] 并行分布式框架 Celery 之 worker 启动 (2)
[源码解析] 并行分布式框架 Celery 之 worker 启动 (2) 目录 [源码解析] 并行分布式框架 Celery 之 worker 启动 (2) 0x00 摘要 0x01 前文回顾 0x2 ...
- 日志文件删除shell脚本
大日志文件切割shell脚本 #!/bin/bash # --------------------------------------------------------------------- # ...
- 全网最详细的Linux命令系列-mkdir命令
Linux mkdir 命令用来创建指定的名称的目录,要求创建目录的用户在当前目录中具有写权限,并且指定的目录名不能是当前目录中已有的目录. 命令格式: mkdir [选项] 目录... 命令功能: ...
- 别再面向 for 循环编程了,Spring 自带的观察者模式就很香!
上一篇:JDK 自带的观察者模式就很香! 前段时间栈长给大家分享了什么是观察者模式,以及在 JDK 中如何实现观察者模式,现在都是 Spring 的天下了,今天就再分享下如何在 Spring/ Spr ...
- 201871030119-马桂婷 实验三 结对项目—《D{0-1}KP 实例数据集算法实验平台》项目报告
项目 内容 课程班级博客 2018卓越工程师班 这个作业要求链接 实验三 软件工程结对项目 我的课程学习目标 1.体验软件项目开发中的两人合作,练习结对编程:2.掌握Github协作开发程序的操作方法 ...