Elasticsearch使用系列-ES简介和环境搭建

Elasticsearch使用系列-ES增删查改基本操作+ik分词

一、安装可视化工具Kibana

ES是一个NoSql数据库应用。和其他数据库一样,我们为了方便操作查看它,需要安装一个可视化工具 Kibana。

官网:https://www.elastic.co/cn/downloads/kibana

和前面安装ES一样,选中对应的环境下载,这里选择windows环境,注意安装的版本一定要和ES的版本一致,不然可能会启动不起来。

解压后进到config目录下修改kibana.yml配置文件

修改完配置,进入bin目录,双击 kibana.bat 文件启动。

启动后,打开kibana地址:http://localhost:5601/ ,出现下面界面就是安装成功了。

点自己浏览进入下面

点开发工具进入操作ES的界面,我们ES就在下面界面操作。

二、ES数据结构和数据类型

1.ES数据结构

这里以Mysql作对比,ES7.0以前的结构是Index,Type,Document,ES7.0以后废弃了Type,现在ES和Mysql的结构对比如下

MySql Elasitcsearch
database(数据库) Elasitcsearch(实例)
table(表) index(索引)
row(行) document(文档)
column(列) field(字段)

2.ES数据类型

  • 字符串:text,keyword  (重点类型)
  • 数值:long,integer,short,byte,double,float,half float,scaled float
  • 日期类型:date
  • 布尔类型:boolean
  • 二进制类型:binary
  • 等等。。。

这里的数据类型标红的是ES的重点类型,其它的和平时开发的类型一样,没什么特别。

三、ES的增删查改基本操作

请求方式 url地址 描述
PUT http://localhost:9200/索引名称 创建索引
POST http://local  
     
     
     
     

1.创建索引,相当于数据库创建表

PUT  index

  1. PUT user
  2. {
  3. "mappings" : {
  4. "properties" : {
  5. "age" : {
  6. "type" : "integer"
  7. },
  8.  
  9. "name" : {
  10. "type" : "text"
  11. },
  12. "name2" : {
  13. "type" : "keyword"
  14. },
  15. "name3" : {
  16. "type" : "text",
  17. "fields" : {
  18. "keyword" : {
  19. "type" : "keyword",
  20. "ignore_above" : 256
  21. }
  22. }
  23. },
  24. "hobby" : {
  25. "type" : "text"
  26. }
  27. }
  28. }
  29. }

这里说一下kibana执行的原理,kibana执行的是http请求,前面的PUT为请求方式,还有POST,GET等,后面的user是索引名称,因为kibana配置了es的信息,

所以会自动带上es的地址和端口,实际的请求为 PUT http://192.168.101.13:9200/user

查看索引字段信息

GET index

 2.创建文档,相当于数据库插入数据记录

POST index/_doc/id (index:索引名称,_doc:固定,id:指定记录id,不填会自动生成一个唯一id)

 4.查询

 4.1查询全部

GET index/_search

 4.2按条件查询

  1. GET user/_search
  2. {
  3. "query": {
  4. "term": {
  5. "FIELD": {
  6. "value": "VALUE"
  7. }
  8. }
  9. }
  10. }

5.更新

对应sql语句:update user set age=19 where id=1

_doc,doc,_update:固定写法

6.删除

6.1删除文档(相当于删除一条数据)

对应sql语句: delete from user where id=1

DELETE user/_doc/1

6.2删除索引(相当于删除表)

对应sql语句:drop table user

DELETE user

四、全文索引和ik分词

1.全文索引

创建索引的时候我上面故意创建了name(text),name1(keyword),name2(text+keyword),然后数据类型也说了text,keyword是ES的重点类型,这里演示他们的区别。

  • keyword类型:查询时条件只能全匹配
  • text类型:全文索引查询,查询时会先分词,然后用分词去匹配查询
  • keyword+text类型,一个字段两种类型,可以全匹配,也可以全文索引查询

keyword查询例子,name2(keyword)的查询:

keyword的查询用term,或terms(配置多个值)

因为是全匹配,条件”张三“查到数据,条件”张“时查不到数据。

text查询例子,name(text)的查询

text的查询用match

因为是全文索引分词匹配,所以条件“张三”和条件“张”的,都把匹配到的数据都查询出来了。

keyword+text查询例子,name3(text+keyword)的查询。

当只想查全匹配时,用term查询

当想用全文索引查询时,用match

2.ik分词

1.什么是分词?

我搜的是爱祖国,为什么,“爱钓鱼,爱唱歌"的都被搜出来了呢?

因为ES默认内置了一个分词器standard,看下这个分词器的分词结果

可以看到“爱祖国”的分词结果为“爱,祖,国”,被拆分成了单个字,只要一个字匹配到就查出来,这样的结果很多不是我们想要的。我们需要一款根据常用词语的分词器,这样查到的结果会更准确,

这里就用到了ik分词,ik分词也是企业开发用的最多的。

 2.ik分词器插件安装

官网下载:https://github.com/medcl/elasticsearch-analysis-ik/releases

下载的版本要和es一致。

把文件下载后,解压复制到es部署文件的plugins文件夹下,并把文件夹的名称改为ik,必须要叫ik。windows,linux,docker(docker为挂载文件夹的方式把文件映射进去)一样,

然后重启es即可生效。

再看一下用ik分词器的分词结果。

可以看到,已经是按常用词语分词了。

3.自定义词组

上面“爱祖国”,被分成“爱祖国,祖国”,假如我想“爱组”也是一个词,现在这个词没被收怎么办?

打开刚才的ik文件夹下的config目录

里面的.dic结尾的都是分词,打开其中一个看一下。

所以我们要自定义词语,可以新建一个myword.dic

里面写上想要的分词

然后在IKAnalyzer.cfg.xml文件加上刚才的文件名

重启es,再看一下分词结果。

 4.ik分词怎么在索引中使用

创建索引的时候,text类型如果没指定使用分词器,就会默认内置的分词器,所以使用ik分词器时,创建索引时需要指定。

  1. PUT user2
  2. {
  3. "mappings" : {
  4. "properties" : {
  5. "age" : {
  6. "type" : "integer"
  7. },
  8.  
  9. "name" : {
  10. "type" : "text"
  11.  
  12. },
  13. "name2" : {
  14. "type" : "keyword"
  15. },
  16. "name3" : {
  17. "type" : "text",
  18. "fields" : {
  19. "keyword" : {
  20. "type" : "keyword",
  21. "ignore_above" : 256
  22. }
  23. },
  24. "analyzer": "ik_max_word",
  25. "search_analyzer": "ik_max_word"
  26. },
  27. "hobby" : {
  28. "type" : "text",
  29. "analyzer": "ik_max_word",
  30. "search_analyzer" : "ik_max_word"
  31. }
  32. }
  33. }
  34. }

把user的数据复制到user2。

再次查询“爱祖国”,得到一条想要的数据,没有多余数据。证明ik分词在索引中生效了。

Elasticsearch使用系列-ES增删查改基本操作+ik分词的更多相关文章

  1. MongoDB的增删查改基本操作

    MongoDB的增删查改基本操作 先决条件建库.建集合.建文档 连接mongo,如果连接不上什么连接拒绝,输入mongod命令,启动服务后 输入mongo show dbs 显示当前的所有的数据库 一 ...

  2. Elasticsearch学习系列一(部署和配置IK分词器)

    Elasticsearch简介 Elasticsearch是什么? Elaticsearch简称为ES,是一个开源的可扩展的分布式的全文检索引擎,它可以近乎实时的存储.检索数据.本身扩展性很好,可扩展 ...

  3. 6.在MVC中使用泛型仓储模式和依赖注入实现增删查改

    原文链接:http://www.c-sharpcorner.com/UploadFile/3d39b4/crud-operations-using-the-generic-repository-pat ...

  4. 3.EF 6.0 Code-First实现增删查改

    原文链接:http://www.c-sharpcorner.com/UploadFile/3d39b4/crud-operations-using-entity-framework-5-0-code- ...

  5. 4.在MVC中使用仓储模式进行增删查改

    原文链接:http://www.c-sharpcorner.com/UploadFile/3d39b4/crud-using-the-repository-pattern-in-mvc/ 系列目录: ...

  6. 5.在MVC中使用泛型仓储模式和工作单元来进行增删查改

    原文链接:http://www.c-sharpcorner.com/UploadFile/3d39b4/crud-operations-using-the-generic-repository-pat ...

  7. Sql Server的艺术(一) 视图的增删查改

    视图是从一个或者多个表中查询数据的另一种方式.利用视图可以集中.简化定制数据库,同时还能保障安全. 视图其结构和数据是建立在对应的查询基础上的.和表一样,视图也是包括几个被定义的数据列和多个数据行,但 ...

  8. Android SQLite最简单demo实现(增删查改)

    本来不太想写这篇博客的,但是看到网上的关于android数据库操作的博文都讲得很详细,对于像我这样的新手入门了解SQLite的基本操作有一定难度,所以我参考了网上的一些博客文章,并自己亲自摸索了一遍, ...

  9. 在MVC中使用泛型仓储模式和工作单元来进行增删查改

    原文链接:http://www.c-sharpcorner.com/UploadFile/3d39b4/crud-operations-using-the-generic-repository-pat ...

随机推荐

  1. 【LeetCode】912. Sort an Array 解题报告(C++)

    作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录 题目描述 题目大意 解题方法 库函数排序 桶排序 红黑树排序 归并排序 快速排序 ...

  2. Chapter 5 Interaction

    目录 5.1 Interaction requires a joint intervention 5.2 Identifying interaction 5.3 Counterfactual resp ...

  3. BP网络简单实现

    目录 BP算法的简单实现 Linear 全连接层 ReLu MSELoss 交叉熵损失函数 BP算法的简单实现 """ BPnet 简易实现 约定输入数据维度为(N, i ...

  4. 一文解析Apache Avro数据

    摘要:本文将演示如果序列化生成avro数据,并使用FlinkSQL进行解析. 本文分享自华为云社区<[技术分享]Apache Avro数据的序列化.反序列&&FlinkSQL解析 ...

  5. uniapp中使用animate.css4.1.1动画库在小程序中不生效解决办法

    找到源码animate.css修改以下代码 :root { --animate-duration: 1s; --animate-delay: 1s; --animate-repeat: 1; } // ...

  6. [opencv]keypoint数据结构分析

    KeyPoint这数据结构中有如下数据成员: angle:角度,表示特征点的方向,通过Lowe大神的论文可以知道,为了保证方向不变形,SIFT算法通过对特征点周围邻域进行梯度运算,求得该点方向.-1为 ...

  7. Java基础(八)——IO流2_缓冲流、转换流

    一.缓冲流 1.介绍 缓冲流:不能直接作用在文件上,需要包一层,它是一种处理流.用于提高文件的读写效率.它在流的基础上对流的功能进行了增强.提高读写速度的原因:内部提供了一个缓冲区.缺省使用 8192 ...

  8. FP增长算法

    Apriori原理:如果某个项集是频繁的,那么它的所有子集都是频繁的. Apriori算法: 1 输入支持度阈值t和数据集 2 生成含有K个元素的项集的候选集(K初始为1) 3 对候选集每个项集,判断 ...

  9. 使用 history 对象和 location 对象中的属性和方法制作一个简易的网页浏览工具

    查看本章节 查看作业目录 需求说明: 使用 history 对象和 location 对象中的属性和方法制作一个简易的网页浏览工具 实现思路: 使用history对象中的 forward() 方法和 ...

  10. 【MySQL作业】MySQL函数——美和易思系统信息函数和加密函数应用习题

    点击打开所使用到的数据库>>> 1.显示当前 MySQL 服务器的版本信息和登录信息. MySQL 系统信息函数 version() 用于返回当前 MySQL 的版本号," ...