ElasticSearch 全文检索— ElasticSearch 基本操作

REST 简介-定义

　　REST (REpresentation State Transfer)描述了一个架构样式的网络系统，比如 web 应用程序。它首次出现在 2000 年 Roy Fielding 的博士论文中，他是 HTTP 规范的主要编写者之一。REST 指的是一组架构约束条件和原则。满足这些约束条件和原则的应用程序或设计就是 RESTful。

　　Web 应用程序最重要的 REST 原则是，客户端和服务器之间的交互在请求之间是无状态的。从客户端到服务器的每个请求都必须包含理解请求所必需的信息。如果服务器在请求之间的任何时间点重启，客户端不会得到通知。此外，无状态请求可以由任何可用服务器回答，这十分适合云计算之类的环境。客户端可以缓存数据以改进性能。

　　在服务器端，应用程序状态和功能可以分为各种资源。资源是一个有趣的概念实体，它向客户端公开。资源的例子有：应用程序对象、数据库记录、算法等等。每个资源都使用 URI (Universal Resource Identifier) 得到一个惟一的地址。所有资源都共享统一的界面，以便在客户端和服务器之间传输状态。使用的是标准的 HTTP 方法，比如 GET、PUT、POST 和 DELETE。

REST 简介-资源

REST 简介-基本操作

　　1）GET 获取对象的当前状态

　　2）PUT 改变对象的状态

　　3）POST 创建对象

　　4）DELETE 删除对象

　　5）HEAD 获取头信息

REST 简介-资源

　ES 内置的REST接口

ElasticSearch-CURL命令

简单认为是可以在命令行下访问url的一个工具

curl是利用URL语法在命令行方式下工作的开源文件传输工具，使用curl可以简单实现常见的get/post请求。

　Curl的使用

　　1）-X 指定http请求的方法GET POST PUT DELETE

　　2）-d 指定要传递的参数

　ElasticSearch-CURL命令-建立索引库

curl -XPUT 'http://master:9200/djt/'

PUT/POST都可以

示例：

[hadoop@masternode elasticsearch-2.4.]$ curl -XPOST http://masternode:9200/zimo/user/1 -d '{"name" : "john", "age" : "28"}'

{"_index":"zimo","_type":"user","_id":"","_version":,"_shards":{"total":,"successful":,"failed":},"created":true}

输入网址：http://192.168.86.135:9200/_plugin/head/ 可以看到我们创建的zimo库成功了。

接下来再看一下创建的数据：

　　如图所示，数据也成功创建了。

ElasticSearch-CURL命令-PUT与POST对比

　　　1)PUT是幂等方法，而POST并不是。所以PUT用于更新操作、POST用于新增操作比较合适。

　　　2)PUT，DELETE操作是幂等的。所谓幂等是指不管进行多少次操作，结果都一样。比如我用PUT修改一篇文章，然后在做同样的操作，每次操作后的结果并没有不同，DELETE也是一样。

　　　3)POST操作不是幂等的，比如常见的POST重复加载问题：当我们多次发出同样的POST请求后，其结果是创建出了若干的资源。

　　　4)还有一点需要注意的就是，创建操作可以使用POST，也可以使用PUT，区别在于POST是作用在一个集合资源之上的（/articles），而PUT操作是作用在一个具体资源之上的（/articles/123），比如说很多资源使用数据库自增主键作为标识信息，而创建的资源的标识信息到底是什么只能由服务端提供，这个时候就必须使用POST。

　ElasticSearch-CURL命令-创建索引注意事项

　　1)索引库名称必须要全部小写，不能以下划线开头，也不能包含逗号

　　2)如果没有明确指定索引数据的ID，那么es会自动生成一个随机的ID,需要使用POST参数

curl -XPOST http://master:9200/zimo/user/ -d '{"name" : "john"}'

　创建全新内容的两种方式：

　　1）使用自增ID（post）

　　2）在url后面添加参数（get）

[hadoop@masternode elasticsearch-2.4.]$ curl -XPUT http://masternode:9200/zimo/user/2?op_type=create -d '{"name" : "john", "age" : 28}'

{"_index":"zimo","_type":"user","_id":"","_version":,"_shards":{"total":,"successful":,"failed":},"created":true}

[hadoop@masternode elasticsearch-2.4.]$ curl -XGET http://masternode:9200/zimo/user/1

或者

{"_index":"zimo","_type":"user","_id":"","_version":,"found":true,"_source":{"name" : "john", "age" : }}

　ElasticSearch-CURL命令-查询索引GET

　　1.根据员工id查询

[hadoop@masternode elasticsearch-2.4.]$ curl -XGET http://masternode:9200/zimo/user/1

{"_index":"zimo","_type":"user","_id":"","_version":,"found":true,"_source":{"name" : "john", "age" : }}

在任意的查询字符串中添加pretty参数，es可以得到易于识别的json结果。

[hadoop@masternode elasticsearch-2.4.]$ curl -XGET http://masternode:9200/zimo/user/1?pretty

{

  "_index" : "zimo",

  "_type" : "user",

  "_id" : "",

  "_version" : ,

  "found" : true,

  "_source" : {

    "name" : "john",

    "age" :

  }

}

　　2.检索文档中的一部分，如果只需要显示指定字段

[hadoop@masternode elasticsearch-2.4.]$ curl -XGET 'http://masternode:9200/zimo/user/1?_source=name&pretty'

{

  "_index" : "zimo",

  "_type" : "user",

  "_id" : "",

  "_version" : ,

  "found" : true,

  "_source" : {

    "name" : "john"

  }

}

　　3.查询指定索引库指定类型所有数据

[hadoop@masternode elasticsearch-2.4.]$ curl -XGET http://masternode:9200/zimo/user/_search

{"took":,"timed_out":false,"_shards":{"total":,"successful":,"failed":},"hits":{"total":,"max_score":1.0,"hits":[{"_index":"zimo","_type":"user","_id":"AWVlstKrgUMcKLYQxfRR","_score":1.0,"_source":{"name" : "john"}},{"_index":"zimo","_type":"user","_id":"","_score":1.0,"_source":{"name" : "john", "age" : }},{"_index":"zimo","_type":"user","_id":"","_score":1.0,"_source":{"name" : "john", "age" : }}]}}

　　4.根据条件进行查询

[hadoop@masternode elasticsearch-2.4.]$ curl -XGET http://masternode:9200/zimo/user/_search?q=age:28

{"took":,"timed_out":false,"_shards":{"total":,"successful":,"failed":},"hits":{"total":,"max_score":0.30685282,"hits":[{"_index":"zimo","_type":"user","_id":"","_score":0.30685282,"_source":{"name" : "john", "age" : }},{"_index":"zimo","_type":"user","_id":"","_score":0.30685282,"_source":{"name" : "john", "age" : }}]}}

　ElasticSearch-CURL命令-DSL查询

　　Domain Specific Language领域特定语言

　　新添加一个文档

[hadoop@masternode elasticsearch-2.4.]$ curl -XPUT http://masternode:9200/zimo/user/3/_create -d '{"name" : "lily", "age" : 18}'

{"_index":"zimo","_type":"user","_id":"","_version":,"_shards":{"total":,"successful":,"failed":},"created":true}

[hadoop@masternode elasticsearch-2.4.0]$ curl -XGET http://masternode:9200/zimo/user/_search -d '{"query":{"match":{"name":"lily"}}}'  （查询）

{"took":,"timed_out":false,"_shards":{"total":,"successful":,"failed":},"hits":{"total":,"max_score":0.30685282,"hits":[{"_index":"zimo","_type":"user","_id":"","_score":0.30685282,"_source":{"name" : "lily", "age" : }}]}}

　ElasticSearch-CURL命令-MGET查询

　　1.使用mget API获取多个文档

　　先新建一个库

[hadoop@masternode elasticsearch-2.4.]$ curl -XPUT 'http://masternode:9200/zimo2'

{"acknowledged":true}

[hadoop@masternode elasticsearch-2.4.]$ curl -XPOST http://masternode:9200/zimo2/user/1 -d '{"name" : "lucy", "age" : 20}'

{"_index":"zimo2","_type":"user","_id":"","_version":,"_shards":{"total":,"successful":,"failed":},"created":true}

[hadoop@masternode elasticsearch-2.4.]$ curl -XGET http://masternode:9200/_mget?pretty -d '{"docs":[{"_index":"zimo","_type":"user","_id":2,"_source":"name"},{"_index":"zimo2","_type":"user","_id":1}]}'

{

  "docs" : [ {

    "_index" : "zimo",

    "_type" : "user",

    "_id" : "",

    "_version" : ,

    "found" : true,

    "_source" : {

      "name" : "john"

    }

  }, {

    "_index" : "zimo2",

    "_type" : "user",

    "_id" : "",

    "_version" : ,

    "found" : true,

    "_source" : {

      "name" : "lucy",

      "age" :

    }

　　2.如果需要的文档在同一个_index或者同一个_type中，你就可以在URL中指定一个默认的/_index或者/_index/_type

[hadoop@masternode elasticsearch-2.4.]$ curl -XGET http://masternode:9200/zimo/user/_mget?pretty -d '{"docs":[{"_id":1},{"_id":2}]}'

{

  "docs" : [ {

    "_index" : "zimo",

    "_type" : "user",

    "_id" : "",

    "_version" : ,

    "found" : true,

    "_source" : {

      "name" : "john",

      "age" :

    }

  }, {

    "_index" : "zimo",

    "_type" : "user",

    "_id" : "",

    "_version" : ,

    "found" : true,

    "_source" : {

      "name" : "john",

      "age" :

    }

  } ]

}

　　3.如果所有的文档拥有相同的_index 以及 _type，直接在请求中添加ids的数组即可。

curl -XGET http://masternode:9200/zimo/user/_mget?pretty -d '{"ids":["1","2"]}'

　　结果同上。

　ElasticSearch-CURL命令-HEAD使用

　　如果只想检查一下文档是否存在，你可以使用HEAD来代替GET方法，这样只会返回HTTP头部文件。

[hadoop@masternode elasticsearch-2.4.]$ curl -i -XHEAD http://masternode:9200/zimo/user/1

HTTP/1.1  OK

Content-Type: text/plain; charset=UTF-

Content-Length:

　ElasticSearch-CURL命令-更新

　　ES可以使用PUT或者POST对文档进行更新（全部更新），如果指定ID的文档已经存在，则执行更新操作。执行更新操作的时候要注意以下细节：

　　1）ES首先将就得文档标记为删除状态

　　2）然后添加新的文档

　　3）就得文档不会立即消失，但是你也无法访问

　　4）ES会在你继续添加更多数据的时候再后台清理已经标记问删除状态的文档、

　　局部更新：可以添加新字段或者更新已有字段（必须使用POST）

[hadoop@masternode elasticsearch-2.4.0]$ curl -XPOST http://masternode:9200/zimo/user/1/_update -d '{"doc":{"name":"john","age":30}}'

{"_index":"zimo","_type":"user","_id":"1","_version":5,"_shards":{"total":2,"successful":2,"failed":0}}

　ElasticSearch-CURL命令-删除

[hadoop@masternode elasticsearch-2.4.]$ curl -XDELETE http://masternode:9200/zimo/user/1

{"found":true,"_index":"zimo","_type":"user","_id":"","_version":,"_shards":{"total":,"successful":,"failed":}}

　　如果文档存在，found属性值为true，_version属性值+1；

　　如果文档不存在，found属性值为false，但是_version属性值依然+1，这个就是内部管理的一部分，它保证了我们在多个节点间的不同操作的顺序都被正确标记了；

　　注意：删除一个文档也不会立即生效，它只是被标记我已删除，ElasticSearch将会在你之后添加更多所以的时候才会在后头进行删除内容的清理。

　ElasticSearch-CURL命令-bulk批量操作

　　bulk API可以帮助我们同时执行多个请求。

　　格式：

action: index/create/update/delete

　　metadata:_index/_type/_id

　　request body:_source(删除操作不需要)

　　　　　　(action:{metadata})

　　　　　　{request body       }

　　　　　　(action:{metadata})

　　　　　　{request body       }

　　create和ndex的区别：如果数据存在，使用create操作失败会提示文档已经存在，使用index则可以成功执行。

//新建一个requests文件
[hadoop@masternode elasticsearch-2.4.]$ vi requests

{"index":{"_index":"zimo","_type":"user","_id":""}}

{"name":"mayun","age":}

{"update":{"_index":"zimo","_type":"user","_id":""}}

{"doc":{"age":}}

[hadoop@masternode elasticsearch-2.4.]$ ls

bin  config  lib  LICENSE.txt  modules  NOTICE.txt  plugins  README.textile  requests

//执行批量操作

[hadoop@masternode elasticsearch-2.4.]$ curl -XPOST http://masternode:9200/_bulk --data-binary @requests;

{"took":,"errors":false,"items":[{"index":{"_index":"zimo","_type":"user","_id":"","_version":,"_shards":{"total":,"successful":,"failed":},"status":}},{"update":{"_index":"zimo","_type":"user","_id":"","_version":,"_shards":{"total":,"successful":,"failed":},"status":}}]}

　　bulk请求可以在URL中声明/_indexhuozhe /_-index/_type.

　 bulk一次最大可以处理多少数据量：

　　1）bulk会把将要处理的数据载入内存中，所以数据量是有限的；

　　2）最佳的数据量不是一个确定的数值，它取决于你的硬件，你的文档大小以及复杂性，你的索引以及搜索的负载；

　　3）一般建议是1000-5000个文档，如果你的文档很大，可以适当减少队列，大小建议是5-15M，默认不能超过100M，可以在ES的配置文件中修改这个值http.max_content_length:100mb；

　　4）https://www.elastic.co/guide/en/elasticsearch/reference/2.4/moudles-http.html。

　ElasticSearch-CURL命令-版本控制

　　普通关系型数据库使用的是PCC（悲观并发控制）：当我们在修改一个数据前先锁定这一行，然后确保只有读取到的这个线程可以修改这一行数据。

　　ES使用的是OCC（乐观并发控制）：ES不会阻止某一数据的访问。然而，如果基础数据在我们读取和写入的间隔中发生了变化，更新就会失败，这时候就由程序来决定如何处理这个冲突。它可以重新读取数据来进行更新，又或者将这一情况最直接反馈给用户。

　　ES如何实行版本控制？（使用ES内部版本号）

　　1）首先需要修改的文档，获取版本号(_version)

[hadoop@masternode elasticsearch-2.4.]$ curl –XGET http://masternode:9200/zimo/user/2

{"_index":"zimo","_type":"user","_id":"","_version":1,"found":true,"_source":{"name" : "john", "age" : }}

　　2）在执行更新操作的时候把版本号传过去

[hadoop@masternode elasticsearch-2.4.]$ curl http://masternode:9200/zimo/user/2?version=1 -d '{"name":"john1","age":29}'

{"_index":"zimo","_type":"user","_id":"","_version":,"_shards":{"total":,"successful":,"failed":},"created":false}

　　该操作可以重复执行，每执行一次版本号都会+1。

　　3）如果传递的版本号和待更新的版本号不一致，更新操作将会失败。

以上就是博主为大家介绍的这一板块的主要内容，这都是博主自己的学习过程，希望能给大家带来一定的指导作用，有用的还望大家点个支持，如果对你没用也望包涵，有错误烦请指出。如有期待可关注博主以第一时间获取更新哦，谢谢！

ElasticSearch 全文检索— ElasticSearch 基本操作的更多相关文章

ElasticSearch 全文检索— ElasticSearch概述
ElasticSearch 产生背景 1.海量数据组合条件查询 2.毫秒级或者秒级返回数据 Lucene 定义 lucene是一个开放源代码的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一 ...
ElasticSearch 全文检索— ElasticSearch 核心概念
ElasticSearch核心概念-Cluster 1)代表一个集群,集群中有多个节点,其中有一个为主节点,这个主节点是可以通过选举产生的,主从节点是对于集群内部来说的.es的一个概念就是去中心化,字 ...
ElasticSearch 全文检索— ElasticSearch 安装部署
ElasticSearch 规划-集群规划 ElasticSearch 规划-集群规划 ElasticSearch 规划-用户规划 ElasticSearch 规划-目录规划 ElasticSearc ...
Elasticsearch全文检索工具入门
Elasticsearch全文检索工具入门: 1.下载对应系统版本的文件 elasticsearch-2.4.0.zip 1.1运行elasticsearch-2.4.0\elasticsearch- ...
干货 |《从Lucene到Elasticsearch全文检索实战》拆解实践
1.题记 2018年3月初,萌生了一个想法:对Elasticsearch相关的技术书籍做拆解阅读,该想法源自非计算机领域红火已久的[樊登读书会].得到的每天听本书.XX拆书帮等. 目前市面上Elast ...
《从Lucene到Elasticsearch全文检索实战》的P184页
curl -XPOST "http://localhost:9200/_bulk?pretty" --data-binary @books.json 这句话在书中是以crul的命令 ...
全文检索-Elasticsearch （三） DSL
DSL:elasticsearch查询语言elasticsearch对json 的语法有严格的要求,每个json串不能换行,同时一个json串和一个json串之间,必须有一个换行 DSL(介绍查询语言 ...
SpringBoot日记——ElasticSearch全文检索
看到标题的那一串英文,对于新手来说一定比较陌生,而说起检索,应该都知道吧. 这个ElasticSearch目前我们的首选,他主要有可以提供快速的存储.搜索.分析海量数据的作用.他是一个分布式搜索服务, ...
Elasticsearch全文检索学习
ElasticSearch官方网址:https://www.elastic.co ElasticSearch官方网址(中文):https://www.elastic.co/cn/ Elasticsea ...

随机推荐

HDU1548(楼梯问题bfs)
#include"cstdio" #include"queue" #include"cstring" using namespace std ...
【转】Pro Android学习笔记（四六）：Dialog（3）：对话框弹对话框
目录(?)[-] 帮助提示框的实现实现再弹框再谈fragment管理器提示框的按钮Help,将触发弹出新的帮助提示框. 帮助提示框的实现帮助提示框的实现很简单,利用重写onCreateView ...
css菜鸟之HTML 中块级元素设置 height:100% 的实现
HTML 中块级元素设置 height:100% 的实现当你设置一个页面元素的高度(height)为100%时,期望这样元素能撑满整个浏览器窗口的高度,但大多数情况下,这样的做法没有任何效果. 为什 ...
nmap 快速扫描所有端口
nmap -sT -sV -Pn -v xxx.xxx.xxx.xxx nmap -sS -p 1-65535 -v 192.168.1.254参数:-sS TCP SYN扫描 nmap ...
C语言学习笔记--struct 和 union关键字
1.struct关键字 C 语言中的 struct 可以看作变量的集合struct中的每个数据成员都有独立的存储空间. 结构体与柔性数组 (1)柔性数组即数组大小待定的数组 (2)C 语言中可以由结构 ...
IPC编程之共享内存
一,共享内存介绍共享内存是三个IPC(Inter-Process Communication)机制中的一个,它允许两个不相关的进程访问同一个逻辑内存. 二.共享内存使用的函数 #include ...
mysql--二进制日志(bin-log)
一.设置二进制日志进制日志记录了所有的DDL和DML,但不包括各种查询.通过二进制日志,可以实现什么效果呢?二进制日志文件可以[实现灾难数据恢复],另外可以应用到[mysql复制数据同步].二进制日 ...
使用SecureCRT工具部署项目
总结下我的Java开发过程的一些知识点: 我要上线某个项目,此时我需要给测试人员发送安全扫描文件,等待测试人员完成项目的扫描之后才可以完成上线: 1 将项目打成war包.比如implgtyy.war文 ...
JVM优化（未完）
-XX:+PrintGC 在eclipse控制台打印简单的GC信息,与-verbose:gc一样 -verbose:gc 在eclipse控制台打印简单的GC信息 -XX:+PrintGCDetail ...
托管调试助手 "PInvokeStackImbalance":的调用导致堆栈不对称。原因可能是托管的 PInvoke 签名与非托管的目标签名不匹配。请检查 PInvoke 签名的调用约定和参数与非托管
在C#中一定要检查引用时的数据类型 WinAPI 的数据类型默认是32位的,但是引用时外部的是 Long类型默认是64位的.所以引用时需要将 long 改为 int 型. 参照 http://blo ...

ElasticSearch 全文检索— ElasticSearch 基本操作

ElasticSearch 全文检索— ElasticSearch 基本操作的更多相关文章

随机推荐

热门专题