ElasticSearch : 基础

#新建索引以及类型:

PUT http://10.18.43.3:9200/test

{

    "settings": {

        "number_of_shards": 3,

        "number_of_replicas": 0

    },

    "mappings": {

        "type1": {

            "properties": {

                "id": {

                    "type": "long"

                    },

                "ukey": {

                    "type": "keyword"

                },

                "startid": {

                    "type": "long"

                },

                "title": {

                    "type": "text"

                },

                "fetch_time": {

                    "type": "date",

                    "format": "yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||epoch_millis"

                }

            }

        }

    }

}

keyword类型的字段是不可切分的,text可以分词

#插入数据: PUT http://10.18.43.3:9200/test/type1/1

{

    "key": value,

    "key2": value2

}

,如果需要自动生成id,需要把方法改成POST,然后把url改成http://10.18.43.3:9200/test/type1

#更新数据

POST http://10.18.43.3:9200/test222/type1/1/_update

{

    "doc": {

        "content":"更新content2"

    }

}

更新数据需要用POST方法而且后面要加_update,更新的字段要包含在 doc 字段里面

#删除数据

DELETE http://10.18.43.3:9200/test/type1/1

#删除索引

DELETE http://10.18.43.3:9200/test

#简单查询

GET http://10.18.43.3:9200/test/type1/1

#条件查询

POST http://10.18.43.3:9200/test/_search

{

    "query": {

        "match_all": {}

    },

    "from": 1,

    "size": 2

}

from 是从哪一行开始,size 是查询显示多少条

POST http://10.18.43.3:9200/test/_search

{

    "query": {

        "match": {

            "html_snapshot": "医生"

        }

    },

    "sort": [

        {

            "id": {

                "order": "desc"

            }

        }

    ]

}

查询所有html_snapshot包含"医生"的数据,类似于模糊查询(查询html_snapshot包含"医生"的数据),需要注意这个模糊匹配会把查询条件再次分词,如

条件为"html_snapshot": "医生和护士"的话,那么很可能会分成"医生","护士"两个词来分别匹配,如果需要像SQL那样 %xxx%这种形式的模糊匹配的话,

那么需要把 "match"改为"match_phrase",这样如果匹配"医生和护士",那么会匹配里面包含 xxx医生和护士xxxx 这种类型的数据

这儿html_snapshot是text类型,如果是keyword类型的话查询结果是精确查询的结果(查询html_snapshot等于"医生"的数据)

按照id降序排列

POST http://10.18.43.3:9200/test/_search

{

    "query": {

        "query_string": {

            "query": "(非常感谢 AND 医院) OR 医生",

            "fields": ["html_snapshot", "content"]

        }

    }

}

查询多个字段,这样查询也是会先自动分词然后进行匹配

POST http://10.18.43.3:9200/test/_search

{

    "query": {

        "term": {

            "startid": 2

        }

    }

}

精确查询 startid == 2

POST http://10.18.43.3:9200/test/_search

{

    "query": {

        "range": {

            "startid": {

                "gte": 2,

                "lte": 3

            }

        }

    }

}

startid 大于等于2,小于等于3的数据

POST http://10.18.43.3:9200/test/_search

{

    "query": {

        "bool": {

            "must": [

                {

                    "match": {

                        "startid": 2

                    }

                },

                {

                    "match": {

                        "html_snapshot": "客气"

                    }

                }

            ]

        }

    }

}

查询 startid必须为2(因为是keyword类型) 和 html_snapshot必须包含(text类型)"客气" 的所有数据

#聚合查询

POST http://10.18.43.3:9200/test/_search

{

    "aggs": {

        "group_by_startid": {

            "terms": {

                "field": "startid",

                "size": 3

            }

        }

    }

}

根据startid统计所有数据count,返回统计结果前3的聚合数据,size是显示3条聚合数据

可以同时统计多组聚合信息

POST http://10.18.43.3:9200/test/_search

{

    "aggs": {

        "group_by_startid": {

            "stats": {

                "field": "startid"

            }

        }

    }

}

stats是计算聚合关键字,里面有startid的总数,最大值最小值平均值总和等数据

##Elasticsearch 使用bool 子句来将各种子查询关联起来，组成布尔表达式，bool 子句可以随意组合、嵌套。

bool子句主要包括：

must：表示必须匹配。
must_not：表示一定不能匹配。
should：表示可以匹配，类似于布尔运算里的”或”。如果bool 子句里，没有must子句，那么，should子句里至少匹配一个，如果有must子句，那么，should子句至少匹配零个。可以使用minimum_should_match 来对最小匹配数进行设置。

====================================ES的快照备份查询与恢复===========================================

索引的快照过程是增量的。在创建索引快照的过程中，ElasticSearch会分析仓库中已经存在的索引文件，只拷贝那些在最后一次快照之后被创建或者更新的文件。That allows multiple snapshots to be preserved in the repository in a compact form. 快照过程以非阻塞的方式执行，所有的索引和搜索操作都可以对正在被创建快照的索引继续执行。一个快照表示的是这个索引在快照被创建时间点的索引视图，所以在索引过程开始之后被添加到索引中的记录不会出现在快照中。
(参考 https://blog.csdn.net/ale2012/article/details/82702128#_126)

需要先在elasticsearch.yml中加入  path.repo: /usr/local/backups 这个配置来配置备份文件夹 文件夹权限要设置为777

1. 创建快照仓库, 名字为all_backup

http://10.1.1.112:9200/_snapshot/all_backup   PUT

{

  "type": "fs",

  "settings": {

    "location": "/usr/local/backups/all_backup"

  }

}

2. 备份快照,快照名字v2019-7-2

http://10.1.1.112:9200/_snapshot/all_backup/v2019-7-2?wait_for_completion=true    PUT

如果只需要备份某几个索引可以加上:

{
"indices": "article"
}


3. 查询快照

http://10.1.1.112:9200/_snapshot/all_backup/*   GET

4. 恢复快照

http://10.1.1.112:9200/_snapshot/all_backup/v2019-7-2/_restore   POST

ElasticSearch : 基础的更多相关文章

ELK(elasticsearch+kibana+logstash)搜索引擎(二)： elasticsearch基础教程
1.elasticsearch的结构首先elasticsearch目前的结构为 /index/type/id id对应的就是存储的文档ID,elasticsearch一般将数据以JSON格式存储. ...
Elasticsearch 基础入门
原文地址:Elasticsearch 基础入门博客地址:http://www.extlight.com 一.什么是 ElasticSearch ElasticSearch是一个基于 Lucene 的 ...
ElasticSearch 基础 1
ElasticSearch 基础=============================== 索引创建 ========================== 1. RESTFUL APIAPI 基本 ...
Elasticsearch基础但非常有用的功能之二：模板
文章转载自: https://mp.weixin.qq.com/s?__biz=MzI2NDY1MTA3OQ==&mid=2247484584&idx=1&sn=accfb65 ...
最完整的Elasticsearch 基础教程
翻译:潘飞(tinylambda@gmail.com) 基础概念 Elasticsearch有几个核心概念.从一开始理解这些概念会对整个学习过程有莫大的帮助. 接近实时(NRT) Ela ...
ELK 之一：ElasticSearch 基础和集群搭建
一:需求及基础: 场景: 1.开发人员不能登录线上服务器查看详细日志 2.各个系统都有日志,日志数据分散难以查找 3.日志数据量大,查询速度慢,或者数据不够实时 4.一个调用会涉及到多个系统,难以在这 ...
Elasticsearch基础教程
Reference: http://blog.csdn.net/cnweike/article/details/33736429 基础概念 Elasticsearch有几个核心概念.从一开始理解这些概 ...
elasticsearch基础概念
接近实时(NRT) Elasticsearch是一个接近实时的搜索平台.这意味着,从索引一个文档直到这个文档能够被搜索到有一个轻微的延迟(通常是1秒). 集群(clu ...
Elasticsearch基础知识分享
1. Elasticsearch背景介绍 Elasticsearch 是一个基于 Lucene 的搜索服务器.它提供了一个分布式多用户能力的全文搜索引擎,基于 RESTful web 接口.Elast ...
Elasticsearch基础教程分享
基础及相关资料首先我们先了解一下什么是Elastisearch,Elasticsearch(简称es)是一个基于Lucene库的搜索引擎.它提供了一个分布式.支持多租户的全文搜索引擎,具有HTTP ...

随机推荐

matlab练习程序（随机直线采样）
我只是感觉好玩,写了这样一段程序. 原理就是先随机生成两个点,然后根据这两个点画直线,最后在直线上的像素保留,没在直线上的像素丢弃就行了. 最后生成了一幅含有很多空洞的图像. 当然,对含有空洞的图像是 ...
matlab练习程序（模糊集图像增强）
算法有很多变种.不过主要就是以下三步. 1.设计隶属度函数将图像从空间域变换到模糊集域. 2.设计模糊增强算子,在模糊集域对图像进行处理. 3.根据第1步的隶属度函数重新将图像从模糊集域变换到空间域. ...
java中加密的方式概述
加密是用一种特殊的算法改变原有的数据,使未经授权的用户即使获得了已经加密的信息,但不知其解密的方法,仍然无法了解信息的内容. 大体上分为单向加密和双向加密,双向加密又可分为对称加密和非对称加密 ...
java面试题全集（上）--java基础
本文转载自:https://blog.csdn.net/jackfrued/article/details/44921941 1.面向对象的特征有哪些方面? 答:面向对象的特征主要有以下几个方面: - ...
checkpoint(sqlserver数据库检查点)
关于检查点的解释: 出于性能方面的考虑,数据库引擎对内存(缓冲区缓存)中的数据库页进行修改,但在每次更改后不将这些页写入磁盘.相反,数据库引擎定期发出对每个数据库的检查点命令.“检查点”将当前内存 ...
（一）svn介绍
项目管理中的版本控制问题通常软件开发由多人协作开发,如果对代码文件.文档等没有进行版本控制,将会出现很多问题: 备份多个版本,占用磁盘空间大解决代码冲突困难容易引发BUG 难于恢复至以前正确版本 ...
day011-网络编程
1. 网络编程概述 1.1 网络编程三要素地址.端口.协议 1.1.1 IP地址:网络中设备的唯一标识. IPV4格式:xxx.xxx.xxx.xxx由四段数字组成,每一段数字由八位二进制数字组成 ...
Java应用程序
示例: public class HelloWorld { public static void main(String[] args) { System.out.println("Hell ...
Python语言程序设计基础（5）—— 函数和代码复用
lambda sum = lambda x,y : x + y print(sum(3,3),type(sum)) 默认参数 def prints(str,times = 2) : print(str ...
【转】Activity、Window、View的关系
1.先看一个现象 1 2 3 4 5 6 7 8 9 10 11 public class MainActivity extends Activity { @Override pr ...

ElasticSearch : 基础

ElasticSearch : 基础的更多相关文章

随机推荐

热门专题