ElasticSearch : 基础
#新建索引以及类型:
PUT http://10.18.43.3:9200/test
{
"settings": {
"number_of_shards": 3,
"number_of_replicas": 0
},
"mappings": {
"type1": {
"properties": {
"id": {
"type": "long"
},
"ukey": {
"type": "keyword"
},
"startid": {
"type": "long"
},
"title": {
"type": "text"
},
"fetch_time": {
"type": "date",
"format": "yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||epoch_millis"
}
}
}
}
}
keyword类型的字段是不可切分的,text可以分词 #插入数据: PUT http://10.18.43.3:9200/test/type1/1
{
"key": value,
"key2": value2
}
,如果需要自动生成id,需要把方法改成POST,然后把url改成http://10.18.43.3:9200/test/type1 #更新数据
POST http://10.18.43.3:9200/test222/type1/1/_update
{
"doc": {
"content":"更新content2"
} }
更新数据需要用POST方法而且后面要加_update,更新的字段要包含在 doc 字段里面 #删除数据
DELETE http://10.18.43.3:9200/test/type1/1 #删除索引
DELETE http://10.18.43.3:9200/test #简单查询
GET http://10.18.43.3:9200/test/type1/1 #条件查询
POST http://10.18.43.3:9200/test/_search
{
"query": {
"match_all": {}
},
"from": 1,
"size": 2
}
from 是从哪一行开始,size 是查询显示多少条 POST http://10.18.43.3:9200/test/_search
{
"query": {
"match": {
"html_snapshot": "医生"
}
},
"sort": [
{
"id": {
"order": "desc"
}
}
]
}
查询所有html_snapshot包含"医生"的数据,类似于模糊查询(查询html_snapshot包含"医生"的数据),需要注意这个模糊匹配会把查询条件再次分词,如
条件为"html_snapshot": "医生和护士"的话,那么很可能会分成"医生","护士"两个词来分别匹配,如果需要像SQL那样 %xxx%这种形式的模糊匹配的话,
那么需要把 "match"改为"match_phrase",这样如果匹配"医生和护士",那么会匹配里面包含 xxx医生和护士xxxx 这种类型的数据
这儿html_snapshot是text类型,如果是keyword类型的话查询结果是精确查询的结果(查询html_snapshot等于"医生"的数据)
按照id降序排列 POST http://10.18.43.3:9200/test/_search
{
"query": {
"query_string": {
"query": "(非常感谢 AND 医院) OR 医生",
"fields": ["html_snapshot", "content"]
}
}
}
查询多个字段,这样查询也是会先自动分词然后进行匹配 POST http://10.18.43.3:9200/test/_search
{
"query": {
"term": {
"startid": 2
}
}
}
精确查询 startid == 2 POST http://10.18.43.3:9200/test/_search
{
"query": {
"range": {
"startid": {
"gte": 2,
"lte": 3
}
}
}
}
startid 大于等于2,小于等于3的数据 POST http://10.18.43.3:9200/test/_search
{
"query": {
"bool": {
"must": [
{
"match": {
"startid": 2
}
},
{
"match": {
"html_snapshot": "客气"
}
}
]
}
}
}
查询 startid必须为2(因为是keyword类型) 和 html_snapshot必须包含(text类型)"客气" 的所有数据 #聚合查询
POST http://10.18.43.3:9200/test/_search
{
"aggs": {
"group_by_startid": {
"terms": {
"field": "startid",
"size": 3
}
}
}
}
根据startid统计所有数据count,返回统计结果前3的聚合数据,size是显示3条聚合数据
可以同时统计多组聚合信息 POST http://10.18.43.3:9200/test/_search
{
"aggs": {
"group_by_startid": {
"stats": {
"field": "startid"
}
}
}
}
stats是计算聚合关键字,里面有startid的总数,最大值最小值平均值总和等数据
##Elasticsearch 使用bool 子句来将各种子查询关联起来,组成布尔表达式,bool 子句可以随意组合、嵌套。
bool子句主要包括:
must:表示必须匹配。
must_not:表示一定不能匹配。
should:表示可以匹配,类似于布尔运算里的”或”。如果bool 子句里,没有must子句,那么,should子句里至少匹配一个,如果有must子句,那么,should子句至少匹配零个。可以使用minimum_should_match 来对最小匹配数进行设置。
====================================ES的快照备份查询与恢复===========================================
索引的快照过程是增量的。在创建索引快照的过程中,ElasticSearch会分析仓库中已经存在的索引文件,只拷贝那些在最后一次快照之后被创建或者更新的文件。That allows multiple snapshots to be preserved in the repository in a compact form. 快照过程以非阻塞的方式执行,所有的索引和搜索操作都可以对正在被创建快照的索引继续执行。一个快照表示的是这个索引在快照被创建时间点的索引视图,所以在索引过程开始之后被添加到索引中的记录不会出现在快照中。
(参考 https://blog.csdn.net/ale2012/article/details/82702128#_126)
需要先在elasticsearch.yml中加入 path.repo: /usr/local/backups 这个配置来配置备份文件夹 文件夹权限要设置为777 1. 创建快照仓库, 名字为all_backup
http://10.1.1.112:9200/_snapshot/all_backup PUT
{
"type": "fs",
"settings": {
"location": "/usr/local/backups/all_backup"
}
} 2. 备份快照,快照名字v2019-7-2
http://10.1.1.112:9200/_snapshot/all_backup/v2019-7-2?wait_for_completion=true PUT 如果只需要备份某几个索引可以加上:
{
"indices": "article"
}
3. 查询快照
http://10.1.1.112:9200/_snapshot/all_backup/* GET 4. 恢复快照
http://10.1.1.112:9200/_snapshot/all_backup/v2019-7-2/_restore POST
ElasticSearch : 基础的更多相关文章
- ELK(elasticsearch+kibana+logstash)搜索引擎(二): elasticsearch基础教程
1.elasticsearch的结构 首先elasticsearch目前的结构为 /index/type/id id对应的就是存储的文档ID,elasticsearch一般将数据以JSON格式存储. ...
- Elasticsearch 基础入门
原文地址:Elasticsearch 基础入门 博客地址:http://www.extlight.com 一.什么是 ElasticSearch ElasticSearch是一个基于 Lucene 的 ...
- ElasticSearch 基础 1
ElasticSearch 基础=============================== 索引创建 ========================== 1. RESTFUL APIAPI 基本 ...
- Elasticsearch基础但非常有用的功能之二:模板
文章转载自: https://mp.weixin.qq.com/s?__biz=MzI2NDY1MTA3OQ==&mid=2247484584&idx=1&sn=accfb65 ...
- 最完整的Elasticsearch 基础教程
翻译:潘飞(tinylambda@gmail.com) 基础概念 Elasticsearch有几个核心概念.从一开始理解这些概念会对整个学习过程有莫大的帮助. 接近实时(NRT) Ela ...
- ELK 之一:ElasticSearch 基础和集群搭建
一:需求及基础: 场景: 1.开发人员不能登录线上服务器查看详细日志 2.各个系统都有日志,日志数据分散难以查找 3.日志数据量大,查询速度慢,或者数据不够实时 4.一个调用会涉及到多个系统,难以在这 ...
- Elasticsearch基础教程
Reference: http://blog.csdn.net/cnweike/article/details/33736429 基础概念 Elasticsearch有几个核心概念.从一开始理解这些概 ...
- elasticsearch基础概念
接近实时(NRT) Elasticsearch是一个接近实时的搜索平台.这意味着,从索引一个文档直到这个文档能够被搜索到有一个轻微的延迟(通常是1秒). 集群(clu ...
- Elasticsearch基础知识分享
1. Elasticsearch背景介绍 Elasticsearch 是一个基于 Lucene 的搜索服务器.它提供了一个分布式多用户能力的全文搜索引擎,基于 RESTful web 接口.Elast ...
- Elasticsearch基础教程分享
基础及相关资料 首先我们先了解一下什么是Elastisearch,Elasticsearch(简称es)是一个基于Lucene库的搜索引擎.它提供了一个分布式.支持多租户的全文搜索引擎,具有HTTP ...
随机推荐
- C语言指针的陷阱
C语言指针的陷阱 分类: C/Cpp 转自:http://blog.csdn.net/porscheyin/article/details/3461670 “C语言诡异离奇,陷阱重重,却获得了巨大 ...
- 基于ssh的多节点之间互信通信的实现
实现条件:node1:192.168.176.6 主机名称是node1.magedu.com: node2:192.168.176.6 主机名称是node1.magedu.com: 实现目的:在节点n ...
- android Listview 软引用SoftReference异步加载图片
首先说一下,android系统加载大量图片系统内存溢出的3中解决方法: (1)从网络或本地加载图片的时候,只加载缩略图.这个方法的确能够少占用不少内存,可是它的致命的缺点就是,因为加载的是缩略图,所以 ...
- 在浏览器里使用SAPGUI里的SE80
效果如图:点击Fiori launchpad的SE80对应的tile: 即可在浏览器里打开SE80 具体步骤 (1). 在后台找到Fiori catalog page ID: SAP_FIORI_EX ...
- websocket常见错误
当websockt连接是open的时候send()方法传送数据,当连接关闭或获取不到的时候回抛出异常. 一个通常的错误是人们喜欢在连接open之前发送消息.如下所示: // 这将不会工作 var ws ...
- Eclipse Java常用快捷键(Eclipse Shortcut Keys for Java Top10)(转)
Eclipse Java常用快捷键(Eclipse Shortcut Keys for Java Top10) 0.背景Eclipse作为Java的OpenSource开发IDE,已经是开发人员进行J ...
- 二、 OSI模型的实现TCP 、IP
主要名词定义: IPIP层接收由更低层(网络接口层例如以太网设备驱动程序)发来的数据包,并把该数据包发送到更高层---TCP或UDP层:相反,IP层也把从TCP或UDP层接收来的数据包传送到更低层.I ...
- log4net 配置完成后发现不能输出日志的解决方法
配置好log4net后发现日志不能输出,打开调试看一下几个属性都是false,(比如isdebugenable =false)这其实是项目的启动时候没有加入一行声明代码导致的,可以在程序的Assemb ...
- ACM/ICPC 2018亚洲区预选赛北京赛站网络赛 B Tomb Raider 【二进制枚举】
任意门:http://hihocoder.com/problemset/problem/1829 Tomb Raider 时间限制:1000ms 单点时限:1000ms 内存限制:256MB 描述 L ...
- fast、faster中ap值的计算
def voc_ap(rec, prec, use_07_metric=False): """ ap = voc_ap(rec, prec, [use_07_metric ...