《深入理解Elasticsearch》README】的更多相关文章

书目 <深入理解ElasticSearch>拉斐尔·酷奇,马雷克·罗戈任斯基[著]张世武,余洪森,商旦[译] 机械工业出版社,2016.1 本系列包括以下8篇笔记 第01章 ElasticSearch简介 第02章 查询DSL进阶 第03章 底层索引控制 第04章 分布式索引架构 第05章 管理ElasticSearch 第06章 故障处理 第07章 改善用户搜索体验 第08章 ElasticSearch Java API 参考资料 [1]Elasticsearch索引的父子关系(index…
深入理解ElasticSearch 介绍: 本书涵盖了Elasticsearch的许多中高级功能,并介绍了缓存.ApacheLucene库以及监控等模块的内部运作机制.其中,还涉及一些实用案例,比如配置Elasticsearch参数.使用监控API等. 目录: 前言 第1章 Elasticsearch简介1 1.1 Apache Lucene简介1 1.1.1 熟悉Lucene2 1.1.2 Lucene的总体架构2 1.1.3 分析数据4 1.1.4 Lucene查询语言5 1.2 何为Ela…
1.es与MySQL的概念对比 2.概念理解 2.1 Index : 一个索引即是文档的集合 2.2 Document : 一个文档即是一个可被索引的基础单元信息,一条记录: 2.3 Replicas : 索引一份或多份存储,可以理解成冗余存储以防数据丢失: 2.4 shards : 一个索引被截断若干小片存储,每个片就是一个shard. 参考:http://www.dataguru.cn/thread-608747-1-1.html https://www.cnblogs.com/keving…
1.多节点监控 2.类似war功能部署,tomcat即可使用 3.免费 4.ElasticHQ supports all major version of Elasticsearch from version 2.x, 5.x, 6.x…
以下是官网手册(部分)(v5.1) 直接直接看官网手册 https://www.elastic.co/guide/en/elasticsearch/reference/5.1/search-aggregations-metrics-top-hits-aggregation.html Top hits Aggregationedit A top_hits metric aggregator keeps track of the most relevant document being aggreg…
理解二次评分 二次评分是指重新计算查询返回文档中指定个数文档的得分,es会截取查询返回的前N个,并使用预定义的二次评分方法来重新计算他们的得分 小结 有时候,我们需要显示查询结果,并且使得页面上靠前文档的顺序能受到一些额外的规则控制,但遗憾的是,我们并不能通过二次评分来实现,也许有些读者会想到window-size参数,然而实际上这个参数与返回列表中靠前文档并无关系,他只是制定了每个分片应该返回的文档数,而且window_size不能小于页面大小 二次评分功能并不能与排序一起使用,这是因为排序发…
1.为什么使用查询模版 让应用程序开发者只需要把查询传递给elasticsearch,而不需要考虑查询语句的构造.查询DSL语法.查询结果过滤等细节知识. 2.使用版本5.1,查询模版在5.6中发生变化.注意.官网地址  https://www.elastic.co/guide/en/elasticsearch/reference/5.1/search-template.html 3.注册查询模版 方法一:使用配置文件,需要copy到集群所有节点 You can register search…
计算文档得分的因子: 文档权重(document boost):索引期赋予某个文档的权重值 字段权重(field boost):查询期赋予某个文档的权重值 协调因子(coord):基于文档中词项个数的协调因子,一个文档命中率查询中的词项越多,得分越高 逆文档频率(inverse document frequency):一个基于词项的因子,用来告诉评分公式该词项还有多么罕见,评分公式利用该因子,为包含罕见词项的文档加权 长度范数(length norm):每字段的基于词项个数的归一化因子(在索引期…
Lucene的概念 document:以json的形式体现,搜索和搜索的主要载体 field:document的一个部分 term(词项):代表文本中的一个词 token(词条):term在field中的一次出现,包括词项的文本.开始和结束的偏移.词条类型 inverted index(倒排索引):将词项映射到文档.倒排索引是面向词项,而不是面向文档的. segmeng:每个索引由多个段组成,创建后不再修改,文档被删除后,删除信息单独保存在一个文档中,而段本身并没有修改. segmengs me…
一.高亮的一些问题 elasticsearch提供了三种高亮方式,前面我们已经简单的了解了elasticsearch的高亮原理; 高亮处理跟实际使用查询类型有十分紧密的关系,其中主要的一点就是muti term 查询的重写,例如wildcard.prefix等,由于查询本身和高亮都涉及到查询语句的重写,如果两者之间的重写机制不同,那么就可能会碰到以下情况 相同的查询语句, 使用unified和fvh得到的高亮结果是不同的,甚至fvh Highlighter无任何高亮信息返回: 二.数据环境 el…