ElasticSearch权威指南学习(文档)】的更多相关文章

路由文档到分片 当你索引一个文档,它被存储在单独一个主分片上.Elasticsearch是如何知道文档属于哪个分片的呢?当你创建一个新文档,它是如何知道是应该存储在分片1还是分片2上的呢? 进程不能是随机的,因为我们将来要检索文档.事实上,它根据一个简单的算法决定: shard = hash(routing) % number_of_primary_shards routing值是一个任意字符串,它默认是_id但也可以自定义. 这个routing字符串通过哈希函数生成一个数字,然后除以主切片的数…
什么是文档 在Elasticsearch中,文档(document)这个术语有着特殊含义.它特指最顶层结构或者根对象(root object)序列化成的JSON数据(以唯一ID标识并存储于Elasticsearch中) 文档元数据 节点 说明 _index 文档存储的地方 _type 文档代表的对象的类 _id 文档的唯一标识 _index 索引(index)类似于关系型数据库里的"数据库"--它是我们存储和索引关联数据的地方. _type 在应用中,我们使用对象表示一些"事…
排序方式 相关性排序 默认情况下,结果集会按照相关性进行排序 -- 相关性越高,排名越靠前. 相关性分值会用_score字段来给出一个浮点型的数值,所以默认情况下,结果集以_score进行倒序排列. 字段值排序 使用 sort 参数进行排序: GET /_search { "query" : { "filtered" : { "filter" : { "term" : { "user_id" : 1 }}…
请求体查询 简单查询语句(lite)是一种有效的命令行adhoc查询.但是,如果你想要善用搜索,你必须使用请求体查询(request body search)API. 空查询 我们以最简单的 search API开始,空查询将会返回索引中所有的文档. GET /_search {} 同字符串查询一样,你可以查询一个,多个或_all索引(indices)或类型(types): GET /index_2014*/type1,type2/_search {} 你可以使用from及size参数进行分页:…
概念 映射(mapping)机制用于进行字段类型确认,将每个字段匹配为一种确定的数据类型(string, number, booleans, date等).+ 分析(analysis)机制用于进行全文文本(Full Text)的分词,以建立供搜索用的反向索引. 数据类型差异 在索引中有12个tweets,只有一个包含日期2014-09-15,但是我们看看下面查询中的total hits. GET /_search?q=2014 # 12 个结果 GET /_search?q=2014-09-15…
空集群 只有一个空节点的集群 一个节点(node)就是一个Elasticsearch实例,而一个集群(cluster)由一个或多个节点组成,它们具有相同的cluster.name,它们协同工作,分享数据和负载.当加入新的节点或者删除一个节点时,集群就会感知到并平衡数据. 集群中一个节点会被选举为主节点(master),它将临时管理集群级别的一些变更,例如新建或删除索引.增加或移除节点等.主节点不参与文档级别的变更或搜索,这意味着在流量增长的时候,该主节点不会成为集群的瓶颈.任何节点都可以成为主节…
创建索引 当我们需要确保索引被创建在适当数量的分片上,在索引数据之前设置好分析器和类型映射. 手动创建索引,在请求中加入所有设置和类型映射,如下所示: PUT /my_index { "settings": { ... any settings ... }, "mappings": { "type_one": { ... any mappings ... }, "type_two": { ... any mappings ..…
查询阶段 在初始化查询阶段(query phase),查询被向索引中的每个分片副本(原本或副本)广播. 每个分片在本地执行搜索并且建立了匹配document的优先队列(priority queue). 优先队列 一个优先队列(priority queue is)只是一个存有前n个(top-n)匹配document的有序列表.这个优先队列的大小由分页参数from和size决定.例如,下面这个例子中的搜索请求要求优先队列要能够容纳100个document GET /_search { "from&q…
目录 HTTP权威指南-学习笔记 HTTP: Web的基础 URL与资源 HTTP报文 连接管理 HTTP结构 Web服务器 代理 缓存 集成点: 网关,隧道及中继 Web机器人 识别,认证与安全 客户端识别与cookie机制 基本认证机制 安全HTTP 内容发布与分发 Web主机托管 [] HTTP权威指南-学习笔记 HTTP (Hypertext Transfer Protocol, 超文本传输协议) 运行实例 HTTP: Web的基础 Web客户端和服务器: Web内容都是存储在服务器上的…
本文作为Elastic search系列的开篇之作,简要介绍其简要历史.安装及基本概念和核心模块. 简史 Elastic search基于Lucene(信息检索引擎,ES里一个index—索引,一个索引指向一个或者多个分片—shards,一个分片就是一个Lucene实例). ES的诞生于04年,Shay Banon—据传刚失业又新婚,祸不单行(港蓉蒸蛋糕,蒸的吗),在Lucene的基础上为他去伦敦学厨师的老婆做的食谱搜索.一不小心,搞出了ES,然而老婆大人的食谱搜索却遥遥无期,估计Shay在家键…