业务问题

业务需求是不断变化迭代的，也许我们之前写的某个业务逻辑在下个版本就变化了，我们可能需要修改原来的设计，例如数据库可能需要添加一个字段或删减一个字段，而在搜索中也会发生这件事，即使你认为现在的索引设计已经很完美了，在生产环境中，还是有可能需要做一些修改的，需要添加映射字段或者需要修改字段类型等等。

数据库中我们可以直接修改原来的表设计语句，前提是需要做好数据迁移。但是在 Elasticsearch 中就没那么简单了。尽管可以增加新的类型到索引中，或者增加新的字段到类型中，但是不能添加新的分析器或者对现有的字段做改动。如果你那么做的话，结果就是那些已经被索引的数据就不正确，搜索也不能正常工作。针对这个问题必须重新建立索引。

别名定义

重新建立索引的问题是必须更新应用中的索引名称，索引别名就是用来解决这个问题的！

假设我们有个学生的原始索引 student_index_v1，我们给它起个别名 student_index，程序中也是用别名 student_index 进行搜索，当我们的业务需求发生改变需要修改索引的时候，我们重新创建个索引 student_index_v2，同时将别名 student_index 指向新的索引 student_index_v2，同时将 student_index_v1 的数据迁移到新的 student_index_v2，这样我们就可以做到在零停机下从旧索引切换到新索引。

索引别名就像一个快捷方式或软连接，可以指向一个或多个索引，也可以给任何一个需要索引名的API来使用，而且别名不能与索引同名。

别名带给我们极大的灵活性，允许我们做下面这些：

在运行的集群中可以无缝的从一个索引切换到另一个索引。
给多个索引分组。
给索引的一个子集创建视图。

别名管理

别名还可以映射到某个索引也可以映射到多个索引。别名还可以与筛选器关联，筛选器将在搜索和路由值时自动应用，别名不能与索引同名。

Elasticsearch 中有两种方式管理别名： _alias 用于单个操作， _aliases 用于执行多个原子级操作。

单个索引别名

POST /_aliases

{

    "actions" : [

        { "add" : { "index" : "test1", "alias" : "alias1" } }

    ]

}

删除别名

POST /_aliases

{

    "actions" : [

        { "remove" : { "index" : "test1", "alias" : "alias1" } }

    ]

}

重命名别名

POST /_aliases

{

    "actions" : [

        { "remove" : { "index" : "test1", "alias" : "alias1" } },

        { "add" : { "index" : "test2", "alias" : "alias1" } }

    ]

}

重命名别名是一个简单的删除然后指向新的索引。这个操作是原子性的，因此不需要担心短时间内的别名不指向一个索引。

将别名与多个索引关联

POST /_aliases

{

    "actions" : [

        { "add" : { "index" : "test1", "alias" : "alias1" } },

        { "add" : { "index" : "test2", "alias" : "alias1" } }

    ]

}

亦可以通过索引数组的方式来实现

POST /_aliases

{

    "actions" : [

        { "add" : { "indices" : ["test1", "test2"], "alias" : "alias1" } }

    ]

}

对于上面的示例，还可以使 glob pattern 将别名关联到拥有公共名称的多个索引:

POST /_aliases

{

    "actions" : [

        { "add" : { "index" : "test*", "alias" : "all_test_indices" } }

    ]

}

Filtered Aliases

过滤器别名提供了一个简单的方法对同一个索引来创建不同的“视图”。过滤器能够使用Query DSL来定义并且被应用到所有的搜索，统计，通过查询删除和其它类似的行为。

为了创建一个带过滤器的别名，首先需要确保映射的字段已经存在于mapping中。

PUT /test1

{

  "mappings": {

    "_doc": {

      "properties": {

        "user" : {

          "type": "keyword"

        }

      }

    }

  }

}

然后我们可以创建一个在user字段上带过滤器的别名。

POST /_aliases

{

    "actions" : [

        {

            "add" : {

                 "index" : "test1",

                 "alias" : "alias2",

                 "filter" : { "term" : { "user" : "kimchy" } }

            }

        }

    ]

}

成功则返回

{"acknowledged":true}

这样设置之后，我们通过 test1 这个 index 直接进行搜索可以看到索引的全部文档，但是通过 alias2 这个别名就只能看到符合过滤器过滤后的结果了，即只有一个 user 为 "kimchy" 的结果。

Routing

可以将路由值与别名关联。这个特性可以与过滤别名一起使用，以避免不必要的碎片操作。

何为路由？

所有的文档 API（ get 、 index 、 delete 、 bulk 、 update 以及 mget ）都接受一个叫做 routing 的路由参数，通过这个参数我们可以自定义文档到分片的映射。一个自定义的路由参数可以用来确保所有相关的文档---例如所有属于同一个用户的文档都被存储到同一个分片中。

以下命令创建一个指向索引 test 的新别名 alias1。创建 alias1 后，所有具有此别名的操作将自动修改为使用值 1 进行路由:

POST /_aliases

{

    "actions" : [

        {

            "add" : {

                 "index" : "test",

                 "alias" : "alias1",

                 "routing" : "1"

            }

        }

    ]

}

还可以为搜索和索引操作指定不同的路由值

POST /_aliases

{

    "actions" : [

        {

            "add" : {

                 "index" : "test",

                 "alias" : "alias2",

                 "search_routing" : "1,2",

                 "index_routing" : "2"

            }

        }

    ]

}

如上例所示，搜索路由(search_routing)可能包含几个用逗号分隔的多个值，但是索引路由(index_routing)就只能包含一个值。

如果使用路由别名的搜索操作也有路由参数，则使用搜索别名路由和参数中指定的路由的交集。例如，下面的命令将使用“2”作为路由值。因为搜索操作中有路由参数2,3，而搜索路由设置的是1,2，所以取交集即为2。

GET /alias2/_search?q=user:kimchy&routing=2,3

别名示例

仍然以上面学生的例子， student_index 是一个指向当前真实索引的别名。真实索引包含一个版本号： student_index_v1 ， student_index_v2 等等。

首先，创建索引 student_index_v1 ，然后将别名 student_index 指向它：

PUT /student_index_v1  // 创建索引 student_index_v1 。

PUT /student_index_v1/_alias/student_index  //设置别名 student_index 指向 student_index_v1 。

你可以检测这个别名指向哪一个索引：

GET /*/_alias/student_index

或哪些别名指向这个索引：

GET /student_index_v1/_alias/*

两者都会返回下面的结果：

{

    "student_index_v1" : {

        "aliases" : {

            "student_index" : { }

        }

    }

}

然后，我们决定修改索引中一个字段的映射。当然，我们不能修改现存的映射，所以我们必须重新索引数据。首先, 我们用新映射创建索引 student_index_v2 ：

PUT /student_index_v2

{

    "mappings": {

        "my_type": {

            "properties": {

                "tags": {

                    "type":   "string",

                    "index":  "not_analyzed"

                }

            }

        }

    }

}

然后我们将数据从 student_index_v1 索引到 student_index_v2 ，下面的过程在重新索引你的数据中已经描述过。一旦我们确定文档已经被正确地重索引了，我们就将别名指向新的索引。

一个别名可以指向多个索引，所以我们在添加别名到新索引的同时必须从旧的索引中删除它。这个操作需要原子化，这意味着我们需要使用 _aliases 操作：

POST /_aliases

{

    "actions": [

        { "remove": { "index": "student_index_v1", "alias": "student_index" }},

        { "add":    { "index": "student_index_v2", "alias": "student_index" }}

    ]

}

经过以上几步操作，你的应用就成功在零停机的情况下从旧索引迁移到新索引了。其实别名还有更多管理的语法。

文档迁移

对于新旧索引的文档数据迁移，字段 _source 的一个优点是在Elasticsearch中已经有整个文档。你不必从源数据中重建索引，而且那样通常比较慢。

为了有效的重新索引所有在旧的索引中的文档，用 scroll 从旧的索引检索批量文档，然后用 bulk API 把文档推送到新的索引中。

对现有数据的这类改变最简单的办法就是重新索引：用新的setting创建新的索引并把文档从旧的索引复制到新的索引。

总结

在你的应用中最好的方式是使用别名而不是索引名。这样你就可以在任何时候重建索引。别名的开销很小，应该广泛使用。本文主要整理自官方文档。

Elasticsearch 通关教程（三）：索引别名Aliases问题的更多相关文章

Elasticsearch入门教程(三)：Elasticsearch索引&映射
原文:Elasticsearch入门教程(三):Elasticsearch索引&映射版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文 ...
Elasticsearch 通关教程（七）： Elasticsearch 的性能优化
硬件选择 Elasticsearch(后文简称 ES)的基础是 Lucene,所有的索引和文档数据是存储在本地的磁盘中,具体的路径可在 ES 的配置文件../config/elasticsearch. ...
Elasticsearch通关教程（一）：基础入门
简介 Elasticsearch是一个高度可扩展的.开源的.基于 Lucene 的全文搜索和分析引擎.它允许您快速,近实时地存储,搜索和分析大量数据,并支持多租户. Elasticsearch也使用J ...
Elasticsearch 通关教程（二）：索引映射Mapping问题
数据库建表的时候,我们的DDL语句一般都会指定每个字段的存储类型,例如:varchar,int,datetime等等,目的很明确,就是更精确的存储数据,防止数据类型格式混乱. CREATE TABLE ...
Elasticsearch通关教程（五）：如何通过SQL查询Elasticsearch
前言这篇博文本来是想放在全系列的大概第五.六篇的时候再讲的,毕竟查询是在索引创建.索引文档数据生成和一些基本概念介绍完之后才需要的.当前面的一些知识概念全都讲解完之后再讲解查询是最好的,但是最近公司 ...
Elasticsearch 通关教程（四）：分布式工作原理
前言通过前面章节的了解,我们已经知道 Elasticsearch 是一个实时的分布式搜索分析引擎,它能让你以一个之前从未有过的速度和规模,去探索你的数据.它被用作全文检索.结构化搜索.分析以及这三个 ...
Elasticsearch 通关教程（六）：自动发现机制 - Zen Discoveryedit
发现方式 Zen discovery是内建的.默认的.用于Elasticsearch的发现模块.它提供了单播和基于文件的发现,可以通过插件扩展到支持云环境和其他形式的发现. Zen Discovery ...
elasticsearch最全详细使用教程：入门、索引管理、映射详解、索引别名、分词器、文档管理、路由、搜索详解
一.快速入门1. 查看集群的健康状况http://localhost:9200/_cat http://localhost:9200/_cat/health?v 说明:v是用来要求在结果中返回表头状 ...
elasticsearch系列二：索引详解（快速入门、索引管理、映射详解、索引别名）
一.快速入门 1. 查看集群的健康状况 http://localhost:9200/_cat http://localhost:9200/_cat/health?v 说明:v是用来要求在结果中返回表头 ...

随机推荐

SpringCloud系列——Eureka 服务注册与发现
前言 Eureka是一种基于REST(具像状态传输)的服务,主要用于AWS云中定位服务,以实现中间层服务器的负载平衡和故障转移.本文记录一个简单的服务注册与发现实例. GitHub地址:https:/ ...
C#组件系列——又一款日志组件：Elmah的学习和分享
前言:好久没动笔了,都有点生疏,12月都要接近尾声,可是这月连一篇的产出都没有,不能坏了“规矩”,今天还是来写一篇.最近个把月确实很忙,不过每天早上还是会抽空来园子里逛逛.一如既往,园子里每年这个时候 ...
树莓派3B+通过路由器进SSH和VNC
1.打开树莓派官网 www.raspberrypi.org 选择 ”Raspbian Stretch with desktop and recommended software“ 并下载镜像包含推荐 ...
[转]【翻译】在Visual Studio中使用Asp.Net Core MVC创建你的第一个Web API应用（一）
本文转自:https://www.cnblogs.com/inday/p/6288707.html HTTP is not just for serving up web pages. It’s al ...
Java开发笔记（十八）上下求索的while循环
循环是流程控制的又一重要结构,“白天-黑夜-白天-黑夜”属于时间上的循环,古人“年复一年.日复一日”的“日出而作.日落而息”便是每天周而复始的生活.计算机程序处理循环结构时,给定一段每次都要执行的代码 ...
JAVA-HashMap实现原理
一.HashMap实现原理 1. HashMap概述 HashMap是基于哈希表的Map接口的非同步实现.它允许存入null值和null键.它不保证存入元素的顺序与操作顺序一致,主要是不保证元素的顺序 ...
nginx系列3：搭建一个静态资源web服务器
搭建静态资源web服务器 1,创建静态页面在nginx的安装目录(/usr/local/nginx)下创建文件夹webapplications/helloworld,然后创建一个名为index.ht ...
Fundebug前端JavaScript插件更新至1.7.1，拆分录屏代码，还原部分Script error.
摘要: BUG监控插件压缩至18K. 1.7.1拆分了录屏代码,BUG监控插件压缩至18K,另外我们还原了部分Script error,帮助用户更方便地Debug.请大家及时更新哈~ 拆分录屏代码从 ...
vue 如何点击按钮返回上一页
1,vue 如何点击按钮返回上一页呢? 这是vue挂载的范围html代码 <div @click="goOff()">返回</div> 下面是点击返回的方法 ...
ios屏幕怎么投屏到电脑显示器
iphone在国内一直都很受欢迎,为什么这么受欢迎呢?其实苹果手机操作系统非常的新颖,让人对手机有了重新的认识.但是ios屏幕怎么投屏到电脑显示器.感兴趣的一起阅读下面的内容吧! 使用工具: 苹果手机 ...

Elasticsearch 通关教程（三）： 索引别名Aliases问题