背景

项目中有个需求是需要几个字段作为标签,统计各个标签的文档数量,同时支持分词后的全文检索功能。

原有的mapping设计:

curl -XPUT http://ip:9200/meta_es_metric_data -d'

{
"settings": {
"number_of_shards": 5,
"number_of_replicas": 0
},
"mappings": {
"meta_metric": {
"properties": {
"metricCode": {
"type": "text",
"analyzer" : "ik_max_word"
},
"metricTechType": {
"type": "keyword"
},
"dataDomainName": {
"type": "keyword"
},
"sceneClassify": {
"type": "keyword"
},
"metricClassify": {
"type": "keyword"
}
}
}
}
}'

其中keyword类型就是作为标签统计字段,因为其类型不支持分词检索,检索时必须精确查找,我们尝试把其类型修改成text,text本身就是支持分词索引,但是修改后就报错了:

Fielddata is disabled on text fields by default

经过查询了解es一个字段类型被设置为text,再进行聚合统计,就会报上面的问题.

那么ES有没有办法支持一个字段又支持分词检索同时可以进行统计的特性呢?其实就是ES是否可以一个字段定义两种类型: keyword 和 text.

答案是有的.

ES字段的fields属性

通过fields属性来让当前字段同时具备keyword和text类型

由于我们本身的字段类型是keyword,那我在field 属性中添加一个text,是否就满足需求呢?如:

curl -XPUT http://ip:9200/meta_es_metric_data -d'

{
"settings": {
"number_of_shards": 5,
"number_of_replicas": 0
},
"mappings": {
"meta_metric": {
"properties": {
"metricCode": {
"type": "text",
"analyzer" : "ik_max_word"
},
"metricTechType": {
"type": "keyword"
fields": {
"raw": {
"type": "text"
}
}
}
}
}
}
}'

当用match 搜索metricTechType.raw, 分词搜索是不行的。

之所以想这样做是因为ES支持新增字段、更新字段,但是不支持字段类型的修改

这条方法走不通,就比较复杂了,因为考虑修改字段类型,我们只能重建mapping, 同时涉及历史数据的加载处理。

具体步骤

1.重建索引,因es不支持修改字段类型

curl -XPUT http://ip:9200/meta_es_metric_data_new -d'

{
"settings": {
"number_of_shards": 5,
"number_of_replicas": 0
},
"mappings": {
"meta_metric": {
"properties": {
"metricCode": {
"type": "text",
"analyzer" : "ik_max_word"
}, "metricTechType": {
"type": "text",
"fields": {
"raw": {
"type": "keyword"
}
}
}, "dataDomainName": {
"type": "text",
"fields": {
"raw": {
"type": "keyword"
}
}
}, "sceneClassify": {
"type": "text",
"fields": {
"raw": {
"type": "keyword"
}
}
}, "metricClassify": {
"type": "text",
"fields": {
"raw": {
"type": "keyword"
}
}
}
}
}
}
}'

2.查看索引映射

curl -XGET  'http://ip:9200/meta_es_metric_data_new/_mapping'

3.将数据加载到新的索引上(老索引的数据还是在的)

curl -XPOST http://ip:9200/_reindex -d'
{
"source":{
"index": "meta_es_metric_data"
}, "dest": {
"index": "meta_es_metric_data_new"
} }'

4.查看老索引数据:


curl -XGET 'http://ip:9200/meta_es_metric_data/_search?pretty' -H 'Content-Type: application/json' -d'
{
"query": {
"match": {
"dataDomainName": "用户"
}
}
}
'

5.删除原索引,给新索引创建别名(为了代码不动)

curl -XDELETE http://ip:9200/meta_es_metric_data

curl -XPOST http://ip:9200/_aliases -d'
{
"actions":[
{
"add": {
"index": "meta_es_metric_data_new",
"alias": "meta_es_metric_data"
} }
] }'

6.测试字段是否支持全文检索及聚合

curl -XGET 'http://ip:9200/meta_es_metric_data_new/_search?pretty' -H 'Content-Type: application/json' -d'
{
"query": {
"match": {
"dataDomainName": "用户"
}
},
"sort": {
"dataDomainName.raw": "asc"
},
"aggs": {
"Cities": {
"terms": {
"field": "dataDomainName.raw"
}
}
}
}
'

总结

本文主要讲解如何让一个字段支持不同方式索引,利用Fields属性. 同时如何对历史存量数据进行处理. keyword类型支持es精确查找以及聚合排序,text支持全文检索,但是不能进行聚合、排序.

参考

  1. https://doc.codingdict.com/elasticsearch/330/

  2. https://cloud.tencent.com/developer/article/1555004

[Elasticsearch] ES 的Mapping 设计在实际场景中应用的更多相关文章

  1. Elasticsearch 第七篇:父子结构mapping设计以及相关查询

    h2.post_title { background-color: rgba(43, 102, 149, 1); color: rgba(255, 255, 255, 1); font-size: 1 ...

  2. Elasticsearch ES索引

    ES是一个基于RESTful web接口并且构建在Apache Lucene之上的开源分布式搜索引擎. 同时ES还是一个分布式文档数据库,其中每个字段均可被索引,而且每个字段的数据均可被搜索,能够横向 ...

  3. elasticsearch(es) 集群恢复触发配置(Local Gateway参数)

    elasticsearch(es) 集群恢复触发配置(Local Gateway) 当你集群重启时,几个配置项影响你的分片恢复的表现. 首先,我们需要明白如果什么也没配置将会发生什么. 想象一下假设你 ...

  4. elasticsearch版本控制及mapping映射属性介绍

    学习elasticsearch不仅只会操作,基本的运行原理我们还是需要进行了解,以下内容我讲对elasticsearch中的基本知识原理进行梳理,希望对大家有所帮助! 一.ES版本控制 1.Elast ...

  5. 【转载】[Elasticsearch]ES入门

    传送门:http://www.cnblogs.com/xing901022 ES即简单又复杂,你可以快速的实现全文检索,又需要了解复杂的REST API.本篇就通过一些简单的搜索命令,帮助你理解ES的 ...

  6. elasticsearch 权威指南Mapping(映射)

    什么是映射 类似于数据库中的表结构定义,主要作用如下: 定义Index下字段名(Field Name) 定义字段的类型,比如数值型,字符串型.布尔型等 定义倒排索引的相关配置,比如是否索引.记录pos ...

  7. ElasticSearch(ES)使用Nested结构存储KV及聚合查询

    自建博客地址:https://www.bytelife.net,欢迎访问! 本文为博客同步发表文章,为了更好的阅读体验,建议您移步至我的博客 本文作者: Jeffrey 本文链接: https://w ...

  8. CSharpGL(2)设计和使用场景元素及常用接口

    CSharpGL(2)设计和使用场景元素及常用接口 2016-08-13 由于CSharpGL一直在更新,现在这个教程已经不适用最新的代码了.CSharpGL源码中包含10多个独立的Demo,更适合入 ...

  9. 【ElasticSearch】:Mapping相关

    Mapping 类似数据库中的表结构定义,主要作用如下: 定义Index下的字段名(Field Name). 定义字段类型,例如数值型.字符串型.布尔型等. 定义倒排索引相关配置,比如是否索引.记录p ...

随机推荐

  1. 我在组内的Java问题排查分享

    前言 最近翻看以前写的 PPT, 发现了在2019年做的一次技术分享,关于 Java 问题排查,由于没什么公司机密可言,整理下分享给大家~ 线上问题处理流程 直接放PPT截图吧,现在看来依然不过时 问 ...

  2. vector初始化的几种方式-STL

     vector<int>::iterator int_ite;  vector<string>::iterator string_ite;  //vector<T> ...

  3. SpringCloud微服务实战——搭建企业级开发框架(三十):整合EasyExcel实现数据表格导入导出功能

      批量上传数据导入.数据统计分析导出,已经基本是系统必不可缺的一项功能,这里从性能和易用性方面考虑,集成EasyExcel.EasyExcel是一个基于Java的简单.省内存的读写Excel的开源项 ...

  4. LeetCode一维数组的动态和

    一维数组的动态和 题目描述 给你一个数组 nums.数组「动态和」的计算公式为:runningSum[i] = sum(nums[0]...nums[i]). 请返回 nums 的动态和. 示例 1: ...

  5. C/C++ Qt 数据库与TableView多组件联动

    Qt 数据库组件与TableView组件实现联动,以下案例中实现了,当用户点击并选中TableView组件内的某一行时,我们通过该行中的name字段查询并将查询结果关联到ListView组件内,同时将 ...

  6. addict, address, adequate

    addict Addiction is a biopsychosocial disorder characterized by repeated use of drugs, or repetitive ...

  7. spring注解-扩展原理

    AnnotationConfigApplicationContext(IOC容器)的有参构造方法中,在refresh()里对这些组件进行初始化 BeanPostProcessor bean后置处理器, ...

  8. jQuery - 的几种删除方法,还有他们的区别

    1.empty() 清空节点,它能清空元素中的所有后代节点,不能删除自己本身这个节点 2.remove() 该节点与该节点所包含的所有后代节点将同时被删除,提供传递一个筛选的表达式,删除指定合集中的元 ...

  9. 搭建mybatis开发环境

    1.创建工程 <groupId>com.hope</groupId>     <artifactId>day01_eesy_01mybatis</artifa ...

  10. 过滤敏感词工具类SensitiveFilter

    网上过滤敏感词工具类有的存在挺多bug,这是我自己改用的过滤敏感词工具类,目前来说没啥bug,如果有bug欢迎在评论指出 使用前缀树 Trie 实现的过滤敏感词,树节点用静态内部类表示了,都写在一个 ...