ES 是 Elastic Search 的缩写,可以理解为一个支持分布式部署的软件。

部署了以后可以当数据库用,虽然官方不建议这样做,但我们是这样干的。

它解决了很多场景下的查询需求,发版速度飞快,用的人蛮多的,使用 Java 开发并开源。

我刚接触没几天遇到了很多坑,在这里记录一下。

  1、如何精确查询中文字段?

使用 keyword 特性,让分析器不进行拆词,然后使用 term query。如:

 [Keyword(Name = nameof(CompanyName), Index = true)]
public string CompanyName { get; set; }
        /// <summary>
/// Term Query 根据公司名称查询
/// </summary>
/// <param name="name"></param>
/// <returns></returns>
public IEnumerable<EnterpriseCreditInfo> SearchByName(string name)
{
var searchedList = this.client
.Search<EnterpriseCreditInfo>(
m => m.Index(index).Query(q =>
//q.MatchPhrase(mc => mc.Field(ff => ff.CompanyName).Query(name))
q.Term(t => t.Field(f => f.CompanyName).Value(name))
));
return searchedList.Hits.Select(m =>
{
m.Source.Id = m.Id;
return m.Source;
});
}

  2、为什么使用 text 特性 标记后使用 term query 查询中文查不到数据?如:

[Text(Name = nameof(CompanyName), Index = true)]
public string CompanyName { get; set; }

Text 特性和 Keyword 特性都是表示 string 类型的。

  其中 Keyword 特性表示将索引 field 的值。

  Text 表示使用分析器进行拆词索引多个 term 。

所以 Text 可以指定分词器而 Keyword 则不行。 如指定 ik 中文分词器:

 [Text(Name = nameof(CompanyName), Index = true, Analyzer = "ik")]
public string CompanyName { get; set; }

至于为什么无法命中索引,是因为默认的 Analyzer = "standard" 分词器会将中文分成一个汉字一个 term 所以直接查询 term 是查询不到的。

  3、如何分词查询中文(全文搜索)?可以使用 match 系列 。自己百度去。

  4、使用 Nest 创建索引的方法有哪些?

        /// <summary>
/// 默认的初始化 client
/// </summary>
/// <param name="nodes">服务器集群</param>
/// <param name="index">索引名</param>
protected virtual void InitClient(IEnumerable<Uri> nodes, string index)
{
var pool = new StaticConnectionPool(nodes); var settings = new ConnectionSettings(pool);
settings.DefaultIndex(index);
settings.DisableDirectStreaming(true);//影响性能发布时注释,用于抓取 request 和 response。
client = new ElasticClient(settings.ThrowExceptions()); //直接抛出异常,发布时去掉。
var exits = client.IndexExists(index); if (!exits.Exists)
{
CreateIndex(index + "_real", index);//默认使用别名,方便索引重建。
}
}
        /// <summary>
/// 当索引不存在的时候创建索引。
/// 根据 <see cref="Nest.ElasticsearchTypeAttribute"/> 自动映射类型
/// 默认创建 NumberOfShards = 5
/// 默认创建 NumberOfReplicas = 1,
/// </summary>
/// <param name="index"></param>
protected virtual void CreateIndex(string index, string Alias)
{
var descriptor = new CreateIndexDescriptor(index)
.Settings(s =>
s.NumberOfShards().NumberOfReplicas())
.Aliases(m => m.Alias(Alias))
.Mappings(ms => ms.Map<T>(m => m
.Properties(ps => ps
.Text(t => t.Name(n => n.Id))
.Text(t => t.Name(n => n.CreateTime).Index(true)))
.AutoMap())); client.CreateIndex(descriptor); }

5、如何使用类似于 sql-in 的查询操作?

  使用操作符| 、& 等拼接 term query ,可以实现各种查询,如 term any (网上抄的):

        /// <summary>
/// term any item of <paramref name="values"/>
/// </summary>
/// <typeparam name="T"></typeparam>
/// <param name="descriptor"></param>
/// <param name="field"></param>
/// <param name="values"></param>
/// <returns></returns>
protected static QueryContainer TermAny(QueryContainerDescriptor<T> descriptor, Field field, IEnumerable<string> values)
{
QueryContainer q = new QueryContainer();
foreach (var value in values)
{
q |= descriptor.Term(t => t.Field(field).Value(value));
}
return q;
}

6、其他注意事项:

1、小写,index 和 type 要小写,否则抛异常。

term 是小写的。所以比如 term query

descriptor.Term(t => t.Field(field).Value("Foo")); 辣鸡 查不出来。用 keyword 不知道区不区分,一会试试再补。

 帮到你的话点赞。

												

ES 使用小结的更多相关文章

  1. ES使用小结之索引Rollover

    Elasticsearch 使用小结之索引Rollover 索引名 一般而言,客户端将数据每天写入一个索引,比如直接写入YYYY-MM-HH格式的索引,那么我们只需要在写入的客户端里面获取时间,然后得 ...

  2. Elasticsearch全文检索实战小结

    一.项目概述 这是一个被我称之为“没有枪.没有炮,硬着头皮自己造”的项目.项目是和其它公司合作的三个核心模块开发. 使用ES的目的是: 1).采集数据.网站数据清洗后存入ES: 2).对外提供精确检索 ...

  3. gitbook 入门教程之使用 gitbook-cli 开发电子书

    gitbook 生成电子书主要有三种方式: gitbook-cli 命令行操作,简洁高效,适合从事软件开发的相关人员. gitbook-editor 编辑器操作,可视化编辑,适合无编程经验的文学创作者 ...

  4. 《死磕 Elasticsearch 方法论》:普通程序员高效精进的 10 大狠招!(完整版)

    原文:<死磕 Elasticsearch 方法论>:普通程序员高效精进的 10 大狠招!(完整版) 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链 ...

  5. 有关于OpenGL、OpenGL ES、WebGL的小结

    转自原文 有关于OpenGL.OpenGL ES.WebGL的小结 一.   OpenGL简介 OpenGL(全写Open Graphics Library)是个定义了一个跨编程语言.跨平台的编程接口 ...

  6. Linux环境下段错误的产生原因及调试方法小结(转)

    最近在Linux环境下做C语言项目,由于是在一个原有项目基础之上进行二次开发,而且 项目工程庞大复杂,出现了不少问题,其中遇到最多.花费时间最长的问题就是著名的“段错误”(Segmentation F ...

  7. Linux环境下段错误的产生原因及调试方法小结

    转载自http://www.cnblogs.com/panfeng412/archive/2011/11/06/2237857.html 最近在Linux环境下做C语言项目,由于是在一个原有项目基础之 ...

  8. Unity3d 经验小结

      Unity3d 经验小结 文本教程 你是第2541个围观者 0条评论 供稿者:Jamesgary 标签:unity3d教程 Fbx.贴图导入Unity时的注意事项: 在导出Fbx之前,Maya中已 ...

  9. simple_html_dom使用小结

    simple_html_dom使用小结 分类: PHP2012-08-31 14:24 3094人阅读 评论(0) 收藏 举报 htmlcallbackstringdivfunctionfile  1 ...

随机推荐

  1. 全网最详细的IDEA、Eclipse和MyEclipse之间于Java web项目发布到Tomcat上运行成功的对比事宜【博主强烈推荐】【适合普通的还是Maven方式创建的】(图文详解)

    不多说,直接上干货! IDEA [适合公司业务]全网最详细的IDEA里如何正确新建[普通或者Maven]的Java web项目并发布到Tomcat上运行成功[博主强烈推荐](类似eclipse里同一个 ...

  2. U盘上安装Ubuntu系统 便捷式系统 - 赖大大

    简单介绍: U盘可以作为电脑的磁盘使用,在U盘上安装Ubuntu系统,只要有电脑,就可以轻松打开自己的系统, 方便又快捷,非常适合出差工作,学习使用. 另外,插入U盘后,需要我们就入电脑的Blos模式 ...

  3. epoll的ET和LT模式

    epoll有两种模式,Edge Triggered(简称ET) 和 Level Triggered(简称LT). 在采用这两种模式时要注意的是,如果采用ET模式,那么仅当状态发生变化时才会通知,而采用 ...

  4. 怎么样在windows命令下创建一个没有文件名的文件?

    直接上图 echo ' ' >> .aa //创建一个空字符的 .aa 的文件

  5. mysql主从复制总结

    第一步:开启所有MYSQL服务器的BIN日志,每台服务器设置一个唯一的server-id的值(默认是1,一般取IP最后一段) 修改主服务器(master)的my.cnf [mysqld] log-bi ...

  6. 微信小程序https配置

    先简单说下什么是https,https与http区别 ,以及https的原理 什么是https 在说HTTPS之前先说说什么是HTTP,HTTP就是我们平时浏览网页时候使用的一种协议.HTTP协议传输 ...

  7. Deep learning with Python 学习笔记(8)

    Keras 函数式编程 利用 Keras 函数式 API,你可以构建类图(graph-like)模型.在不同的输入之间共享某一层,并且还可以像使用 Python 函数一样使用 Keras 模型.Ker ...

  8. 解决SharePoint 2010拒绝访问爬网内容源错误

    今天发现SP爬网出现了问题,持续时间蛮长的,一直爬不到内容. 解决方案: 这里有一条解决在SharePoint 2010搜索爬网时遇到的"拒绝访问错误"的小技巧. 首先要检查默认内 ...

  9. python之字符串中有关%d,%2d,%02d的问题

    python之字符串中有关%d,%2d,%02d的问题 在python中,通过使用%,实现格式化字符串的目的.(这与c语言一致) 其中,在格式化整数和浮点数时可以指定是否补0和整数与小数的位数. 首先 ...

  10. Hadoop专有名词

    Hadoop专有名词 一. HDFS 二. MapReduce 1.MRAppMaster:MapReduce Application Master 负责整个过程调度和协调的 2.MapTask:在M ...