模糊搜索

可以进行模糊搜索:

  1. GET job/type1/_search
  2. {
  3. "query":{
  4. "fuzzy":{
  5. "title":{
  6. "value":"linx",
  7. "fuzziness": 2,
  8. "prefix_length": 1
  9. }
  10. }
  11. }
  12. }

在上面的例子中,可模糊查询与linx相似的单词。

fuzziness是指“编辑距离”,就是说从一个字符串想要通过增删改变换到另一个字符串,需要操作的最少次数。比如,linux和linxu之间的编辑距离为1,因为交换ux就可以完成变换。

prefix_length是说多少位字符认为是前缀。前缀部分必须完全匹配。

搜索建议

搜索建议功能,需要配合程序,在向es中存入文档时,就需要通过分词等方式,指定搜索建议字段的内容。

指定之后,可通过suggest方式,根据用户的当前输入,获取搜索建议:

  1. GET wechatsearch/passage/_search
  2. {
  3. "suggest":{
  4. "my-suggest":{
  5. "text":"ppt",
  6. "completion":{
  7. "field":"suggest",
  8. "fuzzy":{
  9. "fuzziness":2
  10. }
  11. }
  12. }
  13. },
  14. "_source": "ptitle"
  15. }

上面代码搜索出与ppt关键词相近的搜索建议。其中,fuzziness值为2,因此,像p2p、pdf之类的关键词也会被搜索出来。较小的fuzziness会有更精确的匹配。

返回结果示例:

  1. {
  2. "took": 20,
  3. "timed_out": false,
  4. "_shards": {
  5. "total": 5,
  6. "successful": 5,
  7. "failed": 0
  8. },
  9. "hits": {
  10. "total": 0,
  11. "max_score": 0,
  12. "hits": []
  13. },
  14. "suggest": {
  15. "my-suggest": [
  16. {
  17. "text": "ppt",
  18. "offset": 0,
  19. "length": 3,
  20. "options": [
  21. {
  22. "text": "pdf",
  23. "_index": "wechatsearch",
  24. "_type": "passage",
  25. "_id": "16",
  26. "_score": 10,
  27. "_source": {
  28. "ptitle": "Smallpdf:无所不能的PDF在线处理站"
  29. }
  30. },
  31. {
  32. "text": "ppt",
  33. "_index": "wechatsearch",
  34. "_type": "passage",
  35. "_id": "7",
  36. "_score": 10,
  37. "_source": {
  38. "ptitle": "这18个技巧都不知道,别说你会做PPT"
  39. }
  40. },
  41. {
  42. "text": "pa",
  43. "_index": "wechatsearch",
  44. "_type": "passage",
  45. "_id": "10",
  46. "_score": 5,
  47. "_source": {
  48. "ptitle": "吐血整理了这20个堪称神器的网站,个个都能解你燃眉之急"
  49. }
  50. }
  51. ]
  52. }
  53. ]
  54. }
  55. }

搜索高亮

可以指定哪些字段搜索高亮,并且指定高亮字符两侧的包裹标签,从而实现查询的返回结果包含html高亮效果。

  1. GET /megacorp/employee/_search
  2. {
  3. "query" : {
  4. "match_phrase" : {
  5. "about" : "rock climbing"
  6. }
  7. },
  8. "highlight": {
  9. "fields" : {
  10. "about" : {}
  11. }
  12. }
  13. }

注意,高亮的结果在返回时单独存放,并不是将_source数据做了改变。

单独有一个highlight部分存放高亮内容:

  1. {
  2. ...
  3. "hits": {
  4. "total": 1,
  5. "max_score": 0.23013961,
  6. "hits": [
  7. {
  8. ...
  9. "_score": 0.23013961,
  10. "_source": {
  11. "first_name": "John",
  12. "last_name": "Smith",
  13. "age": 25,
  14. "about": "I love to go rock climbing",
  15. "interests": [ "sports", "music" ]
  16. },
  17. "highlight": {
  18. "about": [
  19. "I love to go <em>rock</em> <em>climbing</em>"
  20. ]
  21. }
  22. }
  23. ]
  24. }
  25. }

关于ES的入门使用暂时整理到这里。

ES的官方文档是最好的参考资料,介绍很全面。


完成这些文档的同时,做了一个简单的小项目,基于Python(Django)的web搜索界面,采用ES作为搜索引擎。

此项目地址:

https://github.com/dox1994/WechatSearch_Python

搜索提示:

搜索结果:

Elastic Search快速上手(4):细节补充的更多相关文章

  1. Elastic Search快速上手(1):简介及安装配置

    前言 最近开始尝试学习Elastic Search,因此决定做一些简单的整理,以供后续参考,快速上手使用ES. 简介 ElasticSearch是一个基于Lucene的搜索服务器.它提供了一个分布式多 ...

  2. Elastic Search快速上手(2):将数据存入ES

    前言 在上手使用前,需要先了解一些基本的概念. 推荐 可以到 https://www.elastic.co/guide/cn/elasticsearch/guide/current/index.htm ...

  3. Elastic Search快速上手(3):搜索

    前言 存储好数据之后,便可通过RESTful API进行搜索. 详细文档可参考: --简单搜索https://www.elastic.co/guide/cn/elasticsearch/guide/c ...

  4. Elastic Search快速入门

    https://blog.csdn.net/weixin_42633131/article/details/82902812 通过这个篇文章可以快速入门,快速搭建一个elastic search de ...

  5. socket网络编程快速上手(二)——细节问题(4)

    5.慢系统调用及EINTR 还记得前面readn和writen函数么?里面有个EINTR,现在就来谈谈这个,这个很重要. Linux世界有个叫信号的东西,感觉他就像一位隐士,很少遇到他,而他又无处不在 ...

  6. WebAPI调用笔记 ASP.NET CORE 学习之自定义异常处理 MySQL数据库查询优化建议 .NET操作XML文件之泛型集合的序列化与反序列化 Asp.Net Core 轻松学-多线程之Task快速上手 Asp.Net Core 轻松学-多线程之Task(补充)

    WebAPI调用笔记   前言 即时通信项目中初次调用OA接口遇到了一些问题,因为本人从业后几乎一直做CS端项目,一个简单的WebAPI调用居然浪费了不少时间,特此记录. 接口描述 首先说明一下,基于 ...

  7. socket网络编程快速上手(二)——细节问题(5)(完结篇)

    6.Connect的使用方式 前面提到,connect发生EINTR错误时,是不能重新启动的.那怎么办呢,是关闭套接字还是直接退出进程呢?如果EINTR前,三次握手已经发起,我们当然希望链路就此已经建 ...

  8. 简明易懂,将细节隐藏,面向新手树立web开发概念——学完Java基础语法,超快速上手springboot+mybatiJavaWeb开发

    简明易懂,将细节隐藏,面向新手树立web开发概念 --学完Java基础语法,超快速上手JavaWeb开发 Web本质(先忽视各种协议) Web应用可以理解为浏览器和服务器之间的交互. 我们可以看一个简 ...

  9. 快速上手RaphaelJS-Instant RaphaelJS Starter翻译(一)

       (目前发现一些文章被盗用的情况,我们将在每篇文章前面添加原文地址,本文源地址:http://www.cnblogs.com/idealer3d/p/Instant_RaphaelJS_Start ...

随机推荐

  1. yum install 报错

    把python2升级到python3以后,yum报错: [root@localhost Python-]# yum install openssl File except KeyboardInterr ...

  2. IE与其他浏览器兼容性问题总结

    1.eval(idName) [问题描述]:IE.safari.Chrome浏览器下都可以使用eval(idName)或getElementById(idName)来取得id为idName的HTML对 ...

  3. Apache Flink - 配置依赖,连接器,库

    每个Flink程序都依赖于一组Flink库. 1.Flink核心和应用程序依赖项 Flink本身由一组类和运行需要的依赖组成.所有类和依赖的组合形成了Flink运行时的核心,并且当一个Flink程序运 ...

  4. mybatis参数形式

    1 使用map <select id="selectRole" parameterType="map" resultType="RoleMap& ...

  5. windows 连接 Linux 云服务器

    1.在我们购买了 阿里云 或者 腾讯云后,如果选择使用的是 Linux 系统,在 windows 上要远程连接,需要用到的是 putty 这一个软件 putty 官网:https://www.putt ...

  6. 定位ScheduledExecutorService过了一段时间不执行问题

    今天查看生产环境的sentinel控制台,发现某dubbo应用一共5个节点,有3个失联了. 查看失联节点的应用日志,服务没有挂,各dubbo接口的日志正常在打印. 在应用节点ping/telnet s ...

  7. Python Docstring 风格和写法学习

    什么是Python Docstring 和Java类似,Python也通过注释形式的Docstring给程序.类.函数等建立文档.通过Docstring建立的文档不仅对人来说有更好的可读性,也能够让I ...

  8. 西湖论剑2019部分writeup

    做了一天水了几道题发现自己比较菜,mfc最后也没怼出来,被自己菜哭 easycpp c++的stl算法,先读入一个数组,再产生一个斐波拉契数列数组 main::{lambda(int)#1}::ope ...

  9. Java8 根据对象某个属性值去重

    list中的对象某个属性存在重复时将重复的对象去重 //根据skuAttrValueName值去重 List<SkuValue> uniqueSkuValues = skuValues.s ...

  10. Oracle查询显示CLOB的内容

    select dbms_lob.substr(note)  from table