elasticsearch拼写纠错之Term Suggester】的更多相关文章

一.什么是拼写纠错 拼写纠错就是搜索引擎可以智能的感知用户输入关键字的错误,并使用纠正过的关键字进行搜索展示给用户:拼写纠错是一种改善用户体验的功能: elasticsearch提供了以下不同类型的suggester来完成拼写纠错和自动完成功能: term suggester主要针对单个的term分词进行纠正的场景: phrase suggester主要针对整个短语的拼写纠正场景: completion suggester主要提供一种快速高效的自动提示功能: 二.Term Suggester基于…
BK树或者称为Burkhard-Keller树,是一种基于树的数据结构,被设计于快速查找近似字符串匹配,比方说拼写纠错,或模糊查找,当搜索”aeek”时能返回”seek”和”peek”. 本文首先剖析了基本原理,并在后面给出了Java源码实现. BK树在1973年由Burkhard和Keller第一次提出,论文在这<Some approaches to best match file searching>.这是网上唯一的ACM存档,需要订阅.更细节的内容,可以阅读这篇论文<Fast Ap…
Elasticsearch 5.0 关于term query和match query的认识 一.基本情况 前言:term query和match query牵扯的东西比较多,例如分词器.mapping.倒排索引等.我结合官方文档中的一个实例,谈谈自己对此处的理解 string类型在es5.*分为text和keyword.text是要被分词的,整个字符串根据一定规则分解成一个个小写的term,keyword类似es2.3中not_analyzed的情况. string数据put到elasticse…
lasticsearch查询模式 一种是像传递URL参数一样去传递查询语句,被称为简单查询 GET /library/books/_search //查询index为library,type为books的全部内容 GET /library/books/_search?q=price:10 //查询index为library,type为books中price等于10的 另一种是DSL语句来进行查询,被称为DSL查询,term和match就属于DSL term查询 term是代表完全匹配,即不进行分…
http://blog.csdn.net/yangwenbo214/article/details/54142786 一.基本情况 前言:term query和match query牵扯的东西比较多,例如分词器.mapping.倒排索引等.我结合官方文档中的一个实例,谈谈自己对此处的理解 string类型在es5.*分为text和keyword.text是要被分词的,整个字符串根据一定规则分解成一个个小写的term,keyword类似es2.3中not_analyzed的情况. string数据…
Elasticsearch查询模式 一种是像传递URL参数一样去传递查询语句,被称为简单查询 GET /library/books/_search //查询index为library,type为books的全部内容 GET /library/books/_search?q=price:10 //查询index为library,type为books中price等于10的 另一种是DSL语句来进行查询,被称为DSL查询,term和match就属于DSL term查询 term是代表完全匹配,即不进行…
改正用户拼写 Term suggester:词项匹配建议:可以通过wiki的插件来下载wiki上面的单词以及短语,来作为你的拼写提示基础仓库: Phrase suggester:n-gram算法,短语匹配: Complete suggester:prefix匹配:内置了FST(Finite State Tranduter)数据结构,实现快速检索,自动完成后续字符填充:但是这个在实现层面上,对于输入那些内容需要预先指定好,这个工作量可就有点大了,然后指定output,就是这些指定的内容输入后,将会…
Term suggester 创建索引 curl -XPUT 'http://172.16.125.136:9200/term?pretty'创建 mapping curl -XPOST http://172.16.125.136:9200/term/suggester/_mapping -H 'Content-Type:application/json' -d '{"properties":{"body":{"type":"text&…
1.概念 1.补全api主要分为四类 Term Suggester(纠错补全,输入错误的情况下补全正确的单词) Phrase Suggester(自动补全短语,输入一个单词补全整个短语) Completion Suggester(完成补全单词,输出如前半部分,补全整个单词) Context Suggester(上下文补全) 整体效果类似百度搜索,如图: 2.Term Suggester(纠错补全) 2.1.api 1.建立索引 PUT /book4 { "mappings": { &q…
一.查询建议介绍 1. 查询建议是什么? 查询建议,为用户提供良好的使用体验.主要包括: 拼写检查: 自动建议查询词(自动补全) 拼写检查如图: 自动建议查询词(自动补全): 2. ES中查询建议的API 查询建议也是使用_search端点地址.在DSL中suggest节点来定义需要的建议查询 示例1:定义单个建议查询词 POST twitter/_search { "query" : { "match": { "message": "…