solr :term 查询, phrase查询, boolean 查询
搜索总体有:term 查询, phrase查询, boolean 查询
1. SOLR搜索覆盖度和准确度保证的三个搜索方式:
保证准确率: AND: Search for two different terms, new and house, requiring both to match 。完全相同逻辑的两种写法:(+new +house new AND house )
保证覆盖率:OR : Search for two different terms, new and house, requiring only one to match 。solr默认的是OR搜索,所以(new or house, new house)结果一样
保证精准度: "": Search for the exact phrase "new house" ,查询full phrase,则solr会考虑在 new AND house的结果集基础上,考虑new 和house之间的position。
保证覆盖率:Fuzzy matching 模糊搜索(包含:wildcard searching通配符搜索, range searching范围搜索, edit-distance searching编辑距离搜索, and proximity searching邻近搜索. )
其中,
(1)范围搜索例子如下:• Query: yearsOld:[18 TO 21] Matches 18, 19, 20, 21 ;• Query: title:[boat TO boulder] Matches boat, boil, book, boulder, etc. ;• Query: price:[12.99 TO 14.99] Matches 12.99, 13.000009, 14.99, etc. ,范围用{}或[]或者[}或者{],同集合区间表示一样。
(2)编辑距离搜索中:编辑距离定义是An edit distance is defined as an insertion插入, a deletion删除, a substitution置换替换, ora transposition互换 of characters.
例子如下:Query: administrator~1 Matches within one edit distance. • Query: administrator~2 Matches within two edit distances. (T his is the default if no edit distance is provided.) • Query: administrator~N Matches within N edit distances
(3)邻近搜索指的是搜索两个term之间的term:Query: "chief of ficer"~1 ,当你只记得短语的第一个和最后一个词的时候可以采用邻近搜索。邻近搜索的例子:Query: "chief of ficer"~N --- Meaning: Finds chief within N positions of off icer.
2. SOLR提供的排除搜索:
NOT或者 -,都表示否定;如 中国 NOT 北京====中国 - 北京
3. SOLR支持野蛮查询:增加了搜索的灵活性
New AND (house OR (home NOT improvement NOT depot NOT grown))
(+(buying purchasing -renting) +(home house residence –(+property -bedroom)))
不论用什么逻辑来搜索,solr都是先搜索每个term的结果集,然后进行逻辑操作返回真实结果
备注:为了和+ 等符号区分,solr中将AND , OR描述为 binary operator
总体来说:越复杂的搜索越影响效率,所以采用哪种搜索以及设置的参数都需要经过分析,否则保证了业务搜索的效果而影响了性能。
solr :term 查询, phrase查询, boolean 查询的更多相关文章
- Solr 使用自定义 Query Parser(短语查询,精准查询)
原文出处:http://blog.chenlb.com/2010/08/solr-use-custom-query-parser.html 由于 Solr 默认的 Query Parser 生成的 Q ...
- Solr基础理论【倒排索引,模糊查询】
一.简介 现有的许多不同类型 的技术系统,如关系型数据库.键值存储.操作磁盘文件的map-reduce[映射-规约]引擎.图数据库等,都是为了帮助用户解决颇具挑战性的数据存储与检索问题而设计的.而搜索 ...
- 获取文档版本版本值 滚动标识符 游标 控制查询如何执行 控制查询在哪些分片执行 boost加权
映射mapping.json{ "book": { "_index": { "enabled": true }, "_id&quo ...
- ElasticSearch的高级复杂查询:非聚合查询和聚合查询
一.非聚合复杂查询(这儿展示了非聚合复杂查询的常用流程) 查询条件QueryBuilder的构建方法 1.1 精确查询(必须完全匹配上,相当于SQL语句中的“=”) ① 单个匹配 termQuery ...
- 通讯服务类API调用的代码示例合集:短信服务、手机号归属地查询、电信基站查询等
以下示例代码适用于 www.apishop.net 网站下的API,使用本文提及的接口调用代码示例前,您需要先申请相应的API服务. 短信服务:通知类和验证码短信,全国三网合一通道,5秒内到达,费用低 ...
- 生活常用类API调用的代码示例合集:邮编查询、今日热门新闻查询、区号查询等
以下示例代码适用于 www.apishop.net 网站下的API,使用本文提及的接口调用代码示例前,您需要先申请相应的API服务. 邮编查询:通过邮编查询地名:通过地名查询邮编 今日热门新闻查询:提 ...
- SpringData JPA进阶查询—JPQL/原生SQL查询、分页处理、部分字段映射查询
上一篇介绍了入门基础篇SpringDataJPA访问数据库.本篇介绍SpringDataJPA进一步的定制化查询,使用JPQL或者SQL进行查询.部分字段映射.分页等.本文尽量以简单的建模与代码进行展 ...
- 013.子查询和分页子查询(sql实例)
--1 子查询 如果子查询和表连接都实现的时候,推荐用表连接实现( 一般:能用表连接实现的就用表连接,有些情况用表连接不能 或者不易实现的再选择子查询) 系统:缓存,执行计划技术手段 --1 wher ...
- 015-elasticsearch5.4.3【五】-搜索API【四】Joining 多文档查询、GEO查询、moreLikeThisQuery、script脚本查询、span跨度查询
一.Joining 多文档查询 joining query 像Elasticsearch这样的分布式系统中执行完整的SQL样式连接非常昂贵.相反,Elasticsearch提供两种形式的连接,旨在水平 ...
随机推荐
- 免费获得 NTFS for Mac 12. Special Edition 激活码活动
进入页面:http://www.paragon-drivers.com/cn/ntfs-mac-free/ntfs-free.html 先点击“下载”按钮,下载 NTFS for Mac 12. Sp ...
- hdu 5243 Homework
Homework Time Limit: 6000/3000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Su ...
- vue项目组件的全局注册
在vue-cli项目中,我们经常会封装自己的组件,并且要在多个界面中引用它,这个时候就需要全局注册组件. 首先我们会封装自己的组件,比如twoDimensionTable文件夹下的index.vue: ...
- 基于鸿洋博客自定于View实现的android音量调节控件
1.在values建立attrs.xml,写出你需要的属性: <?xml version="1.0" encoding="utf-8"?> < ...
- Javascript-- jQuery Ajax应用
使用ajax()方法加载服务器数据 使用ajax()方法是最底层.功能最强大的请求服务器数据的方法,它不仅可以获取服务器返回的数据,还能向服务器发送请求并传递数值,它的调用格式如下: jQuery.a ...
- PhotoShop使用指南(1)——动态图gif的制作
第一步:菜单栏 > 窗口 > 工作区 > 动感 第二步:时间轴 > 设置延迟时间 第三步:时间轴 > 设置循环次数 第四步:存储为Web所用格式 Ctrl+Shift+A ...
- [基本操作] kd 树
概念就不说了吧,网上教程满天飞 学了半天才知道,kd 树实质上只干了两件事情: 1.快速定位一个点 / 矩形 2.有理有据地优化暴力 第一点大概是可以来做二维平面上给点/矩形打标记的问题 第二点大概是 ...
- poj1778
在一个 8*8 的棋盘里有一个国王和一些骑士,我们要把他们送到同一顶点上去. 国王能够选择一名骑士作为坐骑,而与骑士一起行动(相当于一个骑士),同一位置, 同一时刻可以有多个骑士.问最少走的步数. 骑 ...
- 2016 ACM-ICPC 区域赛(大连站)题解
题目链接 A - Wrestling Match (二分图染色) 题意略坑(没有说好的玩家一定能打过差的玩家啊啊~~) 典型的二分图染色问题,每个玩家看成一个点,把相互较量过的玩家之间连边,好的玩家染 ...
- Greenplum中角色权限及客户端认证管理
角色权限及客户端认证管理 GP数据库逻辑结构 在GP中,Database(数据库).Schema(模式)以及Role(角色)三者之间的关系如下所示: 一个数据库下可以有多个模式,一个模式只属于一个数据 ...