定义

查询解析器用于将查询语句(q参数)解析成搜索语法。

默认解析器:lucene

Solr在查询的时候,用到了QueryParser对用户输入做解析,solr默认使用的解析器是lucene,被称之为Standard Query Parser。Standard Query Parser支持原生的查询语法,使你可以方便地构造结构化查询语句。当然,它还有不好的,就是容错比较差,总是把错误抛出来,而不是像dismax一样消化掉。

DisMax解析器

DisMax query parser接口很像Solr的standard request handler,这使得它能轻松适应大多数应用场景。它有简单的语法规则,很少抛出异常给用户。 
DisMax query parser支持一部分Lucene QueryParser语法,在Lucene中,双引号表示短语查询,+/-表示必须出现和不要出现。DisMax查询能自动优化用户的输入,作为一个Solr管理员,你还可以设置boosting函数,进行boosting查询,通过一些过滤方法人工干预查询结果。你可以在solrconfig.xml中指定,也可以在URL中指定来覆盖solrconfig.xml中的配置。 
DisMax 参数

除了通用的查询参数,DisMax还有一些自有的查询参数,你可以在solrconfig.xml中配置这些参数,或者在查询的时候指定,这样会覆盖之前配置的值。

参数

描述

q

查询参数q

q.alt

如果参数q没有指定,就使用standard query parser并代替参数q

qf

Query Fields:在哪些字段上去检索数据。如果不指定的话,使用df

mm

Minimum Match:指定最小匹配因子

pf

Phrase Fields:增加文档的得分如果q参数值离的很近

ps

Phrase Slop:指定q参数中两个词可以距离多远

qs

Query Phrase Slop:指定q参数中两个词可以距离多远,与qf搭配使用

tie

Tie Breaker:使用一个0到1之间的浮点数

bq

Boost Query:指定一个额外因素来增加匹配到的文档的得分

bf

Boost Functions:指定boosts使用的函数

DisMax Query Parser使用举例

使用StandardRequestHandler查询"video" 
http://localhost:8983/solr/select?q=video&fl=name+score

已经配置了查询字段:text、features、name、id、manu、cat。而且匹配上name和cat会有更高的得分 
http://localhost:8983/solr/select?defType=dismax&q=video

可以将score显示出来,看一下各个文档的得分 
http://localhost:8983/solr/select?defType=dismax&q=video&fl=*,score

现在想设置features有更高的得分,而text有较低的得分 
http://localhost:8983/solr/select?defType=dismax&q=video&qf=features^20.0+text^0.3

现在希望某一字段在满足某一情况下有更高的得分 
http://localhost:8983/solr/select?defType=dismax&q=video&bq=cat:electronics^5.0

现在想使用有另外一个为instock的handler,它配置了一个过滤器:inStock:true 
http://localhost:8983/solr/select?defType=dismax&q=video&qt=instock&fl=name,score,inStock

如果查询短语的单词是一个或者两个,原则上返回的结果中必须包含全部单词,但是你的查询短语很长,solr允许有单词不匹配。你可以通过mm参数设置最多有多少单词不匹配。 
http://localhost:8983/solr/select?defType=dismax&q=belkin+ipod+gibberish

可以通过调试功能验证你的想法。 
http://localhost:8983/solr/select?defType=dismax&q=belkin+ipod+gibberish&debugQuery=true

eDisMax

Extended DisMax

参数

说明

mm.autoRelax

如果设置为true,可以使mm参数暂时失效:比如stopwords和fq可能会使查询结果为空

boost

对于匹配的文档,越多的字符串匹配将会取得更高的得分

lowercaseOperators

这个参数可以用来指示是否把or和and当做OR和AND处理

ps

短语查询时,默认的溢出量amount of slop,用来影响boosting

pf2

指定多值的字段可选的权重

ps2

与pf2搭配使用,没有指定的话,使用ps

pf3

指定多值的字段可选的权重

ps3

与pf3搭配使用,没有指定的话,使用ps

stopwords

布尔值,设置是否StopFilterFactory生效,设为false,则stopwords停词不起作用

uf

设置用户可以使用那些字段检索,默认是所有字段,也就是uf=*;设置为uf=title,就是只让查询title字段;设置为uf=*-title,就是禁止查询title字段;设置为uf=-*屏蔽所有字段的检索

solr 查询解析器的更多相关文章

  1. Solr Dismax查询解析器-深入分析

    Solr 支持多种查询解析,给搜索引擎开发人员提供灵活的查询解析.Solr 中主要包含这几个查询解析器:标准查询解析器.DisMax 查询解析器,扩展 DisMax 查询解析器(eDisMax) Di ...

  2. Solr搜索解析及查询解析器用法概述

    一.简介 大多数查询都使用 了标准的Solr语法.这种语法是Solr最常见的,由默认查询解析器负责处理.Solr的默认查询解析器是Lucene查询解析器[LuceneQParserPlugin类实现] ...

  3. Solr查询配置及优化【eDisMax查询解析器】

    一.简介 Lucene查询解析器语法支持创建任意复杂的布尔查询,但还有一些缺点,它不是用户查询处理的理想解决方案.这里面最大的问题是Lucene查询解析器的语法要求严格,一旦破坏就会抛出异常.指望用户 ...

  4. lucene查询解析器语法

    注意:使用QueryParser查询,关键词是会被分词的,如果不需要分词,可以选择使用Lucene提供的API查询类. Lucene提供了丰富的API来组合定制你所需要的查询器,同时也可以利用Quer ...

  5. kotlin 写的一个简单 sql 查询解析器

    package com.dx.efuwu.core import org.apache.commons.lang.StringUtils import java.sql.PreparedStateme ...

  6. Solr系列五:solr搜索详解(solr搜索流程介绍、查询语法及解析器详解)

    一.solr搜索流程介绍 1. 前面我们已经学习过Lucene搜索的流程,让我们再来回顾一下 流程说明: 首先获取用户输入的查询串,使用查询解析器QueryParser解析查询串生成查询对象Query ...

  7. Solr查询语法

    基于solr版本:6.0.0 当配置好本地的环境之后,就访问http://localhost:8080/solr/index.html.或者是访问已经放在服务器上的solr环境,例如http://10 ...

  8. Solr -- 查询语法/参数

    1. 常用查询参数 参数 描述 defType 指定用于处理查询语句(参数q的内容)的查询解析器,eg:defType=lucene sort 指定响应的排序方式:升序asc或降序desc.同时需要指 ...

  9. Solr实现Low Level查询解析(QParser)

    Solr实现Low Level查询解析(QParser) Solr基于Lucene提供了方便的查询解析和搜索服务器的功能,可以以插件的方式集成,非常容易的扩展我们自己需要的查询解析方式.其中,Solr ...

随机推荐

  1. TP5中用redis缓存

    在config.php配置文件下找到缓存设置,将原来的文件缓存修改为redis缓存,也可以改为多种类型的缓存: // +---------------------------------------- ...

  2. flask的cookies操作

    from flask import Flask,request,Response app = Flask(__name__) @app.route('/') def hello_world(): re ...

  3. vim中ctrl+z,jobs,fg命令用法

    例如:vi test.cctrl + z 将vi 打开的test.c停止并转到后台又打开一个vi buf.cctrl + z 将vi 打开的buf.c停止并转到后台此时通过jobs可以看到任务列表通过 ...

  4. [转帖]开源的监控技术栈除了ELK,还有InfluxData的TICK

    开源的监控技术栈除了ELK,还有InfluxData的TICK   https://cloud.tencent.com/developer/news/357119 来源 | Influxdata 译者 ...

  5. sql常用到的查询连接

    一.内连接(Inner Join) select * from a inner join b on a.name=b.name; 此语句的结果为同时匹配表a和表b的记录集.即内连接取的是两个表的交集. ...

  6. ArrayList与LinkedList的区别,如何减少嵌套循环的使用

    如果要减少嵌套循环的使用: 我们可以将需要在二重循环里面判断的条件放在一个Map的key里面: 在判断的时候只需要进行key是否存在,然后操作接下来的步骤: 这样子就会减少二重循环了,不会发生循环n* ...

  7. hdu 1506 直方图内最大矩形

    题目传送门//res tp hdu 单调栈的经典问题 维护区间的左右边界计算面积即可 #include<iostream> #include<algorithm> #inclu ...

  8. c++11特性

    0. 简介 在c++11标准中, 语言本身和标准库都增加了很多新内容. 里面的某些特性, 会让你在代码编写时更优雅. 我的环境: 系统: ubuntu16.04 g++版本: g++5.4.0 使用c ...

  9. 数位dp详解&&LG P2602 [ZJOI2010]数字计数

    数位dp,适用于解决一类求x~y之间有多少个符合要求的数或者其他. 例题 题目描述 杭州交通管理局经常会扩充一些的士车牌照,新近出来一个好消息,以后上牌照,不再含有不吉利的数字了,这样一来,就可以消除 ...

  10. Codeforces 1244F. Chips

    传送门 显然可以注意到连续的两个相同颜色的位置颜色是不会改变的,并且它还会把自己的颜色每秒往外扩展一个位置 同时对于 $BWBWBW...$ 这样的序列,它每个位置的颜色每一秒变化一次 然后可以发现, ...