1.7.4.3 Parsers
Parsers
除了主查询解析器外,还有一些其他的查询解析器可以使用或者和主查询解析器连合使用.这部分描述了其他查询解析器的细节,并且给出了一些例子:
大多数的解析器都可以使用局部查询参数的方式来表达(Local Parameters in query).
1.1 Block Join Query Parsers
有两种查询解析器支持block joins,这些查询解析器允许索引搜索关系内容.可以使用在你想索引子文档到父文档的地方.比如,一个博客包含父文档和作为其他评论的子文档.或者产品(products)作为父文档,大小(size),颜色(colors),其他种类(variations)作为子文档.在性能方面,索引索引文档之间的关系比在查询时尝试做连接更加有效,因为关系已经在索引中存储,不需要再计算.
注意:这些解析器的功能是新的,在未来有可能发生变化.
要使用这些解析器,文档必须索引有子文档,目前文档只能通过XML update handler来被索引成关系结构.这个XML结构允许<doc>元素中嵌套<doc>元素,也可以包含一个标志父文档的字段.
例子,这里是两个文档,还有它们的子文档:
<add>
<doc>
<field name="id">1</field>
<field name="title">Solr adds block join support</field>
<field name="content_type">parentDocument</field>
<doc>
<field name="id">2</field>
<field name="comments">SolrCloud supports it too!</field>
</doc>
</doc>
<doc>
<field name="id">3</field>
<field name="title">Lucene and Solr 4.5 is out</field>
<field name="content_type">parentDocument</field>
<doc>
<field name="id">4</field>
<field name="comments">Lots of new features</field>
</doc>
</doc>
</add>
在这个例子中,我们使用字段content_type来标记父字段,我们也可以使用一个boolean字段来标记,如isParent是否为true.
1.2 Block Join Children Query Parser
这个解析器使用了一个查询,匹配了一些父文档,返回它们的子文档.它的解析语法:q={!childof=<allParents>}<someParents>.<allParents>是一个匹配父文档的过滤器,这里你可以定义一个字段和值来识别一个父文档.参数someParents确定一个匹配夫文档的查询,输出的是子文档:
使用上面文档的例子,我们可以构造一个查询如q={!childof="content_type:parentDocument"}title:lucene 结果响应中,我们只获取到一个文档:
<result name="response" numFound="1" start="0">
<doc>
<str name="id">12344</str>
<str name="comments">Lots of new features</str>
</doc>
</result>
1.3 Block Join Parent Query Parser
这个解析器使查询匹配子文档,返回父文档的结果.语法: q={!parentwhich=<allParents>}<someChildren>,对于参数allParents是匹配父文档的过滤器,someChildren是一个查询匹配部分或者全部子文档.
使用上面的例子,我们可以构造一个查询:q={!parentwhich="content_type:parentDocument"}comments:SolrCloud,响应结果:
<result name="response" numFound="1" start="0">
<doc>
<str name="id">12341</str>
<arr name="title">
<str>Solr adds block join support</str>
</arr>
<arr name="content_type">
<str>parentDocument</str>
</arr>
</doc>
</result>
1.4 Boost Query Parser
BoostQParser继承了QParserPlugin,从输入的值中创建了一个带权重的查询.参数b是加权函数.
例子:
创建一个查询"foo",使用函数log(popularity)对其加权:
{!boost b=log(popularity)}foo
创建一个查询"foo",使用日期函数关联ReciprocalFloatFunction:
{!boost b=recip(ms(NOW,mydatefield),3.16e-11,1,1)}foo
1.5 Collapsing Query Parser
CollapsingQParser解析器是一个真正的快速过滤器,当结果集中有区别的组(groups)的数量比较高时,相比对solr的标准方法,它提供了要给更高性能的字段合并(collapsing).CollapsingQParser在它将结果集转向剩余的搜索组件之前,将压缩结果集为每组一个单独的文档,所以,所有的下游组件(faceting,highlighting)将使用这个压缩结果集.
基于最高得分(scores)的合并(collapse):
fq={!collapse field=<field_name>}
基于数字字段最小值的合并(collapse):
fq={!collapse field=<field_name> min=<field_name>}
基于数字字段最大值的合并(collapse):
fq={!collapse field=<field_name> max=<field_name>}
基于函数的最小最大值的合并(collapse),cscore()函数可以和CollapsingQParserPlugin一起使用,返回当前文档被合并(collapse)的得分.
fq={!collapse field=<field_name> max=sum(cscore(),field(A))}
使用一个空策略合并(collapse):
fq={!collapse field=<field_name> nullPolicy=<nullPolicy>}
这里有三个空策略:
ignore:在合并(collapse)字段中,删除带有空值的文档,这是默认的.
expand:在合并(collapse)字段中,将每个带有空值的文档作为一个单独的组.
collapse:合并所有的空值文档为一个单独的组.使用最高得分还活着最小/最大值.
CollapsingQParserPlugin完全支持QueryElevationComponent.但是,没有一种方式来展开(extend)组的一页结果,还并不是solr合并(collapse)功能的完全替代品.
1.6 Field Query Parser
字段查询解析器
FieldQParser继承了QParserPlugin.从输入值中创建了一个字段查询.如果合适的话,使用文本分析,构造一个短语查询.参数f指的就是查询的字段.
例子:
{!field f=myfield}Foo Bar
这个例子使用"foo"和"bar"创建了一个短语查询(假定字段myfield的分析器是一个以空格和小写term来分词的文本分析器),这个一般等价于Lucene的查询表达式:
myfield:"Foo Bar".
1.7 Function Query Parser
FunctionQParser继承了QParserPlugin.从输入值中创建一个函数查询.这里只有一种方式使用函数查询,其他的参考 Function Queries.
例子:
{!func}log(foo)
1.8 Function Range Query Parser
FunctionRangeQParser继承QParserPlugin.
参数:
l:最低界限,可选项
u:较高界限,可选项
incl:包含较低界限,true/false,默认为false.
incu:包含较高界限,true/false,默认为false.
这里可以关联为frange.如下示例:
{!frange l=1000 u=50000}myfield
fq={!frange l=0 u=2.2} sum(user_ranking,editor_ranking)
更多相关信息可以参考 Ranges over Functions in Solr1.4.
1.9 Join Query Parser
连合查询解析器
JoinQParser继承QParserPlugin.它允许通过连接操作符来规范文档之间的关系.这和关系型数据库中join(连接)的概念是不同的,因为没有信息去真正的被连接.一个比较合适的"SQL" 比喻是"inner query".
例子:
找到所有包含"ipod"的产品,连接(join)它们针对制造商(manufacturer)的文档,返回制造商的列表.
{!join from=manu_id_s to=id}ipod
找到所有name为 "belkin"的制造商文档,连接它们针对产品的文档,并且针对price小于12美元的过滤器:
q = {!join from=id to=manu_id_s}compName_s:Belkin
fq = price:[* TO 12]
更多关于连接查询的信息,参考Joins. Erick Erickson也写了一篇博客叫 solr 和joins ,主机是SearchHub.org.
1.10 Lucene Query Parser
LuceneQParser继承 QParserPlugin.它使用操作符q.op,默认操作符是"OR" or "AND",默认字段名df.
例子:
{!lucene q.op=AND df=text}myfield:foo +bar -baz
更多关于Lucene查询解析器的语法,参考Lucene javadocs
1.11 Max Score Query Parser
最大得分查询解析
MaxScoreQParser继承LuceneQParser.返回这个从句的最大得分.在tie=1.0 的DisjunctionMaxQuery查询中,它封装了所有的SHOULD clause(从句).任何MUST或者PROHIBITED从句通过as-is传递.没有boolean查询,如 NumericRange就不会通过LuceneQParser解析行为.
例子:
{!maxscore tie=0.01}C OR (D AND E)
1.12 Nested Query Parser
嵌套查询解析
NestedParser继承QParserPlugin.创建一个嵌套查询,具有通过本地参数重新定义类型的能力.这个解析器在这样的场合是非常有用的:在配置中指定默认值,让客户端声明关联它们.
例子:
{!query defType=func v=$q1}
如果q1参数是price,查询可以是对price字段的函数查询,如果q1参数是 {!lucene}inStock:true}},那么就会从 Lucene syntax string中创建term查询,使用inStock=true匹配文档.这些参数可以定义在solrconfig.xml中的默认部分:
<lst name="defaults"
<str name="q1">{!lucene}inStock:true</str>
</lst>
关于嵌套查询的更多性能,参考Nested Query In Solr.
1.13 Old Lucene Query Parser
OldLuceneQParser 继承 QParserPlugin.
例子:
{!lucenePlusSort} myfield:foo +bar -baz;price asc
1.14 Prefix Query Parser
前缀查询解析
PrefixQParser继承 QParserPlugin,对输入的值创建前缀查询.目前没有分析器(analysis)或者值转换器用来床架前缀查询,参数f指的是字段,前缀声明后面的字符串直接被当作通配符查询.
例子:
{!prefix f=myfield}foo
等价于Lucene查询解析器的表达式: myfield:foo*
1.15 Raw Query Parser
未加工的查询解析
RawQParser继承 QParserPlugin,不用任何分析器或者转换器,来创建一个term查询.使用环境:debugging,或者从terms组件中返回原始的terms.只有一个参数f,来定义搜索字段.
例子:
{!raw f=myfield}Foo Bar
构造的query查询是: TermQuery(Term("myfield","Foo Bar"))
1.16 Simple Query Parser
简单查询解析器
基于Lucene的SimpleQueryParser.这个查询解析器允许用户输入它们想要输入的查询,然后它将很好的解释这个查询,并返回结果.
q.operator:开启解析的指定操作,默认的所有的操作都是开启的,这可以按照需要关闭指定的操作,给这个参数传递一个空的字符串就可以关闭指定的操作.
操作符 | 描述 | 例子 |
+ | 指定AND | token1+token2 |
| | 指定OR | token1|token2 |
- | 指定NOT | -token3 |
" | 创建一个短语 | "term1 term2" |
* | 指定一个前缀查询 | term* |
~N |
在一个term的末尾,指定一个模糊查询 | term~1 |
~N | 在短语末尾,指定一个邻近(near)查询. | "term1 term2"~5 |
( ) | 指定查询优先级 | token1 + (token2 |token3) |
q.op:定义默认使用的操作符,一般情况下,默认的是OR,也可以使用AND来替换掉.
qf:查询字段列表
df:如果没有在schem.xml中定义的话定义默认查询字段.如果已经定义,覆盖这个默认字段.
任何语法错误都可以被忽略,这个查询解析器将会尽它所能的解释query.
1.17 Spatial Filter Query Parser
SpatialFilterQParser继承 QParserPlugin,创建一个空间过滤器,这个字段必须实现SpatialQueryable.所有单位均为公里.
参数 | 描述 |
sfield | 过滤器字段,必填 |
pt | 参考点,必须匹配字段的尺寸.必填 |
d | 距离,单位km,必填 |
目前所用的距离量度取决于所述的FieldType,LatLonType默认使用haversine(半矢量).PointType默认使用Euclidean(2-norm).
例子:
{!geofilt sfield=<location_field> pt=<lat,lon> d=<distance>}
这是一些配置值的例子:
fq={!geofilt sfield=store pt=10.312,-20.556 d=3.5}
fq={!geofilt sfield=store}&pt=10.312,-20&d=3.5
fq={!geofilt}&sfield=store&pt=10.312,-20&d=3.5
如果和LatLonType一起使用geofilt,它能够生成的分数等于从点到字段的计算距离.使其作为一个主查询的组件和对查询加权非常有用.
1.18 Surround Query Parser
围绕查询解析器
SurroundQParser继承QParserPlugin.这个解析器提供了围绕查询语法的支持,它提供了邻近(proximity)搜索功能.这里边有两个操作:w创建了一个有序的跨度(距离),n创建了一个无序的跨度(距离).这两个操作都是一个数字值来声明两个term之间的距离.默认为1,最大是99.注意:查询字符串不能用任何方式分词.
例子:
{!surround} 3w(foo, bar)
这个例子将会查找文档中的terms"foo"和"bar"之间距离不会超过3个term.
这个查询解析器也可以接受布尔操作如(AND,OR,NOT或者是大写或者是小写),通配符,短语搜索的引号和加权.w和n操作也可以用大写或者小写表示.
更多关于这个解析器的操作参考:http://wiki.apache.org/solr/SurroundQueryParser
1.19 Switch Query Parser
SwitchQParser继承QParserPlugin.表现出来像"swithc" 或者"case" 状态.
在这个结果中每个查询结构都是XXX:
{!switch case.foo=XXX case.bar=zzz case.yak=qqq}foo
{!switch case.foo=qqq case.bar=XXX case.yak=zzz} bar // extra whitespace is trimmed
{!switch case.foo=qqq case.bar=zzz default=XXX}asdf // fallback to the default
{!switch case=XXX case.bar=zzz case.yak=qqq} // blank input uses 'case'
这个QParsePlugin的部分使用方法就是在SearchHandler的配置中指定appends的fq参数.使用下面的例子,客户端可以选择指定参数in_stock 和shipping来覆盖默认的过滤器行为.但是限制具体的合法值的集合.(shipping=any|free, in_stock=yes|no|all)
<requestHandler name="/select" class="solr.SearchHandler">
<lst name="defaults">
<str name="in_stock">yes</str>
<str name="shipping">any</str>
</lst>
<lst name="appends">
<str name="fq">{!switch case.all='*:*'
case.yes='inStock:true'
case.no='inStock:false'
v=$in_stock}</str>
<str name="fq">{!switch case.any='*:*'
case.free='shipping_cost:0.0'
v=$shipping}</str>
</lst>
</requestHandler>
1.20 Term Query Parser
TermQParser继承QParserPlugin,从输入值中创建一个单独的term查询,相当于readableToIndexed().这是用于通过分面和terms组件从外部可读的terms中生成过滤器查询是很有用的.只有一个字段参数f.
例子:
{!term f=weight}1.5
对于文本字段,没有分析器做处理,因为原始的term已经从分面(facet)和terms组件中返回了.要对文本字段使用分析,参考上面的Field Query Parser.
1.7.4.3 Parsers的更多相关文章
- PHP build notes - WARNING: This bison version is not supported for regeneration of the Zend/PHP parsers (found: 3.0, min: 204, excluded: 3.0).
WARNING: This bison version is not supported for regeneration of the Zend/PHP parsers (found: 3.0, ...
- OAF_文件系列6_实现OAF导出XML文件javax.xml.parsers/transformer(案例)
20150803 Created By BaoXinjian
- OAF_文件系列5_实现OAF解析XML文件javax.xml.parsers(案例)
20150729 Created By BaoXinjian
- This bison version is not supported for regeneration of the Zend/PHP parsers
在 mac 中编译 php-src.git 报错: configure: WARNING: This bison version is not supported , excluded: ). con ...
- WebLogic部署报java.lang.ClassCastException: weblogic.xml.jaxp.RegistrySAXParserFactory cannot be cast to javax.xml.parsers.SAXParserFactory
今天在部署WebLogic项目时,报了java.lang.ClassCastException: weblogic.xml.jaxp.RegistrySAXParserFactory cannot b ...
- Handwritten Parsers & Lexers in Go (翻译)
用go实现Parsers & Lexers 在当今网络应用和REST API的时代,编写解析器似乎是一种垂死的艺术.你可能会认为编写解析器是一个复杂的工作,只保留给编程语言设计师,但我想消除这 ...
- Handwritten Parsers & Lexers in Go (Gopher Academy Blog)
Handwritten Parsers & Lexers in Go (原文地址 https://blog.gopheracademy.com/advent-2014/parsers-lex ...
- java.lang.ClassCastException:weblogic.xml.jaxp.RegistryDocumentBuilderFactory cannot be cast to javax.xml.parsers.DocumentBuilderFactory
java.lang.ClassCastException:weblogic.xml.jaxp.RegistryDocumentBuilderFactory cannot be cast to java ...
- error: <class 'xml.parsers.expat.ExpatError'>, syntax error: line 1, column 0: file: /usr/local/lib/python2.7/xmlrpclib.py line: 557
当linux设备上开启sonar6.2时, supervisorctl status报如下错误: error: <class 'xml.parsers.expat.ExpatError'> ...
随机推荐
- Xtrabackup之innobackupex备份恢复详解(转)
add by zhj:对于Xtrabackup2.2来说,已经解决了本文结尾提到的那个bug,当使用--copy-back时,同时加--force-non-empty-directories 即可.这 ...
- ESP8266 TCP传输AT指令顺序
); //复位 ret = ESP8266_Cmd ( );//测试AT启动 ret = ESP8266_Cmd ( );//选择WIFI应用模式softAP+station //ret = ESP8 ...
- linux下 ls 排序
ls -lS 按大小降序排列 ls -l | sort -n -k5 按大小升序 ls -lrt 按时间降 ...
- MySQL事务处理和锁机制
事务处理和并发性 1.1 基础知识和相关概念 1 )全部的表类型都可以使用锁,但是只有 InnoDB 和 BDB 才有内置的事务功能. 2 )使用 begin 开始事务,使用 commit 结束事务, ...
- MRI中T1和T2的含义与区分[转]
A. MRI名词解释 T1加权像.T2加权像为磁共振检查中报告中常提到的术语,很多非专业人士不明白是什么意思,要想认识何为T1加权像.T2加权像,请先了解几个基本概念: 1.磁共振(maget ...
- VS 2010下单元测试
1.创建单元测试项目 2.创建完成后,新建项目会自动添加“Microsoft.VisualStudio.QualityTools.UnitTestFramework”的引用,该引用用于单元 ...
- 使用 Protocol Buffers 代替 JSON 的五个原因
国内私募机构九鼎控股打造APP,来就送 20元现金领取地址:http://jdb.jiudingcapital.com/phone.html内部邀请码:C8E245J (不写邀请码,没有现金送)国内私 ...
- 处理linux下面的mysql乱码问题(下面的utf8换成gb2312也是可以的)
有时候因为编码需要修改mysql的编码,windows下修改有图文界面简单一些,linux大家就可以参考下面的方法 默认登录mysql之后可以通过SHOW VARIABLES语句查看系统变量及其值 ...
- 2014 年10个最佳的PHP图像操作库--留着有用
Thomas Boutell 以及众多的开发者创造了以GD图形库闻名的一个图形软件库,用于动态的图形计算. GD提供了对于诸如C, Perl, Python, PHP, OCaml等等诸多编程语言的支 ...
- Codeforces Round #335 (Div. 2) A. Magic Spheres 水题
A. Magic Spheres Time Limit: 20 Sec Memory Limit: 256 MB 题目连接 http://www.codeforces.com/contest/606/ ...