lucene特殊字符处理

这是个郁闷的问题,今天遇到了,但在lucene中查询的关键字保护有特殊字符,譬如--,会出现如下异常: org.apache.lucene.queryParser.ParseException: Cannot parse '': Encountered " <EOF>" at line 1, column 0. Was expecting one of: <NOT> ... "+" ... "-"…

Lucene 特殊字符的问题

SolrQuerySyntax http://wiki.apache.org/solr/SolrQuerySyntax solr的处理方式: https://svn.apache.org/repos/asf/lucene/dev/trunk/solr/solrj/src/java/org/apache/solr/client/solrj/util/ClientUtils.java /** * See: {@link org.apache.lucene.queryparser.classic qu…

ELK：kibana使用的lucene查询语法【转载】

kibana在ELK阵营中用来查询展示数据 elasticsearch构建在Lucene之上,过滤器语法和Lucene相同全文搜索在搜索栏输入login,会返回所有字段值中包含login的文档使用双引号包起来作为一个短语搜索"like Gecko" 字段也可以按页面左侧显示的字段搜索限定字段全文搜索:field:value精确搜索:关键字加上双引号 filed:"value"http.code:404 搜索http状态码为404的文档字段本身是否存在_ex…

有关lucene的问题

1.异常:Lock obtain timed out: NativeFSLock 原因:没有及时关闭indexWriter或者indexReader,lucene进行读写的时候会在文件夹里面创建lock ,不关闭的话,lock一直存在,下次进行读写,就会出现该问题解决方法:3.0以及3.0版本之前的,写入document之后,关闭indexWriter ,查询用到indexSearcher,查询结束之后需要关闭indexSearcher 3.0之后的,写入document之后,关闭indexW…

ELK：kibana使用的lucene查询语法

kibana在ELK阵营中用来查询展示数据elasticsearch构建在Lucene之上,过滤器语法和Lucene相同 kibana4官方演示页面全文搜索在搜索栏输入login,会返回所有字段值中包含login的文档…

Lucene 搜索功能

搜索过程图解: 主要 API: IndexSearcher: //所有搜索都通过 IndexSearcher 进行,他们将调用该类中重载的 search() 方法 Query: //封装某种查询类型的具体子类,Query 实例将会被传递给 IndexSearcher 的 search() 方法 QueryParser: //将用户输入的查询表达式处理成各种具体的 Query 对象 TopDocs: //保存由 IndexSearcher.…

Lucene/Solr开发经验

1.开篇语2.概述3.渊源4.初识Solr5.Solr的安装6.Solr分词顺序7.Solr中文应用的一个实例8.Solr的检索运算符 [开篇语]按照惯例应该写一篇技术文章了,这次结合Lucene/Solr来分享一下开发经验. Lucene是一个使用Java语言写的全文检索开发包(API),利用它可以实现强大的检索功能,它的详细介绍大家可以去Google上搜索一下,本文重点放在Solr相关的讨论上. [概述]目前国内研究Solr的人不多,而且大多是因为项目开发需要.Solr师承Lucene,为…

Lucene 高亮功能

原文转载自: http://qindongliang1922.iteye.com/blog/1953409 高亮功能一直都是全文检索的一项非常优秀的模块,在一个标准的搜索引擎中,高亮的返回命中结果,几乎是必不可少的一项需求,因为通过高亮,我们可以在我们的搜索界面上快速标记出用户的检索关键词,从而减少了用户自己寻找想要的结果,在一定程度上大大提高了用户的体验性和友好度. 那么,散仙今天就来看下我们在Lucene中,怎么实现高亮,以及高亮的几种实现方式. 首先散仙还是喜欢老生常谈的来补充下高亮需…

kibana使用的lucene查询语法

kibana在ELK阵营中用来查询展示数据elasticsearch构建在Lucene之上,过滤器语法和Lucene相同 kibana4官方演示页面全文搜索在搜索栏输入login,会返回所有字段值中包含login的文档使用双引号包起来作为一个短语搜索"like Gecko" 字段也可以按页面左侧显示的字段搜索限定字段全文搜索:field:value精确搜索:关键字加上双引号 filed:"value"http.code:404 搜索http状态码为404的文…

Lucene基础(2)

上一篇:Lucene基础(1) 一.Lucene术语 Document, Field, Term, Query, Analyzer相信在其中大多数在之前已经理解了...对其中部分概念详细说明 Document是一个包含了多个Field的容器,通过以下代码应该容易理解二者的关系 Document document=new Document(); //Field.Store.YES或者NO(存储域选项) //设置为YES表示或把这个域中的内容完全存储到文件中,方便进行文本的还原 //设置为NO表示把…

Lucene用法示例

整理一下 ELK 和 Grafana 中会用到的 Lucene 用法: 通配符示例1:过滤出 url 中包含 .pw/ 的网址 url.keyword:*.pw\/* 正则表达式示例1:过滤出 url 中包含 .pw/ 的网址 url.keyword:/.+\.pw\/.+/ 相似度示例1:过滤出 url 中包含 .pw/ 的网址 \.pw~ 或 url:\.pw~ 范围查询示例1:时间范围在17点正到17点10分的网址(+8小时) @timestamp:[2017-09-01T09:…

solr查询特殊字符的处理

1. 使用solr的页面功能时,遇到语法错误 2. 确认原因从lexical error分析时特殊字符的问题. 首先 solr查询有哪些特殊字符? 查找官方文档:http://lucene.apache.org/core/7_6_0/queryparser/org/apache/lucene/queryparser/classic/package-summary.html#package.description Lucene supports escaping special characte…

js相关(easyUI),触发器,ant,jbpm,hibernate二级缓存ehcache,Javamail,Lucene,jqplot,WebService,regex,struts2,oracle表空间

*********************************************js相关********************************************* // 在指定的毫秒数后调用tt = window.setTimeout("x()",3000);// 按指定的周期调t = window.setInterval("second_x()",1000); // 清除window.clearInterval(t);// 当前对象$('…

solr系统query检索词特殊字符的处理

solr是基于 lucence开发的应用,如果query中带有非法字符串,结果很可能是检索出所有内容或者直接报错,所以你对用户的输入必须要先做处理.输入星号,能够检索出所有内容:输入加号,则会报错. 官方的处理办法(java,因为solr是java开发的): https://svn.apache.org/repos/asf/lucene/dev/trunk/solr/solrj/src/java/org/apache/solr/client/solrj/util/ClientUtils.java…

lucene查询语法简介

为什么要介绍lucene:我们在ELK中搜索相关日志的时候,搜索语言需要遵循Lucene才可以匹配到需要的信息什么是Lucene:Lucene是一套用于全文检索和搜寻的开源程式库,由Apache软件基金会支持和提供参考: https://lucene.apache.org/core/2_9_4/queryparsersyntax.html#NOT http://www.lucenetutorial.com/lucene-query-syntax.html 1 全文搜索(有空格一定要用双引号…

ElasticSearch搜索实例含高亮显示及搜索的特殊字符过滤

应用说明见代码注解. 1.简单搜索实例展示: public void search() throws IOException { // 自定义集群结点名称 String clusterName = "elasticsearch_pudongping"; // 获取客户端 Client client = ESClient.initClient(clusterName); // 创建查询索引,参数productindex表示要查询的索引库为productindex SearchReques…

lucene 转义含有查询关键词的字符的

http://www.oschina.net/question/1092_560 Escaping Special Characters Lucene支持转义查询中的特殊字符,以下是Lucene的特殊字符清单:+ - && || ! ( ) { } [ ] ^ " ~ * ? : \ 转义特殊字符我们可以使用符号“\”放于字符之前.比如我们要搜索(1+1):2,我们可以使用如下语法:$1\+1$\:2 lucene自带函数 QueryParser.escape(q) …

lucene查询解析器语法

注意:使用QueryParser查询,关键词是会被分词的,如果不需要分词,可以选择使用Lucene提供的API查询类. Lucene提供了丰富的API来组合定制你所需要的查询器,同时也可以利用Query Parser提供的强大的查询语法解析来构造你想要的查询器.本文章详细的介绍了Lucene的查询语法.通过Java语法分析器把一个查询字符串解析成 Lucene的查询器.在你选择使用Query Parser前,请考虑以下事项: 如果你打算在程序中拼接查询语法串然后再利用Query Parser转换…

Lucene的例子

lucene爬数据库中的数据无非也是查询数据.所有我们用lucene搜索数据主要有下面几个步骤:(代码紧供参考) 一 , 从数据库中查数据 ====爬数据 -------------1 public ArrayList<BaseItem> getDate(String sql) throws SQLException { ArrayList<BaseItem> item = new ArrayList<BaseItem>(); ConnBase d…

elasticsearch regexp查询特殊字符处理

regexp表面意思就是正则查询,但是如果遇到,查询条件中包含特殊的字符串, 就会发现,需要进行相应的转义处理需要处理Lucene regexps即可: /** * 转义字符串中的特殊字符 * 仅过滤Lucene regexps, 其他的勿用 * @param keyword * @return */ public static String escapeExprSpecialWord(String keyword) { return QueryParser.escape(keyword);…

关于org.apache.lucene.queryParser.ParseException: Encountered "" 解决方法

现象: org.apache.lucene.queryParser.ParseException: Encountered "<EOF>" at line 1, column 0. Was expecting one of: <NOT> ... "+" ... "-" ... "(" ... <QUOTED> ... <TERM> ... <PREFIXTERM> .…

第十五章·Kibana深入-Dev Tools及Lucene语法

Dev Tools介绍 Dev Tools 页面包含开发工具,您可以使用这些Dev Tools与Kibana中的数据进行交互. 原先的交互式控制台Sense,使用户方便的通过浏览器直接与Elasticsearch进行交互.从Kibana 5开始改名并直接内建在Kibana,就是Dev Tools选项. Kibana提供了Console UI来通过REST API与Elasticsearch交互,Console位于Kibana的Dev Tools栏下.Console有两个主要区域,左边是编辑区用来…

Lucene查询语法汇总

目录一.单词查询二.通配符查询三.模糊查询四.近似查询五.范围查询六.优先级查询七.逻辑操作八.括号分组九.转义特殊字符 Lucene是目前最为流行的开源全文搜索引擎工具包,提供了完整的查询引擎和索引引擎,部分文本分析引擎. 我们平时使用kibana.阿里云的日志查询或者其他一些lucene二次开发的产品,几乎都支持lucene语法. 下面给大家演示各种查询方式,更多请参考 Apache Lucene - Query Parser Syntax 一.单词查询直接使用单词,例如…

lucene 基础知识点

部分知识点的梳理,参考<lucene实战>及网络资料 1.基本概念 lucence 可以认为分为两大组件: 1)索引组件 a.内容获取:即将原始的内容材料,可以是数据库.网站(爬虫).文本转换为lucence的Docment Docment 为若干个带值得域 b.文档分析:利用分词器对文档进行分析: c.建立索引:根据文档分析的结构建立索引文件: 2)搜索组件 a.建立查询:即将用户请求转换为搜索引擎支持的查询对象格式: b.执行搜索查询:并反馈Document结果集: 2.官方样例代码分析…

用lucene替代mysql读库的尝试

采用lucene对mysql中的表建索引,并替代全文检索操作. 备注:代码临时梳理很粗糙,后续修改. import java.io.File; import java.io.IOException; import java.sql.Connection; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; import java.util.Date; import org.apac…

Lucene的评分(score)机制研究

首先,需要学习Lucene的评分计算公式—— 分值计算方式为查询语句q中每个项t与文档d的匹配分值之和,当然还有权重的因素.其中每一项的意思如下表所示: 表3.5 评分公式中的因子评分因子描述 tf(t in d) 项频率因子——文档(d)中出现项(t)的频率 idf(t) 项在倒排文档中出现的频率:它被用来衡量项的“唯一”性.出现频率较高的term具有较低的idf,出现较少的term具有较高的idf boost(t.field in d) 域和文档的加权,在索引期间设置.你可以用该方法…

[SQL Server] 特殊字符、上标、下标处理

今天遇到一个问题是往 SQL Server 中导入像m².m³这样的单位数据,可是在 SQL Server 中查看到的都是 m2.m3,于是在网上查了一下资料,顺便摘录下来供日后查阅. 一 Windows 系统下快速键入一些特殊字符 ALT+小键盘0153 ™ ALT+小键盘0169 © ALT+小键盘0174 ® ALT+小键盘0177 ± ALT+小键盘0178 ² ALT+小键盘0179 ³ ALT+小键…

java转换 HTML字符实体，java特殊字符转义字符串

为什么要用转义字符串? HTML中<,>,&等有特殊含义(<,>,用于链接签,&用于转义),不能直接使用.这些符号是不显示在我们最终看到的网页里的,那如果我们希望在网页中显示这些符号,该怎么办呢? 这就要说到HTML转义字符串(Escape Sequence)了. 转义字符串(Escape Sequence)也称字符实体(Character Entity).在HTML中,定义转义字符串的原因有两个:第一个原因是像“<”和“>”这类符号已经用来表示HTML…

Lucene的分析资料【转】

Lucene 源码剖析 1 目录 2 Lucene是什么 2.1.1 强大特性 2.1.2 API组成- 2.1.3 Hello World! 2.1.4 Lucene roadmap 3 索引文件结构 3.1 索引数据术语和约定 - 3.1.1 术语定义 3.1.2 倒排索引(inverted indexing) 3.1.3 Fields的种类 3.1.4 片断(segments) 3.1.5 文档编号(document numbers) 3.1.6 索引结构概述 3.1.7 索引文件中定义的…

Lucene提供的条件判断查询

第一.按词条搜索 - TermQuery query = new TermQuery(new Term("name","word1"));hits = searcher.search(query); 这样就可以把 field 为 name 的所有包含 word1 的文档检索出来了. 第二."与或"搜索 - BooleanQuery 它实际是一个组合 query 看看下面的代码: query1 = new TermQuery(new Term(&q…

【lucene特殊字符处理】的更多相关文章