lucene 查询 (转载)】的更多相关文章

Lucene查询 Lucene查询语法以可读的方式书写,然后使用JavaCC进行词法转换,转换成机器可识别的查询. 下面着重介绍下Lucene支持的查询: Terms词语查询 词语搜索,支持 单词 和 语句. 单词,例如:"test","hello" 语句,例如:"hello,world!" 多个词语可以通过操作符,连接成更复杂的搜索逻辑. Field字段查询 Lucene支持针对某个字段进行搜索,语法如: title:hello 或者 titl…
Lucene Query Tool (lqt) 是一个命令行工具用来执行 Lucene 查询并对结果进行格式化输出. 使用方法: 01 $ ./lqt 02 usage: LuceneQueryTool [options] 03     --analyzer <arg>       for query, (KeywordAnalyzer | StandardAnalyzer) 04                            (defaults to KeywordAnalyzer)…
Lucene查询 Lucene查询语法以可读的方式书写,然后使用JavaCC进行词法转换,转换成机器可识别的查询. 下面着重介绍下Lucene支持的查询: Terms词语查询 词语搜索,支持 单词 和 语句. 单词,例如:"test","hello" 语句,例如:"hello,world!" 多个词语可以通过操作符,连接成更复杂的搜索逻辑. Field字段查询 Lucene支持针对某个字段进行搜索,语法如: title:hello 或者 titl…
运用Lucene进行索引,在查询的时候是有条数限制的 public virtual TopFieldDocs Search(Query query, Filter filter, int n, Sort sort); 可以看到第三个参数是int类型,所以返回的条数为int最大值.因为Lucene为索引查询,所以不需要返回全部的数据,根据关键词返回匹配的数据,按照分值排序,int大小的数据足够筛选出匹配的正确数据.在运用Lucene查询的是否不易返回过多条数,这样会影响性能,一般1000条左右就够…
lucene 查询+分页+排序 1.定义一个工厂类 LuceneFactory 1 import java.io.IOException; 2 3 import org.apache.lucene.analysis.Analyzer; 4 import org.apache.lucene.index.CorruptIndexException; 5 import org.apache.lucene.index.IndexReader; 6 import org.apache.lucene.ind…
常用的Lucene查询代码如下所示,该代码的作用是将path路径下的所有索引信息返回 public String matchAll(String path) { try { Directory directory = FSDirectory.open(new File(path)); DirectoryReader reader = DirectoryReader.open(directory); IndexSearcher searcher = new IndexSearcher(reader…
3.3 基本查询3.3.1词条查询 词条查询是未经分析的,要跟索引文档中的词条完全匹配注意:在输入数据中,title字段含有Crime and Punishment,但我们使用小写开头的crime来搜索:因为Crime一词在建立索引时已经变成了crime. { "query": { "term": { "title": "crime" } }} 在词条查询汇总可包含加权属性,影响给定词条的重要程度 { "query&…
前言 Elasticsearch是一个很火的分布式搜索系统,提供了非常强大而且易用的查询和分析能力,包括全文索引.模糊查询.多条件组合查询.地理位置查询等等,而且具有一定的分析聚合能力.因为其查询场景非常丰富,所以如果泛泛的分析其查询性能是一个非常复杂的事情,而且除了场景之外,还有很多影响因素,包括机型.参数配置.集群规模等等.本文主要是针对几种主要的查询场景,从查询原理的角度分析这个场景下的查询开销,并给出一个大概的性能数字,供大家参考. Lucene查询原理 本节主要是一些Lucene的背景…
提问: 1.倒排索引与传统数据库的索引相比优势? 2.在lucene中如果想做范围查找,根据上面的FST模型可以看出来,需要遍历FST找到包含这个range的一个点然后进入对应的倒排链,然后进行求并集操作.但是如果是数值类型,比如是浮点数,那么潜在的term可能会非常多,这样查询起来效率会很低,怎么解决? Lucene 查询原理 - 知乎 https://zhuanlan.zhihu.com/p/35814539 Lucene 查询原理-阿里云开发者社区 https://developer.al…
kibana在ELK阵营中用来查询展示数据 elasticsearch构建在Lucene之上,过滤器语法和Lucene相同 全文搜索 在搜索栏输入login,会返回所有字段值中包含login的文档 使用双引号包起来作为一个短语搜索"like Gecko" 字段 也可以按页面左侧显示的字段搜索限定字段全文搜索:field:value精确搜索:关键字加上双引号 filed:"value"http.code:404 搜索http状态码为404的文档 字段本身是否存在_ex…
原网址:http://hi.baidu.com/lszhuhaichao/blog/item/ccffc7cb858f1514bf09e66f.html Lucene3.0之查询处理(1):原理2010-03-06 23:37Lucene3.0之查询处理(1):原理 1. 查询的三种方式 ①     顺序查询:简单,但查询效率低 ②     索引查询:快速,需要基础索引结构支撑 2. 理论模型 ①     布尔模型:基于集合论和布尔代数的一种简单检索模型 ②     向量模型:查询串和文档之间分…
分页查询只需传入每页显示记录数和当前页就可以实现分页查询功能 Lucene分页查询是对搜索返回的结果进行分页,而不是对搜索结果的总数量进行分页,因此我们搜索的时候都是返回前n条记录 package cn.mylucene; import java.io.IOException; import java.nio.file.Paths; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.stan…
package cn.harmel.lucene; import java.io.IOException; import java.nio.file.Paths; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Document; import org.apache.l…
package cn.harmel.lucene; import java.io.IOException; import java.nio.file.Paths; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Document; import org.apache.l…
各种查询方式一:使用QueryParser与查询语法.(会使用分词器) MultiFieldQueryParser查询字符串 ------------------------> Query对象 例如:上海 AND 天气上海 OR 天气上海新闻 AND site:news.163.com... 方式二:直接创建Query的实例(子类的),不会使用分词器new TermQuery(..);new BooleanQuery(..); package cn.itcast.i_query; import…
kibana在ELK阵营中用来查询展示数据elasticsearch构建在Lucene之上,过滤器语法和Lucene相同 kibana4官方演示页面 全文搜索 在搜索栏输入login,会返回所有字段值中包含login的文档…
Lucene教程 1 lucene简介1.1 什么是lucene    Lucene是一个全文搜索框架,而不是应用产品.因此它并不像www.baidu.com 或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品.2 lucene的工作方式    lucene提供的服务实际包含两部分:一入一出.所谓入是写入,即将你提供的源(本质是字符串)写入索引或者将其从索引中删除:所谓出是读出,即向用户提供全文搜索服务,让用户可以通过关键词定位源.2.1写入流程    源字符…
kibana在ELK阵营中用来查询展示数据elasticsearch构建在Lucene之上,过滤器语法和Lucene相同 kibana4官方演示页面 全文搜索 在搜索栏输入login,会返回所有字段值中包含login的文档 使用双引号包起来作为一个短语搜索"like Gecko" 字段 也可以按页面左侧显示的字段搜索限定字段全文搜索:field:value精确搜索:关键字加上双引号 filed:"value"http.code:404 搜索http状态码为404的文…
检索结果高亮 实现效果: 核心代码 package ucas.ir.lucene; import java.io.File; import java.io.IOException; import javax.print.Doc; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.TokenStream; import org.apache.lucene.analysis.core.Keywo…
QueryParser(单域查询) QueryParser子类对单个域查询时创建查询query,构造方法中需要传入Lucene版本号,检索域名和分词器. QueryParser parser = new QueryParser(Version.LUCENE_43, field, analyzer);// 查询字符串 Query query = parser.parse("key"); MultiFieldQueryParser(多域查询) MultiFieldQueryParser p…
索引创建 以新闻文档为例,每条新闻是一个document,新闻有news_id.news_title.news_source.news_url.news_abstract.news_keywords这6个域,添加两个news document到索引中,下面再贴一下创建索引的代码: package ucas.ir.lucene; import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.An…
2.查询索引库 插入测试数据 xx.xx. index. ArticleIndex @Test public void testCreateIndexBatch() throws Exception{ IndexWriter indexWriter = new IndexWriter(LuceneUtils.directory, LuceneUtils.analyzer,MaxFieldLength.LIMITED); for(inti=0;i<25;i++){ Article article…
0.文档名字:(根据名字索引查询文档)…
csdn blog - Lucene 3.0 的Query Parser(查询语法)   ibm developerWorks - 使用 Apache Lucene 2.4.1 搜索文本   oschina.net - Lucene 2.4.0查询语法详解   cnblogs - 全文检索与Lucene3.3.0学习…
注意:使用QueryParser查询,关键词是会被分词的,如果不需要分词,可以选择使用Lucene提供的API查询类. Lucene提供了丰富的API来组合定制你所需要的查询器,同时也可以利用Query Parser提供的强大的查询语法解析来构造你想要的查询器.本文章详细的介绍了Lucene的查询语法.通过Java语法分析器把一个查询字符串解析成 Lucene的查询器.在你选择使用Query Parser前,请考虑以下事项: 如果你打算在程序中拼接查询语法串然后再利用Query Parser转换…
目录 一.单词查询 二.通配符查询 三.模糊查询 四.近似查询 五.范围查询 六.优先级查询 七.逻辑操作 八.括号分组 九.转义特殊字符 Lucene是目前最为流行的开源全文搜索引擎工具包,提供了完整的查询引擎和索引引擎,部分文本分析引擎. 我们平时使用kibana.阿里云的日志查询或者其他一些lucene二次开发的产品,几乎都支持lucene语法. 下面给大家演示各种查询方式,更多请参考 Apache Lucene - Query Parser Syntax 一.单词查询 直接使用单词,例如…
一.查询理论 创建查询:构建一个包含了文档域和语汇单元的文档查询对象.(例:fileName:lucene) 查询过程:根据查询对象的条件,在索引中找出相应的term,然后根据term找到对应的文档id列表. 二.代码分析 实现代码 /** * Lucene入门 * 查询索引 */ public class QueryIndex { /** * 查询索引 * 第一步:创建一个Directory对象,指定索引库的位置 * 第二步:创建一个IndexReader(索引读取)对象,需要指定Direct…
联合查询   在对数据信息进行操作时,有时需要将不同数据表中的数据信息组合在一起,这时需要使用联合查询.联合查询指的是将多表中的行数据组合在一个数据集中进行显示.本节将讲解有关联合查询方面的相关知识. UNION语句查询 在联合查询中,可以使用多个UNION语句将多个数据表连接起来.UNION是集合查询中应用最多的一种运算符.通过使用UNION运算符可以从多个表中将多个查询的结果组合到一起.使用UNOIN运算符时需要注意以下几点: 1. 两个查询语句中列的数量和列的数据类型必须相互兼容. 2.…
转自:http://catastiger.iteye.com/blog/803796 前提:不对结果做sort操作.    在搜索中,并不是所有的Document和Fields都是平等的.有些技术会要求到对其Doucment或者Fields的权值改变,默认值为:1.0F,以上需求都是通过改变Document的boost因子来改变的. 下面是通过lucene3.0,IKAnalyzer 1.通过设置doc boost改变排序结果 /** * 设置DOC boost 值影响查询排序结果 * @thr…