【Lucene4.8教程之三】搜索 2014-06-21 09:53 1532人阅读评论(0) 收藏

1、关键类

Lucene的搜索过程中涉及的主要类有以下几个：

（1）IndexSearcher：执行search()方法的类

（2）IndexReader：对索引文件进行读操作，并为IndexSearcher提供搜索接口

（3）Query及其子类：查询对象，search()方法的重要参数

（4）QueryParser：根据用户输入的搜索词汇生成Query对象。

（5）TopDocs：search()方法返回的前n个文档

（6）ScoreDocs：提供TopDocs中搜索结果的访问接口

2、搜索的关键步骤

（1）创建IndexReader

（2）使用IndexReader创建IndexSearcher

（3）根据搜索关键字，使用QueryParser生成Query对象

（4）以Query作为参数调用IndexSearcher.search()，执行搜索

（5）以TopDocs以及ScoreDocs遍历结果并处理

示例代码如下：

//（1）创建IndexReader

Directory indexDir2 = FSDirectory.open(indexDir);

IndexReader ir = DirectoryReader.open(indexDir2);

//（2）使用IndexReader创建IndexSearcher

IndexSearcher searcher = new IndexSearcher(ir);

//（3）根据搜索关键字，使用QueryParser生成Query对象

QueryParser parser = new QueryParser(Version.LUCENE_48, "contents",new SimpleAnalyzer(Version.LUCENE_48));

Query query = null;

try {

	query = parser.parse(term);

	} catch (ParseException e) {

		e.printStackTrace();

	}

//（4）以Query作为参数调用IndexSearcher.search()，执行搜索

TopDocs docs = searcher.search(query, 30);		

//（5）以TopDocs以及ScoreDocs遍历结果并处理

ScoreDoc[] hits = docs.scoreDocs;

System.out.println(hits.length);

for (ScoreDoc hit : hits) {

			System.out.println("doc: " + hit.doc + " score: " + hit.score);

		}

3、关于IndexReader

（1）IndexReader未提供构造函数，因此需要通过DirectoryReader.open()方法来创建一个IndexReader。

（2）创建一个IndexReader需要较大的系统开销，因此最好在所有搜索期间都重复使用一个IndexReader，只有在必要的时候才建议打开新的IndexReader。

（3）在创建IndexReader时，它会搜索已有的索引快照，如果你需要搜索索引中的变更信息，那么必须打开一个新的reader。所幸的是IndexReader.reopen方法是一个获取新IndexReader的有效方法，能在耗费较少系统资源的情况下使用当前reader来获取索引中所有的变更信息。【新版本中已废弃，待确认替代方法】

4、关于QueryParser与Query的子类

对于一个搜索而言，其核心语句为：

searcher.search(query, 10);

此时，其最重要的参数为一个Qeury对象。构造一个Query对象有2种方法：【均以在contents域搜索java关键词为例】

（1）使用Query的子类，如BooleanQuery, ConstantScoreQuery, DisjunctionMaxQuery, FilteredQuery, MatchAllDocsQuery, MultiPhraseQuery, MultiTermQuery, PhraseQuery, SpanQuery, TermQuery，直接实例化一个对外：

searcher.search( new TermQuery(new Term("contents","java")), 10);

以下语句结构更为清晰

Term term= new Term("contents","java");

TermQuery tq = new TermQuery(term);

searcher.search(tq , 10);

此外，即为在contents域中搜索包括java的文档。

（2）使用QueryParser的parse()方法，对所传入的搜索关键词汇进行解释，并返回query对象。

QueryParser parser = new QueryParser(Version.LUCENE_48, "contents",new SimpleAnalyzer(Version.LUCENE_48));

Query query = null;

try {

	query = parser.parse("java");

} catch (ParseException e) {

	e.printStackTrace();

}

TopDocs docs = searcher.search(query, 10);

以上语句创建一个QueryParser，其默认搜索域为contents，然后将搜索词汇转化为Query对象。

如果指定QueryParser的默认搜索域为全部？如何指定一个Query的搜索域？

关于QueryParser与Query子类的更详细内容，请参见

【Lucene4.8教程之六】QueryParser与Query子类：如何生成Query对象 http://blog.csdn.net/jediael_lu/article/details/33288793

【Lucene4.8教程之三】搜索 2014-06-21 09:53 1532人阅读评论(0) 收藏的更多相关文章

【Lucene4.8教程之二】索引 2014-06-16 11:30 3845人阅读评论(0) 收藏
一.基础内容 0.官方文档说明 (1)org.apache.lucene.index provides two primary classes: IndexWriter, which creates ...
搜索基础 AC 2014-01-14 15:53 170人阅读评论(0) 收藏
题目网址:http://haut.openjudge.cn/xiyoulianxi1/1/ 1:晶矿的个数查看提交统计提问总时间限制: 1000ms 内存限制: 65536kB 描述 ...
CocoaPods安装和使用教程分类： ios技术 ios相关 2015-03-11 21:53 48人阅读评论(0) 收藏
目录 CocoaPods是什么? 如何下载和安装CocoaPods? 如何使用CocoaPods? 场景1:利用CocoaPods,在项目中导入AFNetworking类库场景2:如何正确编译运行一 ...
2014/11/06 Oracle触发器初步 2014-11-06 09:03 49人阅读评论(0) 收藏
触发器我就不多解释了,保证数据的完整性的神器,嗯..也是减少程序员工作托管给数据库操作的好帮手.就不讲一些大道理了.通俗点,我们对数据库的操作,无非就是增删改查. 触发器就是在删,改,增的时候( ...
【Solr专题之九】SolrJ教程分类： H4_SOLR/LUCENCE 2014-07-28 14:31 2351人阅读评论(0) 收藏
一.SolrJ基础 1.相关资料 API:http://lucene.apache.org/solr/4_9_0/solr-solrj/ apache_solr_ref_guide_4.9.pdf:C ...
Maven基础教程分类： C_OHTERS 2015-04-10 22:53 232人阅读评论(0) 收藏
更多内容请参考官方文档:http://maven.apache.org/guides/index.html 官方文档很详细,基本上可以查找到一切相关的内容. 另外,快速入门可参考视频:孔浩的maven ...
建立简单的服务器端程序分类： B1_JAVA 2013-10-08 21:53 503人阅读评论(0) 收藏
参考自core java package com.lujinhong.corejava; import java.io.IOException; import java.io.InputS ...
Mahout快速入门教程分类： B10_计算机基础 2015-03-07 16:20 508人阅读评论(0) 收藏
Mahout 是一个很强大的数据挖掘工具,是一个分布式机器学习算法的集合,包括:被称为Taste的分布式协同过滤的实现.分类.聚类等.Mahout最大的优点就是基于hadoop实现,把很多以前运行于单 ...
【solr专题之二】配置文件：solr.xml solrConfig.xml schema.xml 分类： H4_SOLR/LUCENCE 2014-07-23 21:30 1959人阅读评论(0) 收藏
1.关于默认搜索域 If you are using the Lucene query parser, queries that don't specify a field name will use ...

随机推荐

screen-调节屏幕亮度
今天做项目的时候,需要实现一个功能,就是进入一个应用,在这个应用中,屏幕的亮度变为最亮.关键代码如下 bt1.setOnClickListener(new OnClickListener() { @O ...
2.FastJson公司--阿里巴巴开源的速度最快的Json和对象转换工具
转自:https://blog.csdn.net/gongpulin/article/details/52062532 这是关于FastJson的一个使用Demo,在Java环境下验证的这是关于Fa ...
pycharm 配置autopep8（亲测可行）
autopep8是一个可以将Python代码自动排版为PEP8风格第三方包,使用它可以轻松地排版出格式优美整齐的代码.网络上有很多介绍如何在pycharm中配置autopep8的方案,但很多方案中还是 ...
[置顶] MVC三层架构在各框架中的特征
1.从结构上分析jsp+servlet图解原理: 在基于mvc设计模式下的最原始的jsp+Servlet框架,在某种程度上是不能够达到mvc最直观的体现.当客户端发送请求到服务器时,服务器会将从客户端 ...
SpringMVC,Mybatis,FreeMarker连接mycat示例(一)
首页 > 程序开发 > 软件开发 > Java > 正文 SpringMVC,Mybatis,FreeMarker连接mycat示例(一) 项目结构如图: 首先是各种配置文件, ...
canvas.toDataURL() gives “Security Error” in IE 11
http://stackoverflow.com/questions/30101143/canvas-todataurl-gives-security-error-in-ie-11
PHP版本 D-Link 动态域名客户端
<?php /* * D-Link 动态域名客户端.主域名www.dlinkddns.com 和 www.dlinkddns.com.cn * 首先获取外网IP,若IP没有变化,则结束运行:否则 ...
Web 组件是什么
Web 组件是什么一.总结这篇下面的内容多看 1.组件化的目的:高内聚,低耦合,便于多人同时开发 2.各种前端框架(前端组件化)让写前端不要太简单: 3.组件编程最最最最简单实例: <lin ...
Node.js笔记请求方式 GET
三种方法解析url 1. 传统的字符串split切割方法 2. querystring 只能解析数据部分,不能解析前面 index.html之类的地址部分. 3. url 可以解析地址和数 ...
【例题 7-3 UVA - 10976】Fractions Again?!
[链接] 我是链接,点我呀:) [题意] 在这里输入题意 [题解] x>=y => \(\frac{1}{x}<=\frac{1}{y}\) => \(\frac{1}{x}= ...

【Lucene4.8教程之三】搜索 2014-06-21 09:53 1532人阅读 评论(0) 收藏

【Lucene4.8教程之三】搜索 2014-06-21 09:53 1532人阅读 评论(0) 收藏的更多相关文章

随机推荐

热门专题

【Lucene4.8教程之三】搜索 2014-06-21 09:53 1532人阅读评论(0) 收藏

【Lucene4.8教程之三】搜索 2014-06-21 09:53 1532人阅读评论(0) 收藏的更多相关文章