【Lucene4.8教程之三】搜索

1、关键类

Lucene的搜索过程中涉及的主要类有以下几个：

（1）IndexSearcher：执行search()方法的类

（2）IndexReader：对索引文件进行读操作，并为IndexSearcher提供搜索接口

（3）Query及其子类：查询对象，search()方法的重要参数

（4）QueryParser：根据用户输入的搜索词汇生成Query对象。

（5）TopDocs：search()方法返回的前n个文档

（6）ScoreDocs：提供TopDocs中搜索结果的访问接口

2、搜索的关键步骤

（1）创建IndexReader

（2）使用IndexReader创建IndexSearcher

（3）根据搜索关键字，使用QueryParser生成Query对象

（4）以Query作为参数调用IndexSearcher.search()，执行搜索

（5）以TopDocs以及ScoreDocs遍历结果并处理

示例代码如下：

//（1）创建IndexReader

Directory indexDir2 = FSDirectory.open(indexDir);

IndexReader ir = DirectoryReader.open(indexDir2);

//（2）使用IndexReader创建IndexSearcher

IndexSearcher searcher = new IndexSearcher(ir);

//（3）根据搜索关键字，使用QueryParser生成Query对象

QueryParser parser = new QueryParser(Version.LUCENE_48, "contents",new SimpleAnalyzer(Version.LUCENE_48));

Query query = null;

try {

	query = parser.parse(term);

	} catch (ParseException e) {

		e.printStackTrace();

	}

//（4）以Query作为参数调用IndexSearcher.search()，执行搜索

TopDocs docs = searcher.search(query, 30);		

//（5）以TopDocs以及ScoreDocs遍历结果并处理

ScoreDoc[] hits = docs.scoreDocs;

System.out.println(hits.length);

for (ScoreDoc hit : hits) {

			System.out.println("doc: " + hit.doc + " score: " + hit.score);

		}

3、关于IndexReader

（1）IndexReader未提供构造函数，因此需要通过DirectoryReader.open()方法来创建一个IndexReader。

（2）创建一个IndexReader需要较大的系统开销，因此最好在所有搜索期间都重复使用一个IndexReader，只有在必要的时候才建议打开新的IndexReader。

（3）在创建IndexReader时，它会搜索已有的索引快照，如果你需要搜索索引中的变更信息，那么必须打开一个新的reader。所幸的是IndexReader.reopen方法是一个获取新IndexReader的有效方法，能在耗费较少系统资源的情况下使用当前reader来获取索引中所有的变更信息。【新版本中已废弃，待确认替代方法】

4、关于QueryParser与Query的子类

对于一个搜索而言，其核心语句为：

searcher.search(query, 10);

此时，其最重要的参数为一个Qeury对象。构造一个Query对象有2种方法：【均以在contents域搜索java关键词为例】

（1）使用Query的子类，如BooleanQuery, ConstantScoreQuery, DisjunctionMaxQuery, FilteredQuery, MatchAllDocsQuery, MultiPhraseQuery, MultiTermQuery, PhraseQuery, SpanQuery, TermQuery，直接实例化一个对外：

searcher.search( new TermQuery(new Term("contents","java")), 10);

以下语句结构更为清晰

Term term= new Term("contents","java");

TermQuery tq = new TermQuery(term);

searcher.search(tq , 10);

此外，即为在contents域中搜索包括java的文档。

（2）使用QueryParser的parse()方法，对所传入的搜索关键词汇进行解释，并返回query对象。

QueryParser parser = new QueryParser(Version.LUCENE_48, "contents",new SimpleAnalyzer(Version.LUCENE_48));

Query query = null;

try {

	query = parser.parse("java");

} catch (ParseException e) {

	e.printStackTrace();

}

TopDocs docs = searcher.search(query, 10);

以上语句创建一个QueryParser，其默认搜索域为contents，然后将搜索词汇转化为Query对象。

如果指定QueryParser的默认搜索域为全部？如何指定一个Query的搜索域？

关于QueryParser与Query子类的更详细内容，请参见

【Lucene4.8教程之六】QueryParser与Query子类：如何生成Query对象 http://blog.csdn.net/jediael_lu/article/details/33288793

【Lucene4.8教程之三】搜索的更多相关文章

【Lucene4.8教程之三】搜索 2014-06-21 09:53 1532人阅读评论(0) 收藏
1.关键类 Lucene的搜索过程中涉及的主要类有以下几个: (1)IndexSearcher:执行search()方法的类 (2)IndexReader:对索引文件进行读操作,并为IndexSear ...
【Lucene4.8教程之二】索引
一.基础内容 0.官方文档说明 (1)org.apache.lucene.index provides two primary classes: IndexWriter, which creates ...
【Lucene4.8教程之二】索引 2014-06-16 11:30 3845人阅读评论(0) 收藏
一.基础内容 0.官方文档说明 (1)org.apache.lucene.index provides two primary classes: IndexWriter, which creates ...
【OpenCV入门教程之三】图像的载入，显示和输出一站式完全解析（转）
本系列文章由@浅墨_毛星云出品,转载请注明出处. 文章链接:http://blog.csdn.net/poem_qianmo/article/details/20537737 作者:毛星云(浅墨) ...
RabbitMQ系列教程之三：发布/订阅（Publish/Subscribe）（转载）
RabbitMQ系列教程之三:发布/订阅(Publish/Subscribe) (本教程是使用Net客户端,也就是针对微软技术平台的) 在前一个教程中,我们创建了一个工作队列.工作队列背后的假设是每个 ...
【Lucene4.8教程之一】使用Lucene4.8进行索引及搜索的基本操作
在Lucene对文本进行处理的过程中,可以大致分为三大部分: 1.索引文件:提取文档内容并分析,生成索引 2.搜索内容:搜索索引内容,根据搜索关键字得出搜索结果 3.分析内容:对搜索词汇进行分析,生成 ...
【Lucene4.8教程之中的一个】使用Lucene4.8进行索引及搜索的基本操作
版权声明:本文为博主原创文章.转载请注明来自http://blog.csdn.net/jediael_lu/ https://blog.csdn.net/jediael_lu/article/deta ...
EntityFramework_MVC4中EF5 新手入门教程之三 ---3.排序、筛选和分页
在前面的教程你实施了一套基本的 CRUD 操作,为Student实体的 web 页.在本教程中,您将添加排序. 筛选和分页到 StudentsIndex的功能.您还将创建一个页面,并简单分组. 下面的 ...
seo搜索优化教程11-seo搜索优化关键词策略
为了使大家更方便的了解及学习网络营销推广.seo搜索优化,星辉科技强势推出seo搜索优化教程.此为seo教程第11课关键词在seo搜索优化中有着重要的地位,本节主要讲解seo搜索优化中关键词优化的相 ...

随机推荐

hdu1754 基础线段树
I Hate It Time Limit: 9000/3000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total S ...
Excel Aspose.Cells 设置单元格格式为数字
Workbook workbook = new Workbook(); //工作簿 Worksheet sheet = workbook.Worksheets[]; //工作表 sheet.Cells ...
Maven 学习笔记
1. Maven 工具的意义: 从事软件开发,无论什么样的项目,什么样的技术,都要经历:编码.测试.打包.发布等几个特定过程,而这些过程在软件开发周期中都是重复的.繁琐的.Maven的出现是为了将开发 ...
手机扫描二维码下载APP，根据操作系统不同自动下载
Android和IOS手机扫描二维码下载APP,根据OS不同,自动处理相应下载操作.IOS自动跳转至AppStore应用下载页,Android自动下载应用的apk包. <script type= ...
[原]用C#模拟实现扑克牌发牌、排序程序。
(1)52张扑克牌,四种花色(红桃.黑桃.方块和梅花),随机发牌给四个人. (2)最后将四个人的扑克牌包括花色打印在控制台上. 其中:  花色和点数用枚举类型实现  每张扑克牌用结构实 ...
Hibernate配置属性
Hibernate配置属性属性名用途 hibernate.dialect 一个Hibernate Dialect类名允许Hibernate针对特定的关系数据库生成优化的SQL. 取值 full.c ...
使用Qt编写服务器端程序（包括Http传输服务器端）的方法
使用Qt编写客户端的程序的示例或demo较多,但是编写服务器端程序的demo很少.当然,服务器端的程序一般不需要带界面,这点我们可以理解.不过有些时候我们还是需要使用Qt编写一个简单的测试用的服务器代 ...
在WPF中使用ArcGIS Engine
原文 http://blog.csdn.net/zzahkj/article/details/9102621 1.首先,新建一个WPF项目,添加引用ESRI.ArcGIS.AxControls.ESR ...
SQL数据转移
方法一:如果想把数据库A中的表Table1中的数据复制到数据库B中的表Table2中,也就是要预先建立Table2,可以使用一下语句: use B goinsert into Table2 selec ...
【LeetCode练习题】Pow(x, n)
Pow(x, n) Implement pow(x, n). 计算x的n次方. 解题思路: 考虑到n的值会很大,而且可为正可为负可为0,所以掉渣天的方法就是用递归了. 对了,这题也在<剑指off ...

【Lucene4.8教程之三】搜索

【Lucene4.8教程之三】搜索的更多相关文章

随机推荐

热门专题