lucene4入门（2）搜索

欢迎转载http://www.cnblogs.com/shizhongtao/p/3440479.html

接着上一篇，这里继续搜索，对于搜索和创建一样，首先你要确定搜索位置，然后用规定的类来读取。还要注意一点，确定分词器，因为不同的分词器所创建的分词规则不同。上篇我使用的是默认的分词器，这里我也先不管分词器。为了方便阅读，代码就全部粘上。

 package com.bing.test;

 import java.io.File;

 import java.io.FileNotFoundException;

 import java.io.FileReader;

 import java.io.IOException;

 import org.apache.lucene.analysis.Analyzer;

 import org.apache.lucene.analysis.standard.StandardAnalyzer;

 import org.apache.lucene.document.Document;

 import org.apache.lucene.document.Field.Store;

 import org.apache.lucene.document.FieldType;

 import org.apache.lucene.document.StringField;

 import org.apache.lucene.document.TextField;

 import org.apache.lucene.index.DirectoryReader;

 import org.apache.lucene.index.IndexReader;

 import org.apache.lucene.index.IndexWriter;

 import org.apache.lucene.index.IndexWriterConfig;

 import org.apache.lucene.queryparser.classic.ParseException;

 import org.apache.lucene.queryparser.classic.QueryParser;

 import org.apache.lucene.search.IndexSearcher;

 import org.apache.lucene.search.Query;

 import org.apache.lucene.search.ScoreDoc;

 import org.apache.lucene.search.TopDocs;

 import org.apache.lucene.store.Directory;

 import org.apache.lucene.store.FSDirectory;

 import org.apache.lucene.util.Version;

 /**

  * @author bingyulei

  *

  */

 public class HelloLucene

 {

     Directory directory = null;

     Document doc;

     IndexWriter writer = null;

     /**

      *

      * @param indexWriterPath

      *            索引创建路径

      * @param filePath

      *            读取文件路径

      */

     public void createIndex(String indexWriterPath, String filePath)

     {

         // 创建indexwriter

         Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_45);// 设置标准分词器

                                                                     // ,默认是一元分词

         IndexWriterConfig iwc = new IndexWriterConfig(Version.LUCENE_45,

                 analyzer);// 设置IndexWriterConfig

         try

         {

             // 创建directory

             // directory=RAMDirectory();//创建在内存中

             // 创建在硬盘上

             directory = FSDirectory.open(new File(indexWriterPath));// 打开存放索引的路径

             writer = new IndexWriter(directory, iwc);

             // 为document添加field

             addFile(writer, filePath);

             System.out.println("添加成功");

         } catch (IOException e)

         {

             // TODO Auto-generated catch block

             e.printStackTrace();

         }

     }

     private void addFile(IndexWriter writer, String filePath)

     {

         File f = new File(filePath);

         FieldType ft = new FieldType();

         ft.setIndexed(true);// 索引

         ft.setStored(true);// 存储，数据量比较大，一般都是不鼓励存储，放在索引文件中会把索引文件撑大

         ft.setTokenized(true);

         for (File file : f.listFiles())

         {

             try

             {

                 // 创建Document对象

                 doc = new Document();

                 // doc.add(new Field("content", new FileReader(file), ft));

                 doc.add(new TextField("content", new FileReader(file)));

                 doc.add(new TextField("filename", file.getName(), Store.YES));

                 doc.add(new StringField("path", file.getPath(), Store.YES));

                 // 添加文档

                 writer.addDocument(doc);

                 writer.commit();// 提交数据

             } catch (FileNotFoundException e)

             {

                 // TODO Auto-generated catch block

                 e.printStackTrace();

             } catch (IOException e)

             {

                 // TODO Auto-generated catch block

                 e.printStackTrace();

             }

         }

     }

     /**

      * 搜索

      *

      * @param path

      *            搜索路径

      * @param indexReaderPath

      *            索引存放路径

      */

     public void seacher(String indexReaderPath, String searthText)

     {

         IndexReader reader=null;

         try

         {

             directory = FSDirectory.open(new File(indexReaderPath));

             // 创建读取索引的reader

              reader = DirectoryReader.open(directory);

             // 根据reader创建search

             IndexSearcher searcher = new IndexSearcher(reader);

             // 创建查询,第二个参数表示查询的字段名，第三个是分词器

             QueryParser parser = new QueryParser(Version.LUCENE_45, "content",

                     new StandardAnalyzer(Version.LUCENE_45));

             // 搜索包含searthText的内容

             Query query = parser.parse(searthText);

             // 搜索返回10条记录

             TopDocs tds = searcher.search(query, 10);

              //获取scoredoc对象组，

              ScoreDoc[] sds=tds.scoreDocs;

              for(ScoreDoc sd:sds){

                  //获取具体的doc

                  Document doc=searcher.doc(sd.doc);

                  System.out.println(doc.get("filename")+":"+doc.get("path"));

              }

         } catch (IOException e)

         {

             // TODO Auto-generated catch block

             e.printStackTrace();

         }// 打开存放索引的路径

         catch (ParseException e)

         {

             // TODO Auto-generated catch block

             e.printStackTrace();

         }finally{

             if (reader!=null)

             {

                 try

                 {

                     reader.close();

                 } catch (IOException e)

                 {

                     // TODO Auto-generated catch block

                     e.printStackTrace();

                 }

             }

         }

     }

 }

说明，"D:\\lucene\\file"是我复制lucene官方文档上的两段话，不过当你创建完索引之后，然后再修改文件内容，新加的内容并不能搜索出来。这个应该很好理解。

然后进行测试：searchTest,就可以得到那个文本文件中有"Changing Similarity"这段字符

package com.bing.test;

import org.junit.Test;

public class HelloLuceneTest

{

    @Test

    public void writertest(){

        HelloLucene test=new HelloLucene();

        test.createIndex("D:\\lucene\\index","D:\\lucene\\file");

    }

    @Test

    public void searchTest(){

        HelloLucene test=new HelloLucene();

        test.seacher("D:\\lucene\\index", "Changing Similarity");

    }

}

lucene4入门（2）搜索的更多相关文章

lucene4入门（1）
欢迎转载http://www.cnblogs.com/shizhongtao/p/3440325.html lucene你可以理解为一种数据库,他是全文搜索的一种引擎. 1.首先去官网download ...
lucene4入门（3）琐记
欢迎转载http://www.cnblogs.com/shizhongtao/p/3440486.html <--这个是lucene4.6的api下载地址,格式是chm的.需要的人可以下载htt ...
solr入门之搜索建议的几种实现方式和最终选取实现思路
上篇博客中我简单的讲了下solr自身的suggest模块来实现搜索建议.但是今天研究了下在solr自身的suggest中添加进去拼音来智能推荐时不时很方便.在次从网上搜集和整理思考了下该问题的解决. ...
angular入门--filter搜索
首先,列表绑定忽略先上代码 <html ng-app="app1"> <head> <meta charset='utf-8' /> < ...
[算法入门]——深度优先搜索（DFS）
深度优先搜索(DFS) 深度优先搜索叫DFS(Depth First Search).OK,那么什么是深度优先搜索呢?_? 样例: 举个例子,你在一个方格网络中,可以简单理解为我们的地图,要从A点到B ...
linux 入门教程
linux入门教程搜索 Linux入门教程前言第一章关于Linux的历史第二章图形界面还是命令窗口第三章 Linux操作系统的安装第四章初步进入linux世界第五章 Linux系统 ...
Linux入门基础篇
Linux入门基础篇 Linux诞生 Linux发行版本说明 Linux官方网站 Linux内核官方网站比较有名的Linux发行版虚拟机(Virtual Machine),一个虚拟的系统,安装在系 ...
Egret入门学习日记 --- 第二篇（书籍的选择 && 书籍目录 && 书中 3.3 节内容）
第二篇 (书籍的选择 && 书籍目录 && 书中 3.3 节内容) 既然选好了Egret,那我就要想想怎么学了. 开始第一步,先加个Q群先,这不,拿到了一本<E ...
java课程设计团队博客《基于学院的搜索引擎》
JAVA课程设计基于学院网站的搜索引擎对学院网站用爬虫进行抓取.建索(需要中文分词).排序(可选).搜索.数据摘要高亮.分页显示.Web界面. 一.团队介绍学号班级姓名简介 2016211 ...

随机推荐

sublime自定义snippet代码片段
相信很多人喜欢sublime编辑工具有两个原因:第一sublime很轻巧方便:第二sublime提供很多自定义拓展功能,包括很简单且和很好用的代码片段功能snippet文件. 今天,在这里就介绍下su ...
iOS开发——实用篇Swift篇&状态栏操作
状态栏操作在Swift开发过程中,针对状态栏操作的过程有很多. 1.在ViewController中操作当前ViewController的状态栏 /** 隐藏状态栏 */ override func ...
Windows 10正式版官方原版ISO镜像下载
[微软官方]下载地址1:官方下载工具(32-位系统版本)官方下载工具(64-位系统版本) [MSDN]下载地址2:cn_windows_10_multiple_editions_x64_dvd_684 ...
shell判断一个变量是否为空
判断一个变量是否为空 . 1. 变量通过" "引号引起来如下所示:,可以得到结果为 IS NULL. #!/bin/sh para1= if [ ! -n "$para ...
css笔记16：盒子模型的入门案例
1.案例一: 效果图如下: (1)box1.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN&quo ...
AES 加解密
// // NSData+AES.h // Smile // // Created by 蒲晓涛 on 12-11-24. // Copyright (c) 2012年 BOX. All rights ...
实现struts2框架
Struts最早是作为Apache Jakarta项目的组成部分,项目的创立者希望通过对该项目的研究,改进和提高JavaServer Pages .Servlet.标签库以及面向对象的技术水准.最初的 ...
markdownpad2 pro注册信息升级破解版
注册信息邮箱地址: Soar360@live.com 授权秘钥: GBPduHjWfJU1mZqcPM3BikjYKF6xKhlKIys3i1MU2eJHqWGImDHzWdD6xhMNLGVpbP2 ...
Mac 10.9 自带apache2虚拟目录设置
花了好几天时间做这个事,终于成功,把正确的做法记录一下. 如果是第一次使用apache,可以先执行sudo apachectl start,然后在浏览器里打开http://localhost看看效果, ...
CentOS(十)--与Linux文件和目录管理相关的一些重要命令②
在结束了第二期的广交会实习之后,又迎来了几天休闲的日子,继续学习Linux.在上一篇随笔 Linux学习之CentOS(十七)--与Linux文件和目录管理相关的一些重要命令① 中,详细记录了与Lin ...

lucene4入门（2）搜索

lucene4入门（2）搜索的更多相关文章

随机推荐

热门专题