用Lucene检索数据库

http://blog.sina.com.cn/s/blog_82ac67c101012r9z.html

package com.javabean;

import java.io.File;
import java.io.IOException;
import java.sql.ResultSet;
import java.sql.SQLException;
import java.util.ArrayList;
import java.util.List;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.Field.Index;
import org.apache.lucene.document.Field.Store;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.queryParser.MultiFieldQueryParser;
import org.apache.lucene.queryParser.ParseException;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.queryParser.QueryParser.Operator;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.store.SimpleFSDirectory;
import org.apache.lucene.util.Version;

public class lucene
{
public void createIndexFile() {
         IndexWriter indexWriter=null;
          try {
             // 需要的分词器
             Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_36);
             // 创建的是哪个版本的IndexWriterConfig
             IndexWriterConfig indexWriterConfig = new IndexWriterConfig(
                     Version.LUCENE_36, analyzer);
              // 创建系统文件-----

　　　　 Directory directory = FSDirectory.open(new File(indexPath));

　　　　 // 这里千万不能用SimpleFSDirectory, 不然会报错, 找错找到你哭
/* Directory directory = new SimpleFSDirectory(new File("D:\\tomcat-6.0.35\\webapps\\jsp_flex\\index")); */

indexWriter = new IndexWriter(directory,indexWriterConfig);
              //访问数据库拿数据
              DBConnect db = new DBConnect();
        String sql = "select * from book";
        ResultSet rs = db.select(sql);
        while(rs.next())
        {
              //indexWriter添加索引
              Document doc=new Document();
              //文本中添加内容
              doc.add(new Field("ISBN",rs.getString(1).toString(),Store.YES,Index.ANALYZED));
              doc.add(new Field("bookname",rs.getString(2).toString(),Store.YES,Index.ANALYZED));
              doc.add(new Field("author",rs.getString(3).toString(),Store.YES,Index.ANALYZED));
              doc.add(new Field("leibie",rs.getString(6).toString(),Store.YES,Index.ANALYZED));
              doc.add(new Field("jianjie",rs.getString(10).toString(),Store.YES,Index.ANALYZED));
              //添加到索引中去
              indexWriter.addDocument(doc);
        }

          } catch (IOException e) {
              e.printStackTrace();
          } catch (SQLException e) {
     e.printStackTrace();
    }finally{
              if(indexWriter!=null){
                  try {
                   indexWriter.commit();
                      indexWriter.close();
                  }  catch (IOException e) {
                      e.printStackTrace();
                  }
              }
          }
      }

      public void seacher(String queryString) throws IOException
      {
       FSDirectory fs;
       try {
        fs =  FSDirectory.open(new File("D:\\tomcat-6.0.35\\webapps\\jsp_flex\\index"));
        IndexReader ir = IndexReader.open(fs);
        long start  = System.currentTimeMillis();
        IndexSearcher search = new IndexSearcher(ir);
        String key = queryString;
        String fieds[] = new String[]{"ISBN","bookname","author","leibie","jianjie"};
        Analyzer ik = new StandardAnalyzer(Version.LUCENE_36);
        MultiFieldQueryParser m = new MultiFieldQueryParser(Version.LUCENE_36, fieds, ik);
        m.setDefaultOperator(Operator.AND);
        Query query = m.parse(key) ;
           ScoreDoc[] hits = search.search(query, null, 1000).scoreDocs;
        System.out.println("共命中"+hits.length+"条记录");
        for(ScoreDoc scoreDoc:hits)
        {
            Document doc= search.doc(scoreDoc.doc);
            System.out.println(scoreDoc.score + "\t ISBN:"+doc.get("ISBN")+"\t bookname:"+doc.get("bookname")+"\t leibie:"+doc.get("leibie"));
        }
           System.out.println("执行时间:"+(System.currentTimeMillis()-start)+"毫秒");
         }
       catch (IOException e)
       {
         e.printStackTrace();
       } catch (ParseException e) {
        e.printStackTrace();
          }


      }

public static void main(String[] args) throws IOException
      {
       lucene test = new lucene();
      // test.createIndexFile();
       test.seacher("中国");

      }

}

用Lucene检索数据库的更多相关文章

【Java】Lucene检索引擎详解
基于Java的全文索引/检索引擎——Lucene Lucene不是一个完整的全文索引应用,而是是一个用Java写的全文索引引擎工具包,它可以方便的嵌入到各种应用中实现针对应用的全文索引/检索功能. L ...
[原创]一种基于Python爬虫和Lucene检索的垂直搜索引擎的实现方法介绍
声明:本文首发在博客园晨星落羽,Shulin_Cao和lvmememe首页,转载请注明出处. 前言 2016.5到2017.5,我们三人(lvmememe,Shulin_Cao,晨星落羽)共同完成了一 ...
3.3 Lucene检索原理
Lucene是一个高效的,基于Java的全文检索库[1].所以在介绍Lucene的检索功能之前,我们要先了解一下全文检索以及Lucene的索引结构. 一.全文检索的基本原理 1. 数据的分类什么是全 ...
Elasticsearch原理学习--为什么Elasticsearch/Lucene检索可以比MySQL快?
转载于:http://vlambda.com/wz_wvS2uI5VRn.html 同样都可以对数据构建索引并通过索引查询数据,为什么Lucene或基于Lucene的Elasticsearch会比关系 ...
Lucene学习之一：使用lucene为数据库表创建索引，并按关键字查询
最近项目中要用到模糊查询,开始研究lucene,期间走了好多弯路,总算实现了一个简单的demo. 使用的lucene jar包是3.6版本. 一:建立数据库表,并加上测试数据.数据库表:UserInf ...
lucene 结合数据库做搜索
package jdbc; import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedSta ...
Lucene检索提高性能的几个方式
1.采用最新版本的Lucene 2.索引文件存储采用本地文件系统,如果需要挂载远程系统,请采用 readonly方式. 3.当然采用更好的硬件,更高I/O的磁盘 4.提高OS 缓存,调整参数 5.提高 ...
PHP项目：如何用PHP高并发检索数据库？
对于抢票.秒杀这种业务,我说说自己对这种高并发的理解吧,这里提出个人认为比较可行的几个方案: 方案一:使用队列来实现可以基于例如MemcacheQ等这样的消息队列,具体的实现方案这么表述吧比如有1 ...
lucene 检索流程整理笔记

随机推荐

maven integration with eclipse 3.0.4 does not work with NTLM proxy
Recently downloaded m2e(maven integration with eclipse). The version is 3.0.4. My environment is beh ...
redis学习笔记——（1）
1. NoSQL&Redis介绍 NoSQL,Not Only SQL,是非关系型的数据库.传统的关系数据库不能满足超大规模和高并发的应用. 是以Key-Value的形式存储,(例如JSON, ...
Symfony学习--目录和入口
1 目录结构根目录下有: app src vendor web app是存放应用的一些配置文件,如果有一些配置文件或者文档,应当存放在这里面. src是存放你的项目的php代码,这里的php至少必须 ...
北京大学信息科学技术学院计算机专业课程大纲选摘--JAVA
JS实现Ajax---例：获取服务器时间
Ajax在本质上是一个浏览器端的技术 XMLHttpRequest XMLHttpRequest对象 XMLHttpRequest对象在IE浏览器和非IE浏览器中创建的方法不同. 简而言之:它可以异步 ...
JS模式：Mixin混合模式，=_=!就是常见的Object.create()或者_extend()
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...
Solr -- 实时搜索
在solr中,实时搜索有3种方案 ①soft commit,这其实是近实时搜索,不能完全实时. ②RealTimeGet,这是实时,但只支持根据文档ID的查询. ③和第一种类似,只是触发softcom ...
echo 和 cat 的区别
tt="1 10 17 10-134-9-154.xml" echo $tt 只是单纯地打印出tt保存的这些变量 cat $tt 则会对tt 中保存的变量文件挨个打印出来
【CodeForces 625C】K-special Tables
题意把1到n*n填在n*n的格子里.要求每一行都是递增的,使第k列的和最大. 分析第k列前的格子1 2 .. 按要求填到满格,然后第k列及后面的格子,都从左到右填递增1的数. 第k列的和再加起来, ...
36.Android之多线程和handle更新UI学习
android经常用到多线程更新UI,今天学习下. 首先布局比较简单: <?xml version="1.0" encoding="utf-8"?> ...

用Lucene检索数据库

用Lucene检索数据库的更多相关文章

随机推荐

热门专题