lucene示例

搭建环境

搭建Lucene的开发环境只需要加入Lucene的Jar包，要加入的jar包至少要有：

lucene-core-3.0.1.jar（核心包）

contrib\analyzers\common\lucene-analyzers-3.0.1.jar（分词器）

contrib\highlighter\lucene-highlighter-3.0.1.jar（高亮）

contrib\memory\lucene-memory-3.0.1.jar（高亮）

Article.java

 package cn.itcast._domain;

 public class Article {

     private Integer id;

     private String title;

     private String content;

     public Integer getId() {

         return id;

     }

     public void setId(Integer id) {

         this.id = id;

     }

     public String getTitle() {

         return title;

     }

     public void setTitle(String title) {

         this.title = title;

     }

     public String getContent() {

         return content;

     }

     public void setContent(String content) {

         this.content = content;

     }

 }

HelloWorld.java

 package cn.itcast.helloworld;

 import java.io.File;

 import java.io.IOException;

 import java.util.ArrayList;

 import java.util.List;

 import org.apache.lucene.analysis.Analyzer;

 import org.apache.lucene.analysis.standard.StandardAnalyzer;

 import org.apache.lucene.document.Document;

 import org.apache.lucene.document.Field;

 import org.apache.lucene.document.Field.Index;

 import org.apache.lucene.document.Field.Store;

 import org.apache.lucene.index.IndexWriter;

 import org.apache.lucene.index.IndexWriter.MaxFieldLength;

 import org.apache.lucene.queryParser.QueryParser;

 import org.apache.lucene.search.IndexSearcher;

 import org.apache.lucene.search.Query;

 import org.apache.lucene.search.ScoreDoc;

 import org.apache.lucene.search.TopDocs;

 import org.apache.lucene.store.Directory;

 import org.apache.lucene.store.FSDirectory;

 import org.apache.lucene.util.Version;

 import org.junit.Test;

 import cn.itcast._domain.Article;

 public class HelloWorld {

     private static Directory directory; // 索引库目录

     private static Analyzer analyzer; // 分词器

     static {

         try {

             directory = FSDirectory.open(new File("./indexDir"));

             analyzer = new StandardAnalyzer(Version.LUCENE_30);

         } catch (IOException e) {

             throw new RuntimeException(e);

         }

     }

     // 建立索引

     @Test

     public void testCreateIndex() throws Exception {

         // 准备数据

         Article article = new Article();

         article.setId(2);

         article.setTitle("准备Lucene的开发环境");

         article.setContent("如果信息检索系统在用户发出了检索请求后再去互联网上找答案，根本无法在有限的时间内返回结果。");

         // 放到索引库中

         // 1, 把Article转为Document

         Document doc = new Document();

         String idStr = article.getId().toString();        //这个使用的话效率降低 被遗弃了

         String idStr = NumericUtils.intToPrefixCoded(article.getId()); // 一定要使用Lucene的工具类把数字转为字符串！

                         //目录区域  和 数据区

         doc.add(new Field("id", idStr, Store.YES, Index.ANALYZED));

         doc.add(new Field("title", article.getTitle(), Store.YES, Index.ANALYZED));

         doc.add(new Field("content", article.getContent(), Store.NO, Index.ANALYZED));

         // 2, 把Document放到索引库中                                            在目录中的长度 源码 Integer.Max_Value

         IndexWriter indexWriter = new IndexWriter(directory, analyzer,  MaxFieldLength.UNLIMITED);

         indexWriter.addDocument(doc);

         indexWriter.close();

     }

     // 搜索

     @Test

     public void testSearch() throws Exception {

         // 准备查询条件

         String queryString = "lucene的";

         // String queryString = "hibernate";

         // 执行搜索

         List<Article> list = new ArrayList<Article>();

         // ==========================================================================================

         // 1，把查询字符串转为Query对象（默认只从title中查询）

         QueryParser queryParser = new QueryParser(Version.LUCENE_30, "title", analyzer);

         Query query = queryParser.parse(queryString);

         // 2，执行查询，得到中间结果

         IndexSearcher indexSearcher = new IndexSearcher(directory); // 指定所用的索引库

         TopDocs topDocs = indexSearcher.search(query, 100); // 最多返回前n条结果

         int count = topDocs.totalHits;

         ScoreDoc[] scoreDocs = topDocs.scoreDocs;

         // 3，处理结果

         for (int i = 0; i < scoreDocs.length; i++) {

             ScoreDoc scoreDoc = scoreDocs[i];

             float score = scoreDoc.score; // 相关度得分

             int docId = scoreDoc.doc; // Document的内部编号

             // 根据编号拿到Document数据

             Document doc = indexSearcher.doc(docId);

             // 把Document转为Article

             String idStr = doc.get("id"); //

             String title = doc.get("title");

             String content = doc.get("content"); // 等价于 doc.getField("content").stringValue();

             Article article = new Article();
                Integer id = NumericUtils.prefixCodedToInt(doc.get("id")); // 一定要使用Lucene的工具类把字符串转为数字！

             article.setId(id);

             article.setTitle(title);

             article.setContent(content);

             list.add(article);

         }

         indexSearcher.close();

         // ==========================================================================================

         // 显示结果

         System.out.println("总结果数：" + list.size());

         for (Article a : list) {

             System.out.println("------------------------------");

             System.out.println("id = " + a.getId());

             System.out.println("title = " + a.getTitle());

             System.out.println("content = " + a.getContent());

         }

     }

 }

1-_搜索互联网资源的程序结构.PNG

索引库的内部结构

建立索引的执行过程

搜索的执行过程

分词器要保持一致

lucene示例的更多相关文章

lucene教程--全文检索技术
1 Lucene 示例代码 https://blog.csdn.net/qzqanzc/article/details/80916430 2 Lucene 实例教程(一)初识L ...
ElasticSearch 集群原理
节点一个运行中的EasticSearch 被称为一个节点,而集群是由多个用于拥有相同cluster.name配置的节点组成,它们共同承担数据和负载的压力,当有新的节点加入或移除,集群会重新平均分布所 ...
【Lucene】三个高亮显示模块的简单示例-Highlighter
Lucene针对高亮显示功能提供了两种实现方式,分别是Highlighter和FastVectorHighlighter 这里的三个示例都是使用Highlighter: 示例代码: package c ...
lucene创建索引简单示例
利用空闲时间写了一个使用lucene创建索引简单示例, 1.使用maven创建的项目 2.需要用到的jar如下: 废话不多说,直接贴代码如下: 1.创建索引的类(HelloLucene): packa ...
Lucene 4.10.2开发示例
这里面用的是比较新的Lucene4.10.2 做的一个实例.(lucene的索引不能太大,要不然效率会很低.大于1G的时候就必须考虑分布索引的问题) 先介绍一下Lucene的几个参数意义: Index ...
Lucene用法示例
整理一下 ELK 和 Grafana 中会用到的 Lucene 用法: 通配符示例1:过滤出 url 中包含 .pw/ 的网址 url.keyword:*.pw\/* 正则表达式示例1:过滤出 ...
Lucene.net 基本示例《第一篇》
Lucene.net是java平台搜索插件Lucene的移植版.它的主要用于开发搜索引擎,站内搜索等. 开篇之前,写个最简单的DEMO,让自己先体验下Lucene.net的魅力,顺便搭建环境. sta ...
【转载】Lucene.Net入门教程及示例
本人看到这篇非常不错的Lucene.Net入门基础教程,就转载分享一下给大家来学习,希望大家在工作实践中可以用到. 一.简单的例子 //索引Private void Index(){ Index ...
Lucene中最简单的索引和搜索示例
package com.jiaoyiping.lucene; import org.apache.lucene.analysis.standard.StandardAnalyzer; import o ...

随机推荐

数据库SQL归纳（二）
数据定义功能对象创建修改删除架构 CREATE SCHEMA DROP SCHEMA 表 CREATE TABLE ALTER TABLE DROP TABLE 视图 CREATE VIEW ...
【贪心】hdu5969 最大的位或
对于右端点r和左端点l,考虑他们的二进制位从高到低,直到第一位不同的为止. 更高的都取成相同的,更低的都取成1. 比如 101011110001 101011101001 101011111111 # ...
vue的开发环境搭建命令加图解
vue的开发环境的搭建不管什么软件我们都要去官网下载安装,这是作为专业程序员的安全意识. 1.安装node.js 官方下载的页面:点击这里大约展示的页面是这样子的!我们演示是windows 64位 ...
计算gcd Exercise07_14
import java.util.Scanner; /** * @author 冰樱梦 * 时间:2018年下半年 * 题目:计算gcd * */ public class Exercise07_14 ...
Java编程思想学习(二)----一切都是对象
2.1用应用操作对象 String s; 这里所创建的只是引用,并不是对象.如果此时向s发送一个消息,就会返回一个运行时错误.这是因为此时s没有和任何事物关联.因此,一种安全的做法是:创建一个引用的同 ...
cocos2d-x解析xml时的Bug
cocos2d-x中使用tinyxml解析xml配置.如下: tinyxml2::XMLDocument doc; if (tinyxml2::XML_SUCCESS != doc.LoadFile( ...
#Java Web累积#表格<table>中隐藏列做备用数据
初入JW,MyEclipse,JS文件中码砖时怎么连个提示都没有. 步骤1 JSP代码中,Table多出一列,如下列代码中的 Other,其中css文件中将col00的width设置为0px; < ...
mqtt 协议之 PINGREQ, PINGRESP
mqtt 协议里最简单的是 ping 协议吧 (心跳包), ping 协议是已连接的客户端发往服务端, 告诉服务端,我还"活着" PINGREQ - PING request fi ...
jquery中remove()与detach()的区别
说到删除节点,马上就会想到remove,不过原来还有一个detach,而且它们还是有区别的,就是detach保留了jquery的数据,而remove就会完全删除干净.所以如果在删除一个dom节点后还想 ...
iOS：基于Socket的第三方框架CocoaAsyncSocket的使用
CocoaAsyncSocket无疑是目前封装得最完善的Socket库了:支持异步TCP/UDP,支持GCD,Objective-C接口封装,同时还有日志跟踪功能,使用此日志跟踪,程序员可以很方便的进 ...

lucene示例

lucene示例的更多相关文章

随机推荐

热门专题