Lucene针对高亮显示功能提供了两种实现方式,分别是Highlighter和FastVectorHighlighter

这里的三个示例都是使用Highlighter;

示例代码:

  1. package com.tan.code;
  2. import java.io.File;
  3. import java.io.IOException;
  4. import java.io.StringReader;
  5. import org.apache.lucene.analysis.TokenStream;
  6. import org.apache.lucene.analysis.core.SimpleAnalyzer;
  7. import org.apache.lucene.document.Document;
  8. import org.apache.lucene.index.DirectoryReader;
  9. import org.apache.lucene.index.IndexReader;
  10. import org.apache.lucene.index.Term;
  11. import org.apache.lucene.queryparser.classic.ParseException;
  12. import org.apache.lucene.queryparser.classic.QueryParser;
  13. import org.apache.lucene.search.IndexSearcher;
  14. import org.apache.lucene.search.Query;
  15. import org.apache.lucene.search.ScoreDoc;
  16. import org.apache.lucene.search.TermQuery;
  17. import org.apache.lucene.search.TopDocs;
  18. import org.apache.lucene.search.highlight.Highlighter;
  19. import org.apache.lucene.search.highlight.InvalidTokenOffsetsException;
  20. import org.apache.lucene.search.highlight.QueryScorer;
  21. import org.apache.lucene.search.highlight.SimpleHTMLFormatter;
  22. import org.apache.lucene.search.highlight.SimpleSpanFragmenter;
  23. import org.apache.lucene.search.highlight.TokenSources;
  24. import org.apache.lucene.store.Directory;
  25. import org.apache.lucene.store.SimpleFSDirectory;
  26. import org.apache.lucene.util.Version;
  27. import org.wltea.analyzer.lucene.IKAnalyzer;
  28. public class HighlighterTest {
  29. // 高亮處理文本(以下内容纯属虚构)
  30. private String text = "China has lots of people,most of them are very poor.China is very big.China become strong now,but the poor people is also poor than other controry";
  31. // 原文高亮
  32. public void highlighter() throws IOException, InvalidTokenOffsetsException {
  33. TermQuery termQuery = new TermQuery(new Term("field", "china"));
  34. TokenStream tokenStream = new SimpleAnalyzer(Version.LUCENE_43)
  35. .tokenStream("field", new StringReader(text));
  36. QueryScorer queryScorer = new QueryScorer(termQuery);
  37. Highlighter highlighter = new Highlighter(queryScorer);
  38. highlighter.setTextFragmenter(new SimpleSpanFragmenter(queryScorer));
  39. System.out.println(highlighter.getBestFragment(tokenStream, text));
  40. }
  41. // 使用CSS進行高亮顯示處理
  42. public void highlighter_CSS(String searchText) throws ParseException,
  43. IOException, InvalidTokenOffsetsException {
  44. // 創建查詢
  45. QueryParser queryParser = new QueryParser(Version.LUCENE_43, "field",
  46. new SimpleAnalyzer(Version.LUCENE_43));
  47. Query query = queryParser.parse(searchText);
  48. // 自定义标注高亮文本标签
  49. SimpleHTMLFormatter htmlFormatter = new SimpleHTMLFormatter(
  50. "<span style=\"backgroud:red\">", "</span>");
  51. // 语汇单元化
  52. TokenStream tokenStream = new SimpleAnalyzer(Version.LUCENE_43)
  53. .tokenStream("field", new StringReader(text));
  54. // 創建QueryScoer
  55. QueryScorer queryScorer = new QueryScorer(query, "field");
  56. Highlighter highlighter = new Highlighter(htmlFormatter, queryScorer);
  57. highlighter.setTextFragmenter(new SimpleSpanFragmenter(queryScorer));
  58. System.out.println(highlighter.getBestFragments(tokenStream, text, 4,
  59. "..."));
  60. }
  61. // 高亮顯示搜索結果
  62. public void highlighter_SR(String field, String searchText)
  63. throws IOException, ParseException, InvalidTokenOffsetsException {
  64. //本次示例为了简便直接使用之前实验建立的索引
  65. Directory directory = new SimpleFSDirectory(new File("E://MyIndex"));
  66. IndexReader reader = DirectoryReader.open(directory);// 读取目录
  67. IndexSearcher search = new IndexSearcher(reader);// 初始化查询组件
  68. QueryParser parser = new QueryParser(Version.LUCENE_43, field,
  69. new IKAnalyzer(true));
  70. Query query = parser.parse(searchText);
  71. TopDocs td = search.search(query, 10000);// 获取匹配上元素的一个docid
  72. ScoreDoc[] sd = td.scoreDocs;// 加载所有的Documnet文档
  73. System.out.println("本次命中数据:" + sd.length);
  74. QueryScorer scorer = new QueryScorer(query, "content");
  75. Highlighter highlighter = new Highlighter(scorer);
  76. highlighter.setTextFragmenter(new SimpleSpanFragmenter(scorer));
  77. for (ScoreDoc scoreDoc : sd) {
  78. Document document = search.doc(scoreDoc.doc);
  79. String content = document.get("content");
  80. TokenStream tokenStream = TokenSources.getAnyTokenStream(
  81. search.getIndexReader(), scoreDoc.doc, "content", document,
  82. new IKAnalyzer(true));
  83. System.out.println(highlighter
  84. .getBestFragment(tokenStream, content));
  85. }
  86. }
  87. }

测试代码:

  1. @Test
  2. public void test() throws IOException, InvalidTokenOffsetsException,
  3. ParseException {
  4. // fail("Not yet implemented");
  5. HighlighterTest highlighterTest = new HighlighterTest();
  6. highlighterTest.highlighter();
  7. highlighterTest.highlighter_CSS("china");
  8. highlighterTest.highlighter_CSS("poor");
  9. highlighterTest.highlighter_SR("content", "床前明月光");
  10. }

测试结果:

  1. <B>China</B> has lots of people,most of them are very poor。<B>China</B> is very big.<B>China</B> become strong now,but the poor people is also poor than other controry
  2. <span style="backgroud:red">China</span> has lots of people,most of them are very poor。<span style="backgroud:red">China</span> is very big.<span style="backgroud:red">China</span> become strong now,but the poor people is also poor than other controry
  3. China has lots of people,most of them are very <span style="backgroud:red">poor</span>。China is very big.China become strong now,but the <span style="backgroud:red">poor</span> people is also <span style="backgroud:red">poor</span> than other controry
  4. 本次命中数据:1
  5. <B>床</B><B>前</B><B>明月光</B>,疑是地上霜

【Lucene】三个高亮显示模块的简单示例-Highlighter的更多相关文章

  1. 【Redis】三、Redis安装及简单示例

    (四)Redis安装及使用   Redis的安装比较简单,仍然和大多数的Apache开源软件一样,只需要下载,解压,配置环境变量即可.具体安装过程参考:菜鸟教程Redis安装.   安装完成后,通过r ...

  2. Python(2.7.6) 标准日志模块的简单示例

    Python 标准库中的 logging 模块提供了一套标准的 API 来处理日志信息的打印. import logging logging.basicConfig( level = logging. ...

  3. java中request,application,session三个域及参数简单示例

    直接上代码: java代码: public class HelloAction implements Action { @Override public String execute() throws ...

  4. lucene创建索引简单示例

    利用空闲时间写了一个使用lucene创建索引简单示例, 1.使用maven创建的项目 2.需要用到的jar如下: 废话不多说,直接贴代码如下: 1.创建索引的类(HelloLucene): packa ...

  5. 为Lua5.3编写C模块简单示例

    为Lua5.3编写C模块简单示例 一.编译安装Lua5.3 MSVC 命令行安装脚本: @echo off md bin md lib md include cd src cl /c /nologo ...

  6. SignalR代理对象异常:Uncaught TypeError: Cannot read property 'client' of undefined 推出的结论 SignalR 简单示例 通过三个DEMO学会SignalR的三种实现方式 SignalR推送框架两个项目永久连接通讯使用 SignalR 集线器简单实例2 用SignalR创建实时永久长连接异步网络应用程序

    SignalR代理对象异常:Uncaught TypeError: Cannot read property 'client' of undefined 推出的结论   异常汇总:http://www ...

  7. pureMVC简单示例及其原理讲解三(View层)

    本篇说的是View层,即视图层,在本示例中包括两个部分:MXML文件,即可视控件:Mediator. 可视控件 可视控件由UserForm.mxml(图1)和UserList.mxml(图2)两个文件 ...

  8. 基于.NET CORE微服务框架 -surging的介绍和简单示例 (开源)

    一.前言 至今为止编程开发已经11个年头,从 VB6.0,ASP时代到ASP.NET再到MVC, 从中见证了.NET技术发展,从无畏无知的懵懂少年,到现在的中年大叔,从中的酸甜苦辣也只有本人自知.随着 ...

  9. web 框架的本质及自定义web框架 模板渲染jinja2 mvc 和 mtv框架 Django框架的下载安装 基于Django实现的一个简单示例

    Django基础一之web框架的本质 本节目录 一 web框架的本质及自定义web框架 二 模板渲染JinJa2 三 MVC和MTV框架 四 Django的下载安装 五 基于Django实现的一个简单 ...

随机推荐

  1. 应用程序框架实战三十四:数据传输对象(DTO)介绍及各类型实体比较

    本文将介绍DDD分层架构中广泛使用的数据传输对象Dto,并且与领域实体Entity,查询实体QueryObject,视图实体ViewModel等几种实体进行比较. 领域实体为何不能一统江湖? 当你阅读 ...

  2. 从零开始编写自己的C#框架(5)——三层架构介绍

    三层架构对于开发人员来说,已经是司空见惯了,除了大型与超小型项目外,大多都是这种架构来进行开发. 在这里为初学者们简单介绍一下三层架构: (下面内容摘自<趣味理解:三层架构与养猪—<.NE ...

  3. Oracle_SQL函数-单行函数

    SQL函数 SQL函数分类 SQL函数主要有两种,分为单行函数.多行函数 单行函数:只对一行进行变换,每行返回一个结果.可以转换数据类型,可以嵌套参数可以是一列或一个值 多行函数:多行函数,每次对一组 ...

  4. iOS开发之微信聊天页面实现

    在上篇博客(iOS开发之微信聊天工具栏的封装)中对微信聊天页面下方的工具栏进行了封装,本篇博客中就使用之前封装的工具栏来进行聊天页面的编写.在聊天页面中主要用到了TableView的知识,还有如何在俩 ...

  5. Windows下Go语言的环境搭建

    在本地搭建了一个开发GO语言的开发环境,给大家分享一下用go语言写的第一个hello world的过程,希望对大家有所帮助. 1.想写GO语言首先得下载go语言的开发包 官方下载地址:https:// ...

  6. SAX解析技术

    SAX,全称Simple API for XML,既是指一种接口,也是指一个软件包.SAX工作原理简单地说就是对文档进行顺序扫描,当扫描到文档(document)开始与结束.元素(element)开始 ...

  7. hexo在git上搭建个人博客

    公司实习第一天接到的任务是:搭建一个基于Nodejs的开源项目的开发环境,接到任务时以为不是很困难,后来才知道该项目已于去年被废弃,搭配环境的时候遇到了不少问题,折腾了两天还是没有最终完成... 不过 ...

  8. SQL存储过程分页(通用的拼接SQL语句思路实现)

    多表通用的SQL存储过程分页 案例一: USE [Community] GO /****** Object: StoredProcedure [dbo].[Common_PageList] Scrip ...

  9. HTML5翻页电子书

    体验效果:http://hovertree.com/texiao/jquery/60/ 图片请用正方形的 参考:http://hovertree.com/h/bjaf/d339euw9.htmhttp ...

  10. C#中对象,字符串,dataTable、DataReader、DataSet,对象集合转换成Json字符串方法。

    C#中对象,字符串,dataTable.DataReader.DataSet,对象集合转换成Json字符串方法. public class ConvertJson { #region 私有方法 /// ...