Lucence

【Lucence】的更多相关文章

lucence.net+盘古分词

第一步: 添加盘古和lucence的dll引用第二步: 拷贝Dict文件夹到项目 demo里面是Dictionaries 不过官方建议改成Dict 然后把所有项右击属性改为“如果较新则复制” 第三步创建索引库,这里是一次性把数据库里的数据循环写入了,正常项目里可以把循环打开,每保存一个数据执行一遍 /// <summary> /// 创建索引库 /// </summary> public void CreateContent() { string indexPat…

Lucence工作原理

lucence 是一个高性能的java全文检索工具包,他使用倒排序文件索引结构,改结构和相应的生成算法如下: 一.设有两篇文章1和2 文章1的内容为:Tom lives in guangzhou,i live in guangzhou too 文章2的内容为:He once lived in shanghai 由于lucence是基于关键词索引和查询的,因此我们首先要取得这两篇文章的关键词.通常我们要做一下处理: a.我们现在有的是文章内容,即一个字符串,我们先要找出字符串中…

lucence学习系列之一基本概念

1. Lucence基本概念 Lucence是一个java编写的全文检索类库,使用它可以为一个应用或者站点增加检索功能. 它通过增加内容到一个全文索引来完成检索功能.然后允许你基于这个索引去查询,返回结果,结果要么根据查询的相关度来排序要么根据任意字段如文档最后修改日期来排序. 增加到Lucence的内容可以来自多种数据源,如SQL/NOSQL 数据库,文件系统,甚至从站点上. 1.1 检索与索引 Lucence能快速的完成查询结果,是因为它不是直接搜索的文本,而是搜索一个索引.这类似于通过查询…

Lucence使用入门

参考: https://blog.csdn.net/u014209975/article/details/50525624 https://www.cnblogs.com/hanyinglong/p/5395600.html http://lucene.apache.org/core/4_0_0/core/overview-summary.html https://www.jianshu.com/p/0a2bbe0f4c42 依赖: lucene-analyzers.jar lucene-ben…

apache开源项目--lucence

Lucene 是apache软件基金会一个开放源代码的全文检索引擎工具包,是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎.Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎. Lucene最初是由Doug Cutting所撰写的,是一位资深全文索引/检索专家,曾经是V-Twin搜索引擎的主要开发者,后来在Excite担任高级系统架构设计师,目前从事于一些INTERNET底层架构…

Lucence.net索引技术二

一. Lucene索引创建和优化 [版本2.9.0以上] Lucene索引的创建首先需要取得几个必须的对象: 1.分词器//可以采用其他的中文分词器 StandardAnalyzer analyzer = new StandardAnalyzer(Version.LUCENE_CURRENT);//分词器 2.lucene目录 File dir = new File(indexDir);// indexDir为文件路径 //这种目录存在锁机制,在打开目录时,写的权利一次只分给一个用户:有效保证了…

Lucence.net索引技术一

1.建立索引为了对文档进行索引,Lucene 提供了五个基础的类,他们分别是 Document, Field, IndexWriter, Analyzer, Directory.下面我们分别介绍一下这五个类的用途: Document Document 是用来描述文档的,这里的文档可以指一个 HTML 页面,一封电子邮件,或者是一个文本文件.一个 Document 对象由多个 Field 对象组成的.可以把一个 Document 对象想象成数据库中的一个记录,而每个 Field 对象就是记录的一…

Lucence.Net+添加关键词+分页+排序

1.使用queryparser完成解析搜索请求 2.基本格式如: QueryParser parser=new QueryParser("字段名称","分析器实例"); Query q=parser.parse("关键词") 3.例如:解析一个关键字太阳 QueryParser parser=new QueryParser("context",new StandardAnalyzer()); Query q=parser.pa…

Lucence.Net学习+盘古分词

创建索引库 //读取文件,存储到索引库 public string CreateDatebase() { //获取索引库的路径 var indexPath = AppDomain.CurrentDomain.BaseDirectory + ConfigurationManager.AppSettings["IndexDateBase"]; FSDirectory dir…

Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎.Lucene的目的是为软件开发人员提供一个简单易用的工具包. 粘贴这句话的意思就是想说明 Lucene仅仅是一个工具包,搜索引擎的工具包. 有人会问?Lucene和solr的区别,solr是一个搜索系统,打个比方,就如servlet和struts2的区别 Lucene就是…

[Todo] solr, lucence等学习

先参考这个吧 http://www.shareditor.com/blogshow/6…

Lucence学习之一：全文检索的基本原理

本文转载自: http://www.cnblogs.com/forfuture1978/archive/2009/12/14/1623594.html 一.总论根据http://lucene.apache.org/java/docs/index.html定义: Lucene是一个高效的,基于Java的全文检索库. 所以在了解Lucene之前要费一番工夫了解一下全文检索. 那么什么叫做全文检索呢?这要从我们生活中的数据说起. 我们生活中的数据总体分为两种:结构化数据和非结构化数据. 结构化数据…

solr/lucence和关系数据库的混合使用

我们知道solr提供了一个DIHandler,提供将关系数据库中的数据导成索引,然后使用solr查询. 对于一个大表中关联数个小表的查询,这非常耗费时间. 我的思路是: 1. 将一个大表做成索引,使用solr查询. 2.数据库查询关联小表的数据. 3. 在接口端进行聚合(使用java做聚合) 正在实践中,特此做笔记记住!…

【solr基础教程之九】客户端分类： H4_SOLR/LUCENCE 2014-07-30 15:28 904人阅读评论(0) 收藏

一.Java Script 1.由于Solr本身可以返回Json格式的结果,而JavaScript对于处理Json数据具有天然的优势,因此使用JavaScript实现Solr客户端是一个很好的选择. 2.在之前,主要使用SolJS作为solr的客户端,目前主要使用ajax-solr,信息请见:https://github.com/evolvingweb/ajax-solr/wiki/Reuters-tutorial%3A-step-1. 3.以下示例未使用上述所述的客户端,而是使用了ajax的基…

【Solr专题之九】SolrJ教程分类： H4_SOLR/LUCENCE 2014-07-28 14:31 2351人阅读评论(0) 收藏

一.SolrJ基础 1.相关资料 API:http://lucene.apache.org/solr/4_9_0/solr-solrj/ apache_solr_ref_guide_4.9.pdf:Client APIs---Using SolrJ http://wiki.apache.org/solr/Solrj solr in action:Using the SolrJ client library to add documents from Java, Using SolrJ from…

【转载】 Searching过程粗略梳理分类： H4_SOLR/LUCENCE 2014-07-25 22:59 316人阅读评论(0) 收藏

转载自:http://www.cnblogs.com/huangfox/archive/2012/02/09/2344686.html solr-searching过程分析(一) --searching过程粗略梳理下午看了一会solr的启动过程,往细的看相当繁琐.换个头绪先看看solr的searching过程. 1.拦截请求,解析请求并构建相应的handler. 发送检索请求,例如:http://localhost:8983/solr3.5/core2/select/?q=*%3A*&vers…

【solr专题之二】配置文件：solr.xml solrConfig.xml schema.xml 分类： H4_SOLR/LUCENCE 2014-07-23 21:30 1959人阅读评论(0) 收藏

1.关于默认搜索域 If you are using the Lucene query parser, queries that don't specify a field name will use the defaultSearchField. The DisMax and Extended DisMax query parsers do not use this value. Use of the defaultSearchField element is deprecated in S…

【solr专题之四】关于VelocityResponseWriter 分类： H4_SOLR/LUCENCE 2014-07-22 12:32 1639人阅读评论(0) 收藏

一.关于Velocity的基本配置在Solr中,可以以多种方式返回搜索结果,如单纯的文本回复(XML.JSON.CSV等),也可以返回velocity,js等格式.而VelocityResponseWriter就是用于将返回velocity类型文本,以便直接用于结果呈现. 在Solr提供的example,其中的一个RequestHandler--/browse,使用了VelocityResponseWriter.其配置如下: <requestHandler name="/browse&q…

【solr专题之三】Solr常见异常分类： H4_SOLR/LUCENCE 2014-07-19 10:30 3223人阅读评论(0) 收藏

1.RemoteSolrException: Expected mime type application/octet-stream but got text/html 现象: SLF4J: Failed to load class "org.slf4j.impl.StaticLoggerBinder". SLF4J: Defaulting to no-operation (NOP) logger implementation SLF4J: See http://www.slf4j.o…

【solr基础教程之二】索引分类： H4_SOLR/LUCENCE 2014-07-18 21:06 3331人阅读评论(0) 收藏

一.向Solr提交索引的方式 1.使用post.jar进行索引 (1)创建文档xml文件 <add> <doc> <field name="id">test4</field> <field name="title">testagain</field> <field name="url">http://www.163.com</field> </d…

solr源码导入eclipse 分类： H4_SOLR/LUCENCE 2014-07-14 14:11 550人阅读评论(1) 收藏

转载自:http://blog.csdn.net/vltic/article/details/19917377 (1)相应的开发环境准备 (1)jdk1.6+的安装和环境变量配置(命令行敲java和javac,检验) (2)ant1.8+的安装和环境变量配置(命令行敲ant -v检验) (3)solr4.6.1源代码下载,选择solr-4.6.1-src.tgz http://mirror.bit.edu.cn/apache/lucene/solr/4.6.1/ (2)编译so…

【solr专题之一】Solr快速入门分类： H4_SOLR/LUCENCE 2014-07-02 14:59 2403人阅读评论(0) 收藏

一.Solr学习相关资料 1.官方材料 (1)快速入门:http://lucene.apache.org/solr/4_9_0/tutorial.html,以自带的example项目快速介绍发Solr的基础使用. (2)API:http://lucene.apache.org/solr/4_9_0/index.html (3)reference:PDF格式,apache-solr-ref-guide-4.9.pdf 2.书籍 (1)Solr in Action,基于4.7版本,极力推荐,此书适合…

Lucence简单学习---1

package cn.itheima.lucene; import java.io.File; import java.util.ArrayList; import java.util.List; import org.apache.commons.io.FileUtils; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import…

lucence 内部结构是什么？

面试官:想了解你的知识面的广度和深度. 解答: Lucene 是有索引和搜索的两个过程,包含索引创建,索引,搜索三个要点.可以基于这个脉络展开一些. 最近面试一些公司,被问到的关于 Elasticsearch 和搜索引擎相关的问题,以及自己总结的回答.…

lucene 基础知识点

部分知识点的梳理,参考<lucene实战>及网络资料 1.基本概念 lucence 可以认为分为两大组件: 1)索引组件 a.内容获取:即将原始的内容材料,可以是数据库.网站(爬虫).文本转换为lucence的Docment Docment 为若干个带值得域 b.文档分析:利用分词器对文档进行分析: c.建立索引:根据文档分析的结构建立索引文件: 2)搜索组件 a.建立查询:即将用户请求转换为搜索引擎支持的查询对象格式: b.执行搜索查询:并反馈Document结果集: 2.官方样例代码分析…

[转]如何循序渐进向dotnet架构师发展

微软的DotNet开发绝对是属于那种入门容易提高难的技术.而要能够成为DotNet架构师没有三年或更长时间的编码积累基本上是不可能的.特别是在大型软件项目中,架构师是项目核心成员,承上启下,因此RUP方法论也认同以架构为核心,体现4+1视图在整个软件开发过程中的重要作用.架构人员既要精通技术,又要熟悉业务,而且基本对软件生命周期各阶段的相关技术都需要有相关的积累和知识储备,而这些不经过多年的磨练是很难达到这个高度的. 要成为一个合格的架构师首先必须是一个合格或优秀的编码人员,对于开发来讲编码…

ElasticSearch详解与优化设计

简介概念安装部署 ES安装数据索引索引优化内存优化 1简介 ElasticSearch(简称ES)是一个分布式.Restful的搜索及分析服务器,设计用于分布式计算:能够达到实时搜索,稳定,可靠,快速.和Apache Solr一样,它也是基于Lucence的索引服务器,而ElasticSearch对比Solr的优点在于: 轻量级:安装启动方便,下载文件之后一条命令就可以启动. Schema free:可以向服务器提交任意结构的JSON对象,Solr中使用schema.xml指定了索引结…

Solr3.6.1 在Tomcat6下的环境搭建

Solr3.6.1 在Tomcat6下的环境搭建 Tomcat路径:D:\prg\apache-tomcat-6-solr 简写为tomcat_home Solr文件下载保存路径为:F:\software\Lucence\solr\apache-solr-3.6.1 简写为solr_home 1:将solr_home/dist下的apache-solr-3.6.1.war拷贝到tomcat_home/webapps文件夹下,并改名为solr.war 2:将solr_home/example/so…

ElasticSearch第一步-环境配置

ElasticSearch第一步-环境配置 ElasticSearch第二步-CRUD之Sense ElasticSearch第三步-中文分词 ElasticSearch第四步-查询详解 ElasticSearch第五步-.net平台下c#操作ElasticSearch详解简介 ElasticSearch是一个开源的分布式搜索引擎,具备高可靠性,支持非常多的企业级搜索用例.像Solr4一样,是基于Lucene构建的.支持时间时间索引和全文检索.官网:http://www.elasticsear…

Lucene 简单API使用

本demo 简单模拟实现一个图书搜索功能. 模拟向数据库添加数据的时候,添加书籍索引. 提供搜索接口,支持按照书名,作者,内容进行搜索. 按默认规则排序返回搜索结果. Jar依赖: <properties> <lucene.version>4.6.1</lucene.version> </properties>  <dependency> <groupId>org.apache.lu…