使用Lucene.Net管理索引实现搜索

之前使用一直是没有问题的，只到今天发现删除的时候无法删除，增加的时候却一直在增加，导致搜索的时候可以搜出来很多相同的结果。

小猪决定趁今天这个机会好好的把这个问题给解决了。

private void ProcessJobs(IndexWriter writer)

{

    while (jobs.Count != )

    {

        IndexJob job = jobs.Dequeue();

        writer.DeleteDocuments(new Term("Id", job.Id.ToString()));//先执行删除的操作

        //如果“添加文章”任务再添加，

        if (job.JobType == JobType.Add)

        {

            BLL.BooksManage bll = new BLL.BooksManage();

            Entity.Books art = bll.GetById(job.Id);

            if (art == null)//有可能刚添加就被删除了

            {

                continue;

            }

            //string channel_id = art.channel_id.ToString();

            string title = art.Title;

            DateTime time = art.CreateDate;

            string content = Utils.DropHTML(art.Brief.ToString());

            string Addtime = art.CreateDate.ToString("yyyy-MM-dd");

            Document document = new Document();

            //只有对需要全文检索的字段才ANALYZED

            document.Add(new Field("Id", job.Id.ToString(), Field.Store.YES, Field.Index.NOT_ANALYZED));

            document.Add(new Field("Title", title, Field.Store.YES, Field.Index.ANALYZED, Lucene.Net.Documents.Field.TermVector.WITH_POSITIONS_OFFSETS));

            document.Add(new Field("Tag", art.Tag, Field.Store.YES, Field.Index.ANALYZED, Lucene.Net.Documents.Field.TermVector.WITH_POSITIONS_OFFSETS));

            document.Add(new Field("PubTime", art.PubTime.ToString("yyyy-MM-dd"), Field.Store.YES, Field.Index.NOT_ANALYZED));

            document.Add(new Field("Cover", art.Cover, Field.Store.YES, Field.Index.NOT_ANALYZED));

            document.Add(new Field("Author", art.Author == null ? "" : art.Author, Field.Store.YES, Field.Index.ANALYZED, Lucene.Net.Documents.Field.TermVector.WITH_POSITIONS_OFFSETS));

            document.Add(new Field("Translator", art.Translator == null ? "" : art.Translator, Field.Store.YES, Field.Index.ANALYZED, Lucene.Net.Documents.Field.TermVector.WITH_POSITIONS_OFFSETS));

            document.Add(new Field("Publisher", art.Publisher == null ? "" : art.Publisher, Field.Store.YES, Field.Index.ANALYZED, Lucene.Net.Documents.Field.TermVector.WITH_POSITIONS_OFFSETS));

            document.Add(new Field("Language", art.Language, Field.Store.YES, Field.Index.NOT_ANALYZED));

            document.Add(new Field("Brief", Utils.DropHTML(art.Brief.ToString()), Field.Store.YES, Field.Index.ANALYZED, Lucene.Net.Documents.Field.TermVector.WITH_POSITIONS_OFFSETS));

            document.Add(new Field("Icon", art.Icon, Field.Store.YES, Field.Index.ANALYZED));

            document.Add(new Field("Rate", art.Rate.ToString(), Field.Store.YES, Field.Index.ANALYZED));

            document.Add(new Field("Price", art.Price.ToString(), Field.Store.YES, Field.Index.ANALYZED));

            document.Add(new Field("Device", art.Device, Field.Store.YES, Field.Index.ANALYZED));

            document.Add(new Field("EngineVersion", art.EngineVersion.ToString(), Field.Store.YES, Field.Index.ANALYZED));

            document.Add(new Field("ContentType", art.ContentType, Field.Store.YES, Field.Index.ANALYZED));

            document.Add(new Field("Size", art.Size.ToString(), Field.Store.YES, Field.Index.ANALYZED));

            document.Add(new Field("Status", art.Status.ToString(), Field.Store.YES, Field.Index.ANALYZED));

            document.Add(new Field("Other2", art.Other2, Field.Store.YES, Field.Index.ANALYZED));

            writer.AddDocument(document);

            logger.Debug("索引" + job.Id + "完毕");

        }

        else

        { 

        }

    }

}

之前小猪还在想为什么这里没有处理删除的逻辑，仔细看了下发现只要增加了任务不管是删除还是添加都会先执行删除操作以防止索引结果的重复。问题就出现在这里，依照什么规则来删除呢？之前小猪直接用的别人的代码，今天才发现需要自己定义删除的规则：

writer.DeleteDocuments(new Term("number", job.Id.ToString()))

另外就是要处理好啥时候删除，啥时候增加的逻辑。不然很容易出现各种问题，例如数据库中没有而索引里有的，或者数据库里有的但是不可用的但是搜索出来的等等等等~~

使用Lucene.Net管理索引实现搜索的更多相关文章

lucene简介创建索引和搜索初步
lucene简介创建索引和搜索初步一.什么是Lucene? Lucene最初是由Doug Cutting开发的,2000年3月,发布第一个版本,是一个全文检索引擎的架构,提供了完整的查询引擎和索引 ...
搜索引擎系列 ---lucene简介创建索引和搜索初步
一.什么是Lucene? Lucene最初是由Doug Cutting开发的,2000年3月,发布第一个版本,是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎 :Lucene得名于Doug妻子 ...
Lucene第二讲——索引与搜索
一.Feild域 1.Field域的属性是否分词:Tokenized 是:对该field存储的内容进行分词,分词的目的,就是为了索引. 否:不需要对field存储的内容进行分词,不分词,不代表不索引 ...
Lucene.net 从创建索引到搜索的代码范例
关于Lucene.Net的介绍网上已经很多了在这里就不多介绍Lucene.Net主要分为建立索引,维护索引和搜索索引Field.Store的作用是通过全文检查就能返回对应的内容,而不必再通过id去DB ...
JAVAEE——Solr：安装及配置、后台管理索引库、使用SolrJ管理索引库、仿京东的电商搜索案例实现
1 学习回顾 1. Lucene 是Apache开源的全文检索的工具包创建索引查询索引 2. 遇到问题? 文件名及文件内容顺序扫描法全文检索 3. 什么是全文检索? 这种先创建索引再 ...
理解Lucene索引与搜索过程中的核心类
理解索引过程中的核心类执行简单索引的时候需要用的类有: IndexWriter.Directory.Analyzer.Document.Field 1.IndexWriter IndexWr ...
lucene索引并搜索mysql数据库[转]
由于对lucene比较感兴趣,本人在网上找了点资料,终于成功地用lucene对mysql数据库进行索引创建并成功搜索,先总结如下: 首先介绍一个jdbc工具类,用于得到Connection对象: im ...
Lucene中最简单的索引和搜索示例
package com.jiaoyiping.lucene; import org.apache.lucene.analysis.standard.StandardAnalyzer; import o ...
用Lucene.net对数据库建立索引及搜索<转>
用Lucene.net对数据库建立索引及搜索最近我一直在研究 Lucene.net ,发现Lucene.net对数据库方面建索引的文章在网上很少见,其实它是可以对数据库进行索引的,我闲着没事,写了个 ...

随机推荐

Servlet学习
编写Servlet应该注意的一些细节: 1: 由于客户端是通过URL地址访问web服务器中的资源,所以Servlet程序若想被外界访问,必须把servlet程序映射到一个URL地址上,这个工作在web ...
[转] Git SSH Key 生成步骤
Git是分布式的代码管理工具,远程的代码管理是基于SSH的,所以要使用远程的Git则需要SSH的配置. github的SSH配置如下: 一 . 设置Git的user name和email: $ git ...
Redis基础知识之—— hset 和hsetnx 的区别
命令参数:HSET key field valueHSETNX key field value 作用区别:HSET 将哈希表 key 中的域 field 的值设为 value .如果 key 不存在, ...
Switch用法
package com.cz.test; public class SwitchExample1 { /** * @param args */ public static void main(Stri ...
对sizeof的思考
一.sizeof的特点(与strlen比较) 1.sizeof是运算符,strlen是函数,这意味着编译程序在编译的时候就把sizeof计算过了,所以sizeof(x)可以用来定义数组维数. 例如 i ...
SQL & PL/SQL 模块总结
SQL 1. 各种function 2. merge 3. connect by PL/SQL 1. pl/sql 寄出 2. 游标 3. procedure 4. function 5. packa ...
线程高级应用-心得4-java5线程并发库介绍，及新技术案例分析
1. java5线程并发库新知识介绍 2．线程并发库案例分析 package com.itcast.family; import java.util.concurrent.ExecutorServi ...
任务调度JOB
1.1 描述定时执行数据库中的PL/SQL块,如存储过程.可以减化前端编程. 1.2 简单示例本示例运行环境:oracle10g + pl/sql +xp. 使用存储过程每 ...
ManyToMany关联方式----
http://blog.csdn.net/sinat_18882775/article/details/51171427 好的博客系列文章总结
phprpc 使用实例（例实没错却不能执行）函数冲突gzdecode
PHPRPC 是一个轻型的.安全的.跨网际的.跨语言的.跨平台的.跨环境的.跨域的.支持复杂对象传输的.支持引用参数传递的.支持内容输出重定向的.支持分级错误处理的.支持会话的.面向服务的高性能远程过 ...

使用Lucene.Net管理索引实现搜索

使用Lucene.Net管理索引实现搜索的更多相关文章

随机推荐

热门专题