lucene 索引中文档的属性建立与不建立带来的影响总结

索引中文档的属性建立与不建立带来的影响总结

1.依据文档的某属性去查找索引的话，只会返回带有此属性(如果你对当前属性设定了条件，那么需要满足当前条件)的所有文档，没有建立此属性的文档是不会在返回结果文档中的，不管你的属性值类型是什么(string、date、long、int)，结果都是一样的

2.查找条件满足，排序不会有任何影响(如果排序的属性文档没有，lucene会按文档建立的先后顺序返回且只会按照这个顺序)，只需注意说的第一点

3.索引查找也不会有任何影响，只需注意说的第一点

4.数量查找条件如果满足，绝对正确，但如果是说的第一点的话，那就有问题了

5.如果做数据统一整合的话，建议没有属性的填默认属性，牺牲点微小的存储空间换来正确的查找结果

理论看不懂？举个例子你就懂了

需求：

建立3条数据的索引，每条数据包含weibotime(date)、forwardtims(long)、replytimes(int)等属性

数据建立索引后，变成3个文档：文档A、文档B、文档C

weibotime(date)、forwardtims(long)、replytimes(int)

文档A：有有有

文档B：无无有

文档C：无无有

操作：

Q:查找weibotime并且降序排列

A:返回有weibotime属性的文档，并且结果顺序是降序的，显示当前索引里只有文档A

Q:查找replytimes，weibotime降序排列

A:返回当前3文档，并且结果顺序显示是：文档A、文档B、文档C

Q:查找replytimes，weibotime升序排列

A:返回当前3文档，并且结果顺序显示是：文档B、文档C、文档A，看到这里你可能会觉得奇怪，文档B、C不都没有属性和值吗，为什么B一定排在C前面？这是lucene实现的，查找的属性有，但操作的属性如排序操作weibotime属性，但两个文档的属性是没有的，那么文档会按建立的先后顺序返回，不管你是升序或者是降序，结果都是一样的

lucene 索引中文档的属性建立与不建立带来的影响总结的更多相关文章

用Lucene对文档进行索引搜索
问题现在给出很多份文档,现在对某个搜索词感兴趣,想找到相关的文档. 简单搜索一种简单粗暴的做法是: 1.读取每个文档:2.找到其中含有搜索词的文档:3.对找到的文档中搜索词出现的次数统计:4.根据 ...
Lucene索引库维护、搜索、中文分词器
删除索引(文档) 需求某些图书不再出版销售了,我们需要从索引库中移除该图书. 1 @Test 2 public void deleteIndex() throws Exception { 3 // ...
lucene全文搜索之三：生成索引字段，创建索引文档（给索引字段加权）基于lucene5.5.3
前言:上一章中我们已经实现了索引器的创建,但是我们没有索引文档,本章将会讲解如何生成字段.创建索引文档,给字段加权以及保存文档到索引器目录 luncene5.5.3集合jar包下载地址:http:// ...
lucene: 索引建立完后无法查看索引文件中的数据
索引建立时 1.对原有索引文件进行建立,是可以访问索引文件中的数据的 2.建立新索引文件,必须等建立完毕后,才可以访问,新建立的文件如果没有建立完是不可以被访问的如果想建 ...
Lucene学习总结之四：Lucene索引过程分析
对于Lucene的索引过程,除了将词(Term)写入倒排表并最终写入Lucene的索引文件外,还包括分词(Analyzer)和合并段(merge segments)的过程,本次不包括这两部分,将在以后 ...
Lucene系列五：Lucene索引详解（IndexWriter详解、Document详解、索引更新）
一.IndexWriter详解问题1:索引创建过程完成什么事? 分词.存储到反向索引中 1. 回顾Lucene架构图: 介绍我们编写的应用程序要完成数据的收集,再将数据以document的形式用lu ...
Lucene学习总结之四：Lucene索引过程分析 2014-06-25 14:18 884人阅读评论(0) 收藏
对于Lucene的索引过程,除了将词(Term)写入倒排表并最终写入Lucene的索引文件外,还包括分词(Analyzer)和合并段(merge segments)的过程,本次不包括这两部分,将在以后 ...
lucene索引
一.lucene索引 1.文档层次结构索引(Index):一个索引放在一个文件夹中: 段(Segment):一个索引中可以有很多段,段与段之间是独立的,添加新的文档可能产生新段,不同的段可以合并成一 ...
Lucene学习笔记：四，Lucene索引过程分析
对于Lucene的索引过程,除了将词(Term)写入倒排表并最终写入Lucene的索引文件外,还包括分词(Analyzer)和合并段(merge segments)的过程,本次不包括这两部分,将在以后 ...

随机推荐

解决nextjs部署到now上之后出现的“Unable to import module 'now__launcher'”错误
解决nextjs部署到now上之后出现的“Unable to import module 'now__launcher'”错误这个错误是由于在next.config.js中直接引用了withLess ...
windows8 使用docker创建第一个nodejs运行环境
现在公司电脑使用的是windows8操作系统,如果想要运行docker,只能安装Docker ToolBox 关于安装Docker ToolBox,请查看文章<windows8安装docker( ...
hdu6041
hdu6041 题意给出一个仙人掌. 如果一个无向连通图的任意一条边最多属于一个简单环,我们就称之为仙人掌.所谓简单环即不经过重复的结点的环. 求前 \(K\) 小生成树 . 分析仙人掌中每个环中 ...
Dfs【bzoj3252】攻略
Description 题目简述:树版[k取方格数] 众所周知,桂木桂马是攻略之神,开启攻略之神模式后,他可以同时攻略k部游戏. 今天他得到了一款新游戏<XX半岛>,这款游戏有n个场景(s ...
10、Django实战第10天：找回密码
今天完成的功能是:用户忘记密码后,通过注册邮箱重置密码... 首先还是把前端页面准备好,把forgetpwd.html复制到templates目录下编辑users.views.py,创建一个忘记密码 ...
【分块】bzoj3196 Tyvj 1730 二逼平衡树
分块或树套树. 在每个块中维护一个有序表,查询时各种二分,全都是分块的经典操作,就不详细说了. 块的大小定为sqrt(n*log2(n))比较快. #include<cstdio> # ...
jvm-监控指令-jdump
格式: jmap [option] vmid 作用: 生成堆转储快照. 使用:(注意:需要使用工具打开,分析. 比如: EclipseMemoryAnalyzer)
C#分析URL参数获取参数和值得对应列表(一)
C#操作Url参数 http://www.cnblogs.com/RobotH/archive/2008/11/17/1335322.html 用 C# 分析 URL 中的参数信息 http://ww ...
js之对象（经典）
一.对象的定义: 对象是JavaScript的一个基本数据类型,是一种复合值,它将很多值(原始值或者其他对象)聚合在一起,可通过名字访问这些值.即属性的无序集合. 二.对象的创建(多种方法) 1.对象 ...
最基础的CSS面试题
1.Doctype作用是什么?严格模式与混杂模式分别是如何触发这两种模式的,区分它们有何意义? (1)<!DOCTYPE>声明位于文档中的最前面,处于<html>标签之前.告知 ...

lucene 索引中文档的属性建立与不建立带来的影响总结

lucene 索引中文档的属性建立与不建立带来的影响总结的更多相关文章

随机推荐

热门专题