Lucene40PostingWriter
控制freq和prox这两个文件的输出,比较简单。
默认skip interval这是16,max skip level这是10.
由源或使用可见VInt编码(而不是速度的传奇PForDelta)。
当存储的文档docid名单delta,假设不存文档频率,是一个delta,存的话假设是1则是(delta << 1) | 1,否则就是两个vint了(delta << 1和termDocFreq)。
最后缓存跳跃表结构。
存位置也类似,只是position是看是否存payload,payloadlength是否和上次一样,offset则是看是否存offset,offsetlength是否也是最后一次。假设有payload,上次写payload。
加分后term,写入跳过表结构(它应该是在tim文件)。
一个段的所有文件,等都加完,来电flushTermsBlock,第一次去RamOutputStream写字典freqStart,proxStart,skipStart信息,最后flush进入tip文件。
Lucene40PostingWriter的更多相关文章
随机推荐
- Linux在高铁项目的部署环境
因为Linux和Java像开源.所以,现在在server基本上使用部署Linux平台即server.然后部署项目.在开发项目的过程中.程序员绝大多数仍采用最经典windows操作系统,尽管Linux也 ...
- UVa 11879 - Multiple of 17
称号:计算一个数字是不17倍数. 说明:串,睑板. 简单的问题,直接推论可以是. 设定 n = 10a + d:(0 ≤ d ≤ 9) a - 5d = 51a - 5n,假设n被17整除,这个数必定 ...
- network: Android 网络推断(wifi、3G与其它)
public class NetworkProber { /** * 网络是否可用 * * @param activity * @return */ public static bool ...
- 【Linux探索之旅】第二部分第一课:终端Terminal,好戏上场
内容简介 1.第二部分第一课:终端Terminal,好戏上场 2.第二部分第二课预告:命令行,世界尽在掌握 终端Terminal,好戏上场 随着第一部分的结束,我们进入了第二部分(小编你这好像是废话. ...
- 我收集的sonar参考资料
sonarQube代码质量管理工具环境筹建笔记 http://www.myexception.cn/open-source/1307345.html 配置sonar.jenkins进行持续审查 htt ...
- (hdu step 6.3.5)Card Game Cheater(匹配的最大数:a与b打牌,问b赢a多少次)
称号: Card Game Cheater Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Other ...
- 【干货】免费获得WebStorm软件
内容提要: 1.WebStorm简介 2.如何免费获得WebStorm 3.利用学生身份免费获得正式版WebStorm WebStorm简介 WebStorm 是一款前端开发 IDE(集成开发环境), ...
- Orleans:NET的Actor模型
.NET的Actor模型:Orleans Orleans是微软推出的类似Scala Akka的Actor模型,Orleans是一个建立在.NET之上的,设计的目标是为了方便程序员开发需要大规模扩展 ...
- UVA 12206 - Stammering Aliens(后缀数组)
UVA 12206 - Stammering Aliens 题目链接 题意:给定一个序列,求出出现次数大于m,长度最长的子串的最大下标 思路:后缀数组.搞出height数组后,利用二分去查找就可以 这 ...
- Binary System
Description Usually we use number in the decimal system, for it is so convenient for us to remember ...