lucene总结——（十七）

（01）rownum和rowid有何区别？
      rownum在表结构中是看不见的，只能在select中明确写出rownum方可显示
      rownum与不同的表绑定在一起，每张表都有自已的rownum，每张表的rownum可以相同，表亡rownum亡
      rownum可用于oracle分页中
      rownum是从1开始的连续不断的数值型

      rowid在表结构中是看不见的，只能在select中明确写出rowid方可显示
      rowid在每张表中都不一样，表亡rowid亡，它是沟通表与DBF文件的桥梁
      rowid可用于索引中

（02）IndexWriter和IndexSearcher有何作用？
IndexWriter将Document对象写入到索引库中，适用于增删改操作
IndexSearcher根据关键字去索引库中查询符合条件的数据，只适用于查询操作

（03）Directory directory = FSDirectory.open(new File("E:/LuceneDBDBDBDBDBDBDBDBDB"));这句话什么意思？
索引库对应的硬盘上的目录，如果无则创建；返之不创建

（04）document.add(new Field("content",article.getContent(),Store.YES,Index.ANALYZED));这句话什么意思？
将content字段和其对应的值，放入到索引库的原始表中，且该字段的值需要进行分词

（05）TopDocs topDocs = indexSearcher.search(query,10);这句话什么意思？
去索引库中查询符合条件的数据，超过10条数据，只取前10条；不足10条，以实际为准

（06）谈谈索引库优化有哪几个方面
      >>文件数量问题
      >>文件大数问题
      >>写入索引库速度问题

（07）分词器有什么作用
      用户不可能完全记住所有文章的内容，可能只能记住该文章中的某些关键字，
      那么做为搜索功能的程序来讲，就需要用关键字去最大限度搜索到用户需要的
      内部，分词器就在中间起了一个桥梁作用

（08）document.get("content")和document.getField("content")有什么区别？
      get()获取document对象中content字段的值，返回值是String类型
      getField("content")获取document对象中content字段，返回值是Field类型

（09）在默认情况下，搜索结果是如何排序的？如果有二个结果相同，又是如何排序的？
      在默认情况下，按得分度的高低排序，如果相同得份，按你插入索引库的先后排序

（10）QueryParser queryParser =
          new QueryParser(LuceneUtil.getVersion(),"content",LuceneUtil.getAnalyzer());
      QueryParser queryParser =
          new MultiFieldQueryParser(LuceneUtil.getVersion(),new String[]                        {"content","title"},LuceneUtil.getAnalyzer());
      有什么区别？
      第一个API表示单字段搜索
      第二个API表示多字段搜索

lucene总结——（十七）的更多相关文章

Lucene 4.0 正式版发布，亮点特性中文解读[转]
http://blog.csdn.net/accesine960/article/details/8066877 2012年10月12日,Lucene 4.0正式发布了(点击这里下载最新版),这个版本 ...
我的MYSQL学习心得（十七）复制
我的MYSQL学习心得(十七) 复制我的MYSQL学习心得(一) 简单语法我的MYSQL学习心得(二) 数据类型宽度我的MYSQL学习心得(三) 查看字段长度我的MYSQL学习心得(四) 数据 ...
lucene 基础知识点
部分知识点的梳理,参考<lucene实战>及网络资料 1.基本概念 lucence 可以认为分为两大组件: 1)索引组件 a.内容获取:即将原始的内容材料,可以是数据库.网站(爬虫).文本 ...
用lucene替代mysql读库的尝试
采用lucene对mysql中的表建索引,并替代全文检索操作. 备注:代码临时梳理很粗糙,后续修改. import java.io.File; import java.io.IOException; ...
Lucene的评分(score)机制研究
首先,需要学习Lucene的评分计算公式—— 分值计算方式为查询语句q中每个项t与文档d的匹配分值之和,当然还有权重的因素.其中每一项的意思如下表所示: 表3.5 评分公式中的因子评分因子描述 ...
Lucene的分析资料【转】
Lucene 源码剖析 1 目录 2 Lucene是什么 2.1.1 强大特性 2.1.2 API组成- 2.1.3 Hello World! 2.1.4 Lucene roadmap 3 索引文件结 ...
Lucene提供的条件判断查询
第一.按词条搜索 - TermQuery query = new TermQuery(new Term("name","word1"));hits = sear ...
Lucene 单域多条件查询
在Lucene 中 BooleanClause用于表示布尔查询子句关系的类,包括:BooleanClause.Occur.MUST表示and,BooleanClause.Occur.MUST_NOT表 ...
lucene自定义过滤器
先介绍下查询与过滤的区别和联系,其实查询(各种Query)和过滤(各种Filter)之间非常相似,可以这样说只要用Query能完成的事,用过滤也都可以完成,它们之间可以相互转换,最大的区别就是使用过滤 ...

随机推荐

eclispe 出现超内存错误
刚开始以为只要修改tomcat的最大最小内存就可以,结果还是报错,后来才懂需要在eclipse.ini文件中修改 -Xms256m-Xmx512m的值改大些,增加虚拟机运行的内存空间刚开始最小值只有 ...
【BZOJ2731】三角形覆盖问题
想象一条平行于\(y\)轴的扫描线,从低往高扫描.如何确定关键高度才能使每两个关键高度之间分割出的图形易于计算呢? 关键高度有:三角形底边高度.三角形上顶点高度.三角形交点的高度. 如此分割,我们 ...
UVA.10791 Minimum Sum LCM (唯一分解定理)
UVA.10791 Minimum Sum LCM (唯一分解定理) 题意分析也是利用唯一分解定理,但是要注意,分解的时候要循环(sqrt(num+1))次,并要对最后的num结果进行判断. 代码总 ...
ELK5.4安装Xpack
X-Pack是一个Elastic Stack的扩展,将安全,警报,监控,报告和图形功能包含在一个易于安装的软件包中.在Elasticsearch 5.0.0之前,必须安装单独的Shield.Watch ...
python基础之模块之序列化
---什么是序列化(picking)? 我们把变量从内存中变成可存储或传输的过程称之为序列化. 序列化之后,就可以把序列化后的内容写入磁盘,或者通过网络传输到别的机器上. 反过来,把变量内容从序列化的 ...
Python【sys】模块和【hashlib】模块
import sysimport osprint(sys.platform) #判断操作系统,windows10输出win32print("sys.path:",sys.path) ...
caffe rpn layer 中的 reshape layer
Reshape层:(改变blob的形状,N,C,W,H) layer { name: "reshape" type: "Reshape" bottom: &qu ...
数据分析与展示---Numpy数据存取与函数
简介一:数据的CSV文件存取(一维或二维) (一)写入文件savetxt (二)读取文件loadtxt 二:多维数据的存取 (一)保存文件tofile (二)读取文件fromfile (三)NumP ...
Vue组件穿透
1. element ui怎么修改单独一个label的颜色用 >>> 进行组件的穿透
Linux基础实验
过滤,管道与重定向过滤管道重定向运维常用给某目录设置权限 sudo chmod -R /var/www/html/

lucene总结——（十七）

lucene总结——（十七）的更多相关文章

随机推荐

热门专题