Solr学习之五

XGogo 2024-08-11 09:48:22 原文

一、段管理

段是一个自包含，仅可读的solr的索引的子集。一旦一个段被刷新到持久存储后，它将不会改变。当添加新文档到你的索引时候，它们被写入到新的段中。因此，在你的索引中，有很多激活的段。一次查询必须从所有的段中去读数据，以便获得一个完成的结果集。从某种意义上说，有许多小的段将会影响你的查询性能。合并许多小段到少数的大段的过程一般被称为段的合并。

二、优化索引

优化索引是一个强制Lucene去合并存在的段到一定数量的大段的操作，这一定数量默认值为1.

举个例子，一个具有32个段的索引，优化后，只有一个段。因此优化是个需要耗费cpu、内存、和磁盘空间的昂贵操作，特别是对于大索引而言。一个大索引的完全优化，可能花费几个小时也不稀奇。

Solr社区对于是否优化索引的建议是更改你的段合并侧率。一个优化过的索引并不意味这慢的查询会突然变快。相反有时候不优化索引，查询性能仍然是可以接受的。

索引合并配置：

配置项	作用
ramBufferSizeMB	在文档被刷新到目录之前的缓存大小的最大内存设置；默认是100MB。增加这个值将会缓存更多的文档在内存中，从而在索引的时候减少磁盘的IO。
maxBufferedDocs	在文档被刷新到目录之前，缓存的最大文档数量；默认值为1000个文档。
mergePolicy	控制Lucene执行段合并，比如决定多少个段合并为一个段。默认为TieredMergePolicy。
mergeFactor	控制一次合并多少个段。默认为10.最优设置，取决于你的平均文档大小，可用的内存和渴望的索引的吞吐量。
mergeScheduler	控制何时段合并运行。默认是在后台并发执行的，用的配置为：concurrentMergeScheduler

虽然这些配置在solrconfig.xml被注释掉，但是，后台段的合并在你的索引中仍然是可用的。在后台执行的。我建议你避免优化，避免更改段合并的设置，除非建索引的吞吐量成为你程序的问题的时候。

删除处理

在段被刷新到磁盘之后就是不可以改变的。删除操作，并不会从存在的段中删除已经存在的文档。

删除的文档并不会从你索引中删除，直到包含删除的段被合并。在底层，Lucene通过一个单独的数据结构来跟踪段。在大多数情况下，你不用担心合并进程。

Solr学习之五的更多相关文章

Solr学习总结（六）SolrNet的高级用法（复杂查询，分页，高亮，Facet查询）
上一篇,讲到了SolrNet的基本用法及CURD,这个算是SolrNet 的入门知识介绍吧,昨天写完之后,有朋友评论说,这些感觉都被写烂了.没错,这些基本的用法,在网上百度,资料肯定一大堆,有一些写的 ...
Solr学习总结（五）SolrNet的基本用法及CURD
上一篇已经讲到了Solr 查询的相关的参数.这里在讲讲C#是如何通过客户端请求和接受solr服务器的数据, 这里推荐使用SolrNet,主要是:SolrNet使用非常方便,而且用户众多,一直都在更新, ...
Solr学习笔记之3、Solr dataimport - 从SQLServer导入数据建立索引
Solr学习笔记之3.Solr导入SQLServer数据建立索引一.下载MSSQLServer的JDBC驱动下载:Microsoft JDBC Driver 4.0 for SQL Server ...
Solr学习笔记之2、集成IK中文分词器
Solr学习笔记之2.集成IK中文分词器一.下载IK中文分词器 IK中文分词器此文IK版本:IK Analyer 2012-FF hotfix 1 完整分发包二.在Solr中集成IK中文分词器 ...
Solr学习笔记之1、环境搭建
Solr学习笔记之1.环境搭建一.下载相关安装包 1.JDK 2.Tomcat 3.Solr 此文所用软件包版本如下: 操作系统:Win7 64位 JDK:jdk-7u25-windows-i586 ...
Solr学习(2) Solr4.2.0+IK Analyzer 2012
Solr学习(二) Solr4.2.0+IK Analyzer 2012 开场白: 本章简单讲述如何在solr中配置著名的 IK Analyzer 分词器. 本章建立在 Solr学习(一) 基础上进 ...
Solr学习笔记之5、Component（组件）与Handler（处理器）学习
Solr学习笔记之5.Component(组件)与Handler(处理器)学习一.搜索篇拼写检查(spellCheck) 作用:用来检查用户输入的检索内容是否存在,如果不存在则给它提示出相近或相似 ...
Solr学习笔记之4、Solr配置文件简介
Solr学习笔记之4.Solr配置文件简介摘自<Solr in Action>. 1. solr.xml – Defines one or more cores per Solr ser ...
Solr学习之二-Solr基础知识
一基本说明简单来说Solr是基于Lucene的高性能的,开源的Java企业搜索服务器.Solr可以看作一个Web app,运行在tomcat或Jetty这类HTTP服务器上, 底层是一个基于Luc ...

随机推荐

JAVA Drp项目实战—— Unable to compile class for JSP 一波三折
交代下背景.电脑系统是64位的,用的是64位的Tomcat.安装是32位的Myeclipse10,java环境也是32位的.Tomcat在開始启动时会报这样一个错误,"Can't load ...
新浪微博使用OAuth2.0调用API
# -*- coding: cp936 -*- #python 2.7.10 #xiaodeng #新浪微博使用OAuth2.0调用API #微博开放接口的调用,都需要获取用户的身份认证.目前微博开 ...
为什么需要设置pythonpath环境变量？
# -*- coding: utf-8 -*- #python 27 #xiaodeng #为什么需要设置pythonpath环境变量? #只需设置pythonpath,从而可以从正在用的目录(也就是 ...
LoadRunner脚本关联动态数据的最简单方法
为什么要关联动态数据呢?举个例子,在对我们平台的工作流性能测试时, 在待办任务里面选择一条记录执行发送操作,LoadRunner VuGen会详细记录下来流程发送操作的细节,但在回放脚本的时候会有问题 ...
Loadrunner脚本编程（3）- 检查点，关联等函数
http://www.360doc.com/content/10/0806/13/1698198_44078093.shtml 1．错误预防和恢复参数默认是用{}括起来的,但也可以指定用< ...
掀开图片显示介绍的css效果
概述主要运用到CSS3的3D transform等变换详细代码下载:http://www.demodashi.com/demo/10575.html 一.概述 1.主要运用到CSS3的3D tr ...
从一个Idea到产品需要经历哪些阶段？
从一个Idea到产品需要经历哪些阶段? Lkey 07月19日 16:520 现实工作中,不免遇到这样的情况.什么嘛?老板(领导)又有新想法了?又有其他Idea了?心里一阵骂娘xxxxxx.或者产品负 ...
【php】实现多个一维数组转换成二维循环数组
1.目的:将下面类型数组转换成模板循环打印二维数组数组库一维数组: 模板要求循环二维数组: 2.代码: header("Content-type: text/html; charset=u ...
wubi.exe的工作原理
wubi.exe的工作原理 Wubi没有修改系统分区,在一个Windows分区中安装了一个完整的Ubuntu系统.初看起来,这简直是不可能完成的任务.但是Wubi的确做到了.而我们要关心的是Wubi是 ...
我遇到了Hibernate异常
真是郁闷,今天想用Hibernate的实现对数据库的增删查改,但是就是报异常不断啊!呵呵,为什么?就是在主键的问题上,我用主键的生成形式是:Sequence时就报IllegalArgumentExce ...