Solr主配置文件

　　schema.xml，在SolrCore的conf目录下，它是Solr数据表配置文件，它定义了加入索引的数据的数据类型的。主要包括FieldTypes、Fields和其他的一些缺省设置。

fieldType

　　打开这个配置文件，我们可以看到许多fieldType标签，string、int什么的，其中我们拿text_general来举例分析：

 <fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">

   <analyzer type="index">

     <tokenizer class="solr.StandardTokenizerFactory"/>

     <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />

     <filter class="solr.LowerCaseFilterFactory"/>

   </analyzer>

   <analyzer type="query">

     <tokenizer class="solr.StandardTokenizerFactory"/>

     <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />

     <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>

     <filter class="solr.LowerCaseFilterFactory"/>

   </analyzer>

 </fieldType>

　　FieldType子结点包括：name,class,positionIncrementGap等一些参数：
1、name：是这个FieldType的名称
2、class：是Solr提供的包solr.TextField，solr.TextField允许用户通过分析器来定制索引和查询，分析器包括一个分词器（tokenizer）和多个过滤器（filter）
3、positionIncrementGap：可选属性，定义在同一个文档中此类型数据的空白间隔，避免短语匹配错误，此值相当于Lucene的短语查询设置slop值，根据经验设置为100。

　　在FieldType定义的时候最重要的就是定义这个类型的数据在建立索引和进行查询的时候要使用的分析器analyzer,包括

1、分词和过滤索引分析器中：使用solr.StandardTokenizerFactory标准分词器，solr.StopFilterFactory停用词过滤器，solr.LowerCaseFilterFactory小写过滤器。

2、搜索分析器中：使用solr.StandardTokenizerFactory标准分词器，solr.StopFilterFactory停用词过滤器，这里还用到了solr.SynonymFilterFactory同义词过滤器。

field

　　在schema.xml中除了fieldType占有大量篇幅外，还有field，以下是一部分

 <field name="name" type="text_general" indexed="true" stored="true"/>

 <field name="features" type="text_general" indexed="true" stored="true"multiValued="true"/>

　　在fields结点内定义具体的Field，filed定义包括name,type（为之前定义过的各种FieldType）,indexed（是否被索引）,stored（是否被储存），multiValued（是否存储多个值）等属性。
　　multiValued：该Field如果要存储多个值时设置为true，solr允许一个Field存储多个值，比如存储一个用户的好友id（多个），商品的图片（多个，大图和小图），通过使用solr查询要看出返回给客户端是数组：

UniqueKey

　　Solr中默认定义唯一主键key为id域，Solr在删除、更新索引时使用id域进行判断，也可以自定义唯一主键。

 <uniqueKey>id</uniqueKey>

copyField　　

　　copyField复制域，可以将多个Field复制到一个Field中，以便进行统一的检索：　　

 <copyField source="title" dest="text"/>

 <copyField source="author" dest="text"/>

 <copyField source="description" dest="text"/>

 <copyField source="keywords" dest="text"/>

 <copyField source="content" dest="text"/>

　　比如，输入关键字搜索title标题内容content，定义title、content、text的域，根据关键字只搜索text域的内容就相当于搜索title和content，将title和content复制到text中。

dynamicField

　　动态字段就是不用指定具体的名称，只要定义字段名称的规则，例如定义一个 dynamicField，name为*_i，定义它的type为text，那么在使用这个字段的时候，任何以_i结尾的字段都被认为是符合这个定义的，例如：name_i，gender_i，school_i等。

配置中文分词器

　　网上下载好相应版本的IKAnalyzer，拷贝IKAnalyzer的文件到Web容器下，以tomcat为例，Solr目录中将IKAnalyzer2012FF_u1.jar拷贝到 Tomcat的webapps/solr/WEB-INF/lib 下。在Tomcat的webapps/solr/WEB-INF/下创建classes目录，将IKAnalyzer.cfg.xml、stopword.dic ext.dic 复制到 Tomcat的webapps/solr/WEB-INF/classes，stopword.dic 和ext.dic必须保存成无BOM的utf-8类型（一般默认就这样）。

　　IKAnalyzer.cfg.xml修改字典引用

 <?xml version="1.0" encoding="UTF-8"?>

 <!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">

 <properties>

     <comment>IK Analyzer 扩展配置</comment>

     <!--用户可以在这里配置自己的扩展字典 -->

     <entry key="ext_dict">ext.dic;</entry>

     <!--用户可以在这里配置自己的扩展停止词字典-->

     <entry key="ext_stopwords">stopword.dic;</entry>

 </properties>

　　修改Solr的schema.xml文件，添加FieldType：

 <!-- IKAnalyzer-->

 <fieldType name="text_ik" class="solr.TextField">

     <analyzer type="index" isMaxWordLength="false"class="org.wltea.analyzer.lucene.IKAnalyzer"/>

     <analyzer type="query" isMaxWordLength="true"class="org.wltea.analyzer.lucene.IKAnalyzer"/>

 </fieldType>

　　solr配置文件中有的域我们才能进行update提交数据，不然插不进数据也便无法为这类数据建立索引。根据需求配置自定义域，这样我们才能够插入字段product_name。

 <!--IKAnalyzer Field-->

 <field name="product_name" type="text_ik" indexed="true" stored="true" />

　　未配置product_name前插入数据：

配置域后，就能插product_name了:

　　接下来测试中文分词()，可流畅分词，如果有需要，可以在ext.dic设置自定义词汇。

Solr索引配置的更多相关文章

使用Solr索引MySQL数据
环境搭建 1.到apache下载solr,地址:http://mirrors.hust.edu.cn/apache/lucene/solr/ 2.解压到某个目录 3.cd into D:\Solr\s ...
solr多核配置
假设已经配置好了一个单core的solr服务器. solr.xml配置文件单核和多核主要在solr.xml配置不同.在solr/example中已经有一个名称为multicore的文件夹里面给我们配 ...
将数据库表导入到solr索引
将数据库表导入到solr索引编辑solrcofnig.xml添加处理器 <requestHandler name="/dataimport" class="org ...
使用solrj操作solr索引库
(solrj)初次使用solr的开发人员总是很郁闷,不知道如何去操作solr索引库,以为只能用<五分钟solr4.5教程(搭建.运行)>中讲到的用xml文件的形式提交数据到索引库,其实没有 ...
使用solrj操作solr索引库,solr是lucene服务器
客户端开发 Solrj 客户端开发 Solrj Solr是搭建好的lucene服务器当然不可能完全满足一般的业务需求可能要针对各种的架构和业务调整这里就需要用到Solrj了 Solrj是Sol ...
将数据库的数据导入solr索引库中
在solr与tomcat整合文章中,我用的索引库是mycore,现在就以这个为例. 首先要准备jar包:solr-dataimporthandler-4.8.1.jar.solr-dataimport ...
如何在分布式环境中同步solr索引库和缓存信息
天气依旧很好,主要是凉快.老习惯,我在北京向各位问好. 搜索无处不在,相信各位每天都免不了与它的亲密接触,那么我想你确实有必要来了解一下它们,就上周在公司实现的一个小需求来给各位分享一下:如何在分布式 ...
Solr(六)Solr索引数据存放到HDFS下
Solr索引数据存放到HDFS下一新建solr core hdfs 方法:http://www.cnblogs.com/Matchman/p/7287385.html 二修改solrconfig ...
Solr 06 - Solr中配置使用IK分词器 (配置schema.xml)
目录 1 配置中文分词器 1.1 准备IK中文分词器 1.2 配置schema.xml文件 1.3 重启Tomcat并测试 2 配置业务域 2.1 准备商品数据 2.2 配置商品业务域 2.3 配置s ...

随机推荐

【LeetCode每天一题】Palindrome Number( 回文数字)
Determine whether an integer is a palindrome. An integer is a palindrome when it reads the same back ...
python3编写发送四种http请求的脚本
python3编写发送http请求的脚本使用requests包: http://docs.python-requests.org/zh_CN/latest/user/quickstart.html ...
node使用 log4js
log4js //配置日志的输出级别,共ALL<TRACE<DEBUG<INFO<WARN<ERROR<FATAL<MARK<OFF八个级别,defau ...
Tensorboard简介
Tensorflow官方推出了可视化工具Tensorboard,可以帮助我们实现以上功能,它可以将模型训练过程中的各种数据汇总起来存在自定义的路径与日志文件中,然后在指定的web端可视化地展现这些信息 ...
iOS 新浪微博-3.0 新特性
每个程序在第一次启动的时候,都会显示新特性.效果如下: 思路: 添加一个ViewController,里面放两个View,一个是UISrollView,另一个pageControl 往UISrollV ...
cocos2d JS 艺术字特殊符号的显示
this.setSocreAtion(score, this.tfMoneyList[index],mun); //传入分数与对象,调用下面的函数 setSocreAtion : function ( ...
Django Form(表单）
前台用 get 或 post 方法向后台提交一些数据. GET方法: html示例(保存在templates文件夹中): <!DOCTYPE html> <html> < ...
C++实现 safaBase64编码跟nonSafeBase64编码的转换
默认Base64编码的字符串,用于网络传输是不安全的,因为Base64编码使用的标准字典含有“+”,“/”. 规则如下: //nonSafeBase64 到 safeBase64'+' ------ ...
1.display:flex布局笔记
/*display:flex布局方式主要运用于垂直居中的效果*/ 一.Flex译为Flexible Box(弹性盒子),任何一个容器都可以指定为Flex布局注:设置为Flex布局之后,子元素的flo ...
caffe编译环境的错误：..build_release/src/caffe/proto/caffe.pb.h:23:35: fatal error: google/protobuf/arena.h: 没有那个文件
在搭建caffe的环境时出现错误: .build_release/src/caffe/proto/caffe.pb.h:23:35: fatal error: google/protobuf/aren ...

Solr索引配置

Solr主配置文件

fieldType

field

UniqueKey

copyField

dynamicField

配置中文分词器

Solr索引配置的更多相关文章

随机推荐

热门专题

copyField