solr4.5 schema.xml配置文件

schema.xml配置文件是用于定义index索引库的结构，有点类似于数据表表的定义。

当我们打开schema.xml配置文件时，也许会被里面密密麻麻的代码所吓倒，其实不必惊慌，里面其实就两个东西filed和fieldType。

1、field–类似于数据表的字段

<fields>

      <field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false" omitNorms="true"  default="df"/>

   .....//省略

  <field name="_version_" type="long" indexed="true" stored="true"/><!--此字段为最好不要删除哦！非要删除，请把solrconfig.xml中的updateLog注释，但不建议这样-->

</fields>

属性介绍：

（1）、name：字段名称

（2）、type：字段类型（此处type不是java类型，而是下面定义的fieldType）

（3）、indexed：是否索引？true--solr会对这个字段进行索引，只有经过索引的字段才能被搜索、排序等；false--不索引

（4）、stored：是否存储？true--存储，当我们需要在页面显示此字段时，应设为true，否则false。

（5）、required：是否必须？true--此字段为必需，如果此字段的内容为空，会报异常；false--不是必需

（6）、multiValued：此字段是否可以保存多个值？

（7）、omitNorms：是否对此字段进行解析？有时候我们想通过某个字段的完全匹配来查询信息，那么设置 indexed="true"、omitNorms="true"。

（8）、default：设置默认值

2、fieldType–字段类型

<types>

<fieldType name="string" class="solr.StrField" sortMissingLast="true" />

.....//省略

<fieldType name="text_general" positionIncrementGap="100">

        <analyzer type="index">

                    <tokenizer/>

                    <filter ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />

                     <filter/>

        </analyzer>

        <analyzer type="query">

              <tokenizer/>

              <filter ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />

               <filter synonyms="synonyms.txt" ignoreCase="true" expand="true"/>

                <filter/>

         </analyzer>

 </fieldType>

</types>

属性说明：

（1）、name：类型名称，<field>中的type引用的就是这个name

（2）、class：solr自定义的类型

（3）、<analyzer type="index">定义建立索引时使用的分词器及过滤器

（4）、<analyzer type="query">定义搜索时所使用的分词器及过滤器

（5）、 <tokenizer/>定义分词器

（6）、<filter/>定义过滤器

3、uniqueKey

<uniqueKey>id</uniqueKey>
类似于数据表数据的id，solr索引库中最好定义一个用于标示document唯一性的字段，此字段主要用于删除document。

4、<copyField/>

<copyField source=”cat” dest=”text”/>
实际项目中为了方便查询，我们会把多个需要查询的字段合并到一个字段里，方便查询。

举例：

产品搜索，关键词不应该只匹配产品标题，还应该匹配产品关键词及产品简介等，那么在建立索引库时，可以把标题、产品关键词、简介放到一个叫text的字段中，搜索时直接搜text字段。

<fields>

     <field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false" />

     <field name="title" type="text_general" indexed="true" stored="true"/>

     <field name="keywords" type="text_general" indexed="true" stored="true" omitNorms="true"/>

     <field name="description" type="string" indexed="true" stored="true" multiValued="true"/>

</fields>

<copyField source="title" dest="text"/>

<copyField source="keywords" dest="text"/>

<copyField source="description" dest="text"/>

更多详细的内容请亲自研究schema.xml配置文件

本文出自luoshengsha.com，转载时请注明出处及相应链接。

本文永久链接: http://www.luoshengsha.com/213.html

solr4.5 schema.xml配置文件的更多相关文章

solr4.2 solrconfig.xml配置文件简单介绍
对于solr4.x的每个core有两个很重要的配置文件:solrconfig.xml和schema.xml,下面我们来了解solrconfig.xml配置文件. 具体很详细的内容请细读solrcofi ...
mycat中间件--schema.xml配置文件详解
schema.xml管理着MyCat的逻辑库.表.分片规则.DataNode以及DataSource.弄懂这些配置,是正确使用MyCat的前提. <?xml version="1.0& ...
mycat schema.xml 配置文件详解
<?xml version="1.0"?> <!DOCTYPE mycat:schema SYSTEM "schema.dtd"> &l ...
solr的schema.xml配置文件关键词意义
fieldType:配置扩展的分析器analyzer:具体的分析器的全路径field:配置具体的索引业务字段name:字段的名称type:指定使用哪种分析器域:StringField,textFiel ...
认识配置文件schema.xml（managed-schema）
1.schema文件是在SolrConfig中的架构工厂定义,有两种定义模式: 1.1.默认的托管模式: solr默认使用的就是托管模式.也就是当在solrconfig.xml文件中没有显式声明< ...
Solr5之Schema.xml详解
schema.xml 是用来定义索引数据中的域的,包括域名称,域类型,域是否索引,是否分词,是否存储,是否标准化即 Norms ,是否存储项向量等等. schema.xml 配置文件的根元素就是 sc ...
SOLR企业搜索平台三（schema.xml配置和solrj的使用）
标签:solrj 原创作品,允许转载,转载时请务必以超链接形式标明文章原始出处 .作者信息和本声明.否则将追究法律责任.http://3961409.blog.51cto.com/3951409/8 ...
solr中的schema.xml(managed-schema)文件解读
solr 7.2.1版本managed-schema文件示例 <uniqueKey>id</uniqueKey> 唯一键字段,solr对每一个文档都赋予一个唯一标识符字段,避免 ...
Solr入门之（5）配置文件schema.xml
该配置文件中的标签:<fileTypes>.<fields>.<uniqueKey>.<copyField> fieldType说明标签types中定 ...

随机推荐

山寨小小军团开发笔记之 Arrow Projectile
好久没怎么更新博客了,今天抽空来一篇,讨论一下弓箭的轨迹生成. 一.原理弓箭的轨迹本质就是一个数学问题,使用一个 bezier 曲线公式就可以插值生成.得到轨迹后,做一个lookAt就可以了. 二. ...
jquery mouseout事件冒泡解决方法
在界面中最多使用的是div,如果一个div中包含多个div或img对象时, 针对mouseout鼠标移出事件时,并没有移出div层,但是当移动到div中的img时,也触发了该mouseout事件,这就 ...
hdoj 2202 最大三角形
题目大意:给定n(3<=n<=50000)个点,求其中任意三个点组成的三角形面积最大,输出该面积. 题目传送:http://acm.hdu.edu.cn/showproblem.php?p ...
POJ2104 K-th number 函数式线段树
很久没打代码了,不知道为什么,昨天考岭南文化之前突然开始思考起这个问题来,这个问题据说有很多种方法,划分树什么的,不过对于我现在这种水平还是用熟悉的线段树做比较好.这到题今年8月份的时候曾经做过,那个 ...
Intent (一)
1,简介 Intent 是一种消息传递机制,可以理解为一种对消息的封装,执行某操作的抽象描述,可用于应用程序内部及应用程序之间其组成包括: 要执行的动作(action) 如VIEW_ACTION(查 ...
手把手VirtualBox虚拟机下安装rhel6.4 linux 64位系统详细文档
下面演示安装的是在VirtualBox里安装rhel 6.4 linux 64位系统. 一.VirtualBOX 版本. 二.虚拟机的配置. 1.现在开始演示安装,一起从零开始.点击“新建”,创建新的 ...
cojs 疯狂的粉刷匠疯狂的斐波那契题解报告
疯狂的斐波那契学习了一些奇怪的东西之后出的题目最外层要模p是显然的,然而内层并不能模p 那么模什么呢,显然是模斐波那契的循环节那么我们可以一层层的求出每层的斐波那契循环节之后在从内向外用矩阵乘 ...
lintcode 中等题：subsets II 带重复元素的子集
题目带重复元素的子集给定一个可能具有重复数字的列表,返回其所有可能的子集样例如果 S = [1,2,2],一个可能的答案为: [ [2], [1], [1,2,2], [2,2], [1,2] ...
java--依赖、关联、聚合和组合之间区别的理解
在学习面向对象设计对象关系时,依赖.关联.聚合和组合这四种关系之间区别比较容易混淆.特别是后三种,仅仅是在语义上有所区别,所谓语义就是指上下文环境.特定情景等. 依赖(Dependency)关系是类与 ...
TCL语言笔记：TCL过程控制练习
1.青蛙爬井 for {set day 1;set cur 7} {$cur<77} {incr cur 2 ;incr day } { } puts $day 2.求1加到100 proc g ...

solr4.5 schema.xml配置文件

solr4.5 schema.xml配置文件的更多相关文章

随机推荐

热门专题