Solr特性:Schemaless Mode(自动往Schema中添加field)
WiKi:https://cwiki.apache.org/confluence/display/solr/Schemaless+Mode
介绍:
Schemaless Mode is a set of Solr features that, when used together, allow users to rapidly construct an effective schema by simply indexing sample data, without having to manually edit the schema. These Solr features, all specified in solrconfig.xml
, are:
- Managed schema: Schema modifications are made through Solr APIs rather than manual edits - see Managed Schema Definition in SolrConfig.
- Field value class guessing: Previously unseen fields are run through a cascading set of value-based parsers, which guess the Java class of field values - parsers for Boolean, Integer, Long, Float, Double, and Date are currently available.
- Automatic schema field addition, based on field value class(es): Previously unseen fields are added to the schema, based on field value Java classes, which are mapped to schema field types - see Solr Field Types
配置:
1.Enable Managed Schema
As described in the section Managed Schema Definition in SolrConfig, changing the schemaFactory
will allow the schema to be modified by the Schema API. Your solrconfig.xml
should have a section like the one below (and the ClassicIndexSchemaFactory should be commented out or removed).
< schemaFactory class = "ManagedIndexSchemaFactory" > < bool name = "mutable" >true</ bool > < str name = "managedSchemaResourceName" >managed-schema</ str > </ schemaFactory > |
2.Define an UpdateRequestProcessorChain
The UpdateRequestProcessorChain allows Solr to guess field types, and you can define the default field type classes to use. To start, you should define it as follows (see the javadoc links below for update processor factory documentation):
< updateRequestProcessorChain name = "add-unknown-fields-to-the-schema" > <!-- UUIDUpdateProcessorFactory will generate an id if none is present in the incoming document --> < processor class = "solr.UUIDUpdateProcessorFactory" /> < processor class = "solr.LogUpdateProcessorFactory" /> < processor class = "solr.DistributedUpdateProcessorFactory" /> < processor class = "solr.RemoveBlankFieldUpdateProcessorFactory" /> < processor class = "solr.FieldNameMutatingUpdateProcessorFactory" > < str name = "pattern" >[^\w-\.]</ str > < str name = "replacement" >_</ str > </ processor > < processor class = "solr.ParseBooleanFieldUpdateProcessorFactory" /> < processor class = "solr.ParseLongFieldUpdateProcessorFactory" /> < processor class = "solr.ParseDoubleFieldUpdateProcessorFactory" /> < processor class = "solr.ParseDateFieldUpdateProcessorFactory" > < arr name = "format" > < str >yyyy-MM-dd'T'HH:mm:ss.SSSZ</ str > < str >yyyy-MM-dd'T'HH:mm:ss,SSSZ</ str > < str >yyyy-MM-dd'T'HH:mm:ss.SSS</ str > < str >yyyy-MM-dd'T'HH:mm:ss,SSS</ str > < str >yyyy-MM-dd'T'HH:mm:ssZ</ str > < str >yyyy-MM-dd'T'HH:mm:ss</ str > < str >yyyy-MM-dd'T'HH:mmZ</ str > < str >yyyy-MM-dd'T'HH:mm</ str > < str >yyyy-MM-dd HH:mm:ss.SSSZ</ str > < str >yyyy-MM-dd HH:mm:ss,SSSZ</ str > < str >yyyy-MM-dd HH:mm:ss.SSS</ str > < str >yyyy-MM-dd HH:mm:ss,SSS</ str > < str >yyyy-MM-dd HH:mm:ssZ</ str > < str >yyyy-MM-dd HH:mm:ss</ str > < str >yyyy-MM-dd HH:mmZ</ str > < str >yyyy-MM-dd HH:mm</ str > < str >yyyy-MM-dd</ str > </ arr > </ processor > < processor class = "solr.AddSchemaFieldsUpdateProcessorFactory" > < str name = "defaultFieldType" >strings</ str > < lst name = "typeMapping" > < str name = "valueClass" >java.lang.Boolean</ str > < str name = "fieldType" >booleans</ str > </ lst > < lst name = "typeMapping" > < str name = "valueClass" >java.util.Date</ str > < str name = "fieldType" >tdates</ str > </ lst > < lst name = "typeMapping" > < str name = "valueClass" >java.lang.Long</ str > < str name = "valueClass" >java.lang.Integer</ str > < str name = "fieldType" >tlongs</ str > </ lst > < lst name = "typeMapping" > < str name = "valueClass" >java.lang.Number</ str > < str name = "fieldType" >tdoubles</ str > </ lst > </ processor > < processor class = "solr.RunUpdateProcessorFactory" /> </ updateRequestProcessorChain > |
3.Make the UpdateRequestProcessorChain the Default for the UpdateRequestHandler
Once the UpdateRequestProcessorChain has been defined, you must instruct your UpdateRequestHandlers to use it when working with index updates (i.e., adding, removing, replacing documents). Here is an example using InitParams to set the defaults on all /update
request handlers:
< initParams path = "/update/**" > < lst name = "defaults" > < str name = "update.chain" >add-unknown-fields-to-the-schema</ str > </ lst > </ initParams > |
Solr特性:Schemaless Mode(自动往Schema中添加field)的更多相关文章
- treeview自动从表中添加标题和列值做目录的方法2
treeview自动从表中添加标题和列值做目录的方法2,该方法是借鉴万一老师的 http://www.cnblogs.com/del/archive/2008/05/15/1114450.html 首 ...
- solr 6.0 没有schema.xml未自动创建schema文件
solr 6.0 没有schema.xml未自动创建schema文件 摘要:在之前的Solr版本中(Solr5之前),在创建core的时候,Solr会自动创建好schema.xml,但是在之后的版本中 ...
- schema中字段类型的定义
当schema中字段类型为String时,保存的时候如果该字段为Number也可以保存成功,mongoose会自动将其转换为数字字符串. 当schema中字段类型为Number时,保存的时候如果该字段 ...
- SOLR企业搜索平台 三 (schema.xml配置和solrj的使用)
标签:solrj 原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作者信息和本声明.否则将追究法律责任.http://3961409.blog.51cto.com/3951409/8 ...
- 部署自动初始化Schema的数据库
我们使用容器的方式部署数据库组件,特别是企业有大量的项目开发业务的,部署的开发.测试数据库组件较多时.经常会遇到以下问题: 业务需要使用数据库,但部署完数据库后,需要在数据库中执行创建schema的操 ...
- unreal3对象属性自动从配置文件中加载的机制
unrealscript中有两个与属性自动配置相关的关键字: config/globalconfig 当把它们应用于属性时,对象在创建后,该属性的初始值会被自动设置为相对应ini文件中的值. 举例来说 ...
- DataGridView设置不自动显示数据库中未绑定的列
项目中将从数据库查出来的数据绑定到DataGridView,但是不想显示所有的字段.此功能可以通过sql语句控制查出来的字段数目,但是DataGridView有属性可以控制不显示未绑定的数据,从UI层 ...
- SQL2005中使用identity_insert向自动增量字段中写入内
摘自: http://www.aspbc.com/tech/showtech.asp?id=1117 SQL2005以前的数据库是不允许向自动增量字段中写入内容的,ACCESS也不行,但在SQL200 ...
- asp自动解析网页中的图片地址,并将其保存到本地服务器
程序实现功能:自动将远程页面的文件中的图片下载到本地. 程序代码 <% '将本文保存为 save2local.asp '测试:save2local.asp?url=http://ent.sina ...
随机推荐
- Android图片高斯模糊的一些方法
高斯模糊 高斯模糊就是将指定像素变换为其与周边像素加权平均后的值,权重就是高斯分布函数计算出来的值. 一种实现 点击打开链接<-这里是一片关于高斯模糊算法的介绍,我们需要首先根据高斯分布函数计算 ...
- TCP/IP协议 socket
TCP/IP四层协议 TCP/IP概念 tcp/ip协议是主机接入互联网以及接入互联网的两台主机通信的标准. 数据帧概念 数据帧 |-- 包头 | |--源地址 | |--目标地址 | |--数据类型 ...
- Space-vim的.spacevim配置备份
安装 windows安装 配置 在C盘的用户目录下,有一个'.spacevim'的文件,可以修改你要的配置 " Let Vim and NeoVim shares the same plug ...
- Rhythmk 学习 Hibernate 01 - maven 创建Hibernate 项目之 增删改查入门
1.环境: Maven :3.1.1 开发工具:Spring Tool Suite 数据库 : Mysql 5.6 2.项目文件结构 文件代码: 2.1 .pom.xml <project x ...
- win10 修改hosts
win10 修改hosts,是权限的问题, C:\Windows\System32\drivers\etc\hosts 添加权限即可. http://jingyan.baidu.com/article ...
- linux img文件 分区挂载
首先是将制作的img文件比如hd5.img和loop设备建立联系. losetup /dev/loop0 hd5.img 然后用fdisk分区:fdisk /dev/loop0 mkfs.ext4 / ...
- js 滚动条滚动到底部触发事件
一.前言 在开发项目时,常常需要展示大量数据.如果全部显示出来,数据相对少时,看不出来什么不同,如果数据很多时,一次请求全部显示,这就相当可怕了. 面对这种问题,PC里使用了分页效果,将数据分成一页页 ...
- ssm 动态切换数据源
1,添加数据库配置 jdbc.driver=com.microsoft.sqlserver.jdbc.SQLServerDriver #jdbc.url=jdbc:sqlserver://192.16 ...
- 二叉树垂直遍历 · Binary Tree Vertical Order Traversal
[抄题]: 给定二叉树,返回其节点值的垂直遍历顺序. (即逐列从上到下).如果两个节点在同一行和同一列中,则顺序应 从左到右. 给定一个二叉树 {3,9,20,#,#,15,7} 3 /\ / \ 9 ...
- boost之内存管理
内存管理一直是令C++程序员最头疼的工作,C++继承了C那高效而又灵活的指针,使用起来稍微不小心就会导致内存泄露.野指针.越界访问等访问.虽然C++标准提供了只能指针std::auto_ptr,但是并 ...