solr4.2增量索引之同步(修改，删除，新增)--转载

原文地址：http://www.jiancool.com/article/12743229775/;jsessionid=14E9B3F1BB33399799884B5C8F15DDE1

solr增量索引配置
1.在进行增量索引前，首先要弄懂几个必要的属性，以及数据库建表事项，和dataimporter.properties
                   data-config.xml里面的数据


    注意这个只能返回ID字段

 注意这个只能返回ID字段
                   数据库配置注意事项
1.如果只涉及添加，与修改业务，那么数据库里只需额外有一个timpstamp字段
就可以了，默认值为当前系统时间，CURRENT_TIMESTAMP（笔者的数据为mysql的）
2.如果还涉及删除业务，那么数据里就需额外再多添加一个字段isdelete，int类型的
用0,1来标识，此条记录是否被删除，当然也可以用其他字段标识，ture或false都可以

dataimporter.properties
这个配置文件很重要，它是用来记录当前时间与上一次修改时间的，通过它能够找出，那些，新添加的，修改的，或删除的记录

下面为笔者当时测试时的一个演示，其中添加，修改，删除，都涉及了

    <dataConfig>

         <!---   此段话配置的是一个MySQL的数据源，（数据源也可以配置在solrconfig.xml中）  --->

        <dataSource name="mydb" type="JdbcDataSource" driver="com.mysql.jdbc.Driver" url="jdbc:mysql://localhost/test" user="root" password="ninemax"/>

        <document>

             <!--  下面分别来介绍属性（如有错误，欢迎指出） -->

             <!--  pk="ID" 这个很有必要，因为其中的增量索引查询主键ID时需要  -->

              <!--  dataSource="mydb"   这个引用名字是引用上面数据源的名字 -->

              <!--  name="myinfo"   这个名字必须唯一，存在多个实体时 -->

               <!--  query="select  *  from myinfo WHERE isdelete=0   query查询是指

               查询出表里所有的符合条件的数据，因为笔者测试的有删除业务，所以

               where  后面有一个限定条件isdelete=0，意思为查询未被删除的数据

               (注意这个query查询只对第一次全量导入有作用，对增量导入不起作用)

               -->

               <!--

               deltaQuery="select ID  from myinfo where my_date > '${dataimporter.last_index_time}'"

               deltaQuery的意思是，查询出所有经过修改的记录的ID

               可能是修改操作，添加操作，删除操作产生的

               (此查询只对增量导入起作用，而且只能返回ID值)

               -->

               <!--

               deletedPkQuery="select ID from myinfo where isdelete=1"

               此操作值查询那些数据库里伪删除的数据的ID（即isdelete标识为1的数据）

               solr通过它来删除索引里面对应的数据

               (此查询只对增量导入起作用，而且只能返回ID值)

               -->

               <!--

                deltaImportQuery="select * from myinfo where ID='${dataimporter.delta.ID}'"

                次查询是获取以上两步的ID，然后把其全部数据获取，根据获取的数据

                对索引库进行更新操作，可能是删除，添加，修改

                (此查询只对增量导入起作用，可以返回多个字段的值,一般情况下，都是返回所有字段的列)

               -->

             <entity pk="ID"  dataSource="mydb" name="myinfo" query="select  *  from myinfo WHERE isdelete=0 "

              deltaQuery="select ID  from myinfo where my_date > '${dataimporter.last_index_time}'"

              deletedPkQuery="select ID from myinfo where isdelete=1"

              deltaImportQuery="select * from myinfo where ID='${dataimporter.delta.ID}'"

             >

             <!--  此条记录有必要说一下，ID指定大写的，与上面语句中的对应起来---->

              <field column="ID" name="id"/>

               <field column="name" name="name"/>

               <field column="address" name="address"/>

               <field column="age" name="age"/>

                <field column="my_date" name="my_date"/>

                 <field column="isdelete" name="isdelete"/>

              </entity>

        </document>

    </dataConfig>

solr4.2增量索引之同步(修改，删除，新增)--转载的更多相关文章

sphinx增量索引和主索引来实现索引的实时更新
项目中文章的信息内容因为持续有新增,而文章总量的基数又比较大,所以做搜索的时候,用了主索引+增量索引这种方式来实现索引的实时更新. 实现原理: 1. 新建一张表,记录一下上一次已经创建好索引的最后一条 ...
数据源、数据集、同步任务、数据仓库、元数据、数据目录、主题、来源系统、标签、增量识别字段、修改同步、ES索引、HBase列族、元数据同步、
数据源.数据集.同步任务.数据仓库.元数据.数据目录.主题.来源系统.标签. 增量识别字段.修改同步.ES索引.HBase列族.元数据同步.DS.ODS.DW.DM.zk集群地址 == 数据源数据源 ...
[Spring cloud 一步步实现广告系统] 15. 使用开源组件监听Binlog 实现增量索引准备
MySQL Binlog简介什么是binlog? 一个二进制日志,用来记录对数据发生或潜在发生更改的SQL语句,并以而进行的形式保存在磁盘中. binlog 的作用? 最主要有3个用途: 数据复制( ...
[Solr] (源) Solr与MongoDB集成，实时增量索引
一. 概述大量的数据存储在MongoDB上,需要快速搜索出目标内容,于是搭建Solr服务. 另外一点,用Solr索引数据后,可以把数据用在不同的项目当中,直接向Solr服务发送请求,返回xml.js ...
Lucene.net 实现近实时搜索（NRT）和增量索引
Lucene做站内搜索的时候经常会遇到实时搜索的应用场景,比如用户搜索的功能.实现实时搜索,最普通的做法是,添加新的document之后,调用 IndexWriter 的 Commit 方法把内存中的 ...
solr与.net系列课程(六)solr定时增量索引与安全
solr与.net系列课程(六)solr定时增量索引与安全 solr增量索引的方式,就是一个Http请求,但是这样的请求显然不能满足要求,我们需要的是一个自动的增量索引,solr官方提供了一个定时器 ...
xunsearch增量索引改进版
最近测试了xunserach全文索引程序.xunsearch只有LINUX版,所以想用windows服务器请使用其它全文索引程序.xunsearch本身不像coreseek那样自带增量索引的功能,所以 ...
sphinx 增量索引及时更新、sphinx indexer索引合成时去旧和过滤办法(转)
一.sphinx增量索引的设置数据库中的已有数据很大,又不断有新数据加入到数据库中,也希望能够检索到.全部重新建立索引很消耗资源,因为我们需要更新的数据相比较而言很少.例如.原来的数据有几百万 ...
Solr与MongoDB集成，实时增量索引
Solr与MongoDB集成,实时增量索引一. 概述大量的数据存储在MongoDB上,需要快速搜索出目标内容,于是搭建Solr服务. 另外一点,用Solr索引数据后,可以把数据用在不同的项目当中, ...

随机推荐

20155325 2016-2017-2 《Java程序设计》第1周学习总结
教材学习内容总结三大平台 java SE:JVM(java虚拟机),JRE(运行java程序),JDK(包括JRE及开发过程中需要的一些工具程序),java语言. java EE:基于java SE ...
Ubuntu配置android环境
jdk:http://www.oracle.com/technetwork/cn/java/javase/downloads/index.html 安装JDK的步骤:http://jingyan.ba ...
【LG4631】[APIO2018]Circle selection 选圆圈
[LG4631][APIO2018]Circle selection 选圆圈题面洛谷题解用\(kdt\)乱搞剪枝. 维护每个圆在\(x.y\)轴的坐标范围相当于维护一个矩形的坐标范围为\([ ...
TensorFlow深度学习实战---循环神经网络
循环神经网络(recurrent neural network,RNN)-------------------------重要结构(长短时记忆网络( long short-term memory,LS ...
youtube高清视频下载方法
youtube下载方法有多种, 但都不支持1080P以上的高清下载, 今天找到一种支持1080P的, 记录一下步骤1: 百度搜: Dooseen tubedown 下载该软件, 并安装, 一直下一步 ...
Django——test文件编写接口测试
用自己建立的小网页来做接口测试,在Django的tests.py写下如下 test_login_page为用get方式登录login路径,根据回复验证是否查看到页面 test_login_action ...
Unity ScriptableObject自定义属性显示
1. 继承Editor,重写OnInspectorGUI方法 Editor官方文档需求将TestClass中intData属性和stringData按指定格式显示. 实现定义一个测试类TestC ...
MYSQL存储过程调试过程
mysql不像oracle有plsqldevelper工具用来调试存储过程,所以有几种简单的方式追踪执行过程: 1.用一张临时表,记录调试过程: 2.直接在存储过程中,增加select xxx,在控 ...
亚马逊与Twitter携手电子商务
亚马逊(Amazon)与Twitter开展了合作,允许用户以Twitter消息的形式将喜欢的商品发送到购物篮中.这些高科技企业正在想办法把社交媒体和电子商务融为一体. 这一功能旨在将Twitter转变 ...
Js 问题分析--js 影响页面性能
文档下载链接:http://pan.baidu.com/s/1i4Hci4d (失效请留言)

solr4.2增量索引之同步(修改，删除，新增)--转载

solr4.2增量索引之同步(修改，删除，新增)--转载的更多相关文章

随机推荐

热门专题