Solr DataImportHandler】的更多相关文章

DIH主要用于从数据库抓取数据并创建索引.另外还能够从HTTP(RSS.ATOM)拉数据. 相关概念: Datasource:数据源,包含获取数据必需的信息:数据位置(url).数据库driver.登录账号和password Entity:相当于数据库的一个视图,能够从一个表或联表查询获得 Processor:数据处理器,负责从数据源中获取数据.处理.然后增加到索引中 Transformer:数据转换器,可选,负责改动数据.创建新的field.或依据须要把一条记录变成多条记录 首先.链接数据库须…
最近准备把一千九百多万数据导入Solr中,在以前测试数据只有一两百万,全量导入没有任务问题.但是,换成一千九百万数据时,solr报内存异常(java.lang.OutOfMemoryError:GC overhead limit exceeded),整个tomcat无法使用.我发现,我给tomcat最大堆内存512M.我觉得,可能是内存过小,于是,我把内存改大些,1024M(set JAVA_OPTS=-server -Xms1024m -Xmx1024m -XX:PermSize=128M -…
最近一个项目要用到solr做全文检索,开始盲人摸象. 用tomcat 7 开始配置,开始正常,但是遇到cookie里有中文就报错. 无奈,换tomcat 6, 结果DataImportHandler 就不间断报内存溢出的错误. 百度google之, 发现资料都是很老的,不是说mysql不支持某属性,就是要自己改导入代码.期间得知 batchSize这个属性,遂查询官网.(关键时刻,还是官网给 力) mysql的设置(红色部分),搞定. <dataSource type="JdbcDataS…
1.参数clean clean : (default 'true'). Tells whether to clean up the index before the indexing is started. clean如果为false:则不会删除老索引中的数据,但是会更新数据(根据id进行判断) 例如:数据库中有数据1.2.3,索引中有数据2.3 如果clean=false,那么full import后,索引中仍有数据1. 如果clean=true,那么full import后,索引重无数据1.…
一. 概述 大量的数据存储在MongoDB上,需要快速搜索出目标内容,于是搭建Solr服务. 另外一点,用Solr索引数据后,可以把数据用在不同的项目当中,直接向Solr服务发送请求,返回xml.json等形式的内容,使得对数据的使用更灵活. 对于MongoDB与Solr的描述不在这里阐释了,本文旨在给大家提供整个Solr与MongoDB接合的方法,实现实时的增量索引. MongoDB的官网:http://www.mongodb.org/ Solr项目的主页:http://lucene.apac…
环境搭建 1.到apache下载solr,地址:http://mirrors.hust.edu.cn/apache/lucene/solr/ 2.解压到某个目录 3.cd into D:\Solr\solr-4.10.3\example 4.Execute the server by “java -jar startup.jar”Solr会自动运行在自带的Jetty上 5.访问http://localhost:8983/solr/#/ PS:solr-5.0 以上默认对schema的管理是使用m…
转载请注明出处:http://www.cnblogs.com/zhuxiaojie/p/5764680.html 本教程基于solr5.5 前言 至于为什么要用solr5.5,因为最新的6.10,没有中文的分词器支持,这里使用的是ik分词器,刚好支持到5.5 ik分词器下载地址 :https://github.com/EugenePig/ik-analyzer-solr5  , 下载完之后使用maven命令, mvn package 即可生成jar文件,或者下载我编译好的 http://pan.…
1.参照 http://www.cnblogs.com/luxh/p/5016894.html 部署好solr的环境 2.在solr_home下建立一个core_item目录 [root@iZ23exixsjaZ solr_home]# pwd /luxh/solr/solr_home [root@iZ23exixsjaZ solr_home]# mkdir core_item 在core_item目录中建立data目录 [root@iZ23exixsjaZ core_item]# pwd /l…
MySQL 拷贝mysql-connector-java-5.1.25-bin.jar到E:\solr-4.8.0\example\solr-webapp\webapp\WEB-INF\lib目录下面 配置E:\solr-4.8.0\example\solr\collection1\conf\solrconfig.xml 1 2 3 4 5 6 <requestHandler name="/dataimport"      class="org.apache.solr.…
SOLR (全文检索) http://sinykk.iteye.com/ 1.   什么是SOLR 官方网站 http://wiki.apache.org/solr http://wiki.apache.org/solr/DataImportHandler 本文档以solr3.4   tomcat6.3  IKAnalyzer3.2.5Stable为例 1.1. 什么是SOLR Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器.同时对其进行了扩展,提供了比Lucene更…