Solr6+IKAnalyzer分词环境搭建
环境要求
Zookeeper版本:zookeeper-3.4.8
JDK版本: jdk1.8.
Solr版本:solr-6.4.1
Tomcat版本:tomcat8
ZK地址:127.0.0.1:2181(如果是zk集群的话,多个配置之间使用逗号分隔)
应用部署
已经打包Tomcat压缩文件<apache-tomcat-8.5.11-solr.zip>
百度云下载:链接:http://pan.baidu.com/s/1qX9sN28 密码:du9x
如上附件打包过程:
- 将solr-6.4.1\server\solr-webapp\webapp下面的所有文件复制到tomcat/webapps/solr/目录下
- 将 solr-6.4.1\server\lib\下面所有的*.jar 复制到tomcat/webapps/solr/WEB-INF/lib/目录下
- 将 solr-6.4.1\server\lib\ext\下面所有的*.jar 复制到tomcat/webapps/solr/WEB-INF/lib/目录下
- 将 solr-6.4.1\server\solr 下的所有文件复制到tomcat/solrhome/目录下
配置修改
- 增加tomcat/bin/catalina.sh中的JAVA_HOME和zk的配置
JAVA_OPTS="-DzkHost=127.0.0.1:2181"
JAVA_HOME="C:/DevTool/jdk1.8.0_92/"
- 修改tomcat/solrhome/solr.xml中的hostPort为tomcat的访问端口(例如tomcat访问端口为10100,那么修改配置如下)
<int name="hostPort">10100</int>
- 修改tomcat/webapps/solr/WEB-INFO/web.xml修改solr/home的值(改目录为打包过程第四部的solrhome目录),例如:
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>C:\Users\Silver\Desktop\apache-tomcat-8.5.11-10100\solrhome</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
- 设置日志输出
tomcat/webapps/solr/WEB-INF/classes/目录下增加log4j.properties文件 ,并更改solr.log=D:/logs/solr/
# Default Solr log4j config
# rootLogger log level may be programmatically overridden by -Dsolr.log.level
#solr.log=${solr.log.dir}
solr.log=D:/logs/solr/
log4j.rootLogger=INFO, file, CONSOLE # Console appender will be programmatically disabled when Solr is started with option -Dsolr.log.muteconsole
log4j.appender.CONSOLE=org.apache.log4j.ConsoleAppender
log4j.appender.CONSOLE.layout=org.apache.log4j.EnhancedPatternLayout
log4j.appender.CONSOLE.layout.ConversionPattern=%d{yyyy-MM-dd HH:mm:ss.SSS} %-5p (%t) [%X{collection} %X{shard} %X{replica} %X{core}] %c{.} %m%n #- size rotation with log cleanup.
log4j.appender.file=org.apache.log4j.RollingFileAppender
log4j.appender.file.MaxFileSize=10MB
log4j.appender.file.MaxBackupIndex= #- File to log to and log format
log4j.appender.file.File=${solr.log}/solr.log
log4j.appender.file.layout=org.apache.log4j.EnhancedPatternLayout
log4j.appender.file.layout.ConversionPattern=%d{yyyy-MM-dd HH:mm:ss.SSS} %-5p (%t) [%X{collection} %X{shard} %X{replica} %X{core}] %c{.} %m%n # Adjust logging levels that should differ from root logger
log4j.logger.org.apache.zookeeper=WARN
log4j.logger.org.apache.hadoop=WARN
log4j.logger.org.eclipse.jetty=WARN
log4j.logger.org.eclipse.jetty.server.Server=INFO
log4j.logger.org.eclipse.jetty.server.ServerConnector=INFO # set to INFO to enable infostream log messages
log4j.logger.org.apache.solr.update.LoggingInfoStream=OFF
- 启动tomcat
登录tomcat进行查看搭建情况
http://127.0.0.1:10100/solr/index.html
可能遇到的问题
- ClassNotFund -- com.codahale.metrics.MetricSet
-- solr-6.4.1\server\lib\除了jetty之外的jar包都放到 tomcat/webapps/solr/WEB-INFO/lib/下
- HTTP Status 403 - Access to the requested resource has been denied
-- 注释掉tomcat/webapps/solr/WEB-INFO/web.xml中的所有<security-constraint>标签
- Xid out of order. Got Xid 52 with err 0 expected Xid 51 for a packet with details: clientPath:null serverPath:null finished:false header:: 51,14
-- 升级zookeeper版本为3.4.8
- UnsupportedClassVersionError: org/apache/solr/servlet/SolrDispatchFilter : Unsupported major.minor version 52.0
-- Solr工程需要JDK8以上,因此需要设置JAVA_HOME为JDK8
设置分词(IKAnalyzer分词)
Git下载源码工程:https://github.com/cj96248/ik-analyzer-solr6.git
将工程打包出JAR包,并且放在tomcat/webapps/solr/WEB-INF/lib/目录下
配置参考:
http://www.tuicool.com/articles/faYFBzA
原理:在字段上面进行了分词处理,solr服务器数据在插入会调用分词进行索引,查询的时候调用分词进行查询
Solr6+IKAnalyzer分词环境搭建的更多相关文章
- 搜索引擎Solr系列(一): Solr6.2.1环境搭建
一:Solr简介 Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口.用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引:也可以通 ...
- solr 6.2.1环境搭建
一:Solr简介 Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口.用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引:也可以通过 ...
- Solr7.2.1环境搭建和配置ik中文分词器
solr7.2.1环境搭建和配置ik中文分词器 安装环境:Jdk 1.8. windows 10 安装包准备: solr 各种版本集合下载:http://archive.apache.org/dist ...
- Solr6.0环境搭建
感谢TTTTTTTTT丶的分享. 转载地址: 点击打开链接 准备工作: 目前最新版本6.0.下载solr 6.0:Solr6.0下载 JDK8 下载jdk1.8:jdk1.8[solr6.0是基于jd ...
- [精华]Hadoop,HBase分布式集群和solr环境搭建
1. 机器准备(这里做測试用,目的准备5台CentOS的linux系统) 1.1 准备了2台机器,安装win7系统(64位) 两台windows物理主机: 192.168.131.44 adminis ...
- Nutch1.7学习笔记:基本环境搭建及使用
Nutch1.7学习笔记:基本环境搭建及使用 作者:雨水,时间:2013-10-31博客地址:http://blog.csdn.net/gobitan 说明:Nutch有两个主版本1.x和2.x,它们 ...
- Hadoop之环境搭建
初学Hadoop之环境搭建 阅读目录 1.安装CentOS7 2.安装JDK1.7.0 3.安装Hadoop2.6.0 4.SSH无密码登陆 本文仅作为学习笔记,供大家初学Hadoop时学习参考. ...
- jdk、tomcat、solr环境搭建
环境概述 1)操作系统:windows7旗舰版(64位) 2)jdk:jdk-8u131-windows-x64: 3)tomcat:apache-tomcat-9.0.0.M21 4)solr:so ...
- Elasticsearch简单使用和环境搭建
Elasticsearch简单使用和环境搭建 1 Elasticsearch简介 Elasticsearch是一个可用于构建搜索应用的成品软件,它最早由Shay Bannon创建并于2010年2月发布 ...
随机推荐
- poj1275收银员——差分约束
题目:http://poj.org/problem?id=1275 做的第一道差分约束题... 首先,根据题意得出一些不等关系(f为前缀和雇佣人数): 0 <= f[i] - f[i-1] &l ...
- JSON标准格式
标准JSON的合法符号:{(左大括号) }(右大括号) "(双引号) :(冒号) ,(逗号) [(左中括号) ](右中括号) JSON字符串:特殊字符可在字符前面加 \ 或使用 ...
- Subsets Forming Perfect Squares
题意: 给出n个数字,选出若干个数字,使得这些数字的乘积是一个完全平方数,问有多少种选法. 解法: 考虑异或方程组,$x_i$表示第i个数字是否选, 注意到只要保证结果中各个质因数都出现偶数次就可保证 ...
- shell的split生成的文件按规律命名及添加扩展名
可以参考 用shell切分文件--split shell下的split命令主要用于分割一些大文件用的,比如经常要用到将一个几十万行的TXT分割为多少行一个的文件,非常有用,唯一坑爹的是,切割后的文件不 ...
- Validtion
今天在使用Validation框架实现验证时,出现以上的错误.查询资料后发现“validation-config.dtd”这个文件没有导入自己的工程,才会出现这样的错误. 将从文件导入后果然解决了问题 ...
- 梦工厂实验室 蛇形填数 dfs
问题 D: 蛇形填数 时间限制: 3 Sec 内存限制: 64 MB提交: 28 解决: 5[提交][状态][讨论版] 题目描述 在n*n方阵里填入1,2,...,n*n,要求填成蛇形.例如n=4 ...
- 洛谷1087 FBI树 解题报告
洛谷1087 FBI树 本题地址:http://www.luogu.org/problem/show?pid=1087 题目描述 我们可以把由“0”和“1”组成的字符串分为三类:全“0”串称为B串,全 ...
- 16-CoreData之多表关联(存储自定义数据模型)
多表关联 1.1-简介 什么是多表关联 在处理数据库的关系中,无非只有三种关系 一对一:一个老师只能在一个教室上课,不可能同时在两个教室上课 一对多:一个教室可以有多个学生,但一个学生只能在一个教室 ...
- phpstudy的mysql版本升级至5.7
phpstudy安装的mysql版本一般都是5.5或5.4的,但是有时候做项目又必须用到mysql5.7版本,所以我们现在来看一下如何在phpstudy的环境下将mysql版本升级至5.7 温馨提醒: ...
- 萌新学习图的强连通(Tarjan算法)笔记
--主要摘自北京大学暑期课<ACM/ICPC竞赛训练> 在有向图G中,如果任意两个不同顶点相互可达,则称该有向图是强连通的: 有向图G的极大强连通子图称为G的强连通分支: Tarjan算法 ...