solr-6.4.2安装+分词器配置
一、solr安装
solr下载地址:http://archive.apache.org/dist/lucene/solr/6.4.2/
1、解压solr软件包:
tar xf solr-6.4.2.tgz
2、copy需要的文件以及jar包
将solr项目copy到tomcat的webapps目录下并命名为solr
cp -r solr-6.4.2/server/solr-webapp/webapp /data/tomcat/webapps/solr
将solr-6.4.2/server/lib/ext/目录下的jar文件复制到solr/WEB-INF/lib/目录下
cp solr-6.4.2/server/lib/ext/* /data/tomcat/webapps/solr/WEB-INF/lib/
将solr-6.4.2/dist/目录下的solr-dataimporthandler-6.4.2.jar和solr-dataimporthandler-extras-6.4.2.jar文件复制到solr/WEB-INF/lib/目录下
cd solr-6.4.2/dist/
cp solr-dataimporthandler-6.4.2.jar solr-dataimporthandler-extras-6.4.2.jar /data/tomcat/webapps/solr/WEB-INF/lib/
3、创建solr的家目录并去web.xml中配置
将solr-6.4.2/server/solr目录复制到data目录下并更名为solr-home
cp -r solr-6.4.2/server/solr /data/solr-home
vim /data/tomcat/webapps/solr/WEB-INF/web.xml修改solr-home的目录位置
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>/data/tomcat/solr-home</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
4、在tomcat下的solr项目的WEB-INF下创建classes目录,然后把solr-6.4.2/server/resources下的log4j.properties粘贴过去
mkdir /data/tomcat/pre_publish_solr/webapps/solr/WEB-INF/classes
cp solr-6.4.2/server/resources/log4j.properties /data/tomcat/webapps/solr/WEB-INF/classes/
把solr-6.4.2/server/lib下的metrics-core-3.1.2.jar、metrics-ganglia-3.1.2.jar、metrics-graphite-3.1.2.jar、metrics-jetty9-3.1.2.jar、metrics-jvm-3.1.2.jar这几个jar包放到tomcat下的solr项目的WEB-INF/lib目录下。否则会抛出异常
cd solr-6.4.2/server/lib
cp metrics-core-3.1.2.jar metrics-ganglia-3.1.2.jar metrics-graphite-3.1.2.jar metrics-jetty9-3.1.2.jar metrics-jvm-3.1.2.jar /data/tomcat/webapps/solr/WEB-INF/lib/
5、配置solr的访问权限
solr默认限制了对solr资源的访问,在tomcat中solr下修改web.xml:
本人的修改方法是注释掉了禁止追踪,保留了Enable everything but TRACE,访问时正常的
<!--security-constraint>
<web-resource-collection>
<web-resource-name>Disable TRACE</web-resource-name>
<url-pattern>/</url-pattern>
<http-method>TRACE</http-method>
</web-resource-collection>
<auth-constraint/>
</security-constraint-->
二、分词器配置
solr-6.4.2配置中文分词器IK Analyzer
1、将ik-analyzer-solr6.x.jar复制到tomcat\webapps\solr\WEB-INF\lib目录下
2、将stopword.dic、IKAnalyzer.cfg.xml复制到tomcat\webapps\solr\WEB-INF\classes
3、修改schema文件,打开solr_home\new_core\conf\managed-schema文件,添加IK分词器配置
<fieldType name="text_ik" class="solr.TextField">
<!--索引时候的分词器-->
<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<!--查询时候的分词器-->
<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
solr-6.4.2安装+分词器配置的更多相关文章
- 真分布式SolrCloud+Zookeeper+tomcat搭建、索引Mysql数据库、IK中文分词器配置以及web项目中solr的应用(1)
版权声明:本文为博主原创文章,转载请注明本文地址.http://www.cnblogs.com/o0Iris0o/p/5813856.html 内容介绍: 真分布式SolrCloud+Zookeepe ...
- Solr入门之(8)中文分词器配置
Solr中虽然提供了一个中文分词器,但是效果很差,可以使用IKAnalyzer或Mmseg4j 或其他中文分词器. 一.IKAnalyzer分词器配置: 1.下载IKAnalyzer(IKAnalyz ...
- solr英文使用的基本分词器和过滤器配置
solr英文应用的基本分词器和过滤器配置 英文应用分词器和过滤器一般配置顺序 索引(index): 1:空格 WhitespaceTokenizer 2:过滤词(停用词,如:on.of.a.an ...
- Solr IK分词器配置
下载地址:https://search.maven.org/search?q=com.github.magese 分词器配置: 参考:https://www.cnblogs.com/mengjinlu ...
- 2.IKAnalyzer 中文分词器配置和使用
一.配置 IKAnalyzer 中文分词器配置,简单,超简单. IKAnalyzer 中文分词器下载,注意版本问题,貌似出现向下不兼容的问题,solr的客户端界面Logging会提示错误. 给出我配置 ...
- Solr6.5.0配置中文分词器配置
准备工作: solr6.5.0安装成功 1.去官网https://github.com/wks/ik-analyzer下载IK分词器 2.Solr集成IK a)将ik-analyzer-solr6.x ...
- solr常用操作及集成分词器或cdh集群部署说明
首先,如果是从http://lucene.apache.org/solr/下载的solr,基本都是自带集成的jetty服务,不需要单独搭建tomcat环境,但是要注意jdk版本,直接解压通过cmd命令 ...
- 聊聊 elasticsearch 之分词器配置 (IK+pinyin)
系统:windows 10 elasticsearch版本:5.6.9 es分词的选择 使用es是考虑服务的性能调优,通过读写分离的方式降低频繁访问数据库的压力,至于分词的选择考虑主要是根据目前比较流 ...
- Elasticsearch初步使用(安装、Head配置、分词器配置)
目录 返回目录:http://www.cnblogs.com/hanyinglong/p/5464604.html 1.ElasticSearch简单说明 a.ElasticSearch是一个基于Lu ...
随机推荐
- Spring Boot(五):Spring Boot的启动器Starter大全及自定义Starter
现有启动器Starter目录 Spring Boot应用启动器基本的一共有44种,具体如下: 1)spring-boot-starter 这是Spring Boot的核心启动器,包含了自动配置.日志和 ...
- 如何高效利用github提升自己
作为开源代码库以及版本控制系统,Github拥有超过900万开发者用户,是开发者打开程序开源大门的一扇窗口,也是开发者快速提升自己的一个重要途径.本文将从两个方面介绍github的使用方式. 和逛微博 ...
- multicast based on udp
1.概念 单播,是用于两个主机之间传送数据; 广播,是一个主机对局域网内的所有主机发送数据; 多播,又称为组播,它是对一组特定的主机通信. 将网络上同一类型业务逻辑上分组,只和组内的成员通信,其它主机 ...
- docker的使用02
自定义容器名称: docker run --name -i -t ubuntu /bin/bash docker ps -a 数据卷的使用 数据卷其实就是容器和宿主机目录之间的映射. 具体实现: su ...
- 使用GraphicsMagick/ImageMagick批量对图片瘦身
GrahpicsMagick: find . -iname "*.jpg" -exec gm convert -strip +profile "*" -qual ...
- 解决PHP编译cURL的reinstall the libcurl问题
今天正好要用到PHP的curl功能,发现服务器上的PHP并没有配置curl,进而查询PHP官方文档,得知编译PHP时需要带上 –with-curl参数,才能把curl模块编译进去.我现在PHP已经编译 ...
- Solve Equation gcd(x,y)=gcd(x+y,lcm(x,y)) gcd(x,y)=1 => gcd(x*y,x+y)=1
/** 题目:Solve Equation 链接:http://acm.hnust.edu.cn/JudgeOnline/problem.php?id=1643 //最终来源neu oj 2014新生 ...
- 2017 Wuhan University Programming Contest (Online Round) B Color 树形dp求染色方法数
/** 题目:Color 链接:https://oj.ejq.me/problem/23 题意:给定一颗树,将树上的点最多染成m种颜色,有些节点不可以染成某些颜色.相邻节点颜色不同.求染色方法数. 思 ...
- sublime和webstorm安装zencoding
[webstorm] 1.下载模板,地址为http://code.google.com/p/zen-coding/downloads/list,下载以下文件 WebIDE and IntelliJ I ...
- python笔记2 生成器 文件读写
生成器 一边循环一边计算的机制,称为生成器(Generator). 把一个列表生成式的[]改成(),就创建了一个generator: 创建了一个generator后,通过for循环来迭代它. 著名的斐 ...