solr-6.4.2安装+分词器配置
一、solr安装
solr下载地址:http://archive.apache.org/dist/lucene/solr/6.4.2/
1、解压solr软件包:
tar xf solr-6.4.2.tgz
2、copy需要的文件以及jar包
将solr项目copy到tomcat的webapps目录下并命名为solr
cp -r solr-6.4.2/server/solr-webapp/webapp /data/tomcat/webapps/solr
将solr-6.4.2/server/lib/ext/目录下的jar文件复制到solr/WEB-INF/lib/目录下
cp solr-6.4.2/server/lib/ext/* /data/tomcat/webapps/solr/WEB-INF/lib/
将solr-6.4.2/dist/目录下的solr-dataimporthandler-6.4.2.jar和solr-dataimporthandler-extras-6.4.2.jar文件复制到solr/WEB-INF/lib/目录下
cd solr-6.4.2/dist/
cp solr-dataimporthandler-6.4.2.jar solr-dataimporthandler-extras-6.4.2.jar /data/tomcat/webapps/solr/WEB-INF/lib/
3、创建solr的家目录并去web.xml中配置
将solr-6.4.2/server/solr目录复制到data目录下并更名为solr-home
cp -r solr-6.4.2/server/solr /data/solr-home
vim /data/tomcat/webapps/solr/WEB-INF/web.xml修改solr-home的目录位置
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>/data/tomcat/solr-home</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
4、在tomcat下的solr项目的WEB-INF下创建classes目录,然后把solr-6.4.2/server/resources下的log4j.properties粘贴过去
mkdir /data/tomcat/pre_publish_solr/webapps/solr/WEB-INF/classes
cp solr-6.4.2/server/resources/log4j.properties /data/tomcat/webapps/solr/WEB-INF/classes/
把solr-6.4.2/server/lib下的metrics-core-3.1.2.jar、metrics-ganglia-3.1.2.jar、metrics-graphite-3.1.2.jar、metrics-jetty9-3.1.2.jar、metrics-jvm-3.1.2.jar这几个jar包放到tomcat下的solr项目的WEB-INF/lib目录下。否则会抛出异常
cd solr-6.4.2/server/lib
cp metrics-core-3.1.2.jar metrics-ganglia-3.1.2.jar metrics-graphite-3.1.2.jar metrics-jetty9-3.1.2.jar metrics-jvm-3.1.2.jar /data/tomcat/webapps/solr/WEB-INF/lib/
5、配置solr的访问权限
solr默认限制了对solr资源的访问,在tomcat中solr下修改web.xml:
本人的修改方法是注释掉了禁止追踪,保留了Enable everything but TRACE,访问时正常的
<!--security-constraint>
<web-resource-collection>
<web-resource-name>Disable TRACE</web-resource-name>
<url-pattern>/</url-pattern>
<http-method>TRACE</http-method>
</web-resource-collection>
<auth-constraint/>
</security-constraint-->
二、分词器配置
solr-6.4.2配置中文分词器IK Analyzer
1、将ik-analyzer-solr6.x.jar复制到tomcat\webapps\solr\WEB-INF\lib目录下
2、将stopword.dic、IKAnalyzer.cfg.xml复制到tomcat\webapps\solr\WEB-INF\classes
3、修改schema文件,打开solr_home\new_core\conf\managed-schema文件,添加IK分词器配置
<fieldType name="text_ik" class="solr.TextField">
<!--索引时候的分词器-->
<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<!--查询时候的分词器-->
<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
solr-6.4.2安装+分词器配置的更多相关文章
- 真分布式SolrCloud+Zookeeper+tomcat搭建、索引Mysql数据库、IK中文分词器配置以及web项目中solr的应用(1)
版权声明:本文为博主原创文章,转载请注明本文地址.http://www.cnblogs.com/o0Iris0o/p/5813856.html 内容介绍: 真分布式SolrCloud+Zookeepe ...
- Solr入门之(8)中文分词器配置
Solr中虽然提供了一个中文分词器,但是效果很差,可以使用IKAnalyzer或Mmseg4j 或其他中文分词器. 一.IKAnalyzer分词器配置: 1.下载IKAnalyzer(IKAnalyz ...
- solr英文使用的基本分词器和过滤器配置
solr英文应用的基本分词器和过滤器配置 英文应用分词器和过滤器一般配置顺序 索引(index): 1:空格 WhitespaceTokenizer 2:过滤词(停用词,如:on.of.a.an ...
- Solr IK分词器配置
下载地址:https://search.maven.org/search?q=com.github.magese 分词器配置: 参考:https://www.cnblogs.com/mengjinlu ...
- 2.IKAnalyzer 中文分词器配置和使用
一.配置 IKAnalyzer 中文分词器配置,简单,超简单. IKAnalyzer 中文分词器下载,注意版本问题,貌似出现向下不兼容的问题,solr的客户端界面Logging会提示错误. 给出我配置 ...
- Solr6.5.0配置中文分词器配置
准备工作: solr6.5.0安装成功 1.去官网https://github.com/wks/ik-analyzer下载IK分词器 2.Solr集成IK a)将ik-analyzer-solr6.x ...
- solr常用操作及集成分词器或cdh集群部署说明
首先,如果是从http://lucene.apache.org/solr/下载的solr,基本都是自带集成的jetty服务,不需要单独搭建tomcat环境,但是要注意jdk版本,直接解压通过cmd命令 ...
- 聊聊 elasticsearch 之分词器配置 (IK+pinyin)
系统:windows 10 elasticsearch版本:5.6.9 es分词的选择 使用es是考虑服务的性能调优,通过读写分离的方式降低频繁访问数据库的压力,至于分词的选择考虑主要是根据目前比较流 ...
- Elasticsearch初步使用(安装、Head配置、分词器配置)
目录 返回目录:http://www.cnblogs.com/hanyinglong/p/5464604.html 1.ElasticSearch简单说明 a.ElasticSearch是一个基于Lu ...
随机推荐
- Android解决button反复点击问题
public class BaseActivity extends Activity { protected boolean isDestroy; //防止反复点击设置的标志.涉及到点击打开其它Act ...
- POJ 2528 Mayor's posters 离散化+线段树
题目大意:给出一些海报和贴在墙上的区间.问这些海报依照顺序贴完之后,最后能后看到多少种海报. 思路:区间的范围太大,然而最多仅仅会有10000张海报,所以要离散化. 之后用线段树随便搞搞就能过. 关键 ...
- 服务器中很多的CLOSE_WAIT
服务器中很多的CLOSE_WAIT,请教各位大虾!!!!!!!!!最近遇到一个问题,工程在LINUX服务器上面跑起来了以后,运行一段时间 就有很多的CLOSE_WAIT链接,多了之后,网站就访问不了了 ...
- web开发中经常使用的js
将自己在web开发中经经常使用到的一些JS总结一下. 1.改动标签和表单的值 改动标签的值: var customer = document.getElementById("custm&qu ...
- get方式请求乱码
-----------------jsp--------------- var search = $("#searchName").val();search = encodeURI ...
- Sublime 正则 替换方法
- android中TabHost和RadioGroup
android底部菜单应用 博客分类: android--UI示例 TabHostMenuRadioGroupButton 在android中实现菜单功能有多种方法. Options Menu:用户 ...
- OpenCV学习笔记十八:opencv_flann模块
一,简介: Fast Library for Approximate Nearest Neighbors (FLANN)算法库.
- 多线程编程中的join函数
# coding: utf-8 # 测试多线程中join的功能 import threading, time def doWaiting(): print 'start waiting1: ' + t ...
- Laravel 5.1 Blade模板引擎
为什么要使用blade 它是干什么用的? blade模板引擎使我们写HTML页面的地方,使用它是因为它能给我们提供很多的遍历,减少代码的重复率 提高开发效率.我们写blade的路径是 resource ...