一、定义

官网的定义:

Solr是基于Lucene构建的流行,快速,开放源代码的企业搜索平台。它具有高度的可靠性,可伸缩性和容错能力,可提供分布式索引,复制和负载平衡查询,自动故障转移和恢复,集中式配置等。 Solr支持许多世界上最大的互联网站点的搜索和导航功能。

简单的理解solr就是一款搜索框架,通常用实现查询功能,比如电商网站的商品检索。

二、环境搭建

本文基于以下开源组件版本搭建,约定下载后组件和解压缩的文件都放置在/opt目录下

  • solr-8.2.0

  • apache-tomcat-8.5.47

首先下载solr-8.2.0.tgz,可以使用wget命令:

  1. wget http://mirrors.tuna.tsinghua.edu.cn/apache/lucene/solr/8.2.0/solr-8.2.0.tgz

解压缩:

  1. tar -zxvf solr-8.2.0.tgz -C .

解压后,/opt目录下会多一个solr-8.2.0目录

下载apache-tomcat-8.5.47:

  1. wget https://mirrors.tuna.tsinghua.edu.cn/apache/tomcat/tomcat-8/v8.5.47/bin/apache-tomcat-8.5.47.tar.gz

解压缩:

  1. tar -zxvf apache-tomcat-8.5.47.tar.gz

为了将solr部署到tomcat服务器,不使用solr自带的jetty,首先在/opt目录下创建一个目录用于部署solr服务,名称无限制,这里取名solr了。

  1. mkdir solr

复制一份tomcat到/opt/solr目录下,重命名为tomcat8

  1. cp -r apache-tomcat-8.5.47 solr/tomcat8

solr本质是一个web服务,我们将它复制到tomcat8下:

  1. cp -r solr-8.2.0/server/solr-webapp/webapp solr/tomcat8/webapps/solr

复制solr-8.2.0/server/lib/ext下的部分jar到solr目录中,为了简便可以完全复制所有的,然后忽略掉disruptor-3.4.2.jar

  1. cp solr-8.2.0/server/lib/ext/* solr/tomcat8/webapps/solr/WEB-INF/lib/

复制solr-8.2.0/server/lib下以metrics开头的jar到solr目录:

  1. cp solr-8.2.0/server/lib/metrics* solr/tomcat8/webapps/solr/WEB-INF/lib/

上面这两项注意是复制到solr服务的lib目录下,不是复制到tomcat8/lib下。

复制solr-8.2.0/server/resources下的log4j*.xml文件到solr

首先在solr创建classes目录:

  1. mkdir solr/tomcat8/webapps/solr/WEB-INF/classes

复制日志配置文件:

  1. cp solr-8.2.0/server/resources/log4j2*.xml solr/tomcat8/webapps/solr/WEB-INF/classes/

将solr-8.2.0/server/solr目录复制到solr/目录下,并重命名为solrhome:

  1. cp -r solr-8.2.0/server/solr solr/solrhome

修改日志路径

  1. vim solr/tomcat8/webapps/solr/WEB-INF/classes/log4j2.xml

指定fileName和filePattern的路径:

  1. <RollingRandomAccessFile
  2. name="MainLogFile"
  3. fileName="/opt/solr/solrhome/log/solr.log"
  4. filePattern="/opt/solr/solrhome/log/solr.log.%i" >
  5. <PatternLayout>
  6. ....

关联solr及solrhome

修改solr里的web.xml文件

  1. vim solr/tomcat8/webapps/solr/WEB-INF/web.xml

web.xml中<web-app></web-app>标签内添加如下配置,指定sorlhome路径

  1. <env-entry>
  2. <env-entry-name>solr/home</env-entry-name>
  3. <env-entry-value>/opt/solr/solrhome</env-entry-value>
  4. <env-entry-type>java.lang.String</env-entry-type>
  5. </env-entry>

注释掉下方的下列配置:

  1. <!--
  2. <security-constraint>
  3. <web-resource-collection>
  4. <web-resource-name>Disable TRACE</web-resource-name>
  5. <url-pattern>/</url-pattern>
  6. <http-method>TRACE</http-method>
  7. </web-resource-collection>
  8. <auth-constraint/>
  9. </security-constraint>
  10. <security-constraint>
  11. <web-resource-collection>
  12. <web-resource-name>Enable everything but TRACE</web-resource-name>
  13. <url-pattern>/</url-pattern>
  14. <http-method-omission>TRACE</http-method-omission>
  15. </web-resource-collection>
  16. </security-constraint>
  17. -->

最后启动tomcat,访问服务器的solr服务:

  1. sh solr/tomcat8/bin/start.sh

访问地址:

  1. localhost:8080/solr/index.html

三、配置IK分词器

首先从IK分词器下载与solr版本匹配的jar包,并放置在solr服务的lib目录下,

  1. cp ik-analyzer-8.2.0.jar solr/tomcat8/webapps/solr/WEB-INF/lib/

在solr/solrhome/下创建目录test_core,拷贝配置文件到test_core中:

  1. cp -r solr/solrhome/configsets/sample_techproducts_configs/conf/ solr/solrhome/test_core/

修改conf中的solr.xml文件,修改jar路径:

  1. <lib dir="${solr.install.dir:../}/contrib/extraction/lib" regex=".*\.jar" />
  2. <lib dir="${solr.install.dir:../}/dist/" regex="solr-cell-\d.*\.jar" />
  3. <lib dir="${solr.install.dir:../}/contrib/clustering/lib/" regex=".*\.jar" />
  4. <lib dir="${solr.install.dir:../}/dist/" regex="solr-clustering-\d.*\.jar" />
  5. <lib dir="${solr.install.dir:../}/contrib/langid/lib/" regex=".*\.jar" />
  6. <lib dir="${solr.install.dir:../}/dist/" regex="solr-langid-\d.*\.jar" />
  7. <lib dir="${solr.install.dir:../}/dist/" regex="solr-ltr-\d.*\.jar" />
  8. <lib dir="${solr.install.dir:../}/contrib/velocity/lib" regex=".*\.jar" />
  9. <lib dir="${solr.install.dir:../}/dist/" regex="solr-velocity-\d.*\.jar" />

修改managed-schema文件,添加ik分词器配置:

  1. <!-- ik分词器 -->
  2. <fieldType name="text_ik" class="solr.TextField">
  3. <analyzer type="index">
  4. <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
  5. <filter class="solr.LowerCaseFilterFactory"/>
  6. </analyzer>
  7. <analyzer type="query">
  8. <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
  9. <filter class="solr.LowerCaseFilterFactory"/>
  10. </analyzer>
  11. </fieldType>

重启solr服务,打开管理界面,添加test_core:



打开管理界面,分词示例:

Solr单机环境搭建及部署的更多相关文章

  1. Kafka 0.7.2 单机环境搭建

    Kafka 0.7.2 单机环境搭建当下载完Kafka后,进行解压,其目录结构如下: bin config contrib core DISCLAIMER examples lib lib_manag ...

  2. Solr4.8.0源码分析(4)之Eclipse Solr调试环境搭建

    Solr4.8.0源码分析(4)之Eclipse Solr调试环境搭建 由于公司里的Solr调试都是用远程jpda进行的,但是家里只有一台电脑所以不能jpda进行调试,这是因为jpda的端口冲突.所以 ...

  3. windows7 spark单机环境搭建及pycharm访问spark

    windows7 spark单机环境搭建 follow this link how to run apache spark on windows7 pycharm 访问本机 spark 安装py4j ...

  4. [转载] Hadoop和Hive单机环境搭建

    转载自http://blog.csdn.net/yfkiss/article/details/7715476和http://blog.csdn.net/yfkiss/article/details/7 ...

  5. 2-1 RHEL6.5 环境搭建与部署

    第二部分:Linux常见服务管理 2-1 RHEL6.5 环境搭建与部署 第二部分主要讲解的是开源服务搭建 学习方法与注意事项: 1. 端正态度,开始学习 2. 认真完成作业和实验(并详细记录) 3. ...

  6. kafka单机环境搭建及其基本使用

    最近在搞kettle整合kafka producer插件,于是自己搭建了一套单机的kafka环境,以便用于测试.现整理如下的笔记,发上来和大家分享.后续还会有kafka的研究笔记,依然会与大家分享! ...

  7. solr单机环境配置并包含外部单机zookeeper

    首先和之前一样下载solr-5.3.1.tgz,然后执行下面命令释放文件并放置在/usr/目录下: $ .tgz $ /usr/ $ cd /usr/solr- 这个时候先不用启动solr,因为单机模 ...

  8. Mac系统STF自动化环境搭建及部署踩坑记录

    因为公司需要寻找一个免root的自动化测试方案,所以以前做的老方案需要被替代.一阵搜寻找到了这个框架,但是部署起来很是折腾,搞了一下午终于搞定,顺便记录一下过程,有需要的自取. 转载请注明出处:htt ...

  9. HBase单机环境搭建

    在搭建HBase单机环境之前,首先你要保证你已经搭建好Java环境: $ java -version java version "1.8.0_51" Java(TM) SE Run ...

随机推荐

  1. c++ 判断两圆位置关系

    对于两圆的位置一般有五种关系: (1) 外离:两圆的半径之和小于两圆圆心距离 (2) 外切:两圆的半径之和等于两圆圆心距离 (3) 相交:两圆的半径之和大于两圆圆心距离,两圆圆心距离大于两圆半径之差 ...

  2. 使用foreach一次性添加多个单选按钮

    <?php //这个函数创建一个单选按钮 //函数接收一个论据:值 //函数也会让按钮有"黏性"-->记住你是如何填写它的. function create_radio ...

  3. 如何通过PHP将excel的数据导入MySQL中

    在开发PHP程序时,很多时候我们会有将数据批量导入数据库的需求,如学生信息批量添加到数据库中,而事先用excel编排好,对excel实行操作,便是我们比较常用的选择方式. 在对excel的操作中,ph ...

  4. 关于微信H5页面开发中音乐不自动播放的解决方法

    我想应该有很多人在做H5场景应用.H5微刊.H5微杂志的时候加入背景音乐吧(客户需求),相信很多人一定碰过不能自动播放的时候,即使是相同的iPhone 5s也有不播放的时候,很蛋疼吧!? 之前我的解决 ...

  5. windows 下mysql5.7设置密码

    学习Springboot时用到mysql数据库,以前用的mysql5.6版本 基本百度一个教程即可,听说5.7有新改动,突然想试试于是找到解压版mysql5.7照常安装, 以前用的mysql5.6版本 ...

  6. nginx动静分离与网关

    当我们请求一个网页的时候,可能会加载很多css,js,img等静态文件:一般这些文件是很久都不会变化的,所以我们为了提高页面响应速度,完全可以将这些文件缓存到浏览器中(可以理解为cookie信息),这 ...

  7. mysql复习(1)基本CRUD操作

    一.这段时间在学校,把之前的东西都好好捡起来. 0.下面介绍Mysql的最基本的增删改查操作,很多IT工作者都必须掌握的命令,也是IT面试最常考的知识点.在进行增删改查之前,先建立一个包含数据表use ...

  8. IBM公司面试题

    进入IBM差不多是每一个IT人的梦想.IBM公司向来以高素质人才作为企业持续竞争力的保证,所以经常出一些千奇百怪的面试题,来考验一个人的综合能力,以下是5道IBM曾经出过的面试题,看看你能作出几道:  ...

  9. django + celery的队列,路由与弹性

    #celery_app.py #!/usr/bin/env python # -*- coding: utf-8 -*- from __future__ import absolute_import ...

  10. Ubuntu Text editor文本编辑器相关设置

    刚开始不熟悉Ubuntu,设置个文本编辑界面都难找到: 打开后在顶上的导航栏,下拉框内有preferences: 里面可以设置视图.字体颜色等