Solr4+IKAnalyzer的安装配置

一、下载Solr4.10.2
我们以Windows版本为例，solr-4.10.2.zip是目前最新版本，下载地址：
http://www.apache.org/dyn/closer.cgi/lucene/solr/4.10.2
二、 Solr安装：

1、解压solr-4.10.2.zip

2、将 solr-4.10.2/example/webapps/solr.war 拷贝到Tomcat的webapps目录下（如D:\apache-tomcat-7.0.57\webapps），重新启动Tomcat 并访问http://localhost:8080/(目的是解压solr.war)，然后你会发现solr-4.10.2/example/webapps/下多了一个Solr的目录。

3、在D:\apache-tomcat-7.0.57\webapps\solr创建solr_home目录：

4、修改D:\apache-tomcat-7.0.57\webapps\solr\WEB-INF\web.xml 添加如下配置（apache-tomcat-7.0.56/webapps/solr/WEB-INF/web.xml）

配置solr home的地址：

   <env-entry>

   <env-entry-name>solr/home</env-entry-name>

<env-entry-value>

    D:\apache-tomcat-7.0.57\webapps\solr\solr_home

</env-entry-value>

   <env-entry-type>java.lang.String</env-entry-type>

</env-entry>

5、复制solr-4.10.2的solr-4.10.2/example/solr/ 所有内容copy到solr_home

6、复制solr-4.10.2的solr-4.10.2/example/lib/ext目录下所有文件

到 apache-tomcat-7.0.56/webapps/solr/WEB-INF/lib

复制solr-4.10.2的example/resources目录下的log4j.properties文件到Tomcat的lib下；

启动Tomcat。

访问：http://localhost:8080/solr 进入到管理界面

三、集成ikanalyzer中文分词器

1、在谷歌http://code.google.com/p/ik-analyzer/downloads/list下载IK Analyzer 2012FF_hf1解压后得到如下目录结构：

2、将IKAnalyzer2012FF_u1.jar包copy到 apache-tomcat-7.0.56/webapps/solr/WEB-INF/lib 下。

在apache-tomcat-7.0.56/webapps/solr/WEB-INF/下创建classes目录

将IKAnalyzer.cfg.xml、stopword.dic copy到 apache-tomcat-7.0.56/webapps/solr/WEB-INF/classes

3、修改apache-tomcat-7.0.56/webapps/solr/solr_home/collection1/conf/schema.xml

在第一个节点内添加如下配置：

<fieldType name="text_ik" class="solr.TextField">

<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>

<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>

 </fieldType>

将对应需要用ik分词的字段的type改为以上定义的name值 text_ik（大约120行处）：

   <field name="sku" type="text_en_splitting_tight" indexed="true" stored="true" omitNorms="true"/>

   <field name="name" type="text_ik" indexed="true" stored="true"/>

   <field name="manu" type="text_ik" indexed="true" stored="true" omitNorms="true"/>

配置完成，重启tomcat并访问http://localhost:8080/solr。发现左边可以选择分词器

根据我们配置的中文分词器，选择Manu：

分析一个熊孩子造的句子：小明吃完水果然后喝水

发现非常智能的构建出关键词了。

centos下面的配置：

创建solr目录
/usr/local/solr/tomcat
复制tomcat到指定目录cp apache-tomcat-7.0.47 /usr/local/solr/tomcat -r
将解压后的war复制到tomcat运行目录下cp solr-4.10.3.war /usr/local/solr/tomcat/webapps/solr.war
启动tomcat解压war包 ./startup.sh
查看启动情况：tail -f logs/catalina.out
关闭tomcat：./shutdown.sh
删除war包：rm -rf solr.war
复制lib包cp -f /root/solr-4.10.3/example/lib/ext/* /usr/local/solr/tomcat/webapps/solr/WEB-INF/lib
创建solrhome：cp -r /root/solr-4.10.3/example/solr /usr/local/solr/solrhome
进入/usr/local/solr/tomcat/webapps/solr/WEB-INF/
修改web.xml中，注意去掉注释
<env-entry>
       <env-entry-name>solr/home</env-entry-name>
       <env-entry-value>/usr/local/solr/solrhome</env-entry-value>
       <env-entry-type>java.lang.String</env-entry-type>
    </env-entry>

然后启动，然后访问/solr/即可

配置分词
cp IKAnalyzer2012FF_u1.jar /usr/local/solr/tomcat/webapps/solr/WEB-INF/lib
在/usr/local/solr/tomcat/webapps/solr/WEB-INF/
创建mkdir classes
复制配置文件cp ext_stopword.dic IKAnalyzer.cfg.xml mydict.dic /usr/local/solr/tomcat/webapps/solr/WEB-INF/classes

复制schema.xml到/usr/local/solr/solrhome/collection1/conf
cp -rf schema.xml /usr/local/solr/solrhome/collection1/conf
复制solrconfig.xml到/usr/local/solr/solrhome/collection1/conf
cp -rf solrconfig.xml /usr/local/solr/solrhome/collection1/conf

Solr4+IKAnalyzer的安装配置的更多相关文章

【转载】Solr4+IKAnalyzer的安装配置
转载:http://www.cnblogs.com/madyina/p/4131751.html 一.下载Solr4.10.2 我们以Windows版本为例,solr-4.10.2.zip是目前最新版 ...
Solr4.10.3安装配置
系统环境 window版本为:windows 8.1 64位软件环境 JDK版本:1.7 solr版本:4.10.3 tomcat版本:tomcat 7 安装过程步骤一:将下载好的solr-4.1 ...
solr4.5安装配置 linux+tomcat6.0+mmseg4j-1.9.1分词
首先先介绍下solr的安装配置 solr下载地址 (我这用的solr-4.5.0) 运行环境 JDK 1.5或更高版本下载地址(Solr 4以上版本,要求JDK 1.6) 我用的JDK1.6 ) ...
elasticsearch系列一：elasticsearch（ES简介、安装&配置、集成Ikanalyzer）
一.ES简介 1. ES是什么? Elasticsearch 是一个开源的搜索引擎,建立在全文搜索引擎库 Apache Lucene 基础之上用 Java 编写的,它的内部使用 Lucene 做索引 ...
elasticsearch系列一elasticsearch（ES简介、安装&配置、集成Ikanalyzer）
一.ES简介 1. ES是什么? Elasticsearch 是一个开源的搜索引擎,建立在全文搜索引擎库 Apache Lucene 基础之上用 Java 编写的,它的内部使用 Lucene 做索引 ...
Hive安装配置指北（含Hive Metastore详解）
个人主页: http://www.linbingdong.com 本文介绍Hive安装配置的整个过程,包括MySQL.Hive及Metastore的安装配置,并分析了Metastore三种配置方式的区 ...
Hive on Spark安装配置详解（都是坑啊）
个人主页:http://www.linbingdong.com 简书地址:http://www.jianshu.com/p/a7f75b868568 简介本文主要记录如何安装配置Hive on Sp ...
ADFS3.0与SharePoint2013安装配置(原创)
现在越来越多的企业使用ADFS作为单点登录,我希望今天的内容能帮助大家了解如何配置ADFS和SharePoint 2013.安装配置SharePoint2013这块就不做具体描述了,今天主要讲一下怎么 ...
Hadoop的学习--安装配置与使用
安装配置系统:Ubuntu14.04 java:1.7.0_75 相关资料官网下载地址官网文档安装我们需要关闭掉防火墙,命令如下: sudo ufw disable 下载2.6.5的版本, ...

随机推荐

LCS(打印路径) POJ 2250 Compromise
题目传送门题意:求单词的最长公共子序列,并要求打印路径分析:LCS 将单词看成一个点,dp[i][j] = dp[i-1][j-1] + 1 (s1[i] == s2[j]), dp[i][j] ...
JavaScript基础知识总结
正则表达式: 是一种专门用于操作字符串规则. 正则表达式: 通过一些符号来表达,简化对字符串的复杂操作. 弊端:阅读性较差常见操作: 1.匹配 String matches(regex) 2.获取( ...
【wikioi】2216 行星序列（线段树）
http://wikioi.com/problem/2216/ 这题太让我感动了QAQ,让我找到了我一直以来写线段树的错误!!!! 就是,pushdown一定要放在最前面!要不然顺序会错.也就是说,当 ...
Java中实现文件上传下载的三种解决方案
第一点:Java代码实现文件上传 FormFile file=manform.getFile(); String newfileName = null; String newpathname=null ...
lightning mdb 源代码分析（2）
本系列前一篇已经分析了lightningmdb的整体架构和主要的数据结构.本文将介绍一下MMAP原理以及lmdb中如何使用它. 1. Memory Map原理内存映射文件与虚拟内存有些类似,通过内存 ...
DTD约束的校验工具安装及检验（Iexmltls工具）
通过打开我们写的dtd约束文档,我们可以看到,在我们不按规定的格式打开xml时并不能检验出错误.此时我们可以借助软件来帮助我们校验. Iexmltls是一个在IE浏览器下安装的用于检验xml约束是否正 ...
TinyMCE在线编辑器使用方法初探
首先,下载TinyMCE包,地址:http://www.tinymce.com/ 然后将下载后的包解压,放置到一个文件夹下,创建一个html文件,并在其中书写如下代码: <!DOCTYPE ht ...
连连看beta发布
组名:天天向上组长:王森组员:张政.张金生.林莉.胡丽娜代码地址:HTTPS:https://git.coding.net/jx8zjs/llk.git SSH:git@git.coding.n ...
html5：服务器事件推送（server-sent events）Asp.net
支持不支持IE 个人理解说明个人理解:这种消息推送方式不太推广,原因有以下三点~~~`我怎么老是学这些自己认为不会推广的东西呢~汗在.net中,framework4.5以上就可以由SignalR ...
gcc/g++链接时.o文件及库的顺序问题
折腾gcc/g++链接时.o文件及库的顺序问题链接静态库的顺序问题 GCC 编译使用动态链接库和静态链接库--及先后顺序----及环境变量设置总结

Solr4+IKAnalyzer的安装配置

Solr4+IKAnalyzer的安装配置的更多相关文章

随机推荐

热门专题