Solr 集成ikanalyzer

Solr 不能对中文进行分词，ikanalyzer可以。

ikanalyzer下载链接

1.下载 jar形式

2.放到`D:\soft\solr-8.1.0\server\solr-webapp\webapp\WEB-INF\lib`路径下

3.在路径`D:\soft\solr-8.1.0\server\solr`下，新建一个mycore

4. 复制路径`D:\soft\solr-8.1.0\example\example-DIH\solr\solr`下所有文件，放到`D:\soft\solr-8.1.0\server\solr\mycore`

5.找到`D:\soft\solr-8.1.0\server\solr\mycore\conf` 路径下的managed-schema文件，打开，加入下面的代码

<!-- ik分词器 -->

	<fieldType name="text_ik" class="solr.TextField">

	  <analyzer type="index">

		  <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>

		  <filter class="solr.LowerCaseFilterFactory"/>

	  </analyzer>

	  <analyzer type="query">

		  <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>

		  <filter class="solr.LowerCaseFilterFactory"/>

	  </analyzer>

	</fieldType>

6.重启solr `solr restart -p 8983` ,浏览器输入： http://localhost:8983

7.自定义分词索引

7.1 在路径`D:\soft\solr-8.1.0\server\solr-webapp\webapp\WEB-INF`下，新建classes文件。

7.2 解压 ik-analyzer-solr7-7.x.jar ,复制 ext.dic，IKAnalyzer.cfg.xml，stopword.dic 这三个文件。

7.3 将上面复制的三个文件放到classes里。

8.对比测试在ext.dic文件里加上一个索引: 黑夜给了我黑色的眼睛，

然后重启solr `solr restart -p 8983` ,浏览器输入： http://localhost:8983

参考文章 : solr7.3 环境搭建配置中文分词器 ik-analyzer-solr7 详细步骤

Solr 集成ikanalyzer的更多相关文章

solr服务中集成IKAnalyzer中文分词器、集成dataimportHandler插件
昨天已经在Tomcat容器中成功的部署了solr全文检索引擎系统的服务:今天来分享一下solr服务在海量数据的网站中是如何实现数据的检索. 在solr服务中集成IKAnalyzer中文分词器的步骤: ...
elasticsearch系列一：elasticsearch（ES简介、安装&配置、集成Ikanalyzer）
一.ES简介 1. ES是什么? Elasticsearch 是一个开源的搜索引擎,建立在全文搜索引擎库 Apache Lucene 基础之上用 Java 编写的,它的内部使用 Lucene 做索引 ...
elasticsearch系列一elasticsearch（ES简介、安装&配置、集成Ikanalyzer）
一.ES简介 1. ES是什么? Elasticsearch 是一个开源的搜索引擎,建立在全文搜索引擎库 Apache Lucene 基础之上用 Java 编写的,它的内部使用 Lucene 做索引 ...
solr集成mmseg4j分词
solr集成mmseg4j分词 mmseg4j https://code.google.com/p/mmseg4j/ https://github.com/chenlb/mmseg4j-solr 作者 ...
nutch和solr集成
Linux下的Nutch和solr集成 3.1.Nutch安装 l 解压 tar -zxvf apache-nutch-1.4-bin.tar.gz l 终端下cd到目录 apache-nutch- ...
solr配置IKAnalyzer抛出ClassNotFoundException
这个问题搞了很久,在QQ群上问了很久,关键很气人的是我居然被群主给开了.我也是醉了.我不知道我哪里得罪了那个solr群的群主. 废话不多说.抛出的异常如下: 刚开始一直认为是没有找到类,也就相当于没找 ...
玩转大数据系列之Apache Pig如何与Apache Solr集成（二）
散仙,在上篇文章中介绍了,如何使用Apache Pig与Lucene集成,还不知道的道友们,可以先看下上篇,熟悉下具体的流程. 在与Lucene集成过程中,我们发现最终还要把生成的Lucene索引,拷 ...
Solr集成IK中文分词器
1.将IKAnalyzer-2012-4x.jar拷贝到example\solr-webapp\webapp\WEB-INF\lib下: 2.在schema.xml文件中添加fieldType: &l ...
Solr配置Ikanalyzer分词器
上一篇文章讲解在win系统中如何安装solr并创建一个名为test_core的Core,接下为text_core配置Ikanalyzer 分词器 1.打开text_core的instanceDir目录 ...

随机推荐

Linux 之文件
文件名称在linux中,windows概念中的文件夹和文件是没有区别的,都是统称为文件. 1.Linux中文件的名称大小写是敏感的 2.名称最多可以为255个字符 3.除了正斜线以外,都是有效字符 ...
OSI七层模型的新认识
OSI 七层模型是internet的基石,它并没有制定一个标准,规定我们要怎么去做.美国军方曾把它精简到四层,只是站在了更实用的层次. 我们先来看看这个模型. 应用层->Applicatio ...
更改Ubuntu下默认Python版本
更改Ubuntu下默认Python版本首先查看系统内有哪些版本的Python ls /usr/bin/python* 查看当前python版本 python --version 基于用户修改默认版本 ...
18.父组件给子组件传值&方法
1.父组件给子组件传值 2.父组件把方法传递给子组件
PAT基础级-钻石段位样卷2-7-4 6翻了 (15 分)
“666”是一种网络用语,大概是表示某人很厉害.我们很佩服的意思.最近又衍生出另一个数字“9”,意思是“6翻了”,实在太厉害的意思.如果你以为这就是厉害的最高境界,那就错啦 —— 目前的最高境界是数字 ...
PHP message: PHP Fatal error: Allowed memory size of 134217728 bytes exhausted 错误
php运行一段时间后,部分页面打不开,查看nginx日志里面一直在报PHP message: PHP Fatal error: Allowed memory size of 134217728 by ...
Luogu P1294 高手去散步
Luogu P1294 高手去散步因为数据较小,所以用邻接矩阵存图即可. 将1号点到$t$号点分别设为起点,深搜遍历路线,开一个$vis$数组,记录每一个点是否被访问过.每次求出从当前起点出发的最大 ...
php版网站站打包程序【配合webshell】（原创）
因为大马只能下载一些单文件,无法下载文件夹里的文件,所以花费一些时间写了一个PHP脚本,打包全站数据,在此分享!切勿做违法事情! 使用方法: 1.将该程序上传到网站的目录下,如/zip.php : 2 ...
BZOJ3514 GERALD07加强版
GERALD07 Description N个点M条边的无向图,询问保留图中编号在[l,r]的边的时候图中的联通块个数. Input 第一行四个整数N.M.K.type,代表点数.边数.询问数以及询问 ...
多任务udp聊天器完整版
import socket import threading def send_msg(udp_socket,dest_ip,dest_port): while True: send_data = i ...

Solr 集成ikanalyzer

Solr 不能对中文进行分词，ikanalyzer可以。

ikanalyzer下载链接

1.下载 jar形式

2.放到D:\soft\solr-8.1.0\server\solr-webapp\webapp\WEB-INF\lib路径下

3.在路径D:\soft\solr-8.1.0\server\solr下，新建一个mycore

4. 复制 路径D:\soft\solr-8.1.0\example\example-DIH\solr\solr下所有文件，放到D:\soft\solr-8.1.0\server\solr\mycore

5.找到D:\soft\solr-8.1.0\server\solr\mycore\conf 路径下的managed-schema文件，打开，加入下面的代码

6.重启solr solr restart -p 8983 ,浏览器 输入 ： http://localhost:8983

7.自定义分词索引

7.1 在路径D:\soft\solr-8.1.0\server\solr-webapp\webapp\WEB-INF下，新建classes文件。

7.2 解压 ik-analyzer-solr7-7.x.jar ,复制 ext.dic，IKAnalyzer.cfg.xml，stopword.dic 这三个文件。

7.3 将上面复制的三个文件放到classes里。

8.对比测试 在ext.dic文件里加上一个索引: 黑夜给了我黑色的眼睛，

然后重启solr solr restart -p 8983 ,浏览器 输入 ： http://localhost:8983

参考文章 : solr7.3 环境搭建 配置中文分词器 ik-analyzer-solr7 详细步骤

Solr 集成ikanalyzer的更多相关文章

随机推荐

热门专题

2.放到`D:\soft\solr-8.1.0\server\solr-webapp\webapp\WEB-INF\lib`路径下

3.在路径`D:\soft\solr-8.1.0\server\solr`下，新建一个mycore

4. 复制路径`D:\soft\solr-8.1.0\example\example-DIH\solr\solr`下所有文件，放到`D:\soft\solr-8.1.0\server\solr\mycore`

5.找到`D:\soft\solr-8.1.0\server\solr\mycore\conf` 路径下的managed-schema文件，打开，加入下面的代码

6.重启solr `solr restart -p 8983` ,浏览器输入： http://localhost:8983

7.1 在路径`D:\soft\solr-8.1.0\server\solr-webapp\webapp\WEB-INF`下，新建classes文件。

8.对比测试在ext.dic文件里加上一个索引: 黑夜给了我黑色的眼睛，

然后重启solr `solr restart -p 8983` ,浏览器输入： http://localhost:8983

参考文章 : solr7.3 环境搭建配置中文分词器 ik-analyzer-solr7 详细步骤