Solr6.6 IK 中文分词的配置和使用

　　1. 首先，下载IKAnalyzer ，下载

　　2. 将ik的相关文件拷贝到 webapps\solr\WEB-INF\lib 目录下

　　　或者存放solr-6.6.0\server\solr\test\lib下面，就是在核test下面建立lib文件夹，把对应组件放在lib下面

　　修改solrconfig.xml，增加如下：

 <lib dir="./lib" regex=".*\.jar"/>

　　3. 在 solr-6.6.0\server\solr\test\conf\managed-schema增加如下配置

 <fieldType name="text_ik" class="solr.TextField">

    <analyzer type="index" >

      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>

      <filter class="solr.StopFilterFactory" ignoreCase="true" words="lang/CNstopwords.txt" />

    </analyzer>

    <analyzer type="query">

      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>

      <filter class="solr.StopFilterFactory" ignoreCase="true" words="lang/CNstopwords.txt" />

    </analyzer>

  </fieldType>

CNstopwords.txt为通用词文件

　　或

<!-- 我添加的IK分词 -->

         <fieldType name="text_ik" class="solr.TextField">

                   <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>

                   <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>

         </fieldType>

　　同时，把需要分词的字段，设置为text_ik，

  <field name="pathsummary"      type="text_ik"   indexed="true"  stored="true"  multiValued="false" />

  <field name="attr_content"      type="text_ik"   indexed="true"  stored="true"  multiValued="false" />

　　4、在admin后台， analysis 下查看分词效果

Solr6.6 IK 中文分词的配置和使用的更多相关文章

真分布式SolrCloud+Zookeeper+tomcat搭建、索引Mysql数据库、IK中文分词器配置以及web项目中solr的应用(1)
版权声明:本文为博主原创文章,转载请注明本文地址.http://www.cnblogs.com/o0Iris0o/p/5813856.html 内容介绍: 真分布式SolrCloud+Zookeepe ...
Solr学习总结（八）IK 中文分词的配置和使用
最近,很多朋友问我solr 中文分词配置的问题,都不知道怎么配置,怎么使用,原以为很简单,没想到这么多朋友都有问题,所以今天就总结总结中文分词的配置吧. 有的时候,用户搜索的关键字,可能是一句话,不是 ...
Solr5.5.1 IK中文分词配置与使用
前言用过Lucene.net的都知道,我们自己搭建索引服务器时和解决搜索匹配度的问题都用到过盘古分词.其中包含一个词典. 那么既然用到了这种国际化的框架,那么就避免不了中文分词.尤其是国内特殊行业比 ...
Solr6.6.0添加IK中文分词器
IK分词器就是一款中国人开发的,扩展性很好的中文分词器,它支持扩展词库,可以自己定制分词项,这对中文分词无疑是友好的. jar包下载链接:http://pan.baidu.com/s/1o85I15o ...
Solr7.2.1环境搭建和配置ik中文分词器
solr7.2.1环境搭建和配置ik中文分词器安装环境:Jdk 1.8. windows 10 安装包准备: solr 各种版本集合下载:http://archive.apache.org/dist ...
Solr学习笔记之2、集成IK中文分词器
Solr学习笔记之2.集成IK中文分词器一.下载IK中文分词器 IK中文分词器此文IK版本:IK Analyer 2012-FF hotfix 1 完整分发包二.在Solr中集成IK中文分词器 ...
2.IKAnalyzer 中文分词器配置和使用
一.配置 IKAnalyzer 中文分词器配置,简单,超简单. IKAnalyzer 中文分词器下载,注意版本问题,貌似出现向下不兼容的问题,solr的客户端界面Logging会提示错误. 给出我配置 ...
对本地Solr服务器添加IK中文分词器实现全文检索功能
在上一篇随笔中我们提到schema.xml中<field/>元素标签的配置,该标签中有四个属性,分别是name.type.indexed与stored,这篇随笔将讲述通过设置type属性的 ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（十九）ES6.2.2 安装Ik中文分词器
注: elasticsearch 版本6.2.2 1)集群模式,则每个节点都需要安装ik分词,安装插件完毕后需要重启服务,创建mapping前如果有机器未安装分词,则可能该索引可能为RED,需要删除后 ...

随机推荐

hdu 1533(最小费用最大流)
Going Home Time Limit: 10000/5000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total ...
从零开始，学习web前端之HTML5开发
什么是HTML5 HTML5是HTML最新的修订版本,2014年10月由万维网联盟(W3C)完成标准制定.是下一代 HTML 标准. 为什么要学习HTML5 HTML5定义了一系列新元素,如新语义标签 ...
ajaxReturn 之前dump调试，导致$.ajax不能正常运行
ajaxReturn 之前dump调试,导致$.ajax不能正常运行以后调试的时候,注意下这个情况
tp3.23 nginx lnmp填坑
thinkphp3.23在apache上可以轻松实现4个路由模式但是在nginx上就出现问题我们的环境是用lnmp包实现(地址:https://lnmp.org/) 安装完成后,ta的lnmp的n ...
HDU 5128.The E-pang Palace-计算几何
The E-pang Palace Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 512000/512000 K (Java/Othe ...
POJ1958 Strange Towers of Hanoi [递推]
题目传送门 Strange Towers of Hanoi Time Limit: 1000MS Memory Limit: 30000K Total Submissions: 3117 Ac ...
Bzoj4016/洛谷P2993 [FJOI2014] 最短路径树问题（最短路径问题+长链剖分/点分治）
题面 Bzoj 洛谷题解首先把最短路径树建出来(用$Dijkstra$,没试过$SPFA$$\leftarrow$它死了),然后问题就变成了一个关于深度的问题,可以用长链剖分做,所以我 ...
matlab学习之绘制参数曲线，添加辅助线以及颜色设置
粘贴代码 % 插入参数曲线h % 插入辅助线h1 % 并设置颜色,包括画布颜色和曲线颜色 t=-pi:0.1:pi; x=cos(t)-sin(3*t); y=sin(t).*cos(t)-cos(3 ...
文件包含漏洞检测工具fimap
文件包含漏洞检测工具fimap 在Web应用中,文件包含漏洞(FI)是常见的漏洞.根据包含的文件不同,它分为本地文件包含漏洞(LFI)和远程文件包含漏洞(RFL).利用该漏洞,安全人员可以获取服务 ...
【极角排序】【扫描线】hdu6127 Hard challenge
平面上n个点,每个点带权,任意两点间都有连线,连线的权值为两端点权值之积.没有两点连线过原点.让你画一条过原点直线,把平面分成两部分,使得直线穿过的连线的权值和最大. 就把点极角排序后,扫过去,一侧的 ...

Solr6.6 IK 中文分词的配置和使用

Solr6.6 IK 中文分词的配置和使用的更多相关文章

随机推荐

热门专题