Linux安装ElasticSearch-2.2.0-分词器插件(Mmseg)
1、在gitpub上搜索elasticsearch-analysis,能够看到所有elasticsearch的分词器:
2、安装Mmseg分词器:https://github.com/medcl/elasticsearch-analysis-mmseg
cd /data
git clone https://github.com/medcl/elasticsearch-analysis-mmseg.git
cd elasticsearch-analysis-mmseg mvn clean
mvn compile
mvn package
mkdir /usr/share/elasticsearch/plugins/mmseg --在plugins目录下面创建ik目录
-- copy & unzip file #{project_path}/elasticsearch-analysis-mmseg/target/elasticsearch-analysis-mmseg-*.zip to your elasticsearch's folder: plugins/mmseg
mv target/releases/elasticsearch-analysis-mmseg-1.8.0.zip /usr/share/elasticsearch/plugins/mmseg/
unzip elasticsearch-analysis-mmseg-1.8.0.zip
3、配置IK Analysis:https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis.html
在elasticsearch.yml文件的末尾处加上(http://blog.csdn.net/huwei2003/article/details/40591191)
vim /etc/elasticsearch/elasticsearch.yml index:
analysis:
analyzer:
mmseg_maxword:
type: custom
filter: [lowercase]
tokenizer: mmseg_maxword
mmseg_maxword_with_cut_letter_digi:
type: custom
filter: [lowercase,cut_letter_digit]
tokenizer: mmseg_maxword
# tokenizer:
# mmseg_maxword:
# type: mmseg
# seg_type: "max_word"
# mmseg_complex:
# type: mmseg
# seg_type: "complex"
# mmseg_simple:
# type: mmseg
# seg_type: "simple"
4、重起elasticsearch服务
service elasticsearch restart
5、测试mmseg分词器
Linux安装ElasticSearch-2.2.0-分词器插件(Mmseg)的更多相关文章
- linux(centos 7)下安装elasticsearch 5 的 IK 分词器
(一)到IK 下载 对应的版本(直接下载release版本,避免mvn打包),下载后是一个zip压缩包 (二)将压缩包上传至elasticsearch 的安装目录下的plugins下,进行解压,运行如 ...
- Elasticsearch 7.x - IK分词器插件(ik_smart,ik_max_word)
一.安装IK分词器 Elasticsearch也需要安装IK分析器以实现对中文更好的分词支持. 去Github下载最新版elasticsearch-ik https://github.com/medc ...
- Linux下,非Docker启动Elasticsearch 6.3.0,安装ik分词器插件,以及使用Kibana测试Elasticsearch,
Linux下,非Docker启动Elasticsearch 6.3.0 查看java版本,需要1.8版本 java -version yum -y install java 创建用户,因为elasti ...
- docker上安装elasticsearch和ik分词器插件和header,实现分词功能
docker run -di --name=tensquare_es -p 9200: -p 9300:9300 elasticsearch:5.6.8 创建elasticsearch容器(如果版本不 ...
- elasticsearch安装中文分词器插件smartcn
原文:http://blog.java1234.com/blog/articles/373.html elasticsearch安装中文分词器插件smartcn elasticsearch默认分词器比 ...
- Elasticsearch之中文分词器插件es-ik的自定义热更新词库
不多说,直接上干货! 欢迎大家,关注微信扫码并加入我的4个微信公众号: 大数据躺过的坑 Java从入门到架构师 人工智能躺过的坑 Java全栈大联盟 ...
- 【自定义IK词典】Elasticsearch之中文分词器插件es-ik的自定义词库
Elasticsearch之中文分词器插件es-ik 针对一些特殊的词语在分词的时候也需要能够识别 有人会问,那么,例如: 如果我想根据自己的本家姓氏来查询,如zhouls,姓氏“周”. 如 ...
- Elasticsearch之中文分词器插件es-ik(博主推荐)
前提 什么是倒排索引? Elasticsearch之分词器的作用 Elasticsearch之分词器的工作流程 Elasticsearch之停用词 Elasticsearch之中文分词器 Elasti ...
- Elasticsearch(10) --- 内置分词器、中文分词器
Elasticsearch(10) --- 内置分词器.中文分词器 这篇博客主要讲:分词器概念.ES内置分词器.ES中文分词器. 一.分词器概念 1.Analysis 和 Analyzer Analy ...
- Elasticsearch系列---使用中文分词器
前言 前面的案例使用standard.english分词器,是英文原生的分词器,对中文分词支持不太好.中文作为全球最优美.最复杂的语言,目前中文分词器较多,ik-analyzer.结巴中文分词.THU ...
随机推荐
- Creating fields using CSOM
When creating a field, whether you are using CAML, server-side object mode, or one of the client-s ...
- Struts2的Action继承ActionSupport时,利用AOP来拦截Action出现NoSuchMethodException
参考:http://zhanghua.1199.blog.163.com/blog/static/46449807201111139501298/ 做项目的时候,由于要用到在Struts2的Actio ...
- WebRTC学习之九:摄像头的捕捉和显示
较新的WebRTC源代码中已经没有了与VoiceEngine结构相应的VidoeEngine了,取而代之的是MeidaEngine.MediaEngine包括了MediaEngineInterface ...
- Android版-微信APP支付
首发地址: Android版-微信APP支付 欢迎留言.转发 微信极速开发系列文章(微信支付.授权获取用户信息等):点击这里 目录 1.注册账号.开发者认证 2.添加应用 3.申请微信支付 4.技术开 ...
- RobotFramework+Selenium2+Appium环境搭建
转载:https://www.cnblogs.com/testway/p/7372326.html 装python 2.7 RobotFramework是python2 写的,图形界面使用的wxpyt ...
- linux 查找文件或者服务
[root@localhost ~]# whereis mysql mysql: /usr/bin/mysql /usr/lib/mysql /usr/share/mysql /usr/share/m ...
- java语言特性之一
package java.util.Collections; public static int indexOfSubList(List<?> source, List<?> ...
- 【转】Java抽象类与接口的区别
很多常见的面试题都会出诸如抽象类和接口有什么区别,什么情况下会使用抽象类和什么情况你会使用接口这样的问题.本文我们将仔细讨论这些话题. 在讨论它们之间的不同点之前,我们先看看抽象类.接口各自的特性. ...
- Java中创建访问HTTPS的自签名证书的方法
一.问题: 常常在用java访问https的请求时,总是出现SSL禁止的异常.这里给大家教下怎么创建与添加证书. 二.工具 : 1.创建一个目录 2.去Github上搜索InstallCert,然后随 ...
- SQL Server中获取最新插入的自增ID
SCOPE_IDENTITY()函数 返回的是紧跟这个插入语句生成的自增ID, 若果前一个语句不是插入自增ID的,将返回NULL @@IDENTITY 返回全局的最有一个生成的自增ID,全局可用 cr ...