ElasticSearch5中文分词(IK)

ElasticSearch安装

官网：https://www.elastic.co

1.ElasticSearch安装

1.1.下载安装公共密钥

rpm --import https://artifacts.elastic.co/GPG-KEY-elasticsearch

1.2.在 /etc/yum.repos.d/ 目录下建立 elasticsearch.repo 文件

vim /etc/yum.repos.d/elasticsearch.repo

在文件中写入：

[elasticsearch-5.x]

name=Elasticsearch repository for 5.x packages

baseurl=https://artifacts.elastic.co/packages/5.x/yum

gpgcheck=1

gpgkey=https://artifacts.elastic.co/GPG-KEY-elasticsearch

enabled=1

autorefresh=1

type=rpm-md

保存退出

1.3.使用yum安装

yum install elasticsearch

1.4.添加系统服务

chkconfig --add elasticsearch

service elasticsearch start  //启动

service elasticsearch stop  //关闭

service elasticsearch status//查看状态

启动后访问 localhost:9200 得到

{

  "name" : "Cp8oag6",

  "cluster_name" : "elasticsearch",

  "cluster_uuid" : "AT69_T_DTp-1qgIJlatQqA",

  "version" : {

    "number" : "5.0.1",

    "build_hash" : "f27399d",

    "build_date" : "2016-11-21T09:51:41.449Z",

    "build_snapshot" : false,

    "lucene_version" : "6.2.1"

  },

  "tagline" : "You Know, for Search"

}

2 安装ik中文分词插件

2.1 ik git地址 https://github.com/medcl/elasticsearch-analysis-ik

克隆ik

git clone https://github.com/medcl/elasticsearch-analysis-ik

git checkout tags/v5.0.1 切换版本 版本号可以修改

2.2 通过java工具打包

mvn package

如果提示 mvn 不存在看下面

打包后在 target/releases/ 这个路径下面有一个 elasticsearch-analysis-ik-{version}.zip 这个文件将这个压缩文件复制到 ElasticSearch 下plugins/ik 目录下然后解压

我的 plugins 目录是 /usr/share/elasticsearch/plugins 这个路

建立 ik 目录

mkdir /usr/share/elasticsearch/plugins/ik

复制文件

cp  ./target/releases/elasticsearch-analysis-ik-{version}.zip  /usr/share/elasticsearch/plugins/ik

解压

cd /usr/share/elasticsearch/plugins/ik

unzip elasticsearch-analysis-ik-{version}.zip

2.3 将ik 插件安装到 ElasticSearch中

创建索引m8：

http put 'http://localhost:9200/m8'

如果提示http put不存在看下面

为索引（m8）及类型（logs）下的字段（message）设置分词器（分词器可选ik_smart或ik_max_word）：

http put localhost:9200/m8 -d '{

    "settings" : {

        "analysis" : {

            "analyzer" : {

                "ik" : {

                    "tokenizer" : "ik_smart"

                }

            }

        }

    },

    "mappings" : {

        "logs" : {

            "dynamic" : true,

            "properties" : {

                "message" : {

                    "type" : "string",

                    "analyzer" : "ik_smart"

                }

            }

        }

    }

}'

案例

http://192.168.199.115:9200/m8/_analyze?analyzer=ik_max_word&text=南京市长江大桥

结果

参数说明：

ik_max_word: 会将文本做最细粒度的拆分，比如会将“中华人民共和国国歌”拆分为“中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,和,国国,国歌”，会穷尽各种可能的组合；

ik_smart: 会做最粗粒度的拆分，比如会将“中华人民共和国国歌”拆分为“中华人民共和国,国歌”。

mvn 不存在看下面解决：

1.安装java的jdk

官网下载地址http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

下载rpm包：

wget  http://download.oracle.com/otn-pub/java/jdk/8u111-b14/jdk-8u111-linux-x64.rpm?AuthParam=1479708556_19e817839b0ee72d40569ae8a23689d0

安装：

rpm  -ivh jdk-8u111-linux-x64.rpm

设置环境变量：

vim  /etc/profile

在最后添加

JAVA_HOME=/usr/java/jdk1.8.0_111

JRE_HOME=/usr/java/jdk1.8.0_111/jre

PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin

CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib

export JAVA_HOME JRE_HOME PATH CLASSPATH

立即生效：

source /etc/profile

验证：

 java -version

安装 maven 就是 mvn 命令他需要java 才能运行

wget http://repos.fedorapeople.org/repos/dchen/apache-maven/epel-apache-maven.repo -O /etc/yum.repos.d/epel-apache-maven.repo

yum -y install apache-maven

http put不存在问题：

yum install httpie

转载请注明来源 http://www.cnblogs.com/phpshen/p/6085274.html

分类: linux

ES5中文分词(IK)的更多相关文章

ElasticSearch5中文分词(IK)
ElasticSearch安装官网:https://www.elastic.co 1.ElasticSearch安装 1.1.下载安装公共密钥 rpm --import https://artifa ...
ElasticSearch5.6.1 + 中文分词(IK)
在安装ElasticSearch 需要先安装java 的 jdk 可以通过命令来确认是否已经安装了 java -version 如果没有安装可以使用 yum 直接安装通过. 先通过命令查看yum源 ...
elasticsearch 口水篇（8）分词中文分词 ik插件
先来一个标准分词(standard),配置如下: curl -XPUT localhost:9200/local -d '{ "settings" : { "analys ...
java中调用ElasticSearch中文分词ik没有起作用
问题描述: 项目中已经将'齐鲁壹点'加入到扩展词中,但是使用客户端调用的时候,高亮显示还是按照单个文字分词的: 解决方案: 1.创建Mapping使用的分词使用ik 2.查询使用QueryBuilde ...
为Elasticsearch添加中文分词，对比分词器效果
http://keenwon.com/1404.html Elasticsearch中,内置了很多分词器(analyzers),例如standard (标准分词器).english(英文分词)和chi ...
Ubuntu16.04下安装elasticsearch+kibana实现php客户端的中文分词
1.下载安装java, elasticsearch和kibana apt-get install default-jre default-jdk wget https://artifacts.elas ...
Elasticsearch 中文分词(elasticsearch-analysis-ik) 安装
由于elasticsearch基于lucene,所以天然地就多了许多lucene上的中文分词的支持,比如 IK, Paoding, MMSEG4J等lucene中文分词原理上都能在elasticsea ...
为 Elasticsearch 添加中文分词，对比分词器效果
转自:http://keenwon.com/1404.html 为 Elasticsearch 添加中文分词,对比分词器效果 Posted in 后端 By KeenWon On 2014年12月12 ...
Lucene开发实例：Lucene中文分词(转载)
1.准备工作下载lucene 3.6.1 : http://lucene.apache.org/下载中文分词IK Analyzer: http://code.google.com/p/ik-analy ...

随机推荐

memory 监控 mysql vs percona vs maria
oracle mysql 5.7 在performance_schema 通过以下表展现内存信息.这些表实际engine为performance_schema.这些表数据实际是以数组的形式存储在内存中 ...
Vue学习之路7-v-on指令学习之简单事件绑定
前言在JavaScript中任何一个DOM元素都有其自身存在的事件对象,事件对象代表事件的状态,比如事件在其中发生的元素.键盘按键的状态.鼠标的位置和鼠标按钮的状态等.事件通常与函数结合使用,函数不 ...
Vue编写的todolist小例子
Vue编写的todolist小例子本篇博客主要包含一个内容: 1.第一个内容:使用Vue编写todolist例子,包含的主要知识是v-model,v-for,el表达式,以及Vue中使用method ...
Spring的AOP开发的相关术语
转载自 https://www.cnblogs.com/ltfxy/p/9873618.html SpringAOP简介: AOP思想最早是由AOP联盟组织提出的.Spring使用这种思想最好的框架. ...
spark program guide
概述 Spark 应用由driver program 组成,driver program运行用户的主函数,在集群内并行执行各种操作主要抽象RDD: spark提供RDD,是贯穿整个集群中所有节点的分 ...
JavaScript在网页中使用以及注意事项
<script>标签的解析<script>xxx</script>这组标签,是用于在 html 页面中插入 js 的主要方法.它主要有以下几个属性:charset: ...
Visual Studio Code 支持TensorFlow配置支持
首先选择解释器选择TensorFlow版本的conda版本 (当然你如果是通过python单独安装的TensorFlow也可以) 编辑器输入代码,进行测试 import tensorflow as ...
转://云和恩墨的两道Oracle面试题
真题1. 对于一个NUMBER(1)的列,如果查询中的WHERE条件分别是大于3和大于等于4,那么这二者是否等价? 答案:首先对于查询结果而言,二者没有任何区别.从这一点上讲无论是指定大于3还是指定大 ...
filter 实现登录状态控制
每天学习一点点编程PDF电子书.视频教程免费下载:http://www.shitanlife.com/code 网站需要做用户登录鉴权控制,没有登录的话,不能访问网站,提示需要登录. 实现方式: 使 ...
Linux：Day3 文件系统
Linux的文件系统: 根文件系统(rootfs):root filesystem /boot:引导文件存放目录:内核文件(vmlinuz).引导加载器(bootloader,grub)都存放于此目录 ...

ES5中文分词(IK)

ElasticSearch5中文分词(IK)

ES5中文分词(IK)的更多相关文章

随机推荐

热门专题