前言

elasticsearch(下面简称ES,安装ES点击这里)的自带standard分词只能把汉语分割成一个个字,而不能分词、分段,这就是我们需要分析器ik的地方了。

http://{ip}:9200/_analyze?analyzer=standard&pretty=true&text=sojson中华人民共和国

  

访问浏览器(虚拟机IP:9200)查看你elasticsearch的版本号

一、下载ik的相应版本

查看版本和下载链接点击这里

这里提供5.0.0的ES及以前的版本对应的ik版本

二、下载的方式

我这里的ES是2.3.5,对应的ik版本是1.9.5

在版本里选择1.9.5,点击 【Download ZIP】右键选择 -- 复制链接地址

wget https://github.com/medcl/elasticsearch-analysis-ik/archive/v1.9.5.zip

三、解包(如果没有unzip命令的使用  yum install zip unzip *  命令安装)

unzip v1.9.5.zip 

四、 打包

因为是java的源码,需要用maven打包

进入解压后的目录elasticsearch-analysis-ik-1.10.1里面,输入下面命令进行打包

cd elasticsearch-analysis-ik-1.9./

mvn clean package

(注:如果没有mvn的可以直接使用 yum install java* 进行安装,把ES的环境也一起配置好)

五、配置

1、打包后,在当前目录下有target目录,进去,有一个releases目录,把里面的zip包复制到你安装ES目录下的plugins目录下的ik目录(ik目录需要手动添加)

我的ES插件路径是:/usr/share/elasticsearch/plugins/

mkdir -p /usr/share/elasticsearch/plugins/ik

cd target/releases/

mv elasticsearch-analysis-ik-1.9.5.zip /usr/share/elasticsearch/plugins/ik

2、使用unzip命令解包,并把zip包删除了

cd /usr/share/elasticsearch/plugins/

unzip elasticsearch-analysis-ik-1.9..zip

rm -rf elasticsearch-analysis-ik-1.9..zip

六、测试

重启ES服务,查看ES的状态为(Active: active (running))即可。

systemctl restart elasticsearch

systemctl status elasticsearch

如果需要具体测试的话,可以在官网git的下面介绍有(点击查看),简单的方法可以使用下面命令在浏览器访问确认

http://(虚拟机ip):9200/_analyze?analyzer=ik&pretty=true&text=helloworld,中华人民共和国"

 

 

elasticsearch安装与使用(3)-- 安装中文分词插件elasticsearch-analyzer-ik的更多相关文章

  1. elasticsearch安装与使用(4)-- 安装中文分词插件elasticsearch 的 jdbc

    前言 elasticsearch(下面简称ES)使用jdbc连接mysql比go-mysql-elasticsearch的elasticsearch-river-jdbc能够很好的支持增量数据更新的问 ...

  2. Ubuntu16.04下安装elasticsearch+kibana实现php客户端的中文分词

    1.下载安装java, elasticsearch和kibana apt-get install default-jre default-jdk wget https://artifacts.elas ...

  3. ElasticSearch(三) ElasticSearch中文分词插件IK的安装

    正因为Elasticsearch 内置的分词器对中文不友好,会把中文分成单个字来进行全文检索,所以我们需要借助中文分词插件来解决这个问题. 一.安装maven管理工具 Elasticsearch 要使 ...

  4. Elasticsearch安装中文分词插件ik

    Elasticsearch默认提供的分词器,会把每一个汉字分开,而不是我们想要的依据关键词来分词.比如: curl -XPOST "http://localhost:9200/userinf ...

  5. ElasticSearch 中文分词插件ik 的使用

    下载 IK 的版本要与 Elasticsearch 的版本一致,因此下载 7.1.0 版本. 安装 1.中文分词插件下载地址:https://github.com/medcl/elasticsearc ...

  6. Elasticsearch安装ik中文分词插件(四)

    一.IK简介 IK Analyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包.从2006年12月推出1.0版开始, IKAnalyzer已经推出了4个大版本.最初,它是以开源项目Lu ...

  7. Elasticsearch如何安装中文分词插件ik

    elasticsearch-analysis-ik 是一款中文的分词插件,支持自定义词库. 安装步骤: 1.到github网站下载源代码,网站地址为:https://github.com/medcl/ ...

  8. 【elasticsearch】(3)centos7 安装中文分词插件elasticsearch-analyzer-ik

    前言 elasticsearch(下面简称ES,安装ES点击这里)的自带standard分词只能把汉语分割成一个个字,而不能分词.分段,这就是我们需要分析器ik的地方了. 一.下载ik的相应版本 查看 ...

  9. ElasticSearch-5.0.0安装中文分词插件IK

    Install IK 源码地址:https://github.com/medcl/elasticsearch-analysis-ik,git clone下来. 1.compile mvn packag ...

随机推荐

  1. C#基础视频教程4.2 如何编写简单的计算器

    用过VB6或者早期代码的人都应该能感觉到,C#目前也没看出来有什么特别之处,所谓的面向对象也没有什么体现.所以我们需要在原有基础上重写一份代码,然后比较两种做法的优缺点.我们在项目上右击添加一个Fun ...

  2. PL/SQL 之 基础

    PL/SQL(Procedural Language extensions to SQL)是Oracle 对标准 SQL 语言的过程化扩展,是专门用于各种环境下对 Oracle 数据库进行访问和开发的 ...

  3. url: (6) Couldn’t resolve host ‘www.ttlsa.com’

    http://www.ttlsa.com/linux/curl-6-couldnt-resolve-host/ 2. 解决问题 尝试解决方法: 修改dns # cat /etc/resolv.conf ...

  4. Python 对字符串切片

    对字符串切片字符串 'xxx'和 Unicode字符串 u'xxx'也可以看成是一种list,每个元素就是一个字符.因此,字符串也可以用切片操作,只是操作结果仍是字符串:>>> 'A ...

  5. Reusing dialogs with a dialog pool--一个sql server service broker例子

    一个sql server service broker例子 ----------------------------------- USE master GO -------------------- ...

  6. Spring MVC 中 AJAX请求并返回JSON

    一.以ModelAndView的方式返回 先看下JavaScript代码: /** * 保存-同步(版本控制库) */ function saveSynchronizedVcHorse(obj) { ...

  7. chrome 此网页正试图从未经验证的来源加载脚本

      chrome 此网页正试图从未经验证的来源加载脚本 CreateTime--2018年5月25日08点02分 Author:Marydon 1.情景还原 以我的网站为例,https://www.c ...

  8. 【Oracle】PL/SQL Developer 快捷键、使用技巧

    1.类SQL PLUS窗口:File->New->Command Window,这个类似于oracle的客户端工具sql plus,但比它好用多了. 2.设置关键字自动大写:Tools-& ...

  9. jquery 获取html <img /> 位置时出错问题

    如图所示,这样端口小图片都是通过jquery html()方法设置的(参数html就是画整个图片的html字符串),如图: 但是出现图片没有完全渲染完的问题,如图: 从图中可以看出在代码运行到断点的时 ...

  10. Python 爬虫实例(3)—— 爬取今日头条as cp 算法 解密

    关于今日头条的 as cp 算法,只是对时间进行了加密,他们的js代码是压缩处理的,正常格式化就可以了 url = "http://www.toutiao.com/api/pc/feed/& ...