学习用Node.js和Elasticsearch构建搜索引擎(1):了解并运行Elasticsearch
1、学习Elasticsearch概述。
了解Elasticsearch是什么?能做什么?可以查一下elasticsearch、lucene等的相关介绍,另外也可以查查资料比较一下其它的搜索引擎sphinx、reds等。
2、学习Elasticsearch术语。
上面参考文章中只列了几个核心术语,其它更多的术语可以自己查找资料。
3、安装Elasticsearch并运行。
a、下载Elasticsearch: https://www.elastic.co/downloads/elasticsearch
本人下载的v5.3.0版本zip包,下载后解压到本地mac系统的/usr/local/elasticsearch目录下.
这个版本需要java1.8以上(包含)支持,这个可以在命令行用java -version查看,达不到要求的就自己升级去。
b、启动Elasticsearch,出现下面类似的界面就说明启动成功了。默认9200是http访问端口,是9300是各节点间彼此通信的端口。

>cd /usr/local/elasticsearch
>bin/elasticsearch
[2017-03-31T16:32:40,477][INFO ][o.e.n.Node ] [] initializing ...
[2017-03-31T16:32:40,571][INFO ][o.e.e.NodeEnvironment ] [iXZpFuL] using [1] data paths, mounts [[/ (/dev/disk1)]], net usable_space [57.7gb], net total_space [232.6gb], spins? [unknown], types [hfs]
[2017-03-31T16:32:40,571][INFO ][o.e.e.NodeEnvironment ] [iXZpFuL] heap size [1.9gb], compressed ordinary object pointers [true]
[2017-03-31T16:32:40,590][INFO ][o.e.n.Node ] node name [iXZpFuL] derived from node ID [iXZpFuL9TUa2_I43LJUQDg]; set [node.name] to override
[2017-03-31T16:32:40,590][INFO ][o.e.n.Node ] version[5.3.0], pid[5772], build[3adb13b/2017-03-23T03:31:50.652Z], OS[Mac OS X/10.12/x86_64], JVM[Oracle Corporation/Java HotSpot(TM) 64-Bit Server VM/1.8.0_121/25.121-b13]
[2017-03-31T16:32:41,642][INFO ][o.e.p.PluginsService ] [iXZpFuL] loaded module [aggs-matrix-stats]
[2017-03-31T16:32:41,642][INFO ][o.e.p.PluginsService ] [iXZpFuL] loaded module [ingest-common]
[2017-03-31T16:32:41,642][INFO ][o.e.p.PluginsService ] [iXZpFuL] loaded module [lang-expression]
[2017-03-31T16:32:41,642][INFO ][o.e.p.PluginsService ] [iXZpFuL] loaded module [lang-groovy]
[2017-03-31T16:32:41,643][INFO ][o.e.p.PluginsService ] [iXZpFuL] loaded module [lang-mustache]
[2017-03-31T16:32:41,643][INFO ][o.e.p.PluginsService ] [iXZpFuL] loaded module [lang-painless]
[2017-03-31T16:32:41,643][INFO ][o.e.p.PluginsService ] [iXZpFuL] loaded module [percolator]
[2017-03-31T16:32:41,643][INFO ][o.e.p.PluginsService ] [iXZpFuL] loaded module [reindex]
[2017-03-31T16:32:41,643][INFO ][o.e.p.PluginsService ] [iXZpFuL] loaded module [transport-netty3]
[2017-03-31T16:32:41,643][INFO ][o.e.p.PluginsService ] [iXZpFuL] loaded module [transport-netty4]
[2017-03-31T16:32:41,644][INFO ][o.e.p.PluginsService ] [iXZpFuL] no plugins loaded
[2017-03-31T16:32:43,969][INFO ][o.e.n.Node ] initialized
[2017-03-31T16:32:43,969][INFO ][o.e.n.Node ] [iXZpFuL] starting ...
[2017-03-31T16:32:44,209][INFO ][o.e.t.TransportService ] [iXZpFuL] publish_address {127.0.0.1:9300}, bound_addresses {[fe80::1]:9300}, {[::1]:9300}, {127.0.0.1:9300}
[2017-03-31T16:32:47,392][INFO ][o.e.c.s.ClusterService ] [iXZpFuL] new_master {iXZpFuL}{iXZpFuL9TUa2_I43LJUQDg}{2FmpVTkEQwKUy9eHEv26qg}{127.0.0.1}{127.0.0.1:9300}, reason: zen-disco-elected-as-master ([0] nodes joined)
[2017-03-31T16:32:47,412][INFO ][o.e.h.n.Netty4HttpServerTransport] [iXZpFuL] publish_address {127.0.0.1:9200}, bound_addresses {[fe80::1]:9200}, {[::1]:9200}, {127.0.0.1:9200}
[2017-03-31T16:32:47,415][INFO ][o.e.n.Node ] [iXZpFuL] started
[2017-03-31T16:32:47,553][INFO ][o.e.g.GatewayService ] [iXZpFuL] recovered [1] indices into cluster_state
[2017-03-31T16:32:47,806][INFO ][o.e.c.r.a.AllocationService] [iXZpFuL] Cluster health status changed from [RED] to [YELLOW] (reason: [shards started [[library][2]] ...]).

c、在浏览器中打开http://localhost:9200/ ,将会显示一些关于你运行的实例的基本信息。

{
"name" : "iXZpFuL",
"cluster_name" : "elasticsearch",
"cluster_uuid" : "inoWXI3_QsGfG8xG4YHOAA",
"version" : {
"number" : "5.3.0",
"build_hash" : "3adb13b",
"build_date" : "2017-03-23T03:31:50.652Z",
"build_snapshot" : false,
"lucene_version" : "6.4.1"
},
"tagline" : "You Know, for Search"
}

4、图形化用户界面。
按照文章中提供的选择,我安装了谷歌浏览器的扩展组件ElasticSearch Toolbox.界面如下。
第一个select加载可选索引,第二个select加载可选类型。因为还没有导入任何数据,暂时没得选。

其实另外一个插件也挺好,地址:https://github.com/mobz/elasticsearch-head 感兴趣的同学可以下载下来试试。
5、基于Node的elasticsearch客户端。
elasticsearch为Node.js提供一个官方模块,称为elasticsearch。可以通过这个模块编码与elasticsearch通讯。
我直接下载的示例代码运行。示例要求node版本0.11.0及以上。
>git clone https://github.com/sitepoint-editors/node-elasticsearch-tutorial.git #下载示例
>cd node-elasticsearch-tutorial #切换目录
>npm install #安装依赖
示例中的文件解释可以看到 https://github.com/sitepoint-editors/node-elasticsearch-tutorial 上去看。
我们目前只需要知道:
1、data.json是测试数据文件,1000条数据。
2、index.js文件的例子就是导入data.json文件中的数据到elasticsearch。使用node index.js运行。
$ node index.js
1000 items parsed from data file
Successfully indexed 1000 out of 1000 items
3、indices.js用于检查索引信息的准确性。
4、其它的elasticsearch测试文件都是检索数据的例子。有各种写法,以后慢慢研究就可以了。
先弄个简单查询的在先前安装的ElasticSearch Toolbox上试试。
由于导入了数据。现在可以在工具中选择索引library,类型article.然后直接点击查询可以看到如下结果:

上面结果是查询所有的,我们可以点击QUERY DEITOR编辑查询条件,比如查询作者名为Rowe的数据,条件如下:

{
"query": {
"match": {
"authors.firstname": "Rowe"
}
},
"from": 0,
"size": 10
}

可以查到一条记录。
关于Elasticsearch数据检索知识下一篇文章再说。
转自https://www.cnblogs.com/fhen/p/6652455.html
学习用Node.js和Elasticsearch构建搜索引擎(1):了解并运行Elasticsearch的更多相关文章
- 学习用Node.js和Elasticsearch构建搜索引擎(6):实际项目中常用命令使用记录
1.检测集群是否健康. curl -XGET 'localhost:9200/_cat/health?v' #后面加一个v表示让输出内容表格显示表头 绿色表示一切正常,黄色表示所有的数据可用但是部分副 ...
- 学习用Node.js和Elasticsearch构建搜索引擎(4): 构建Elasticsearch搜索引擎
一.目标 使用node搭建一个知识库检索系统,要求词条平均检索速度必须在1s以内. 二.思路. 本人思路如下图. 橙色部分为我们要开发的内容, ES服务搭建(暂时用单节点测试,集群搭建以后再说), 三 ...
- 学习用node.js建立一个简单的web服务器
一.建立简单的Web服务器涉及到Node.js的一些基本知识点: 1.请求模块 在Node.js中,系统提供了许多有用的模块(当然你也可以用JavaScript编写自己的模块,以后的章节我们将详细讲解 ...
- 学习用Node.js和Elasticsearch构建搜索引擎(2):一些检索命令
1.Elasticsearch搜索数据有两种方式. 一种方式是通过REST请求URI,发送搜索参数: 另一种是通过REST请求体,发送搜索参数.而请求体允许你包含更容易表达和可阅读的JSON格式.这个 ...
- 学习用Node.js和Elasticsearch构建搜索引擎(7):零停机时间更新索引配置或迁移索引
上一篇说到如果一个索引的mapping设置过了,想要修改type或analyzer,通常的做法是新建一个索引,重新设置mapping,再把数据同步过来. 那么如何实现零停机时间更新索引配置或迁移索引? ...
- 学习用Node.js和Elasticsearch构建搜索引擎(5):mac本机部署canal
1.背景介绍 最近做的一个项目需要快速检索数据,经过商讨后采用了ElasticSearch作为快速检索数据引擎,但是数据如何同步到ES中是个问题,我们最开始计划了定时任务.mysql trigger等 ...
- 学习用Node.js和Elasticsearch构建搜索引擎(3):使用curl命令操作elasticsearch
使用Elasticsearch不免要提到curl工具,curl是利用URL语法在命令行方式下工作的开源文件传输工具.官网地址:https://curl.haxx.se/ 因为elasticsearch ...
- node.js服务端程序在Linux上持久运行
如果要想在服务端部署node.js程序,让其持久化运行,就不能单单使用npm start命令运行,当然了,这样运行是毫无问题的,但是当关闭xshell窗口或者是关闭进程的时候(其实关闭xshell窗口 ...
- 如何用 Node.js 和 Elasticsearch 构建搜索引擎
Elasticsearch 是一款开源的搜索引擎,由于其高性能和分布式系统架构而备受关注.本文将讨论其关键特性,并手把手教你如何用它创建 Node.js 搜索引擎. Elasticsearch 概述 ...
随机推荐
- ansible部署 lnmp+wordpress
如上,是项目的目录结构. common: 获取阿里云的yum源 mysql: 二进制安装mysql nginx: 编译安装nginx php-fpm:编译安装php-fpm wordpress: 获取 ...
- C#-简介(一)
1.C#语言简介 C#计算机语言 是一门高级计算机语言 他的开发模式更接近人类和社会的思维模式,有助于提高开发效率 C#历史 1998年COOL这个项目是C#语言的前身,由微软 Anders Hejl ...
- c/c++ 标准顺序容器 容器的访问,删除 操作
c/c++ 标准顺序容器 容器的访问,删除 操作 pop_front:vector,string不支持 pop_back:forward_list不支持 知识点 1,front, back, at 成 ...
- 利用Python通过频谱分析和KNN完成iphone拨号的语音识别
最近这段时间,学校里的事情实在太多了,从七月下旬一直到八月底实验室里基本天天十二点或者通宵,实在是没有精力和时间来写博客.这周老师出国开会,也算有了一个短暂的休息机会,刚好写点有意思的东西. 上周在天 ...
- Shell脚本常用模板
作为一个运维人员编写Shell脚本是很平常的,一个格式好的脚本不仅赏心悦目,后期自己和别人也易于维护. 下面的脚本就是我自己的shell编写格式,如下: [root@mini05 -]# cat te ...
- 序列对象(bytearray, bytes,list, str, tuple)
列表: L.append(x) # x追加到L尾部 L.count(x) # 返回x在L中出现的次数 L.extend(m) # Iterable m的项追加到L末尾 L += m # 功能同L.ex ...
- 【Teradata】grouping和rollup窗口函数
1.group by后带rollup子句 先按一定的规则产生多种分组,然后返回各个分组所产生的结果集的并集,且没有去掉重复数据(统计出的数据是求和还是最大值还是平均值等这就取决于SELECT后的聚合函 ...
- 设计模式のTemplatePattern(模板模式)----行为模式
一.产生背景 在程序设计中,可能每个对象都有共同的地方,而此时如果每个对象定义一次,如下例子,每个对象都写Stay()方法,这样在每个类中都有很多相同的代码,此时,我们需要用到模板设计模式,来解决这个 ...
- 深入理解Ribbon之源码解析
什么是Ribbon Ribbon是Netflix公司开源的一个负载均衡的项目,它属于上述的第二种,是一个客户端负载均衡器,运行在客户端上.它是一个经过了云端测试的IPC库,可以很好地控制HTTP和TC ...
- 1.01-url-open_code
import urllib.request def load_data(): url = "http://www.baidu.com/" #get的请求 #http请求 #resp ...