Neo4j与ElasticSearch数据同步
<div class="show-content-free">
<h1><a name="t0"></a>Neo4j与ElasticSearch数据同步</h1>
针对节点删除,加了一些逻辑,代码地址
背景
需要强大的检索功能,所有需要被查询的数据都在neo4j。
方案
- 在Server逻辑中直接编写。后端有一个
Storage
类。当有新数据通过RestAPI存入Neo4j时,同时存一份到ElasticSearch - 编写Neo4j插件。Neo4j本身不支持Trigger。但是可以通过插件实现类似功能
方案的选择采用第二种,原因有二
- 集中式的数据同步处理,比分散式上层逻辑数据同步处理 稳定性和可维护性更高
- Neo4j开源仓储提供了Neo4j-ElasticSearch插件,虽然不满足我们的需求,但是可以为编写代码提供极大的参考。
插件试用
实验环境: Ubuntu16.04
Docker 17.12.1-ce
(由于采用Docker,环境对实验影响不大)
实验环境搭建
- 下载最近版本(3.2.x)的Jar包
wget https://github.com/neo4j-contrib/neo4j-elasticsearch/releases/download/3.2.3/neo4j-elasticsearch-3.2.3.jar
- 启动ES容器,该插件用的Jest 2.0.2版本。但是我们使用ElasticSearch2.3也没什么问题
docker run -p 9200:9200 -d --name es elasticsearch:2.3
- 启动neo4j容器, 并挂载磁盘
docker run -p 7474:7474 -p 7687:7687 -v /home/bonsai/Demo/conf:/var/lib/neo4j/conf -v /home/bonsai/Demo/plugins:/var/lib/neo4j/plugins --name neo -d --link es:es neo4j:3.2.3
- cp插件到plugins文件夹
cp neo4j-elasticsearch-3.2.3.jar /home/bonsai/Demo/plugins
- 增加配置
vim /home/bonsai/Demo/conf/neo4j.conf
-
elasticsearch.host_name=http://es:9200
-
elasticsearch.index_spec=people:Person(first_name,last_name), places:Place(name)
- 去除默认密码修改限制
docker exec neo /bin/bash -c "echo 'neo4j:SHA-256,BC43474518A71BA7BEB54461F769A76195226474BFE892FF2562211DFD8043FA,B6070629C73CE74455674D39D65BA3DF:' > data/dbms/auth"
- 重启Neo4j容器
docker restart neo
- 验证neo4j成功加载配置
docker exec neo cat /var/lib/neo4j/logs/debug.log | grep elastic
成功加载配置
功能使用
在Neo4j-ElasticSearch插件中,引用了index_spec
这个配置。具体实现细节下节分析。试用的时候只要知道我们定义了
elasticsearch.index_spec=people:Person(first_name,last_name), places:Place(name)
表示会将Person
标签的Node的first_name
与last_name
属性存入ES people
索引中,会将Place
标签的Node的name
属性存入ES places
索引中
节点创建
-
curl -X POST \
-
http://localhost:7474/db/data/cypher \
-
-H 'authorization: Basic bmVvNGo6bmVvNGo=' \
-
-H 'content-type: application/json' \
-
-d '{
-
"query" : "CREATE (n:Person { first_name : {firstname}, last_name: {lastname} }) RETURN n",
-
"params" : {
-
"firstname" : "Bonsai",
-
"lastname": "Y"
-
}
-
}
-
'
成功创建后访问ES数据库查看
curl -X GET 'http://127.0.0.1:9200/people/_search?pretty='

修改节点
-
curl -X POST \
-
http://localhost:7474/db/data/cypher \
-
-H 'authorization: Basic bmVvNGo6bmVvNGo=' \
-
-H 'content-type: application/json' \
-
-d '{
-
"query" : "MATCH (n:Person) SET n.first_name = { newfirstname } RETURN n",
-
"params" : {
-
"newfirstname" : "new_bonsai"
-
}
-
}'
成功修改后访问ES数据库查看
curl -X GET 'http://127.0.0.1:9200/people/_search?pretty='

- 删除node
-
curl -X POST \
-
http://localhost:7474/db/data/cypher \
-
-H 'authorization: Basic bmVvNGo6bmVvNGo=' \
-
-H 'content-type: application/json' \
-
-d '{
-
"query" : "MATCH (n:Person) Delete n"
-
}'
成功删除后访问ES数据库查看
curl -X GET 'http://127.0.0.1:9200/people/_search?pretty='

</div>原文地址:https://blog.csdn.net/weixin_43086579/article/details/84801418
</div>
Neo4j与ElasticSearch数据同步的更多相关文章
- Oracle和Elasticsearch数据同步
Python编写Oracle和Elasticsearch数据同步脚本 标签: elasticsearchoraclecx_Oraclepython数据同步 Python知识库 一.版本 Pyth ...
- 基于 MySQL Binlog 的 Elasticsearch 数据同步实践 原
一.背景 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品.订单等数据的多维度检索. 使用 Elasticsearch 存储业务数据可以 ...
- 基于MySQL Binlog的Elasticsearch数据同步实践
一.为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品.订单等数据的多维度检索. 使用 Elasticsearch 存储业务数 ...
- kafka2x-Elasticsearch 数据同步工具demo
Bboss is a good elasticsearch Java rest client. It operates and accesses elasticsearch in a way simi ...
- elasticsearch与mongodb分布式集群环境下数据同步
1.ElasticSearch是什么 ElasticSearch 是一个基于Lucene构建的开源.分布式,RESTful搜索引擎.它的服务是为具有数据库和Web前端的应用程序提供附加的组件(即可搜索 ...
- Elasticsearch和mysql数据同步(logstash)
1.版本介绍 Elasticsearch: https://www.elastic.co/products/elasticsearch 版本:2.4.0 Logstash: https://www ...
- Elasticsearch和mysql数据同步(elasticsearch-jdbc)
1.介绍 对mysql.oracle等数据库数据进行同步到ES有三种做法:一个是通过elasticsearch提供的API进行增删改查,一个就是通过中间件进行数据全量.增量的数据同步,另一个是通过收集 ...
- HBase数据同步ElasticSearch该程序
ElasticSearch的River机械 ElasticSearch本身就提供了River机械,对于同步数据. 在这里,现在能找到的官方推荐River: http://www.elasticsear ...
- Linux安装ElasticSearch与MongoDB分布式集群环境下数据同步
ElasticSearch有一个叫做river的插件式模块,可以将外部数据源中的数据导入elasticsearch并在上面建立索引.River在集群上是单例模式的,它被自动分配到一个节点上,当这个节点 ...
随机推荐
- kafka数据分区的四种策略
kafka的数据的分区 探究的是kafka的数据生产出来之后究竟落到了哪一个分区里面去了 第一种分区策略:给定了分区号,直接将数据发送到指定的分区里面去 第二种分区策略:没有给定分区号,给定数据的ke ...
- 洛谷P3376【模板】网络最大流 ISAP
这篇博客写得非常好呀. 传送门 于是我是DCOI这一届第一个网络流写ISAP的人了,之后不用再被YKK她们嘲笑我用Dinic了!就是这样! 感觉ISAP是会比Dinic快,只分一次层,然后不能增广了再 ...
- 19-10-31-B
%%%B哥 ZJ一下: 开题. 发现 语文考试???? 我不认识XD.老帅哥救我! 后来…… 对什么取模??? 什么玩意??输入什么?? 满足啥?? 全是亻 啊! 后来才知道是题楔×了 不管了. 然后 ...
- linux 软件 手动添加至桌面或启动栏
1.创建软连接(也可以不用创建软连接,直接写绝对路径) sudo ln -s /opt/eclipse/eclipse /usr/bin/eclipse 2.创建desktop文件 sudo gedi ...
- PAT甲级——A1067 Sort with Swap(0, i)
Given any permutation of the numbers {0, 1, 2,..., N−1}, it is easy to sort them in increasing order ...
- Asp.net Core Jenkins Docker 实现一键化部署
写在前面 在前段时间尝试过用Jenkins来进行asp.net core 程序在IIS上面的自动部署.大概的流程是Jenkins从git上获取代码 最开始Jenkins是放在Ubuntu的Docker ...
- C语言开发系列-二进制
n位二进制的取值范围 -2的n-1次方 ~ 2的n-1次方-1 输出一个整数的二进制的存储形式 #include <stdio.h> // 输出一个整数的二进制的存储形式 void put ...
- windows API 第 18篇 FindFirstVolume FindNextVolume
函数定义:Retrieves the name of a volume on a computer. FindFirstVolume is used to begin scanning the vol ...
- Spring_注解形式的配置
1.spring配置: 扫描被下面的注解所注解的类, 把这些类直接配置为bean. 例如: @Controller @Service @Repository @Component 这四个注解 Cont ...
- [编织消息框架][JAVA核心技术]数值与逻辑分离
为什么要分离? 业务需求是不停地变,如果把条件写进代码里,当用户需求变时要改代码发版本更新才能生效,这过程无疑是漫长的 就算是在开发期,不停的变开发者精力耗光在沟通,小修改上,无法专注逻辑部分 分离的 ...