<div class="show-content-free">
<h1><a name="t0"></a>Neo4j与ElasticSearch数据同步</h1>

针对节点删除,加了一些逻辑,代码地址

背景

需要强大的检索功能,所有需要被查询的数据都在neo4j。

方案

  • 在Server逻辑中直接编写。后端有一个Storage类。当有新数据通过RestAPI存入Neo4j时,同时存一份到ElasticSearch
  • 编写Neo4j插件。Neo4j本身不支持Trigger。但是可以通过插件实现类似功能

方案的选择采用第二种,原因有二

  • 集中式的数据同步处理,比分散式上层逻辑数据同步处理 稳定性和可维护性更高
  • Neo4j开源仓储提供了Neo4j-ElasticSearch插件,虽然不满足我们的需求,但是可以为编写代码提供极大的参考。

插件试用

实验环境: Ubuntu16.04 Docker 17.12.1-ce (由于采用Docker,环境对实验影响不大)

实验环境搭建

  • 下载最近版本(3.2.x)的Jar包
wget https://github.com/neo4j-contrib/neo4j-elasticsearch/releases/download/3.2.3/neo4j-elasticsearch-3.2.3.jar
  • 启动ES容器,该插件用的Jest 2.0.2版本。但是我们使用ElasticSearch2.3也没什么问题
docker run -p 9200:9200 -d --name es elasticsearch:2.3
  • 启动neo4j容器, 并挂载磁盘
docker run -p 7474:7474 -p 7687:7687 -v /home/bonsai/Demo/conf:/var/lib/neo4j/conf  -v /home/bonsai/Demo/plugins:/var/lib/neo4j/plugins --name neo -d  --link es:es neo4j:3.2.3
  • cp插件到plugins文件夹
cp neo4j-elasticsearch-3.2.3.jar /home/bonsai/Demo/plugins
  • 增加配置 vim /home/bonsai/Demo/conf/neo4j.conf

  1. elasticsearch.host_name=http://es:9200
  2. elasticsearch.index_spec=people:Person(first_name,last_name), places:Place(name)
  • 去除默认密码修改限制
docker exec neo /bin/bash -c "echo 'neo4j:SHA-256,BC43474518A71BA7BEB54461F769A76195226474BFE892FF2562211DFD8043FA,B6070629C73CE74455674D39D65BA3DF:' > data/dbms/auth"
  • 重启Neo4j容器
docker restart neo
  • 验证neo4j成功加载配置docker exec neo cat /var/lib/neo4j/logs/debug.log | grep elastic
    成功加载配置

功能使用

在Neo4j-ElasticSearch插件中,引用了index_spec这个配置。具体实现细节下节分析。试用的时候只要知道我们定义了

elasticsearch.index_spec=people:Person(first_name,last_name), places:Place(name)

表示会将Person标签的Node的first_namelast_name属性存入ES people索引中,会将Place标签的Node的name属性存入ES places索引中

节点创建


  1. curl -X POST \
  2. http://localhost:7474/db/data/cypher \
  3. -H 'authorization: Basic bmVvNGo6bmVvNGo=' \
  4. -H 'content-type: application/json' \
  5. -d '{
  6. "query" : "CREATE (n:Person { first_name : {firstname}, last_name: {lastname} }) RETURN n",
  7. "params" : {
  8. "firstname" : "Bonsai",
  9. "lastname": "Y"
  10. }
  11. }
  12. '

成功创建后访问ES数据库查看

curl -X GET 'http://127.0.0.1:9200/people/_search?pretty='
image.png

修改节点


  1. curl -X POST \
  2. http://localhost:7474/db/data/cypher \
  3. -H 'authorization: Basic bmVvNGo6bmVvNGo=' \
  4. -H 'content-type: application/json' \
  5. -d '{
  6. "query" : "MATCH (n:Person) SET n.first_name = { newfirstname } RETURN n",
  7. "params" : {
  8. "newfirstname" : "new_bonsai"
  9. }
  10. }'

成功修改后访问ES数据库查看

curl -X GET 'http://127.0.0.1:9200/people/_search?pretty='
修改节点
  • 删除node

  1. curl -X POST \
  2. http://localhost:7474/db/data/cypher \
  3. -H 'authorization: Basic bmVvNGo6bmVvNGo=' \
  4. -H 'content-type: application/json' \
  5. -d '{
  6. "query" : "MATCH (n:Person) Delete n"
  7. }'

成功删除后访问ES数据库查看

curl -X GET 'http://127.0.0.1:9200/people/_search?pretty='
删除节点
      </div>原文地址:https://blog.csdn.net/weixin_43086579/article/details/84801418
</div>

Neo4j与ElasticSearch数据同步的更多相关文章

  1. Oracle和Elasticsearch数据同步

    Python编写Oracle和Elasticsearch数据同步脚本 标签: elasticsearchoraclecx_Oraclepython数据同步    Python知识库 一.版本 Pyth ...

  2. 基于 MySQL Binlog 的 Elasticsearch 数据同步实践 原

    一.背景 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品.订单等数据的多维度检索. 使用 Elasticsearch 存储业务数据可以 ...

  3. 基于MySQL Binlog的Elasticsearch数据同步实践

    一.为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品.订单等数据的多维度检索. 使用 Elasticsearch 存储业务数 ...

  4. kafka2x-Elasticsearch 数据同步工具demo

    Bboss is a good elasticsearch Java rest client. It operates and accesses elasticsearch in a way simi ...

  5. elasticsearch与mongodb分布式集群环境下数据同步

    1.ElasticSearch是什么 ElasticSearch 是一个基于Lucene构建的开源.分布式,RESTful搜索引擎.它的服务是为具有数据库和Web前端的应用程序提供附加的组件(即可搜索 ...

  6. Elasticsearch和mysql数据同步(logstash)

    1.版本介绍 Elasticsearch: https://www.elastic.co/products/elasticsearch 版本:2.4.0   Logstash: https://www ...

  7. Elasticsearch和mysql数据同步(elasticsearch-jdbc)

    1.介绍 对mysql.oracle等数据库数据进行同步到ES有三种做法:一个是通过elasticsearch提供的API进行增删改查,一个就是通过中间件进行数据全量.增量的数据同步,另一个是通过收集 ...

  8. HBase数据同步ElasticSearch该程序

    ElasticSearch的River机械 ElasticSearch本身就提供了River机械,对于同步数据. 在这里,现在能找到的官方推荐River: http://www.elasticsear ...

  9. Linux安装ElasticSearch与MongoDB分布式集群环境下数据同步

    ElasticSearch有一个叫做river的插件式模块,可以将外部数据源中的数据导入elasticsearch并在上面建立索引.River在集群上是单例模式的,它被自动分配到一个节点上,当这个节点 ...

随机推荐

  1. kafka数据分区的四种策略

    kafka的数据的分区 探究的是kafka的数据生产出来之后究竟落到了哪一个分区里面去了 第一种分区策略:给定了分区号,直接将数据发送到指定的分区里面去 第二种分区策略:没有给定分区号,给定数据的ke ...

  2. 洛谷P3376【模板】网络最大流 ISAP

    这篇博客写得非常好呀. 传送门 于是我是DCOI这一届第一个网络流写ISAP的人了,之后不用再被YKK她们嘲笑我用Dinic了!就是这样! 感觉ISAP是会比Dinic快,只分一次层,然后不能增广了再 ...

  3. 19-10-31-B

    %%%B哥 ZJ一下: 开题. 发现 语文考试???? 我不认识XD.老帅哥救我! 后来…… 对什么取模??? 什么玩意??输入什么?? 满足啥?? 全是亻 啊! 后来才知道是题楔×了 不管了. 然后 ...

  4. linux 软件 手动添加至桌面或启动栏

    1.创建软连接(也可以不用创建软连接,直接写绝对路径) sudo ln -s /opt/eclipse/eclipse /usr/bin/eclipse 2.创建desktop文件 sudo gedi ...

  5. PAT甲级——A1067 Sort with Swap(0, i)

    Given any permutation of the numbers {0, 1, 2,..., N−1}, it is easy to sort them in increasing order ...

  6. Asp.net Core Jenkins Docker 实现一键化部署

    写在前面 在前段时间尝试过用Jenkins来进行asp.net core 程序在IIS上面的自动部署.大概的流程是Jenkins从git上获取代码 最开始Jenkins是放在Ubuntu的Docker ...

  7. C语言开发系列-二进制

    n位二进制的取值范围 -2的n-1次方 ~ 2的n-1次方-1 输出一个整数的二进制的存储形式 #include <stdio.h> // 输出一个整数的二进制的存储形式 void put ...

  8. windows API 第 18篇 FindFirstVolume FindNextVolume

    函数定义:Retrieves the name of a volume on a computer. FindFirstVolume is used to begin scanning the vol ...

  9. Spring_注解形式的配置

    1.spring配置: 扫描被下面的注解所注解的类, 把这些类直接配置为bean. 例如: @Controller @Service @Repository @Component 这四个注解 Cont ...

  10. [编织消息框架][JAVA核心技术]数值与逻辑分离

    为什么要分离? 业务需求是不停地变,如果把条件写进代码里,当用户需求变时要改代码发版本更新才能生效,这过程无疑是漫长的 就算是在开发期,不停的变开发者精力耗光在沟通,小修改上,无法专注逻辑部分 分离的 ...