Google Cayley图数据库使用方法

最近在用Golang做流程引擎,对于流程图的存储,我看到了Google的Cayley图数据库,感觉它可能会比较适合我的应用,于是便拿来用了用.

项目地址在这里:https://github.com/google/cayley

系统环境 : Windows 7

1. 安装

安装的过程项目文档里写的很明白,有两种安装方式:

直接下载二进制版本.解压到你喜欢的位置.
从源码安装,遵照项目文档一步一步来即可.

2. 使用

安装完成之后,你会看到一个【cayley.exe】的文件，它就是我们要用的程序了。

1. 初始化数据库

初始化数据库要用到的命令是 init ，你可以使用两种方式初始化，一种是命令行，一种是配置文件。

我们先来看命令行的形式：

leveldb : cayley.exe init --db=leveldb --dbpath=tmp/testdb —— 你存储数据的目录就是【tmp/testdb】，它会在这个目录下，建立leveldb数据库；

bolt : cayley.exe init --db=bolt --dbpath=tmp/testdb —— 你存储数据的文件名是【tmp/testdb】，它会在【tmp】目录下，创建一个叫做【testdb】的bolt数据库文件；

mongo : cayley.exe init --db=mongo --dbpath=”<HOSTNAME>:<PORT>” —— HOSTNAME和PORT指向你的Mongo实例。

在命令行中，--db 和 --dbpath 必须是一起出现的。如果你觉得输入命令行很麻烦，那么可以使用配置文件来初始化。cayley给了一个示例文件【cayley.cfg.example】：
{

"database": "bolt",

"db_path": "/tmp/demodb",

"read_only": false

}
这个使用的是bolt数据库，同时配置了路径以及是否只读。关于配置文件如何配置，等一下我们再说。对我来说，只需要把这个文件改动一下，就可以为我所用了：
{

"database": "bolt",

"db_path": "tmp/testdb", // 我是在【cayley.exe】所在目录下的【tmp】文件夹里创建的数据库文件

"read_only": false

}

2. 向数据库加载数据

数据库初始化好了之后，我们就可以加载数据了。cayley项目里给我们提供了两个测试数据，都在【data】目录下，一个是【testdata.nq】，它是一个简单的基于好友关注的网络图，一个是【30kmoviedata.nq.gz】，这里存储了30k个电影数据信息。我们先用简单的【testdata.nq】。

加载数据要用到 load 命令：

cayley.exe load --config=cayley.cfg.example --quads=data/testdata.nq

这样，就把【testdata.nq】里的数据，加载到数据库里了。

3. 连接你的图数据

加载数据之后，我们就可以查看我们的图了。cayley提供了两种方式，一种是REPL，一种是HTTP。

先说REPL：

cayley.exe repl --config=cayley.cfg.example

这样，cayley就已经跑起来了，你可以看到命令行已经变成“cayley>”等待你的输入了。

再说HTTP：

cayley.exe http --config=cayley.cfg.example

敲完这行命令之后，你会看到控制台输出“Cayley now listening on 127.0.0.1:64210”，接下来只要访问http://127.0.0.1:64210/就能看到它的web界面了。

4. 使用

在使用之前，我们先来看一看，cayley里的数据，是什么样的。比如以【testdata.nq】为例：

 1 <alice> <follows> <bob> .

 2 <bob> <follows> <fred> .

 3 <bob> <status> "cool_person" .

 4 <charlie> <follows> <bob> .

 5 <charlie> <follows> <dani> .

 6 <dani> <follows> <bob> .

 7 <dani> <follows> <greg> .

 8 <dani> <status> "cool_person" .

 9 <emily> <follows> <fred> .

10 <fred> <follows> <greg> .

11 <greg> <status> "cool_person" .

它是由一条条四元组构成，其中第一个叫subject，第二个叫predicate，第三个叫object，第四个叫Label（可选），以.结尾。subject和object会转换成有向图的顶点，predicate就是边。label的用法我查了google group，意思是说，你可以在一个数据库里，存多个图，用label来区分不同的图，但是我没有找到关于它的用法。

这张图的关系如下：

其中箭头指明了follows的关系，而#括起来的人名表示，这些人有status为cool_person。

下来我们来看对cayley数据库的增删查：

1 cayley> :a

subject

 predicate object label .

比如我要添加一个人叫“leon”，他关注了“alice”，并且他也是一个“cool_person”，那么输入这样的命令即可：

1 cayley> :a leon follows alice .

2 cayley> :a leon status cool_person .

1 cayley> :d subject predicate object .

比如我刚才添加的“leon”，现在他不想关注“alice”了，那么这样就可以删除刚才建立的关系了：

1 cayley> :d leon follows alice .

对于查询，cayley提供了两种查询语言，一种是类似于JavaScript的语言，一种是简化的MQL。这里我选用类JavaScript的查询语言。因为它的文档相对完整一些。我会通过介绍对象的方式，把查询方法逐一阐述。

1. graph 对象，简写为 g ，它的存在是唯一的，由它来产生 query 对象，进而返回各种查询结果。它可执行的方法如下所示：

graph.Vertex([nodeId],[nodeId]…) 简写为 g.V

参数：nodeId（可选）：一个字符串，或者字符串列表，代表了查询的起始节点

返回：query 对象

从给定的顶点（集）开始一个查询路径，如果没有参数，则认为是图中所有的顶点。

举例：

1 // 我想看目前图中所有的顶点

2 g.V().All()

3 // 我想获得alice这个节点

4 g.V(“alice”).GetLimit(1)

其中All()方法是query对象的方法，用它可以遍历query对象中，所有的数据。GetLimit(number)也是query对象的方法，它获得迭代集里限定数目的数据。

graph.Morphism() 简写为 g.M()

无参数

返回：path 对象

创建一个态射path对象，它本身是不能被查询的，它定义了一类路径映射，可以存储到变量里，在别的查询语句里使用。具体使用之后介绍。主要是和 path.Follow()，path.FollowR()配合使用。

2. path 对象，它是query对象的父类对象。

path对象由 g.V() 和 g.M() 创建，其中 g.V() 创建了query对象，它是path对象的子类。

我们的查询，主要就是使用这个对象，下面以【testdata.nq】里的数据为例，介绍一下都有哪些查询方法。

path.Out([predicatePath],[tags])

参数：predicatePath（可选）下列其中之一

- 空或者undifined：所有从这个节点出去的predicate。
- 一个字符串：从这个节点出去的predicate名字。
- 字符串列表：从这个节点出去的多个predicate名字。
- 一个query path对象：

　　tags（可选）下列其中之一

- 空或者undifined：没有tags
- 一个字符串：向输出集使用的指明predicate的标签
- 字符串列表：添加多个tags

这个方法从path对象开始，通过predicate指向其他objects，也就是要查询的数据。

举例：

 1 // 查看charlie follows了谁。结果是 bob and dani

 2 g.V("charlie").Out("follows")

 3 // 查看alice follows的人，他们又follows了谁。结果是 fred

 4 g.V("alice").Out("follows").Out("follows")

 5 // 从dani出去的路径都指向了哪里。 结果是 bob, greg 和 cool_person

 6 g.V("dani").Out()

 7 // 找到所有dani通过follows和status指向的节点。

 8 // 结果是 bob, greg 和 cool_person

 9 g.V("dani").Out(["follows", "status"])

10 // 找到所有dani通过status指向的节点，并加上tag。

11 // 结果是 {"id": cool_person, "pred": "status"}

12 g.V("dani").Out(g.V("status"), "pred")

path.In([predicatePath],[tags])

和path.Out()用法想同，只不过path.In()查询的是入度，path.Out()查询的是出度。

path.Both([predicatePath],[tags])

用法同上，既查询入度也查询出度。项目文档里说目前这个方法的效率相对来说比较低，因为它是通过Or方法实现的。但是在需要的情况下，还是很有用的。

path.Is(node,[node..])

参数：node：一个或者多个node。

过滤出所有指向参数节点的路径。

举例：

1 // 从图中所有节点出发，找到follows指向bob的路径

2 // 结果显示三个路径指向bob (来自 alice, charlie and dani)

3 g.V().Out("follows").Is("bob")

path.Has(predicate,object)

参数：predicate：指明predicate，也就是哪类路径。

　　object：指向的节点

过滤出所有通过predicate指向object的节点

举例：

1 // 从所有节点开始，找到谁follows了。结果是 alice, charlie and dani

2 g.V().Has("follows", "bob")

3 // follows charlie的人之中，哪些人follows了fred。结果是 bob

4 g.V("charlie").Out("follows").Has("follows", "fred")

Tagging

path.Tag(tag) 简写为 path.As

参数：tag：为结果集的key赋予一个字符串。

为了保存你的工作，或者了解路径是怎么到达终点的，cayley提供了tags。

举例：

1 // 从所有节点开始，把他们保存到“start”中，找到所有有status的predicate，并返回结果

2 // 结果是 {"id": "cool_person", "start": "bob"}, {"id": "cool_person", "start": "greg"}, {"id": "cool_person", "start": "dani"}

3 g.V().Tag("start").Out("status")

path.Back(tag)

参数：tag：要跳回的在query里保存的之前的tag名

举例：

1 // 从所有节点出发，把它们保存到“start”中，找到有status的predicate的连接，然后跳回到“start”中，看看有谁follows了他们，返回结果

2 // 结果是:

3 //   {"id": "alice", "start": "bob"},

4 //   {"id": "charlie", "start": "bob"},

5 //   {"id": "dani", "start": "bob"},

6 //   {"id": "charlie", "start": "dani"},

7 //   {"id": "dani", "start": "greg"}

8 g.V().Tag("start").Out("status").Back("start").In("follows")

path.Save(predicate,tag)

参数：predicate：predicate名

　　tag：一个tag名用来保存object节点

从当前节点开始作为subject，把它通过predicate连接的节点保存在key为tag指向的value里。

举例：

1 // 从 dani 和 bob 开始，查看他们follows了谁，并把结果保存在 “target”中

2 // 结果:

3 //   {"id" : "dani", "target": "bob" },

4 //   {"id" : "dani", "target": "greg" },

5 //   {"id" : "bob", "target": "fred" },

6 g.V("dani", "bob").Save("follows", "target")

Joining

path.Intersect(query) 简写为 path.And

path.Union(query) 简写为 path.Or

path.Except(query) 简写为 path.Difference

这三个放到一起，就是比较两个path对象中，取交集的数据、取并集的数据和取差集的数据。

参数都只有query对象。

举例：

 1 var cFollows = g.V("charlie").Out("follows")

 2 var dFollows = g.V("dani").Out("follows")

 3 // 1. Intersect

 4 // charlie follows的人 (bob and dani) 和 dani follows的人 (bob and greg) -- 返回 bob

 5 cFollows.Intersect(dFollows)

 6 // 或者相同的方式

 7 g.V("charlie").Out("follows").And(g.V("dani").Out("follows"))

 8 // 2. Union

 9 // charlie (bob and dani) 或 dani (bob and greg) follows的人 -- 返回 bob (来自 charlie), bob (来自 dani), dani and greg.

10 cFollows.Union(dFollows)

11 // 3. Except

12 // 从charlie follows的人中，去掉dani follows的人-- 返回 dani

13 cFollows.Except(dFollows)

14 // 或者相同的方式

15 g.V("charlie").Out("follows").Except(g.V("dani").Out("follows"))

使用 Morphisms

path.Follow(morphism)

path.FollowR(morphism)

这两个放到一起，因为它们都用到了morphism path对象。

参数：morphism：一个态射路径。

有了graph.morphism，我们可以准备一个可复用的path。

　　Follow是从morphism定义的路径，顺序查找节点，而FollowR是逆序查找节点的。

举例：

1 friendOfFriend = g.Morphism().Out("follows").Out("follows")

2 // 定义一个morphism为：从给定节点出发，它follows的节点所follows的节点。

3 // 查找charlie follows的人所follows的人里，谁的有status为cool_person

4 // 结果为 bob 和 greg

5 g.V("charlie").Follow(friendOfFriend).Has("status", "cool_person")

6 // 从所有节点出发，找到谁follows的人里，follows了status为cool_person的人

7 // 结果：emily，bob，charlie（来自 bob），charlie（来自greg）

8 g.V().Has("status", "cool_person").FollowR(friendOfFriend)

关于Query对象

query.All()

没有参数，返回值任意。执行结果是query里所有的数据。

query.GetLimit(size)

参数是size，和All()方法一样，只不过加上了返回结果数量的限制。

query.ToArray()

没有参数，返回一个Array。

query.ToValue()

没有参数，返回一个字符串。和ToArray()方法一样，但是只返回一个结果，就像Limit(1)

query.TagArray()

和ToArray()一样，只不过返回的不是string数组，而是一个键值对数组。

query.TagValue()

和ToValue()一样，返回一个只包含一个tag-to-string的map。

query.ForEach(callback)，query.ForEach(limit,callbaack) 简写为 query.Map

略。

关于web界面的可视化

当你使用http界面时，你会看到cayley提供了可视化效果的展示，一种是QueryShape，一种是Visualize。

QueryShape展示了你要查询的态射是什么样的，Visualize会以图形方式展示你的查询结果。在正确地输出图形之前，尤其是Visualize，需要确保查询结果的JSON里，有“target”和“source”这两个键。也就是说，我们在查询的结果里，需要通过Tag，为结果添加标签。

举例：

1 var fOf = g.M().Out("follows").Out("follows").Tag("target")

2 g.V("charlie").Tag("source").Follow(fOf).All()

它返回的结果是这样的JSON，包含了“source”和“target”：

 1 {

 2  "result": [

 3   {

 4    "id": "bob",

 5    "source": "charlie",

 6    "target": "bob"

 7   },

 8   {

 9    "id": "greg",

10    "source": "charlie",

11    "target": "greg"

12   },

13   {

14    "id": "fred",

15    "source": "charlie",

16    "target": "fred"

17   }

18  ]

19 }

这样才能在web页面中，看到可视化的图形展示。

其中QueryShape如下：

Visualize如下：

以上就是我初步尝试cayley数据库的内容，在它项目的doc文件夹下，还有更多更详细的说明，感兴趣的读者可以看一看。

由于个人水平有限，如果哪里有错误或者你有更好的经验，欢迎在评论区留言，我会认真和你交流的。谢谢！

Google Cayley图数据库使用方法的更多相关文章

Cayley图数据库的可视化（Visualize）
引入在文章Cayley图数据库的简介及使用中,我们已经了解了Cayley图数据库的安装.数据导入以及进行查询等. Cayley图数据库是Google开发的开源图数据库,虽然功能还没有Neo4 ...
Cayley图数据库的简介及使用
图数据库在如今数据库群雄逐鹿的时代中,非关系型数据库(NoSQL)已经占据了半壁江山,而图数据库(Graph Database)更是攻城略地,成为其中的佼佼者. 所谓图数据库,它应用图理论( ...
google Cayley图谱数据库初试
一.安装 mkdir cayley cd cayley mkdir src export GOPATH=$(pwd) go get github.com/google/cayley go build ...
图数据库cayley+mongo的起航之旅
图数据库,目前比较主流的可能是Neo4j以及cayley了.但是,由于Neo4j只有社区版是免费的,所以,选择cayley作为项目的最终选择! 今天就简单的介绍下,我的起航之旅. 1.安装go语言环境 ...
使用neo4j图数据库的import工具导入数据 -方法和注意事项
背景最近我在尝试存储知识图谱的过程中,接触到了Neo4j图数据库,这里我摘取了一段Neo4j的简介: Neo4j是一个高性能的,NOSQL图形数据库,它将结构化数据存储在网络上而不是表中.它是一个嵌 ...
图数据库项目DGraph的前世今生
本文由云+社区发表作者:ManishRai Jain 作者:ManishRai Jain Dgraph Labs创始人版权声明:本文由腾讯云数据库产品团队整理,页面原始内容来自于db weekly ...
JanusGraph : 图和图数据库的简介
JanusGraph:图数据库系统简介图(graph)是<数据结构>课中第一次接触到的一个概念,它是一种用来描述现实世界中个体和个体之间网络关系的数据结构. 为了在计算机中存储图,< ...
neo4j 图数据库安装及介绍
neo4j 图数据库安装及介绍一.neo4j图数据库介绍图数据库,顾名思义就是利用了"图的数据结构来作为数据存储逻辑体现的一种数据库",所以要想学好图数据库当然需要了解一些关于 ...
高性能内存图数据库RedisGraph（一）
作为一种简单.通用的数据结构,图可以表示数据对象之间的复杂关系.生物信息学.计算机网络和社交媒体等领域中产生的大量数据,往往是相互连接.关系复杂且低结构化的,这类数据对传统数据库而言十分棘手,一个简单 ...

随机推荐

st表、RMQ和LCA
int lca(int x,int y) { if(de[x]<de[y]) swap(x,y); int d=de[x]-de[y]; for(int i=log2(d);i>=0;i- ...
一道无限极类 PHP 试题
记某次笔试碰到的一道无限极类试题,当时时间比较紧(满满六页试题),还是手写代码,所以最终写的有点错误.记不住原题了,但是要求都知道,特此记录下来! 试题有下面一个数组: $arr = [ '小红' ...
OSPF及实验
OSPF:Open Shortest Path First,最短路径优先1)基本概念:标准的LS型协议--共享拓扑组播更新:224.0.0.5/6触发更新,存在周期更新 30minOSPF是跨层封装 ...
Python+selenium+unittest实现网址登陆及页面跳转校验
这个网址登陆的单元测试代码都写在一个文件中,方便初学者查看和调试:实际测试工作中根据情况进行模块化处理. 话不多说,分布上代码一.import必要模块二.创建测试类,初始化测试环境三.定义登陆方 ...
Object.defineProperty和proxy
Object.defineProperty问题 Object.defineProperty() 无法监控到数组下标的变化.vue只能通过以下几种方法来监听 pop() shift() unshift( ...
c#RSA的SHA1加密与AES加密、解密
前言:公司项目对接了一个对数据保密性要求较高的java公司.api接口逻辑是这样的:他们提供 SHA1私钥与 AES的秘钥.我们需要将传递查询参数通过SHA1 私钥加密再转换成十六进制字符串 ...
SpringBoot2.3中@Async实现异步
启动加上@EnableAsync ,需要执行异步方法上加入@Async. 在方法上加上@Async之后底层使用多线程技术. 不使用异步先关代码: package com.yiyang.myfirs ...
083 01 Android 零基础入门 02 Java面向对象 01 Java面向对象基础 02 构造方法介绍 02 构造方法-带参构造方法
083 01 Android 零基础入门 02 Java面向对象 01 Java面向对象基础 02 构造方法介绍 02 构造方法-带参构造方法本文知识点:构造方法-带参构造方法说明:因为时间紧张, ...
WJQ与机房
sample input 5 6 7 2 3 1 1 5 0 6 0 0 8 6 6 5 3 4 3 7 8 2 4 0 0 6 9 sample output 20 样例解释: 分别以(2,1)为左 ...
python实现单链表及链表常用功能
单链表及增删实现单链表高级功能实现:反序,找中间结点,检测环等参考: https://github.com/wangzheng0822/algo

Google Cayley图数据库使用方法

Google Cayley图数据库使用方法的更多相关文章

随机推荐

热门专题