Google Cayley图数据库使用方法
最近在用Golang做流程引擎,对于流程图的存储,我看到了Google的Cayley图数据库,感觉它可能会比较适合我的应用,于是便拿来用了用.
项目地址在这里:https://github.com/google/cayley
系统环境 : Windows 7
1. 安装
安装的过程项目文档里写的很明白,有两种安装方式:
- 直接下载二进制版本.解压到你喜欢的位置.
- 从源码安装,遵照项目文档一步一步来即可.
2. 使用
安装完成之后,你会看到一个【cayley.exe】的文件,它就是我们要用的程序了。
1. 初始化数据库
初始化数据库要用到的命令是 init ,你可以使用两种方式初始化,一种是命令行,一种是配置文件。
我们先来看命令行的形式:
- leveldb : cayley.exe init --db=leveldb --dbpath=tmp/testdb —— 你存储数据的目录就是【tmp/testdb】,它会在这个目录下,建立leveldb数据库;
- bolt : cayley.exe init --db=bolt --dbpath=tmp/testdb —— 你存储数据的文件名是【tmp/testdb】,它会在【tmp】目录下,创建一个叫做【testdb】的bolt数据库文件;
- mongo : cayley.exe init --db=mongo --dbpath=”<HOSTNAME>:<PORT>” —— HOSTNAME和PORT指向你的Mongo实例。
在命令行中,--db 和 --dbpath 必须是一起出现的。如果你觉得输入命令行很麻烦,那么可以使用配置文件来初始化。cayley给了一个示例文件【cayley.cfg.example】:
- {
- "database": "bolt",
- "db_path": "/tmp/demodb",
- "read_only": false
- }
这个使用的是bolt数据库,同时配置了路径以及是否只读。关于配置文件如何配置,等一下我们再说。对我来说,只需要把这个文件改动一下,就可以为我所用了:
- {
- "database": "bolt",
- "db_path": "tmp/testdb", // 我是在【cayley.exe】所在目录下的【tmp】文件夹里创建的数据库文件
- "read_only": false
- }
2. 向数据库加载数据
数据库初始化好了之后,我们就可以加载数据了。cayley项目里给我们提供了两个测试数据,都在【data】目录下,一个是【testdata.nq】,它是一个简单的基于好友关注的网络图,一个是【30kmoviedata.nq.gz】,这里存储了30k个电影数据信息。我们先用简单的【testdata.nq】。
加载数据要用到 load 命令:
- cayley.exe load --config=cayley.cfg.example --quads=data/testdata.nq
这样,就把【testdata.nq】里的数据,加载到数据库里了。
3. 连接你的图数据
加载数据之后,我们就可以查看我们的图了。cayley提供了两种方式,一种是REPL,一种是HTTP。
先说REPL:
- cayley.exe repl --config=cayley.cfg.example
这样,cayley就已经跑起来了,你可以看到命令行已经变成“cayley>”等待你的输入了。
再说HTTP:
- cayley.exe http --config=cayley.cfg.example
敲完这行命令之后,你会看到控制台输出“Cayley now listening on 127.0.0.1:64210”,接下来只要访问http://127.0.0.1:64210/就能看到它的web界面了。
4. 使用
在使用之前,我们先来看一看,cayley里的数据,是什么样的。比如以【testdata.nq】为例:
- 1 <alice> <follows> <bob> .
- 2 <bob> <follows> <fred> .
- 3 <bob> <status> "cool_person" .
- 4 <charlie> <follows> <bob> .
- 5 <charlie> <follows> <dani> .
- 6 <dani> <follows> <bob> .
- 7 <dani> <follows> <greg> .
- 8 <dani> <status> "cool_person" .
- 9 <emily> <follows> <fred> .
- 10 <fred> <follows> <greg> .
- 11 <greg> <status> "cool_person" .
它是由一条条四元组构成,其中第一个叫subject,第二个叫predicate,第三个叫object,第四个叫Label(可选),以.结尾。subject和object会转换成有向图的顶点,predicate就是边。label的用法我查了google group,意思是说,你可以在一个数据库里,存多个图,用label来区分不同的图,但是我没有找到关于它的用法。
这张图的关系如下:
其中箭头指明了follows的关系,而#括起来的人名表示,这些人有status为cool_person。
下来我们来看对cayley数据库的增删查:
- 增
- 1 cayley> :a
subject
- predicate object label .
比如我要添加一个人叫“leon”,他关注了“alice”,并且他也是一个“cool_person”,那么输入这样的命令即可:
- 1 cayley> :a leon follows alice .
- 2 cayley> :a leon status cool_person .
- 删
- 1 cayley> :d subject predicate object .
比如我刚才添加的“leon”,现在他不想关注“alice”了,那么这样就可以删除刚才建立的关系了:
- 1 cayley> :d leon follows alice .
- 查
对于查询,cayley提供了两种查询语言,一种是类似于JavaScript的语言,一种是简化的MQL。这里我选用类JavaScript的查询语言。因为它的文档相对完整一些。我会通过介绍对象的方式,把查询方法逐一阐述。
1. graph 对象,简写为 g ,它的存在是唯一的,由它来产生 query 对象,进而返回各种查询结果。它可执行的方法如下所示:
graph.Vertex([nodeId],[nodeId]…) 简写为 g.V
参数:nodeId(可选):一个字符串,或者字符串列表,代表了查询的起始节点
返回:query 对象
从给定的顶点(集)开始一个查询路径,如果没有参数,则认为是图中所有的顶点。
举例:
- 1 // 我想看目前图中所有的顶点
- 2 g.V().All()
- 3 // 我想获得alice这个节点
- 4 g.V(“alice”).GetLimit(1)
其中All()方法是query对象的方法,用它可以遍历query对象中,所有的数据。GetLimit(number)也是query对象的方法,它获得迭代集里限定数目的数据。
graph.Morphism() 简写为 g.M()
无参数
返回:path 对象
创建一个态射path对象,它本身是不能被查询的,它定义了一类路径映射,可以存储到变量里,在别的查询语句里使用。具体使用之后介绍。主要是和 path.Follow(),path.FollowR()配合使用。
2. path 对象,它是query对象的父类对象。
path对象由 g.V() 和 g.M() 创建,其中 g.V() 创建了query对象,它是path对象的子类。
我们的查询,主要就是使用这个对象,下面以【testdata.nq】里的数据为例,介绍一下都有哪些查询方法。
path.Out([predicatePath],[tags])
参数:predicatePath(可选)下列其中之一
- 空或者undifined:所有从这个节点出去的predicate。
- 一个字符串:从这个节点出去的predicate名字。
- 字符串列表:从这个节点出去的多个predicate名字。
- 一个query path对象:
tags(可选)下列其中之一
- 空或者undifined:没有tags
- 一个字符串:向输出集使用的指明predicate的标签
- 字符串列表:添加多个tags
这个方法从path对象开始,通过predicate指向其他objects,也就是要查询的数据。
举例:
- 1 // 查看charlie follows了谁。结果是 bob and dani
- 2 g.V("charlie").Out("follows")
- 3 // 查看alice follows的人,他们又follows了谁。结果是 fred
- 4 g.V("alice").Out("follows").Out("follows")
- 5 // 从dani出去的路径都指向了哪里。 结果是 bob, greg 和 cool_person
- 6 g.V("dani").Out()
- 7 // 找到所有dani通过follows和status指向的节点。
- 8 // 结果是 bob, greg 和 cool_person
- 9 g.V("dani").Out(["follows", "status"])
- 10 // 找到所有dani通过status指向的节点,并加上tag。
- 11 // 结果是 {"id": cool_person, "pred": "status"}
- 12 g.V("dani").Out(g.V("status"), "pred")
path.In([predicatePath],[tags])
和path.Out()用法想同,只不过path.In()查询的是入度,path.Out()查询的是出度。
path.Both([predicatePath],[tags])
用法同上,既查询入度也查询出度。项目文档里说目前这个方法的效率相对来说比较低,因为它是通过Or方法实现的。但是在需要的情况下,还是很有用的。
path.Is(node,[node..])
参数:node:一个或者多个node。
过滤出所有指向参数节点的路径。
举例:
- 1 // 从图中所有节点出发,找到follows指向bob的路径
- 2 // 结果显示三个路径指向bob (来自 alice, charlie and dani)
- 3 g.V().Out("follows").Is("bob")
path.Has(predicate,object)
参数:predicate:指明predicate,也就是哪类路径。
object:指向的节点
过滤出所有通过predicate指向object的节点
举例:
- 1 // 从所有节点开始,找到谁follows了。结果是 alice, charlie and dani
- 2 g.V().Has("follows", "bob")
- 3 // follows charlie的人之中,哪些人follows了fred。结果是 bob
- 4 g.V("charlie").Out("follows").Has("follows", "fred")
Tagging
path.Tag(tag) 简写为 path.As
参数:tag:为结果集的key赋予一个字符串。
为了保存你的工作,或者了解路径是怎么到达终点的,cayley提供了tags。
举例:
- 1 // 从所有节点开始,把他们保存到“start”中,找到所有有status的predicate,并返回结果
- 2 // 结果是 {"id": "cool_person", "start": "bob"}, {"id": "cool_person", "start": "greg"}, {"id": "cool_person", "start": "dani"}
- 3 g.V().Tag("start").Out("status")
path.Back(tag)
参数:tag:要跳回的在query里保存的之前的tag名
举例:
- 1 // 从所有节点出发,把它们保存到“start”中,找到有status的predicate的连接,然后跳回到“start”中,看看有谁follows了他们,返回结果
- 2 // 结果是:
- 3 // {"id": "alice", "start": "bob"},
- 4 // {"id": "charlie", "start": "bob"},
- 5 // {"id": "dani", "start": "bob"},
- 6 // {"id": "charlie", "start": "dani"},
- 7 // {"id": "dani", "start": "greg"}
- 8 g.V().Tag("start").Out("status").Back("start").In("follows")
path.Save(predicate,tag)
参数:predicate:predicate名
tag:一个tag名用来保存object节点
从当前节点开始作为subject,把它通过predicate连接的节点保存在key为tag指向的value里。
举例:
- 1 // 从 dani 和 bob 开始,查看他们follows了谁,并把结果保存在 “target”中
- 2 // 结果:
- 3 // {"id" : "dani", "target": "bob" },
- 4 // {"id" : "dani", "target": "greg" },
- 5 // {"id" : "bob", "target": "fred" },
- 6 g.V("dani", "bob").Save("follows", "target")
Joining
path.Intersect(query) 简写为 path.And
path.Union(query) 简写为 path.Or
path.Except(query) 简写为 path.Difference
这三个放到一起,就是比较两个path对象中,取交集的数据、取并集的数据和取差集的数据。
参数都只有query对象。
举例:
- 1 var cFollows = g.V("charlie").Out("follows")
- 2 var dFollows = g.V("dani").Out("follows")
- 3 // 1. Intersect
- 4 // charlie follows的人 (bob and dani) 和 dani follows的人 (bob and greg) -- 返回 bob
- 5 cFollows.Intersect(dFollows)
- 6 // 或者相同的方式
- 7 g.V("charlie").Out("follows").And(g.V("dani").Out("follows"))
- 8 // 2. Union
- 9 // charlie (bob and dani) 或 dani (bob and greg) follows的人 -- 返回 bob (来自 charlie), bob (来自 dani), dani and greg.
- 10 cFollows.Union(dFollows)
- 11 // 3. Except
- 12 // 从charlie follows的人中,去掉dani follows的人-- 返回 dani
- 13 cFollows.Except(dFollows)
- 14 // 或者相同的方式
- 15 g.V("charlie").Out("follows").Except(g.V("dani").Out("follows"))
使用 Morphisms
path.Follow(morphism)
path.FollowR(morphism)
这两个放到一起,因为它们都用到了morphism path对象。
参数:morphism:一个态射路径。
有了graph.morphism,我们可以准备一个可复用的path。
Follow是从morphism定义的路径,顺序查找节点,而FollowR是逆序查找节点的。
举例:
- 1 friendOfFriend = g.Morphism().Out("follows").Out("follows")
- 2 // 定义一个morphism为:从给定节点出发,它follows的节点所follows的节点。
- 3 // 查找charlie follows的人所follows的人里,谁的有status为cool_person
- 4 // 结果为 bob 和 greg
- 5 g.V("charlie").Follow(friendOfFriend).Has("status", "cool_person")
- 6 // 从所有节点出发,找到谁follows的人里,follows了status为cool_person的人
- 7 // 结果:emily,bob,charlie(来自 bob),charlie(来自greg)
- 8 g.V().Has("status", "cool_person").FollowR(friendOfFriend)
关于Query对象
query.All()
没有参数,返回值任意。执行结果是query里所有的数据。
query.GetLimit(size)
参数是size,和All()方法一样, 只不过加上了返回结果数量的限制。
query.ToArray()
没有参数,返回一个Array。
query.ToValue()
没有参数,返回一个字符串。和ToArray()方法一样,但是只返回一个结果,就像Limit(1)
query.TagArray()
和ToArray()一样,只不过返回的不是string数组,而是一个键值对数组。
query.TagValue()
和ToValue()一样,返回一个只包含一个tag-to-string的map。
query.ForEach(callback),query.ForEach(limit,callbaack) 简写为 query.Map
略。
关于web界面的可视化
当你使用http界面时,你会看到cayley提供了可视化效果的展示,一种是QueryShape,一种是Visualize。
QueryShape展示了你要查询的态射是什么样的,Visualize会以图形方式展示你的查询结果。在正确地输出图形之前,尤其是Visualize,需要确保查询结果的JSON里,有“target”和“source”这两个键。也就是说,我们在查询的结果里,需要通过Tag,为结果添加标签。
举例:
- 1 var fOf = g.M().Out("follows").Out("follows").Tag("target")
- 2 g.V("charlie").Tag("source").Follow(fOf).All()
它返回的结果是这样的JSON,包含了“source”和“target”:
- 1 {
- 2 "result": [
- 3 {
- 4 "id": "bob",
- 5 "source": "charlie",
- 6 "target": "bob"
- 7 },
- 8 {
- 9 "id": "greg",
- 10 "source": "charlie",
- 11 "target": "greg"
- 12 },
- 13 {
- 14 "id": "fred",
- 15 "source": "charlie",
- 16 "target": "fred"
- 17 }
- 18 ]
- 19 }
这样才能在web页面中,看到可视化的图形展示。
其中QueryShape如下:
Visualize如下:
以上就是我初步尝试cayley数据库的内容,在它项目的doc文件夹下,还有更多更详细的说明,感兴趣的读者可以看一看。
由于个人水平有限,如果哪里有错误或者你有更好的经验,欢迎在评论区留言,我会认真和你交流的。谢谢!
Google Cayley图数据库使用方法的更多相关文章
- Cayley图数据库的可视化(Visualize)
引入 在文章Cayley图数据库的简介及使用中,我们已经了解了Cayley图数据库的安装.数据导入以及进行查询等. Cayley图数据库是Google开发的开源图数据库,虽然功能还没有Neo4 ...
- Cayley图数据库的简介及使用
图数据库 在如今数据库群雄逐鹿的时代中,非关系型数据库(NoSQL)已经占据了半壁江山,而图数据库(Graph Database)更是攻城略地,成为其中的佼佼者. 所谓图数据库,它应用图理论( ...
- google Cayley图谱数据库初试
一.安装 mkdir cayley cd cayley mkdir src export GOPATH=$(pwd) go get github.com/google/cayley go build ...
- 图数据库cayley+mongo的起航之旅
图数据库,目前比较主流的可能是Neo4j以及cayley了.但是,由于Neo4j只有社区版是免费的,所以,选择cayley作为项目的最终选择! 今天就简单的介绍下,我的起航之旅. 1.安装go语言环境 ...
- 使用neo4j图数据库的import工具导入数据 -方法和注意事项
背景 最近我在尝试存储知识图谱的过程中,接触到了Neo4j图数据库,这里我摘取了一段Neo4j的简介: Neo4j是一个高性能的,NOSQL图形数据库,它将结构化数据存储在网络上而不是表中.它是一个嵌 ...
- 图数据库项目DGraph的前世今生
本文由云+社区发表 作者:ManishRai Jain 作者:ManishRai Jain Dgraph Labs创始人 版权声明:本文由腾讯云数据库产品团队整理,页面原始内容来自于db weekly ...
- JanusGraph : 图和图数据库的简介
JanusGraph:图数据库系统简介 图(graph)是<数据结构>课中第一次接触到的一个概念,它是一种用来描述现实世界中个体和个体之间网络关系的数据结构. 为了在计算机中存储图,< ...
- neo4j 图数据库安装及介绍
neo4j 图数据库安装及介绍 一.neo4j图数据库介绍 图数据库,顾名思义就是利用了"图的数据结构来作为数据存储逻辑体现的一种数据库",所以要想学好图数据库当然需要了解一些关于 ...
- 高性能内存图数据库RedisGraph(一)
作为一种简单.通用的数据结构,图可以表示数据对象之间的复杂关系.生物信息学.计算机网络和社交媒体等领域中产生的大量数据,往往是相互连接.关系复杂且低结构化的,这类数据对传统数据库而言十分棘手,一个简单 ...
随机推荐
- TKE 集群组建最佳实践
Kubernetes 版本 Kubernetes 版本迭代比较快,新版本通常包含许多 bug 修复和新功能,旧版本逐渐淘汰,建议创建集群时选择当前 TKE 支持的最新版本,后续出新版本后也是可以支持 ...
- 纹理_贴图_texture
详细代码可以在我的GitHub上找文末指定的项目.
- 使用IBMMQ时的那些事
之前项目一直使用的是ActiveMQ,突然要变更成IBMMQ,整理了一些搭建MQ和代码连接MQ是遇到的问题,记录一下. (1)三个系统之内部使用IBMMQ交互,所以应设立两个本地接收队列和两个发送队列 ...
- Python-临时文件文件模块-tempfile
案例: 某项目中,从传感器中获得采集数据,每收集到1G的数据后做是数据分析,最终只保留数据分析的结果,收集到的数据放在内存中,将会消耗大量内存,我们希望把这些数据放到一个临时的文件中 临时文件不能命名 ...
- Matlab中num2str函数的用法
转载:https://blog.csdn.net/SMF0504/article/details/51836062 函数功能: 把数值转换成字符串, 转换后可以使用fprintf或disp函数进行输出 ...
- VS2013 C++ 生成与调用DLL(动态链接库) 需要验证
转载:https://blog.csdn.net/s978697043/article/details/82429802 一.创建动态链接库(生成.dll .lib 两个文件) 文件→新建→项目 选择 ...
- 2-K8S常用命令
kubectl 命令行管理工具 类型 命令 描述 基础命令 create 通过文件名或标准输入创建资源 expose 为Deployment,Pod创建service run 在集群中运行一个特定的镜 ...
- SpringBoot+Activiti+bpmn.js+Vue.js+Elementui(OA系统审批流)
引言:OA系统用到请假.加班.调休.离职,需要使用工作流进行流程审批 一:activiti流程设计器的选择(通过学习activiti工作流过程中,发现一款好的流程设计器将会更好的方便的设计好流程(主要 ...
- rsync安装使用中出现的报错
一,查看本地centos的版本: [root@localhost lib]# cat /etc/redhat-release CentOS Linux release 8.1.1911 (Core) ...
- ansible:安装nginx1.18.0(使用role功能)
一,ansible使用role的用途? roles分别将变量/文件/任务/模板/handler等放置于单独的目录中, 并可以方便的include各目录下的功能 roles使playbook能实现代码被 ...