Graph database_neo4j 底层存储结构分析(1)
1 neo4j 中节点和关系的物理存储模型
1.1 neo4j存储模型
The node records contain only a pointer to their first property and their first relationship (in what is oftentermed the _relationship chain). From here, we can follow the (doubly) linked-list of relationships until we find the one we’re interested in, the LIKES relationship from Node 1 to Node 2 in this case. Once we’ve found the relationship record of interest, we can simply read its properties if there are any via the same singly-linked list structure as node properties, or we can examine the node records that it relates via its start node and end node IDs. These IDs, multiplied by the node record size, of course give the immediate offset of both nodes in the node store file.
上面的英文摘自<Graph Databases>(作者:IanRobinson) 一书,描述了 neo4j 的存储模型。Node和Relationship 的 Property 是用一个 Key-Value 的双向列表来保存的; Node 的 Relatsionship 是用一个双向列表来保存的,通过关系,可以方便的找到关系的 from-to Node. Node 节点保存第1个属性和第1个关系ID。
通过上述存储模型,从一个Node-A开始,可以方便的遍历以该Node-A为起点的图。下面给个示例,来帮助理解上面的存储模型,存储文件的具体格式在第2章详细描述。
1.2 示例1
在这个例子中,A~E表示Node 的编号,R1~R7 表示 Relationship 编号,P1~P10 表示Property 的编号。
- Node 的存储示例图如下,每个Node 保存了第1个Property 和 第1个Relationship:
- 关系的存储示意图如下:
从示意图可以看出,从 Node-B 开始,可以通过关系的 next 指针,遍历Node-B 的所有关系,然后可以到达与其有关系的第1层Nodes,在通过遍历第1层Nodes的关系,可以达到第2层Nodes,…
2 neo4j graph db的存储文件介绍
当我们下载neo4j-community-2.1.0-M01 并安装,然后拿 neo4j embedded-example 的EmbeddedNeo4j 例子跑一下,可以看到在target/neo4j-hello-db下会生成如下neo4j graph db 的存储文件。
-rw-r–r– 11 04-11 13:28 active_tx_log
drwxr-xr-x 4096 04-11 13:28 index
-rw-r–r– 23740 04-11 13:28 messages.log
-rw-r–r– 78 04-11 13:28 neostore
-rw-r–r– 9 04-11 13:28 neostore.id
-rw-r–r– 22 04-11 13:28 neostore.labeltokenstore.db
-rw-r–r– 9 04-11 13:28 neostore.labeltokenstore.db.id
-rw-r–r– 64 04-11 13:28 neostore.labeltokenstore.db.names
-rw-r–r– 9 04-11 13:28 neostore.labeltokenstore.db.names.id
-rw-r–r– 61 04-11 13:28 neostore.nodestore.db
-rw-r–r– 9 04-11 13:28 neostore.nodestore.db.id
-rw-r–r– 93 04-11 13:28 neostore.nodestore.db.labels
-rw-r–r– 9 04-11 13:28 neostore.nodestore.db.labels.id
-rw-r–r– 307 04-11 13:28 neostore.propertystore.db
-rw-r–r– 153 04-11 13:28 neostore.propertystore.db.arrays
-rw-r–r– 9 04-11 13:28 neostore.propertystore.db.arrays.id
-rw-r–r– 9 04-11 13:28 neostore.propertystore.db.id
-rw-r–r– 61 04-11 13:28 neostore.propertystore.db.index
-rw-r–r– 9 04-11 13:28 neostore.propertystore.db.index.id
-rw-r–r– 216 04-11 13:28 neostore.propertystore.db.index.keys
-rw-r–r– 9 04-11 13:28 neostore.propertystore.db.index.keys.id
-rw-r–r– 410 04-11 13:28 neostore.propertystore.db.strings
-rw-r–r– 9 04-11 13:28 neostore.propertystore.db.strings.id
-rw-r–r– 69 04-11 13:28 neostore.relationshipgroupstore.db
-rw-r–r– 9 04-11 13:28 neostore.relationshipgroupstore.db.id
-rw-r–r– 92 04-11 13:28 neostore.relationshipstore.db
-rw-r–r– 9 04-11 13:28 neostore.relationshipstore.db.id
-rw-r–r– 38 04-11 13:28 neostore.relationshiptypestore.db
-rw-r–r– 9 04-11 13:28 neostore.relationshiptypestore.db.id
-rw-r–r– 140 04-11 13:28 neostore.relationshiptypestore.db.names
-rw-r–r– 9 04-11 13:28 neostore.relationshiptypestore.db.names.id
-rw-r–r– 82 04-11 13:28 neostore.schemastore.db
-rw-r–r– 9 04-11 13:28 neostore.schemastore.db.id
-rw-r–r– 4 04-11 13:28 nioneo_logical.log.active
-rw-r–r– 2249 04-11 13:28 nioneo_logical.log.v0
drwxr-xr-x 4096 04-11 13:28 schema
-rw-r–r– 0 04-11 13:28 store_lock
-rw-r–r– 800 04-11 13:28 tm_tx_log.1
2.1 存储 node 的文件
1) 存储节点数据及其序列Id
- neostore.nodestore.db: 存储节点数组,数组的下标即是该节点的ID
- neostore.nodestore.db.id :存储最大的ID 及已经free的ID
2) 存储节点label及其序列Id
- neostore.nodestore.db.labels :存储节点label数组数据,数组的下标即是该节点label的ID
- neostore.nodestore.db.labels.id
2.2 存储 relationship 的文件
1) 存储关系数据及其序列Id
- neostore.relationshipstore.db 存储关系 record 数组数据
- neostore.relationshipstore.db.id
2) 存储关系组数据及其序列Id
- neostore.relationshipgroupstore.db 存储关系 group数组数据
- neostore.relationshipgroupstore.db.id
3) 存储关系类型及其序列Id
- neostore.relationshiptypestore.db 存储关系类型数组数据
- neostore.relationshiptypestore.db.id
4) 存储关系类型的名称及其序列Id
- neostore.relationshiptypestore.db.names存储关系类型 token 数组数据
- neostore.relationshiptypestore.db.names.id
2.3 存储 label 的文件
1) 存储label token数据及其序列Id
- neostore.labeltokenstore.db 存储lable token 数组数据
- neostore.labeltokenstore.db.id
2) 存储label token名字数据及其序列Id
- neostore.labeltokenstore.db.names 存储 label token 的 names 数据
- neostore.labeltokenstore.db.names.id
2.4 存储 property 的文件
1) 存储属性数据及其序列Id
- neostore.propertystore.db 存储 property 数据
- neostore.propertystore.db.id
2) 存储属性数据中的数组类型数据及其序列Id
- neostore.propertystore.db.arrays 存储 property (key-value 结构)的Value值是数组的数据。
- neostore.propertystore.db.arrays.id
3) 属性数据为长字符串类型的存储文件及其序列Id
- neostore.propertystore.db.strings 存储 property (key-value 结构)的Value值是字符串的数据。
- neostore.propertystore.db.strings.id
4) 属性数据的索引数据文件及其序列Id
- neostore.propertystore.db.index 存储 property (key-value 结构)的key 的索引数据。
- neostore.propertystore.db.index.id
5) 属性数据的键值数据存储文件及其序列Id
- neostore.propertystore.db.index.keys 存储 property (key-value 结构)的key 的字符串值。
- neostore.propertystore.db.index.keys.id
2.5 其他的文件
1) 存储版本信息
- neostore
- neostore.id
2) 存储 schema 数据
- neostore.schemastore.db
- neostore.schemastore.db.id
3) 活动的逻辑日志
- nioneo_logical.log.active
4) 记录当前活动的日志文件名称
- active_tx_log
Graph database_neo4j 底层存储结构分析(1)的更多相关文章
- Graph database_neo4j 底层存储结构分析(8)
3.8 示例1:neo4j_exam 下面看一个简单的例子,然后看一下几个主要的存储文件,有助于理解<3–neo4j存储结构>描述的neo4j 的存储格式. 3.8.1 neo4j ...
- Graph database_neo4j 底层存储结构分析(7)
3.7 Relationship 的存储 下面是neo4j graph db 中,Relationship数据存储对应的文件: neostore.relationshipgroupstore.db ...
- Graph database_neo4j 底层存储结构分析(6)
3.6 Node 数据存储 neo4j 中, Node 的存储是由 NodeStore 和 ArrayPropertyStore 2中类型配合来完成的. node 的label 内容是存在Array ...
- Graph database_neo4j 底层存储结构分析(5)
3.5 Property 的存储 下面是neo4j graph db 中,Property数据存储对应的文件: neostore.propertystore.db neostore.propertys ...
- Graph database_neo4j 底层存储结构分析(4)
3.3.2 DynamicStore 类型 3.3.2.1 AbstractDynamicStore 的存储格式 neo4j 中对于字符串等变长值的保存策略是用一组定长的 block ...
- Graph database_neo4j 底层存储结构分析(3)
3.3 通用的Store 类型 3.3.1 id 类型 下面是 neo4j db 中,每种Store都有自己的ID文件(即后缀.id 文件),它们的格式都是一样的. [test00]$ls - ...
- Graph database_neo4j 底层存储结构分析(2)
3 neo4j存储结构 neo4j 中,主要有4类节点,属性,关系等文件是以数组作为核心存储结构:同时对节点,属性,关系等类型的每个数据项都会分配一个唯一的ID,在存储时以该ID 为数组的 ...
- Redis(一) 数据结构与底层存储 & 事务 & 持久化 & lua
参考文档:redis持久化:http://blog.csdn.net/freebird_lb/article/details/7778981 https://blog.csdn.net/jy69240 ...
- HBase底层存储原理
HBase底层存储原理——我靠,和cassandra本质上没有区别啊!都是kv 列存储,只是一个是p2p另一个是集中式而已! 首先HBase不同于一般的关系数据库, 它是一个适合于非结构化数据存储的数 ...
随机推荐
- sql查询语句优化
http://www.cnblogs.com/dubing/archive/2011/12/09/2278090.html 最近公司来一个非常虎的dba 10几年的经验 这里就称之为蔡老师吧 在征得 ...
- CSS3 定位| Position研究
视区(视口) 当浏览者查看一份网页文件时,通常使用者代理(User Agents, UA, 浏览器)会提供给浏览者一个视区(视窗或者是画面里的其它可视区域).当我们调整视区大小时,UA 就有可能会改变 ...
- iOS-Socket编程体验
CHENYILONG Blog Socket编程体验 Socket编程体验 技术博客http://www.cnblogs.com/ChenYilong/新浪微博http://weibo.com/lu ...
- HttpClient与HttpUrlConnection下载速度比较
Android有两套http的API,刚开始使用网络编程时多少有些迷惑到底用哪个好呢?其实孰优孰劣无需再争论,google已经指出HttpUrlConnection是Android更优的选择,并在SD ...
- redis初使用
下载地址:https://redis.io/download Redis项目不正式支持Windows.但是,微软开放技术小组开发并维护了针对Win64的Windows端口 windows版下载地址:h ...
- 日期控件-my97DatePicker用法
网上资料,用法,只能选最近30天等等:http://jingyan.baidu.com/article/e6c8503c7244bae54f1a18c7.html
- PHP中VC6、VC9、TS、NTS版本区别与用法
1. VC6与VC9的区别: VC6 版本是使用 Visual Studio 6 编译器编译的,如果你的 PHP 是用 Apache 来架设的,那你就选择 VC6 版本. VC9 版本是使用 Vis ...
- MAC连接安卓手机通过adb指令安装apk
Android的apk可以通过adb命令来安装.在MAC电脑上,如果想通过命令行的方式给安卓手机安装apk,需要做以下操作: 一句话概括就是:将安卓SDK的adb命令添加到环境变量中,然后通过adb ...
- java 接口与工厂
接口时实现多重继承的途径,而生产遵循某个接口的对象的典型方式就是工厂方法设计模式,这与直接调用构造器不同,我们在工厂对象上调用的是某种方法,而该工厂对象将生成接口的某个实现的对象,理论上通过这种方式, ...
- C语言:用指针求最大值和最小值
用指针求数组最大值和最小值(10分) 题目内容: 用指针求含有十个元素的数组最大值和最小值 主函数参考 int main() { int a[10],i,maxnum,minnum; for(i=0; ...